指代消解原理

2024-05-01 02:44
文章标签 原理 指代 消解

本文主要是介绍指代消解原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

指代,在下文采用简称或者代称来代替上文已经出现的某一词语,语言学中把这种现象叫做指代现象。

指代,是语言学中的一种语言现象,使用指代词来代替文本中已经出现的某个语言单元的表达方式。将代表同一实体的不同表述划分到一个等价集合的过程称为指代消解。指代消解在信息抽取、智能问答等任务中,具有十分重要的作用。

人称代词:【李明】怕高妈妈一人呆在家里寂寞,【他】便将家里的电视搬了过来。
指示代词:【很多人都想创造一个美好的世界留给孩子】,【这】可以理解,但不完全正确
有定描述:【贸易制裁】似乎成了【美国政府在对华关系中惯用的大棒】。然而,这【大棒】果真如美国政府所希望的那样灵验吗?

指代消解:形式上,将代表同一实体的不同指称划分到一个等价集合(指代链)的过程称为指代消解。

概念

照应语Anaphor,指代上文语言单元的词语;

先行语Antencedent,指代词所指向的语言单元。

实体,Entity,客观存在的一个或一类物体。

指称,Mention,指代某个实体的表述。

实体可以使用名字来表示,也可以使用名词、代词、短语来表示,代表同一实体的 不同表达方式都称为指称。

指代分两种:

1)回指:照应语和先行语之间存在语义关联,指代关系依赖上下文,不同语境下照应语指代不同实体。

2)共指,两个指称语表示现实世界的同一实体,指代关系独立于上下文客观存在。

中文指代类别:

1)代词指代,你我他、这个、那个等

2)名词短语指代

场景

  • 全文理解:完整的文章中有大量的指代,要理解文章内容需要知道每一个代词指向的是哪一个实体。
  • 文本摘要:使用代词会使行文更加自然,而不是全文均为实体自身名称。
  • 问答系统:比如搜索“谁娶了Claudia Ross”,出来“He married Claudia Ross in 1971”,则系统必须消解“He”是谁。
  • 信息抽取:当关系抽取或者事件抽取时,缺乏关键实体或论元时,关系或事件无法成立,特别在一些公文或法律文书中,类似“原告”、“被告”并不是常规的实体,因此需要将指向对应的实体上。

发展

(1)基于启发式规则

        Hobbs算法:基于句法解析树,对实体短语和先行语之间的关系进行指代判别。RAP算法:依靠句法分析特征和动态关注状态解决第三人称代词和反身代词的指代消解问题。基于规则的指代消解方案,大多利用句法分析和语义角色信息,通过指定严密的规则约束来达到匹配指代词和先行语的目的。

(2)基于统计模型

    基于统计的方阿飞中,先行语和指代词之间的共现频率为重要的考虑指标,同时融合二者之间的词汇、语法、句法、语义一致性等特征进行指代关系判断。

(3)基于机器学习分类模型

        1)指称对模型

        将指代消解任务转化为判断先行与与指代词之间是否匹配的分类任务。

        2)实体-指称模型

        同一指代链中各指代语指向概念相同的同一实体,实体-指称模型不再是判断两个实体是否是指代关系,而是判断当前实体是否能够并入指代链当中的过程。

        3)排序模型

        指代词选择多个候选先行语中概率最高的一个,建立指代关系。

        基于中心理论构建tournament模型,对两个候选先行语进行比较,选择二者概率较大的建立指代关系。另外还有有监督的最大熵排序指代消解算法。排序算法能够为当前实体找到候选指代链中的选择最优,但是该模型不能解决当前实体是否是指代词的问题。

        

基于深度学习模型

        Clark基于高维度指代链特征,学习clstering-paire特征,学习合并不同的指代链,并形成最终的指代决策。

        Lee等人提出端到端的深度学习指代消解模型,zhang等人采用双仿射注意力机制,在端到端指代消解模型当中对指称识别和指代关系构建两个子任务进行联合。

        Aralikatte将指代消解任务转化为阅读理解任务,2020年Wu等人将阅读理解任务融入到端到端的指代消解模型。

这篇关于指代消解原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/950544

相关文章

Java线程池核心参数原理及使用指南

《Java线程池核心参数原理及使用指南》本文详细介绍了Java线程池的基本概念、核心类、核心参数、工作原理、常见类型以及最佳实践,通过理解每个参数的含义和工作原理,可以更好地配置线程池,提高系统性能,... 目录一、线程池概述1.1 什么是线程池1.2 线程池的优势二、线程池核心类三、ThreadPoolE

Spring Boot Interceptor的原理、配置、顺序控制及与Filter的关键区别对比分析

《SpringBootInterceptor的原理、配置、顺序控制及与Filter的关键区别对比分析》本文主要介绍了SpringBoot中的拦截器(Interceptor)及其与过滤器(Filt... 目录前言一、核心功能二、拦截器的实现2.1 定义自定义拦截器2.2 注册拦截器三、多拦截器的执行顺序四、过

Java 队列Queue从原理到实战指南

《Java队列Queue从原理到实战指南》本文介绍了Java中队列(Queue)的底层实现、常见方法及其区别,通过LinkedList和ArrayDeque的实现,以及循环队列的概念,展示了如何高效... 目录一、队列的认识队列的底层与集合框架常见的队列方法插入元素方法对比(add和offer)移除元素方法

SQL 注入攻击(SQL Injection)原理、利用方式与防御策略深度解析

《SQL注入攻击(SQLInjection)原理、利用方式与防御策略深度解析》本文将从SQL注入的基本原理、攻击方式、常见利用手法,到企业级防御方案进行全面讲解,以帮助开发者和安全人员更系统地理解... 目录一、前言二、SQL 注入攻击的基本概念三、SQL 注入常见类型分析1. 基于错误回显的注入(Erro

Spring IOC核心原理详解与运用实战教程

《SpringIOC核心原理详解与运用实战教程》本文详细解析了SpringIOC容器的核心原理,包括BeanFactory体系、依赖注入机制、循环依赖解决和三级缓存机制,同时,介绍了SpringBo... 目录1. Spring IOC核心原理深度解析1.1 BeanFactory体系与内部结构1.1.1

MySQL 批量插入的原理和实战方法(快速提升大数据导入效率)

《MySQL批量插入的原理和实战方法(快速提升大数据导入效率)》在日常开发中,我们经常需要将大量数据批量插入到MySQL数据库中,本文将介绍批量插入的原理、实现方法,并结合Python和PyMySQ... 目录一、批量插入的优势二、mysql 表的创建示例三、python 实现批量插入1. 安装 PyMyS

深入理解Redis线程模型的原理及使用

《深入理解Redis线程模型的原理及使用》Redis的线程模型整体还是多线程的,只是后台执行指令的核心线程是单线程的,整个线程模型可以理解为还是以单线程为主,基于这种单线程为主的线程模型,不同客户端的... 目录1 Redis是单线程www.chinasem.cn还是多线程2 Redis如何保证指令原子性2.

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node