EMNLP 2023 录用论文公布,速看NLP各领域最新SOTA方案

2023-10-13 19:36

本文主要是介绍EMNLP 2023 录用论文公布,速看NLP各领域最新SOTA方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

EMNLP 2023 近日公布了录用论文。

开始前以防有同学不了解这个会议,先简单介绍介绍:EMNLP 是NLP 四大顶会之一,ACL大家应该都很熟吧,EMNLP就是由 ACL 下属的SIGDAT小组主办的NLP领域顶级国际会议,一年举办一次。相较于ACL,EMNLP更偏向于NLP在各个领域解决方案的学术探讨。

今年的EMNLP 2023大会将于12月6日-10日在新加坡召开,我先整理了10篇录用论文来和大家分享,帮助NLP领域的同学了解今年的技术进展以及最新的SOTA方案,发论文更有方向。

需要论文原文及代码的同学看文末

1.Unlocking Context Constraints of LLMs: Enhancing Context Efficiency of LLMs with Self-Information-Based Content Filtering

标题:解锁LLM的上下文约束:利用基于自信息的内容过滤提高LLM上下文效率

内容:由于大型语言模型(LLM)在各种任务上都取得了显著的性能,因此受到了广泛的关注。但是,它们固定的上下文长度在处理长文本或进行长时间对话时碰到了挑战。本文提出了一种称为Selective Context的方法,该方法利用自信息量来过滤掉信息量较少的内容,从而提高固定上下文长度的效率。作者在文本摘要和问答等任务上验证了该方法的有效性,实验数据源包括学术论文、新闻文章和对话记录。

2.New Intent Discovery with Pre-training and Contrastive Learning

标题:基于预训练和对比学习的新意图发现

内容:在本文中,作者为新意图发现提供了两个重要研究问题的新解决方案:(1)如何学习语义表达表示,(2)如何更好地聚类表达。具体来说,作者首先提出了一个多任务预训练策略,以利用丰富的无标注数据以及外部标注数据进行表示学习。然后,作者设计了一个新的对比损失,以利用无标注数据中的自监督信号进行聚类。在三个意图识别基准测试中进行的大量实验证明,该方法无论是在无监督还是半监督场景中,都明显优于当前最先进的方法。

3.Dialogue for Prompting: a Policy-Gradient-Based Discrete Prompt Optimization for Few-shot Learning

标题:Dialogue for Prompting:基于策略梯度的少样本学习离散提示优化

内容:论文提出了一种基于策略梯度的离散提示词优化方法DP2O。作者首先基于GPT-4设计了多轮对话setAlignment策略来生成可读性提示集。然后,提出了一个高效的提示词筛选指标来识别高质量提示词,其复杂度为线性。最后,构建了一个基于策略梯度的强化学习框架,用于最佳匹配提示词和输入。

4.CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Data Limitation With Contrastive Learning

标题:CoCo:对比学习缓解数据稀缺下的机器生成文本检测与连贯性提升

内容:在本文中,作者提出了一个名为 CoCo 的基于连贯性的对比学习模型,以在低资源场景下检测可能的 MGT。受到语言特征的区分性和持久性的启发,作者将文本表示为一个连贯性图,以捕获其实体一致性,该连贯性图进一步由预训练模型和图神经网络编码。为了应对数据缺乏的挑战,作者采用对比学习框架,并提出改进的对比损失,以在训练阶段充分利用难样本。

5.Can Language Models Understand Physical Concepts?

标题:语言模型能理解物理概念吗?

内容:作者设计了一个覆盖视觉概念和具身概念的基准测试。结果显示,随着模型规模的增大,语言模型对某些视觉概念的理解确实提高了,但对很多基本概念仍然缺乏理解。相比之下,融合视觉信息的语言模型在具身概念上表现更好。这说明视觉表示中的丰富语义信息可以帮助语言模型获得具身知识。另外,作者还提出了一种从视觉语言模型向语言模型传递具身知识的知识蒸馏方法。

6.ImageNetVC: Zero-Shot Visual Commonsense Evaluation on 1000 ImageNet Categories

标题:ImageNetVC:在1000个ImageNet类别上进行零样本视觉常识评估

内容:论文提出了ImageNetVC,这是一个针对1000个ImageNet类别设计的细粒度人工标注数据集,专门用于跨类别的零样本视觉常识评估。利用ImageNetVC,作者深入研究了非模态PLMs和VaLMs的基本视觉常识,揭示了VaLMs的缩放定律和backbone模型的影响。此外,作者还研究了影响大规模模型视觉常识的因素,为开发融合视觉常识的语言模型提供了见解。

7.Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning

标题:从信息流角度理解词内学习

内容:在本文中,作者通过信息流的视角来研究ICL的工作机制。作者发现,在示范例子中,标签词起着“锚点”的作用:(1)语义信息在浅层计算层处理过程中聚合到标签词的表达中,(2)标签词中聚合的信息为LLM的最终预测提供参考。基于这些见解,作者提出了一个锚点重新加权方法来改进ICL性能,一个示范压缩技术来加快推理,以及一个用于诊断GPT2-XL中的ICL错误的分析框架。

8.Can We Edit Factual Knowledge by In-Context Learning?

标题:我们能通过词内学习编辑事实知识吗?

内容:这篇论文探究了通过词内学习编辑语言模型中的事实知识。作者进行了全面的实证研究,结果显示词内知识编辑可以在不更新参数的情况下实现知识编辑,并取得与基于梯度的方法相当的成功率。与基于梯度的方法相比,词内知识编辑具有副作用更少的优势,包括对不相关事实过度编辑更少,以及对先前知识遗忘更少。该方法也表现出很好的可扩展性。

9.Beyond Labels: Empowering Human with Natural Language Explanations through a Novel Active-Learning Architecture

标题:超越标签:通过新颖的主动学习架构用自然语言解释赋能人类

内容:这篇论文提出一个新的主动学习架构,不仅提供分类标签,还同时生成自然语言解释来协助人类用户。该架构包含解释生成模块和数据选择模块。结果显示,与仅提供标签相比,该架构生成的自然语言解释可显著提高人类的分类准确率,特别是在少样本场景下。

10.Large Language Model Is Not a Good Few-shotInformation Extractor but a Good Reranker for HardSamples

标题:大语言模型不是一个好的少样本信息提取器,但是一个困难样本的好重排器

内容:这篇论文研究了大语言模型在少样本信息提取任务上的表现。大语言模型本身并不是很好的少样本信息提取器,但它们擅长对难样本进行重排。因此,作者提出了一种混合方法,使用小型预训练语言模型进行过滤,然后用大语言模型重排难样本。实验表明,这种方法可以在信息提取任务上取得显著改进,而且成本可控。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“EMNLP”获取论文+代码合集

码字不易,欢迎大家点赞评论收藏!

这篇关于EMNLP 2023 录用论文公布,速看NLP各领域最新SOTA方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/205398

相关文章

MySQL 存储引擎 MyISAM详解(最新推荐)

《MySQL存储引擎MyISAM详解(最新推荐)》使用MyISAM存储引擎的表占用空间很小,但是由于使用表级锁定,所以限制了读/写操作的性能,通常用于中小型的Web应用和数据仓库配置中的只读或主要... 目录mysql 5.5 之前默认的存储引擎️‍一、MyISAM 存储引擎的特性️‍二、MyISAM 的主

Java实现本地缓存的常用方案介绍

《Java实现本地缓存的常用方案介绍》本地缓存的代表技术主要有HashMap,GuavaCache,Caffeine和Encahche,这篇文章主要来和大家聊聊java利用这些技术分别实现本地缓存的方... 目录本地缓存实现方式HashMapConcurrentHashMapGuava CacheCaffe

无法启动此程序因为计算机丢失api-ms-win-core-path-l1-1-0.dll修复方案

《无法启动此程序因为计算机丢失api-ms-win-core-path-l1-1-0.dll修复方案》:本文主要介绍了无法启动此程序,详细内容请阅读本文,希望能对你有所帮助... 在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是"api-ms-win-core-path-l1-1-0.dll丢失

Python多进程、多线程、协程典型示例解析(最新推荐)

《Python多进程、多线程、协程典型示例解析(最新推荐)》:本文主要介绍Python多进程、多线程、协程典型示例解析(最新推荐),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定... 目录一、multiprocessing(多进程)1. 模块简介2. 案例详解:并行计算平方和3. 实现逻

利用Python实现可回滚方案的示例代码

《利用Python实现可回滚方案的示例代码》很多项目翻车不是因为不会做,而是走错了方向却没法回头,技术选型失败的风险我们都清楚,但真正能提前规划“回滚方案”的人不多,本文从实际项目出发,教你如何用Py... 目录描述题解答案(核心思路)题解代码分析第一步:抽象缓存接口第二步:实现两个版本第三步:根据 Fea

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

MySQL精准控制Binlog日志数量的三种方案

《MySQL精准控制Binlog日志数量的三种方案》作为数据库管理员,你是否经常为服务器磁盘爆满而抓狂?Binlog就像数据库的“黑匣子”,默默记录着每一次数据变动,但若放任不管,几天内这些日志文件就... 目录 一招修改配置文件:永久生效的控制术1.定位my.cnf文件2.添加核心参数不重启热更新:高手应

Spring Boot集成SLF4j从基础到高级实践(最新推荐)

《SpringBoot集成SLF4j从基础到高级实践(最新推荐)》SLF4j(SimpleLoggingFacadeforJava)是一个日志门面(Facade),不是具体的日志实现,这篇文章主要介... 目录一、日志框架概述与SLF4j简介1.1 为什么需要日志框架1.2 主流日志框架对比1.3 SLF4

MySQL中like模糊查询的优化方案

《MySQL中like模糊查询的优化方案》在MySQL中,like模糊查询是一种常用的查询方式,但在某些情况下可能会导致性能问题,本文将介绍八种优化MySQL中like模糊查询的方法,需要的朋友可以参... 目录1. 避免以通配符开头的查询2. 使用全文索引(Full-text Index)3. 使用前缀索

Python解决雅努斯问题实例方案详解

《Python解决雅努斯问题实例方案详解》:本文主要介绍Python解决雅努斯问题实例方案,雅努斯问题是指AI生成的3D对象在不同视角下出现不一致性的问题,即从不同角度看物体时,物体的形状会出现不... 目录一、雅努斯简介二、雅努斯问题三、示例代码四、解决方案五、完整解决方案一、雅努斯简介雅努斯(Janu