[摘要生成]Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward

本文主要是介绍[摘要生成]Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

arxiv 2020
论文链接:https://arxiv.org/pdf/2005.01159.pdf
github链接:https://github.com/luyang-huang96/GraphAugmentedSum
看具体内容,直接跳转链接。本文只从个人角度出发看本篇paper。

疑惑

  1. 数据集:

    NYT:training, validation, and test sets 588909, 32716, and 32703 samples
    CNN/Daily:training, validation, and test sets 287188, 13367, and 11490 samples

  2. graph如何构建?

    利用了OpenIE

  3. graph如何应用?

    两种形式:1)捕获文档级别的交互 ;2)段落内的交互和段落之间主题的转移。这两个合起来是graph encoder部分。
    首次在ABS任务中利用了图神经网络的方式接入graph,之前。

  4. entity linking工具?

    第三章指出:文章未用到EL,文章的方法是用CoreNLP先解决共指问题,然后用OpenIE获取triple,用triple直接构建document-level的图。

  5. 如何测评?

    Rouge测评

  6. 具体模型设置?具体参考

    seq部分:RoBERTa 最后一层 + BiLSTM
    graph 部分分了两种:捕获全局信息的DocGraph和捕获段落之内以之间的主题迁移的SegGraph
    加入了copy机制

  7. 为什么非要添加entity?

    能够捕获段落之间的交互和段落之间的主题转移。“graph-structured encoder to maintain global context and local characteristics of entities

  8. 如果KG能在输出摘要中引入更加丰富的信息话,如何更合理的度量?
  9. 文章的出发点中缺乏semantic interpretation是什么意思?
  10. 输入/输出的长度是多少,输入短的话KG是否能用?
  11. 文章指出抽取式摘要会产生unfaithful content和nearextractive summaries问题(非常合理),如何解决的?
  12. 效果比较BERTSum (Liu and Lapata, 2019), UniLM (Dong et al., 2019), and BART (Lewis et al., 2019)更好。
  13. 实验结果说 "our models generate more informative summaries with less unfaithful errors than their counterparts without the graph encoder. " 是否有解释?
  14. 文章指出了rouge测评的问题,这是众所周知的,但是是否提出的更好的测评方案呢?
  15. training objective?

    除了平常见到的极大似然函数 L s e q L_{seq} Lseq还另外加了一个Node Salience Labeling L m a s k L_{mask} Lmask,即最终的目标函数是:
    L m l = L s e q + L m a s k L_{ml} =L_{seq} + L_{mask} Lml=Lseq+Lmask

  16. 文章提到"a novel multi-choice cloze reward to drive the model to acquire semantic understanding over the input"是什么意思?

    完型填空的方式促进entity之间的交互,通过强化学习实现。

模型:

在这里插入图片描述

个人想法

直接从表格看效果都不如BART,且模型加入了reward机制后非常复杂,那么引用的意义?

可留意的参考文献:

  • STRUCTURED NEURAL SUMMARIZATION
  • 图结构在抽取式摘要中的应用:TextRank、Lexrank
  • Tan et al. (2017) 利用图结构去确定重要的句子。
  • Fernandes et al. (2019) 图结构
  • Fan et al. (2019) 图结构,OpenIE
  • Beck et al. (2018) 为了减少模型的参数,为predicates创建nodes?
  • openIE使用

这篇关于[摘要生成]Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/313565

相关文章

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Python使用python-pptx自动化操作和生成PPT

《Python使用python-pptx自动化操作和生成PPT》这篇文章主要为大家详细介绍了如何使用python-pptx库实现PPT自动化,并提供实用的代码示例和应用场景,感兴趣的小伙伴可以跟随小编... 目录使用python-pptx操作PPT文档安装python-pptx基础概念创建新的PPT文档查看

在ASP.NET项目中如何使用C#生成二维码

《在ASP.NET项目中如何使用C#生成二维码》二维码(QRCode)已广泛应用于网址分享,支付链接等场景,本文将以ASP.NET为示例,演示如何实现输入文本/URL,生成二维码,在线显示与下载的完整... 目录创建前端页面(Index.cshtml)后端二维码生成逻辑(Index.cshtml.cs)总结

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

SQLServer中生成雪花ID(Snowflake ID)的实现方法

《SQLServer中生成雪花ID(SnowflakeID)的实现方法》:本文主要介绍在SQLServer中生成雪花ID(SnowflakeID)的实现方法,文中通过示例代码介绍的非常详细,... 目录前言认识雪花ID雪花ID的核心特点雪花ID的结构(64位)雪花ID的优势雪花ID的局限性雪花ID的应用场景

Django HTTPResponse响应体中返回openpyxl生成的文件过程

《DjangoHTTPResponse响应体中返回openpyxl生成的文件过程》Django返回文件流时需通过Content-Disposition头指定编码后的文件名,使用openpyxl的sa... 目录Django返回文件流时使用指定文件名Django HTTPResponse响应体中返回openp

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2