SIEF——Document-Level Relation Extraction with Sentences Importance Estimation and Focusing
针对文档级关系抽取任务提出一个通用框架——引入句子重要性得分这一概念
- 摘要
- 贡献
- 方法
- 句子重要性评估
- 句子聚焦损失
- 实验结果
- 结论
摘要
文档级关系抽取任务旨在从一个多句子的文档中抽取出实体对的关系。最近的研究通常采用基于序列或图形的模型来表示文档,以预测所有实体对的关系。然而,我们发现这样一个模型并不健壮而且表现出奇怪的行为:当一整篇测试文档作为输入到模型中,它可以预测正确,但当删除非证据语句时,它会出错。因此,我们提出一个句子重要性评估和句子聚焦损失框架用于DocRE——我们设计了一个句子重要性得分和句子聚焦损失来鼓励模型去关注证据句子。在两个主要的数据集上实验结果展现了我们的SIEF框架不仅提升了整体性能,而且使文档及关系抽取模型更加健壮。更重要的是,SIEF是一个通用框架,当和其他基本模型结合后表现出有效性。
贡献
提出的SIEF是一个通用框架,可以与各种base-model结合并且是有效的,进一步增加了模型的可解释性。
方法
整体框架图:
句子重要性评估
我们估计每个句子对于特定实体对的重要性。得分较低的判决将被视为非证据,原则上可以在不改变DocRE预测的情况下删除。我们提出了一个基于DocRE预测的句子重要性得分,该预测包含或不包含所讨论的句子。我们的观察是,关系提取任务通常对证据来说是单调的,即(非严格)更多的关系将被预测为更多的句子。如果我们删除一个句子,并且预测的关系概率降低,那么这个句子很可能就是证据。如果预测的概率没有改变,那么这个句子很可能是没有证据的。此外,当句子被删除时,预测概率有时会增加,在这种情况下,DocRE模型是不可靠的,因为这违反了单调性。 公式如下:
作者通过计算两个概率——分别为基于原始文档的分类概率Pij和删除掉第n个句子后的文档输入所得到分类概率,再通过计算KL散度其中一项得到第n句的重要性得分gij,作者最后引入一个超参数阈值β来评估该句话是evidence sentence or not。
句子聚焦损失
在这一块,作者通过引入sentence focusing loss来鼓励模型在输入文档为完整文档和去掉证据句的文档两种情况下所得到的预测结果保持一致。句子聚焦损失公式如下:
这个并不是最终公式,作者对此稍作改变,,选择一次删除一个non-evi sentence,具体原因和最终公式详见原文。
实验结果
由于作者所提出的框架为一个通用框架,可以应用到诸多base模型上,本文作者选择BiLSTM,Bert-base,HeterGSAN,GAIN作为基础模型,数据集采用通用数据集DocRED,以及对话数据集DialogRE。其中对于数据集DocRED作者用Two Phase,LSR,Reconstructor,DRN,ATLOP,DocuNet来做比较。作者分别利用Glove和Bert-base做嵌入,并都进行了对比且取得了由于比较模型的效果。
结论
作者在本文中提出了一种新的句子信息评估和聚焦(SIEF)方法,用于文档关系抽取(DocRE)。设计了一个句子重要性得分和一个句子聚焦损失,以鼓励模型关注证据句子。提出的SIEF是一个通用框架,可以与各种基本DocRE模型相结合。实验结果表明,SIEF在不同领域都能持续地提高基础模型的性能,并提高了DocRE模型的鲁棒性。
SIEF——Document-Level Relation Extraction with Sentences Importance Estimation and Focusing相关推荐
- 文档级关系抽取:QIUXP:DORE: Document Ordered Relation Extraction based on Generative Framework
DORE: Document Ordered Relation Extraction based on Generative Framework 文档级关系抽取是从整篇文档中抽取出三元组.更难,但也很 ...
- 论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction?
论文解读:Are Noisy Sentences Useless for Distant Supervised Relation Extraction? 注:本文章初次编辑为2020年9月2日,最新编 ...
- 20-Joint entity and relation extraction based on a hybrid neural network(LSTM-ED+CNN),考虑长距离的实体标签之间的关
文章目录 abstract 1.introduction 2.相关工作 2.1. Named entity recognition 2.2. Relation classification 2.3 联合 ...
- 【论文】Awesome Relation Extraction Paper(关系抽取)(PART IV)
0. 写在前面 不想写 1. Neural Relation Extraction with Multi-lingual Attention(Lin/ ACL2017) 这篇文章是在Lin 2016年 ...
- Relation Extraction 关系抽取综述
文章目录 往期文章链接目录 Information Extraction v.s. Relation Extraction Existing Works of RE Pattern-based Met ...
- 关系抽取概述及研究进展Relation Extraction Progress
关系抽取的概述及研究进展 关系抽取任务概述 关系抽取的定义 关系抽取的公开的主流评测数据集 ACE 2005 SemiEval 2010 Task8 Dataset: NYT(New York Tim ...
- 每天读一篇论文2--Document-level Relation Extraction with Cross-sentence Reasoning Graph
摘要: 关系抽取(RelationExtraction,RE)已经从句子级发展到文档级,需要聚集文档信息并使用实体和提及进行推理.现有研究将具有相似表示的实体节点和提及节点放在文档级图中,其复杂的边会 ...
- 文献学习02-Effective Modeling of Encoder-Decoder Architcture for Joint Entity and Relation Extraction
论文信息 (1)题目:Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extracti ...
- 关系抽取论文总结(relation extraction)不断更新
2000 1.Miller, Scott, et al. "A novel use of statistical parsing to extract information from te ...
最新文章
- Windows Server 2012正式版RDS系列⑤
- debian 升级glibc
- OpenCv 如何对图像的像素进行操作
- c语音 udp最大长度_c语言udp自定义头文件 网络通信程序
- tensorflow打印模型图_[深度学习]TensorRT加速tensorflow实例
- 字节跳动攻城狮: 我整理了很久的Python面试指南,请查收!
- 运用大数据助力大发展
- java环境变量_Java的下载及环境变量的配置
- 3904三极管是什么功能_什么是放大器。它有什么特性
- pandas mysql insert_python – Pandas将数据插入MySQL
- c 按输入的字母来输出对应效果
- 软件项目需求开发过程实践之软件需求说明书
- 烟雾传感器应用程序linux,各种类型烟雾传感器的应用及原理解析
- oracle收集直方图,Oracle的直方图
- 用SQL实现取员工日工作量和月工作量
- oracle11g在linux7的静默安装脚本
- 批量修改文件名,图文教学,2分钟简单学会
- Java游戏服务器架构的并发问题及解决方案
- vue中的表单数据提交
- 【openstack一键安装与部署】
热门文章
- 中央网信办等四部门发布《数字乡村标准体系建设指南》,全面规范农业农村数据标准
- zmqclient的稳定接收(意外断开处理)
- 百宝云常用运算符语法解析
- 文件操作---基于python
- 极光尔沃:探讨3d打印技术在汽车制造业的机遇与挑战
- Delphi WebBrowser 去除滚动条和边框
- the input device is not a TTY. If you are using mintty, try prefixing the command with ‘winpty’ 解决方案
- 互联网药库试水:北京今年展开互联网虚拟药库
- 【数据结构】哈夫曼树及哈夫曼编码
- 阿里7年技术员:SQL Server 下载安装教程