想法

最近在整理dee相关的文章,这里做一些整理,方便后续查阅。本文主要介绍3篇DEE相关的文章,主要想介绍核心的动机和创新点,对于细节,可以参看一下几个链接:
https://blog.csdn.net/u011150266/article/details/118079286
Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker
https://blog.csdn.net/o11oo11o/article/details/121583659
Document-level Event Extraction via Parallel Prediction Networks
https://blog.csdn.net/o11oo11o/article/details/120080908
Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event
其中 doc2EDAG 是开山之作,另外2篇是在doc2edag基础上做的一些优化和提升。

论文和核心创新点

动机 (dee vs see)

arguments-scattering and multi-events.
相对于句子级别的事件抽取,篇章级别事件抽取的主要问题是 论元分散,一篇文章多个事件(多标签现象)。

创新点

doc2EDAG


个人认为的主要价值:第一次运用篇章级事件抽取并取得sota效果。
核心思路:运用transformer进行篇章级句子、实体encoding,并设计将事件、实体表格表转换成edag生成和预测过程。
主要贡献: 第一次考虑document-level,第一次设计一个完整的方案且取得当时的sota效果。

DEE-PPN Document-level Event Extraction via Parallel Prediction Networks


核心思路: 和doc2edag框架雷同,红框是差异性的地方。效果比doc2edag好。主要差异点是使用了多粒度的decoder,分别对实体、事件role 进行decoder,再综合decoder,最后接入下游预测任务,同时引用matching loss(很偏数学优化,还没看懂),对最终预测m个事件,实际k个事件这种任务进行优化,论文中说可以达到全局最优。

DEE-GIT Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker


核心思路:也是encoder-decoder的框架。个人认为核心点是在encoder中引入了图谱相关的信息,并进行graph-embeding用于后续的Types Detection and Records Extraction。这里引入的图结构是:node:句子和实体 边:句子1-句子2 、句子1-实体1、实体1-实体2(同一句话 Inter-Mention-Mention Edge)、实体1-实体1(不同句话出现的相同实体 Inter-Mention-Mention Edge)。
整体思路清晰,创新性的融合了图结构信息进入模型,让系统能更好的学习句子实体间的关系,但是疑问在于这种信息是否在强大的注意力机制里已经学习到了?这种图的embed相对transformer刻画的embed真的是一种补充还是多余?在消融实验中已经有答案说,去掉图整体会掉2个点的指标,但还是怀疑图在这里是否真的能起到极其重要的作用?或者这个图embed刚好和当前的任务比较匹配,通过图embed刚好学习到了这一特性?
待后续看代码做完实验再进行论证。

代码分析

三篇论文都是基于doc2edag代码进行设计的。
暂时可以考虑先参看GIT代码进行后续的详细分析。

效果对比

dee-pnn

dee-git


GIT整体效果和pnn接近
但是没有实体识别的效果 edd任务核心是识别事件类型 和识别argument
ace 事件检测

个人看法

待更新

Document-level Event Extraction (DEE)综述相关推荐

  1. 论文阅读:A Survey of Open Domain Event Extraction 综述:开放域事件抽取

    A Survey of Open Domain Event Extraction 综述:开放域事件抽取 目录 A Survey of Open Domain Event Extraction 综述:开 ...

  2. 论文阅读:A Survey of Textual Event Extraction from Social Networks 综述:从社交媒体中抽取文本事件

    A Survey of Textual Event Extraction from Social Networks 综述:从社交媒体中抽取文本事件 目录 A Survey of Textual Eve ...

  3. 【论文阅读】Exploring Sentence Community for Document-Level Event Extraction EMNLP2021

    目录 摘要 简介 本文贡献: 模型方法 篇章图表示 句子社区检测 事件类型和论元分类 实验和结果 总结 摘要 已有的方法基于sequential modeling(序列模型),忽视长文章中的复杂逻辑结 ...

  4. [中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab

    [中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab ...

  5. DE-PPN:Document-level Event Extraction via Parallel Prediction Networks论文解读

    Document-level Event Extraction via Parallel Prediction Networks paper:Document-level Event Extracti ...

  6. 论文笔记 NLPCC 2016|A Convolution BiLSTM Neural Network Model for Chinese Event Extraction

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 触发词标记 3.1.1 单词级别模型 3.1.2 字符级别模型 3.2 论元标记 4 实验 4.1 触发词标记 4.2 ...

  7. 事件抽取(event extraction)

    前言: 事件抽取是由触发词和事件元素组成,目前来看,包括了提示学习的方法和传统方法 Execute 事件由"执行"一词触发,该事件包含三个参数角色,包括执行执行的代理(印度尼西亚) ...

  8. 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...

  9. Multimedia Event Extraction From News With a Unified Contrastive Learning Framework论文解读

    Multimedia Event Extraction From News With a Unified Contrastive Learning Framework 论文:Multimedia Ev ...

最新文章

  1. Programming C# 学习笔记(二) 出发:“Hello World”
  2. python去除英文字符中的数字和标点符号
  3. ajax提交到mysql_利用ajax的方式来提交数据到后台数据库及交互功能
  4. Appium base knowledge
  5. android listview 开发,android开发之ListView实现
  6. 线性系统的基本理论与运算
  7. 1106 Lowest Price in Supply Chain(甲级)
  8. 关于K8s技术架构的几个问题
  9. matlab自带同步电机数学模型,永磁同步电机的数学模型及方程
  10. [抄]外部奖励对内在动机的侵蚀
  11. ubuntu清理磁盘空间的几个技巧
  12. 国家统计局可以获取到全国5级行政区域数据
  13. 用SPSS求均值 方差 标准差小例题
  14. Android通知渠道
  15. in comment after two dashes (--) next character must be > not (position: START_TAG seen ...
  16. oracle gi和gc的区别,别装了,你肯定对GI有什么误解,这才是争取的区别不要弄错...
  17. 仿京东 分类 购物车 + 定位
  18. 强迫症的 LaTeX 学习笔记
  19. Linux系统安全及应用-grub菜单启用密码限制10
  20. matlab神经网络应用设计,神经网络及其matlab实现

热门文章

  1. Python练习笔记 - - 彩色宝石项链
  2. 免费数据库(SQLite、Berkeley DB、PostgreSQL、MySQL、Firebird、mSQL、MSDE、DB2 Express-C、Oracle XE)...
  3. 从事大数据行业有多少种职位,主要的职责是什么?
  4. 气雾培智能管理计算机,丽水市农林院农业智能化快繁中心,气雾栽培,气雾培,鸟巢温室,克隆,植物克隆,克隆技术,植物非试管快繁技术,鱼菜共生,丽水农林院...
  5. 监控远程桌面连接并通过python发送提醒邮件
  6. Android自带语音播报
  7. 自定义DatePicker修改默认颜色和字体,选中颜色和字体,分割线
  8. 三层网络PPS极限测试
  9. lol帧数不稳定是服务器问题吗,英雄联盟fps忽高忽低怎么办_英雄联盟fps不稳定的解决方法...
  10. 大厂程序员反向输出凡尔赛的一天,⚡“夺笋啊”⚡