作 者:崔金满
单 位:燕山大学



Abstract

在现实世界中,经常存在一个句子中包含多个事件的现象,提取多个事件比提取单个事件要困难,本文提出一种联合多事件提取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的图卷积网络来对图信息进行建模,从而联合抽取多个事件触发器和元素。

Introduction

在事件抽取中,一个句子中可能同时出现多个事件,由于这些不同类型的事件之间通常是相互关联的,导致提取困难。比如,“He left the company, and planned to go home directly.”,触发词left可以触发transport和end-position事件。但是,如果考虑到由触发词“go”触发的事件,就能更好的判断这是一个transport事件。
现有方法存在的问题: 基于序列标注的模型很难捕获句子中单词间的长期依赖关系,基于特征的模型需要耗费大量人力,而且特征的选择也会在很大程度上影响模型的性能。此外,这两类方法都不能充分对事件之间的关联建模。

一种直观的方法是引入由句法依赖树等语言资源表示的shortcut arcs,通过较少的转换将信息流从一个点转换的目标节点,这种方法可以减少同一个句子中,从一个事件触发器跳到另一个事件触发器的跳数。如上图,由触发词killed触发的Die事件到触发词barrage触发的attack事件,按照句子本身的顺序从killed到barrage需要6跳,而如果根据句法依存树只需要3跳(图中绿色框)。基于此,本文提出一种联合事件抽取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的GCN来对图信息进行建模。
贡献:① 提出一种新的基于句法结构的联合事件抽取框架,增强了信息流,缓解了多个事件同时出现在同一个句子中的现象。② 提出一种自注意力机制来聚合信息,保证事件之间的关联。

Approach

模型包含四个模块:(i)用向量表示句子的单词表示模块;(ii)句法图卷积神经网络模块;(iii)基于自注意力的触发器分类模块,用来捕获多个事件之间的关联;(iv)参数分类,预测每个提及实体在特定类型的候选事件中所扮演的角色。

Word Representation


wiw_iwi​ 词嵌入:Glove
wiw_iwi​ POS-tagging labe嵌入:查找初始化POS-tagging lable嵌入表
​​​​​​​wiw_iwi​ 位置嵌入:将​​​​​​​wiw_iwi​与当前词的相对距离通过随机初始化的位置嵌入表中查找,编码成实值向量
wiw_iwi​​​​​​​​ 的实体类型标签嵌入向量:使用BIO对句子中的实体提及进行标注,然后通过查找嵌入表得到实值向量。
基于以上步骤可以将句子转化为向量形式,并作为下一模块的输入。

Syntactic Graph Convolution Network​​​​​​​


无向图GGG中的节点表示句子中的token,边(vi,vj)(v_i, v_j)(vi​,vj​)表示从token wiw_iwi​到token wjw_jwj​的有向的 syntactic arc,标签为K(wi,wj)K(w_i, w_j)K(wi​,wj​),为了使信息反流,加入反向边(vj,vi)(v_j, v_i)(vj​,vi​),标签为K′(wi,wj)K'(w_i, w_j)K′(wi​,wj​),此外,还添加了自环,标签为loop。
在语法图卷积网络模块的第kkk层,可以通过以下方式计算节点vvv的图卷积向量

在句法依赖树中为句子生成shortcut arcs,由于语法关系类别数太多,所以将原来的类别进行简化:

对于噪声问题,在边上引入gate机制,为每个边计算权重:

故图卷积向量计算如下:

由于GCN的堆叠层可以以k跳为单位对信息进行建模,而有时两个触发词之间的距离小于kkk,导致信息过度传播,采用hightway units,并进行如下线性变换:

由于DCN的层数限制了捕获图中局部信息的能力,所以使用Bi-LSTM编码单词表示,并作为第一层GCN的输入。

Self-Attention Trigger Classification

为了捕获句子中触发词之间的关联,引入自注意力机制来聚合信息,保证多事件之间的关联,并通过一个全连接层来实现分类。

Argument Classification

对于每一个entity-trigger对,我们通过一个全连接的神经网络来预测元素角色,从而得到第jjj个实体在第iii个触发词所触发事件中的角色。

Experiment

dataset:ACE2005
result:

抽取多事件的实验结果:

论文笔记:Jointly Multiple Events Extraction via Attention-based GraphInformation Aggregation相关推荐

  1. 【论文笔记】Neural Relation Extraction with Multi-lingual Attention

    一.概要   该paper发于ACL2017上,作者主要基于关系事实通常在各种语言中存在某种模式表达,并且不同语言之间的模式是不同的这两个动机,针对于当前存在的单语言关系抽取的方法,从而存在忽略不同语 ...

  2. 【论文笔记】Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized

    论文 论文题目:Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personaliz ...

  3. 【论文笔记】DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection

    论文 论文题目:DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection 收录: ...

  4. 论文笔记(八):360 VR Based Robot Teleoperation Interface for Virtual Tour

    360 VR Based Robot Teleoperation Interface for Virtual Tour 文章概括 摘要 1. 介绍 2. 方法和系统设计 2.1 系统结构 2.2 远程 ...

  5. 论文笔记《Combining Events and Frames Using Recurrent Asynchronous Multimodal Networks for Monocular ...》

    最近在学习DVS相关的算法,读到这篇把event和frame结合的论文,找到了他们在github上开源的代码. 然而这个work的开源并不完全,包括这篇work前面的<Learning Mono ...

  6. 论文笔记:WWW 2019 Heterogeneous Graph Attention Network

    1.前言 论文链接:https://arxiv.org/pdf/1903.07293v1.pdf github:https://github.com/Jhy1993/HAN 图神经网络作为一种基于深度 ...

  7. 论文笔记 EMNLP 2020|Event Extraction by Answering (Almost) Natural Questions

    文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Event Extraction by Answering (Almost) Natural Questions ...

  8. 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning

    文章目录 论文概况 摘要 1 介绍 2 方法 2.1 特征表示 2.1.1 蛋白质的图表示 2.1.3 边特征表示 2.2 EGAT的结构 2.2.2 边缘聚合图关注层 2.2.3 预测概率 2.2. ...

  9. 论文笔记:Dual Contrastive Loss and Attention for GANs

    目录 一.Dual Contrastive Loss and Attention for GANs 是什么? 1.损失函数 2.网络结构 3.总结 二.这项工作主要做了什么? 1.双重对比损失 2.生 ...

最新文章

  1. 算法----合并两个有序链表
  2. 我的百度研发面经整合版(智能云,核心搜索) | 掘金技术征文
  3. flash mini播放器
  4. .NET开发者常会忽略的几个错误
  5. 生产环境遇到难题,你是如何解决的?
  6. 测试需求分析第一部分
  7. 分形吧matlab,Matlab在分形模拟上的一些应用
  8. 台式电脑计算机怎么打不开怎么回事,为什么电脑自带的软件打不开怎么办
  9. 华为手机助手上架流程_华为手机助手导入音乐文件在哪里看 详细步骤介绍
  10. win11家庭版 安卓虚拟机
  11. 激荡三十年(珍藏图文版)
  12. 腾讯低代码平台定价策略公开了
  13. 草莓电吉他音源 Orange Tree Samples Evolution Strawberry Kontakt
  14. 经典:统计字符串中汉字,英文,数字,特殊符号个数
  15. 张小龙:从FoxMail到WeChat
  16. 如何用PS做出一张海报
  17. 秋季出生的宝宝这样起名,全班同学都羡慕。
  18. 面试测试岗想拿13K,HR说你最多值10K,教你怼死HR?
  19. Python爬虫:获取糗事百科笑话
  20. Android的界面设计规范

热门文章

  1. 服务器如何通过FTP传输文件(详细图文教程)
  2. _THROW 何解?
  3. Access 数据库
  4. html5建筑图插件,13个JavaScript图表图形绘制插件
  5. MySQL存储过程--菜鸟教程
  6. 淘宝搜索关键词 关键词的种类 根据宝贝权重选词 判断是否为假词
  7. 向下整取(Floor)和向上整取(Ceiling)
  8. 反汇编-植物大战僵尸
  9. 国外区块链技术部分应用场景(及其一周内相关资讯汇总)
  10. macOS开发 开机自动启动