论文笔记:Jointly Multiple Events Extraction via Attention-based GraphInformation Aggregation
作 者:崔金满
单 位:燕山大学
Abstract
在现实世界中,经常存在一个句子中包含多个事件的现象,提取多个事件比提取单个事件要困难,本文提出一种联合多事件提取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的图卷积网络来对图信息进行建模,从而联合抽取多个事件触发器和元素。
Introduction
在事件抽取中,一个句子中可能同时出现多个事件,由于这些不同类型的事件之间通常是相互关联的,导致提取困难。比如,“He left the company, and planned to go home directly.”,触发词left可以触发transport和end-position事件。但是,如果考虑到由触发词“go”触发的事件,就能更好的判断这是一个transport事件。
现有方法存在的问题: 基于序列标注的模型很难捕获句子中单词间的长期依赖关系,基于特征的模型需要耗费大量人力,而且特征的选择也会在很大程度上影响模型的性能。此外,这两类方法都不能充分对事件之间的关联建模。
一种直观的方法是引入由句法依赖树等语言资源表示的shortcut arcs,通过较少的转换将信息流从一个点转换的目标节点,这种方法可以减少同一个句子中,从一个事件触发器跳到另一个事件触发器的跳数。如上图,由触发词killed触发的Die事件到触发词barrage触发的attack事件,按照句子本身的顺序从killed到barrage需要6跳,而如果根据句法依存树只需要3跳(图中绿色框)。基于此,本文提出一种联合事件抽取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的GCN来对图信息进行建模。
贡献:① 提出一种新的基于句法结构的联合事件抽取框架,增强了信息流,缓解了多个事件同时出现在同一个句子中的现象。② 提出一种自注意力机制来聚合信息,保证事件之间的关联。
Approach
模型包含四个模块:(i)用向量表示句子的单词表示模块;(ii)句法图卷积神经网络模块;(iii)基于自注意力的触发器分类模块,用来捕获多个事件之间的关联;(iv)参数分类,预测每个提及实体在特定类型的候选事件中所扮演的角色。
Word Representation
wiw_iwi 词嵌入:Glove
wiw_iwi POS-tagging labe嵌入:查找初始化POS-tagging lable嵌入表
wiw_iwi 位置嵌入:将wiw_iwi与当前词的相对距离通过随机初始化的位置嵌入表中查找,编码成实值向量
wiw_iwi 的实体类型标签嵌入向量:使用BIO对句子中的实体提及进行标注,然后通过查找嵌入表得到实值向量。
基于以上步骤可以将句子转化为向量形式,并作为下一模块的输入。
Syntactic Graph Convolution Network
无向图GGG中的节点表示句子中的token,边(vi,vj)(v_i, v_j)(vi,vj)表示从token wiw_iwi到token wjw_jwj的有向的 syntactic arc,标签为K(wi,wj)K(w_i, w_j)K(wi,wj),为了使信息反流,加入反向边(vj,vi)(v_j, v_i)(vj,vi),标签为K′(wi,wj)K'(w_i, w_j)K′(wi,wj),此外,还添加了自环,标签为loop。
在语法图卷积网络模块的第kkk层,可以通过以下方式计算节点vvv的图卷积向量
在句法依赖树中为句子生成shortcut arcs,由于语法关系类别数太多,所以将原来的类别进行简化:
对于噪声问题,在边上引入gate机制,为每个边计算权重:
故图卷积向量计算如下:
由于GCN的堆叠层可以以k跳为单位对信息进行建模,而有时两个触发词之间的距离小于kkk,导致信息过度传播,采用hightway units,并进行如下线性变换:
由于DCN的层数限制了捕获图中局部信息的能力,所以使用Bi-LSTM编码单词表示,并作为第一层GCN的输入。
Self-Attention Trigger Classification
为了捕获句子中触发词之间的关联,引入自注意力机制来聚合信息,保证多事件之间的关联,并通过一个全连接层来实现分类。
Argument Classification
对于每一个entity-trigger对,我们通过一个全连接的神经网络来预测元素角色,从而得到第jjj个实体在第iii个触发词所触发事件中的角色。
Experiment
dataset:ACE2005
result:
抽取多事件的实验结果:
论文笔记:Jointly Multiple Events Extraction via Attention-based GraphInformation Aggregation相关推荐
- 【论文笔记】Neural Relation Extraction with Multi-lingual Attention
一.概要 该paper发于ACL2017上,作者主要基于关系事实通常在各种语言中存在某种模式表达,并且不同语言之间的模式是不同的这两个动机,针对于当前存在的单语言关系抽取的方法,从而存在忽略不同语 ...
- 【论文笔记】Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized
论文 论文题目:Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personaliz ...
- 【论文笔记】DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection
论文 论文题目:DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection 收录: ...
- 论文笔记(八):360 VR Based Robot Teleoperation Interface for Virtual Tour
360 VR Based Robot Teleoperation Interface for Virtual Tour 文章概括 摘要 1. 介绍 2. 方法和系统设计 2.1 系统结构 2.2 远程 ...
- 论文笔记《Combining Events and Frames Using Recurrent Asynchronous Multimodal Networks for Monocular ...》
最近在学习DVS相关的算法,读到这篇把event和frame结合的论文,找到了他们在github上开源的代码. 然而这个work的开源并不完全,包括这篇work前面的<Learning Mono ...
- 论文笔记:WWW 2019 Heterogeneous Graph Attention Network
1.前言 论文链接:https://arxiv.org/pdf/1903.07293v1.pdf github:https://github.com/Jhy1993/HAN 图神经网络作为一种基于深度 ...
- 论文笔记 EMNLP 2020|Event Extraction by Answering (Almost) Natural Questions
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Event Extraction by Answering (Almost) Natural Questions ...
- 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning
文章目录 论文概况 摘要 1 介绍 2 方法 2.1 特征表示 2.1.1 蛋白质的图表示 2.1.3 边特征表示 2.2 EGAT的结构 2.2.2 边缘聚合图关注层 2.2.3 预测概率 2.2. ...
- 论文笔记:Dual Contrastive Loss and Attention for GANs
目录 一.Dual Contrastive Loss and Attention for GANs 是什么? 1.损失函数 2.网络结构 3.总结 二.这项工作主要做了什么? 1.双重对比损失 2.生 ...
最新文章
- 算法----合并两个有序链表
- 我的百度研发面经整合版(智能云,核心搜索) | 掘金技术征文
- flash mini播放器
- .NET开发者常会忽略的几个错误
- 生产环境遇到难题,你是如何解决的?
- 测试需求分析第一部分
- 分形吧matlab,Matlab在分形模拟上的一些应用
- 台式电脑计算机怎么打不开怎么回事,为什么电脑自带的软件打不开怎么办
- 华为手机助手上架流程_华为手机助手导入音乐文件在哪里看 详细步骤介绍
- win11家庭版 安卓虚拟机
- 激荡三十年(珍藏图文版)
- 腾讯低代码平台定价策略公开了
- 草莓电吉他音源 Orange Tree Samples Evolution Strawberry Kontakt
- 经典:统计字符串中汉字,英文,数字,特殊符号个数
- 张小龙:从FoxMail到WeChat
- 如何用PS做出一张海报
- 秋季出生的宝宝这样起名,全班同学都羡慕。
- 面试测试岗想拿13K,HR说你最多值10K,教你怼死HR?
- Python爬虫:获取糗事百科笑话
- Android的界面设计规范