论文笔记: Hierarchical Chinese Legal event extraction via Pedal Attention Mechanism
作者:陈宇飞
单位:燕山大学
论文地址:https://www.aclweb.org/anthology/2020.coling-main.9/
目录
- 一、摘要
- 二、引言
- 三、设计
- 四、实验结果
一、摘要
本文主要是使用NLP领域的事件抽取方法来解决中国法律领域中的相关问题。其中为了区分相似案件,为事件检测设计了分层的事件特征。此外,为了解决论元分类中的长距离语义依赖和共指消解问题,提出了一种新的pedal注意力机制,该踏板注意力机制的主要工作是通过依存的相邻词来提取两个词之间的语义关系。因为目前中国法律领域的数据集相对匮乏,本文还标注了一份中国法律事件数据集,但是没有开源。。
二、引言
在传统的事件提取任务中,主要遵循ACE定义的事件结构,将事件抽取分成两个子任务,首先进行触发词的提取,并以此来预测事件类型。然后进行论元提取,提取出与事件相关的参数并预测论元的作用。现在随着自然语言处理领域的发展,开放领域出现了很多优秀的事件抽取技术,但是法律领域的事件抽取任务还是相对较少。目前有使用基于规则的方法提取事件,还有结合神经网络模型进行的法律事件提取。
但是现有的这两个方向存在着一些问题。一方面,传统的事件结构和事件定义不能很好地代表法律事件。例如,如果用AGE作为事件的自变量,会造成歧义。此外,如下图所示的例子中,根据传统的事件定义方法,死亡事件将与刺伤事件分开,从而无法反映受害者死亡与被告行为之间的因果关系。为解决此类问题,本文提出动态分层事件结构根据法律要求表示法律事件,构建过程首先是定义分层类型,然后设计不同的论元类型,以包含法律事件中的关键要素,此外设计一个动态事件结构,它规定事件的论元可以有与事件相关的子论元。
如上图所示,在依存句法树中,第一个pei距离死亡很远,会判断第二个pei与死亡有关联,这就丢失了远距离相关词的信息。而本文提出的pedal(踏板)注意力机制的方法,就可以通过一个词和另一个词的依存相邻词之间的注意权重,以确定这两个词之间的语义关系,这个依存相邻词就叫做踏板。
三、设计
分层事件:所有的事件类型都按照子类型关系有序地组织起来,构成层次化的事件。例如,侵犯财产罪是犯罪的一个子事件。
把论元也分层划分:如果论元T2是论元T1的真子集,则称T2是T1的子类型。如下图,PARTY是ENTITY的子类型。同时还定义了两种特殊的论元类型,STATE和BEHAVIOR分别表示一个事件或其他论证的客观状态和ENTITY的一个子类型。BEHAVIOR可以定义防止事件碎片化,使现有事件更加连贯。比如,escape是一种特定的犯罪行为,是被告人犯罪事实的重要组成部分,对判决产生重大影响。但是逃避作为一个独立事件是没有意义的。如果将这些行为单独定义为事件,那么事件类型将是冗余的,所以将这类事件统一抽象为BEHAVIOR。
动态事件结构:如上图中的PARTY具有子参数年龄和状态,把角色定义为为PARTY-AGE和PHYSICAL-STATE。
本文提出的基于踏板注意力的联合分层事件抽取模型主要由以下几个模块组成:
1.提取事件论元并对论元进行分类;
2.构建句子的层次事件类型特征;
3.利用踏板注意机制提取论元和触发词之间的语义关系;
4.预测触发词标签;
5.预测动态事件结构中的事件自变量角色。
上述中的触发词标签使用Bert模型进行预测,最后汇总成一个联合推理模型,将动态事件结构抽象为一棵树,以触发词为根节点,以论元为节点。节点之间的边表示子节点的论元角色。定义了Mt,aM^{t,a}Mt,a和Mi,jt,aM^{t,a}_{i,j}Mi,jt,a的关联概率矩阵,其中Mi,jt,aM^{t,a}_{i,j}Mi,jt,a表示第I个类型事件包含第j个类型论元的概率,Mi,ja,aM^{a,a}_{i,j}Mi,ja,a表示第I个类型论元包含第j个类型子论元的概率。Mi,jt,aM^{t,a}_{i,j}Mi,jt,a和Mi,ja,aM^{a,a}_{i,j}Mi,ja,a可以学习训练。
四、实验结果
论文笔记: Hierarchical Chinese Legal event extraction via Pedal Attention Mechanism相关推荐
- 论文笔记 COLING 2020|Joint Event Extraction with Hierarchical Policy Network
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 4 实验 5 总结 1 简介 论文题目:Joint Event Extraction with Hierarchical Pol ...
- 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...
- 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 基础模型 3.2 跨事件依赖 4 实验 1 简介 论文题目:Document-level Event Extractio ...
- Re15:读论文 LEVEN: A Large-Scale Chinese Legal Event Detection Dataset
诸神缄默不语-个人CSDN博文目录 论文名称:LEVEN: A Large-Scale Chinese Legal Event Detection Dataset 本文是2022年ACL论文,作者来自 ...
- [中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab
[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab ...
- 【论文笔记】Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection
论文标题:Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection 论文链接:https://s ...
- 论文笔记 EMNLP 2018|Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated
文章目录 1 简介 1.1 创新 2 背景知识 3 方法 4 实验 1 简介 论文题目:Collective Event Detection via a Hierarchical and Bias T ...
- 论文笔记 EMNLP 2021|Lifelong Event Detection with Knowledge Transfer
文章目录 1 简介 1.1 创新 2 方法 2.1 baseline 2.2 新旧事件类型的知识迁移 3 实验 1 简介 论文题目:Lifelong Event Detection with Know ...
- 论文笔记 ACL 2021|Low-resource Event Detection with Ontology Embedding
文章目录 1 简介 1.2 创新 2 方法 2.1 Event Detection (Ontology Population) 2.2 Event Ontology Learning 2.3 Even ...
最新文章
- Linux主辅DNS数据不同步故障排除
- shiro 授权介绍
- 永劫无间为啥显示连接服务器失败,永劫无间服务器故障怎么办?永劫无间服务器故障解决办法...
- Windows - 通过注册表编辑器来删除多余盘符
- php_mvc实现步骤五
- VS2015上配置opencv2.4.11
- STM32工作笔记0030---编写跑马灯实验--使用库函数
- c++循环读取多行文本文件
- 漫画:有趣的 “切蛋糕“ 问题
- webpack5打包普通html项目,webpack打包其他资源
- 折线图_Line plot - 折线图
- DM6437的学习过程
- javascript高级进阶
- Jieba中文分词 (二) ——词性标注与关键词提取
- std::numeric_limits使用
- 音频打不开 服务器运行失败,win7系统提示音频服务器未运行的解决方法
- 【LOD for 3D Graphics】LOD技术背景调查
- SQL Server numeric数据类型
- Python OpenCV 裁剪身份证正反面
- 这款免费开源的数据库工具,支持所有主流数据库!