【关系抽取】A Novel Cascade Binary Tagging Framework for Relational Triple Extraction
A Novel Cascade Binary Tagging Framework for Relational Triple Extraction
2020ACL 吉林大学出品
资源:https://github.com/weizhepei/CasRel
Abatract
作者为了解决三元组重叠(overlap)的情况,提出了新的关系抽取的方法,cascade binary taging framework(CasRel),和传统的关系抽取不同,传统的关系抽取是通过两个实体来抽取(离散的)关系标签,但在这里通过CasRel框架来抽取实体及实体间的关系(这部分后面仔细介绍),最终效果得到了很大的提升。
Introduction
首先作者提出了问题,传统的关系抽取是不能很好的解决三元组重叠,上图:
从图中可以发现,传统的关系抽取针对Normal类型的数据还是可以的,但是针对EPO和SEO的情况就不怎么行了,首先说下EPO,可以看出同一对实体,在传统的关系抽取下只能抽取出一种关系,比如:要么是Act in 或者 Direct movie的关系,然后说下SEO,按说传统的关系抽取也可以,但是数据分布不均衡,比如有的关系标签很多,有的很少,有的正例很多,有的负利很多,这样导致传统模型不能很好的进行学习。尽管像这样的问题已经有人做了很多研究,但是仍然存在很多的问题,他们都把每个实体对的关系看作离散的,这样导致会导致模型学习很困难,原因有两点:第一点,也是上面所说的,数据分布不均衡,第二点, 针对重叠的标签,如果在训练数据很少的情况下,分类器很难去正确的分类。因此作者提出了CasRel框架,把传统形式的关系分类(其中s表示subject,o表示object)换成了
这种形式的,分别训练不同关系的模型,通过s来预测o,比如:如果Figure1中EPO所示,如果s=Quentin Tarantino,
,那么我们就可以判断Quentin Tarantino 和Django Unchained的关系是Act in的类型。
Related Work
这部分就不多说了。
The CASREL Framework
这里仔细讲下CasRel这个框架,灵感来源于下面这个公式(3):
公式也是一步一步拆解的,该公式表达的是求训练集D中每句话Tj中所含的(s,r,o)的最大似然估计。可以看最终的公式(3),可以看出,表示在
话中,s存在的概率,即:在第j个句子中预测s。
表示在
和s条件下,o出现的概率,即:在j个句子中,已经知道s的情况下,去预测o。因此整个方案:首先去找到所有的主客体s,然后根据模型找副客体o,找到就可以直接知道实体及关系了,而且这个binary tagging 方案可以一次抽取多个三元组出来。主要模型图如下图2所示:
在这里说下,为啥叫级联(cascade),因为你可以看成两个层级,第一层就是bert输入到subject输出,第二层就是bert输出的中间层(紫色)到object的输出,在这里注意下,这里有多少个关系就有多少个起始位置信息。模型比较简单,在这里就不再多说了,那么这篇论文也就到这吧,如果有什么说的不对的,欢迎指出!拜拜!
【关系抽取】A Novel Cascade Binary Tagging Framework for Relational Triple Extraction相关推荐
- [实体关系抽取|顶会论文]CasRel:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction
2020.6.22|ACL 2020|吉林大学|原文链接|源码链接 A Novel Cascade Binary Tagging Framework for Relational Triple Ext ...
- ACL2020_A Novel Cascade Binary Tagging Framework for Relational Triple Extraction
A Novel Cascade Binary Tagging Framework for Relational Triple Extraction Abstract Introduction The ...
- CASREL:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction(关系抽取,ACL2020,重叠关系)
文章目录 1.介绍 2.相关工作 3.The CASREL Framework 3.1 Bert 3.2 cascade decoder 4.实验 5.结果 参考 1.介绍 做重叠关系的少 重叠关系: ...
- A Novel Cascade Binary Tagging Framework for Relational Triple Extraction
Abstract 本文提出了关系三元组重叠的问题(一个sentence中有多个三元组,其中三元组中有的实体是同一个).本文将其建模为级联二级制框架,从原来的f(s,o)→rf(s,o) \righta ...
- [实体关系抽取|顶刊论文]UniRel:Unified Representation and Interaction for Joint Relational Triple Extraction
2022.11.16|EMNLP 2022|中国科学技术大学 |原文链接|源码链接 UniRel: Unified Representation and Interaction for Joint R ...
- ACL2020放榜!事件抽取、关系抽取、NER、Few-Shot相关论文整理~
重磅! ACL2020 官方放榜啦!传送门: https://acl2020.org/program/accepted/ 小编在此整理出了一份事件抽取.关系抽取.命名实体识别.Few-Shot以及在模 ...
- 关系抽取Casrel实现(Pytorch版)
前言 关系抽取是自然语言处理中的一个基本任务.关系抽取通常用三元组(subject, relation, object)表示.但在关系抽取中往往会面临的关系三元组重叠问题.<A Novel Ca ...
- 实体关系抽取几篇论文
1.<A Unified MRC Framework for Named Entity Recognition> paper:https://arxiv.org/pdf/1910.1147 ...
- 实体关系抽取学习笔记
1 关系抽取概述 1.1 简介 信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息.关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系. 关系抽取对于很多 ...
最新文章
- 零基础快速学习Java技术的方法整理
- 使用dynamic特性处理XML文档
- Nosql and Mongodb 介绍
- Cooperative Content Distribution and Traffic Engineering
- 阿里巴巴HBase高可用8年填坑实录
- 字符串相乘Python解法
- JAVA复习5(集合——ArrayList)
- Java集合之HashSet源码分析
- 动态字符串的存储结构的实现
- LeetCode—1.快速排序算法
- gnome2 恢复默认 panel
- MFC中.和-的区别
- 修饰器 TypeError: A() missing 1 required positional argument: ‘func‘
- Android 获取及修改屏幕亮度
- 19所高校进入A类!泰晤士计算机专业大学评级公布!
- cad工具箱详细讲解_筑龙网CAD工具箱使用说明
- 点击按钮变色,松开按钮恢复原来的颜色
- 学校计算机报损报废申请表,学校财产登记报损上报制度
- java 自动转 golang_JAVA转Golang
- 有关3DES、DUKPT和MK/SK学习记录