1 信息抽取任务

信息抽取(Information extraction,IE)任务指从非结构化或半结构化的文本中抽取出结构化信息。根据被抽取的对象,信息抽取可以分为以下4个任务:
(1) 实体抽取(Entity)
(2) 关系抽取(Relation)
(3) 事件抽取(Event)
(4) 情感抽取(Sentiment)
IE任务的应用背景:
(1) 互联网的蓬勃发展,捕获互联网上的舆情信息成为了需求
(2) 数据挖掘兴起后,产生了和语言文字相关的数据挖掘任务

1.1 实体抽取任务

定义:从预定语义类型(如人名、地点、组织等)的文本中识别特定类型指定物的任务。
任务
(1) 指代消解任务(Anaphora resolution),关注句子中的指代关系。

  • 找出指代关系
  • 补充代词

(2) 共指消解(Co-references),关注一段文本中不同的命名实体,和所有的代表这些实体的词语。

(3) 与知识图谱相关的任务:实体链接,实体规范化。

1.2 关系抽取任务

定义:识别句子中命名实体间的特定关系。
任务:构建知识图谱

1.3 事件抽取任务

定义:事件有不同类型,从文本中抽取事件需要关注不同的触发词(trigger word)。一个事件,除了触发词,还有相应的事件论元,如在“访问”事件中,有访问者、被访问者等属性。
任务
(1) 事实性检测:判断事件的可信度
(2) 事件时间顺序推断:自动抽取、恢复事件间原有的先后发生顺序
(3) 事件因果检测:从文本中推断事件的因果关系
(4) Script Learning:从大量文本中自从抽取整体的事件框架(script)知识的任务

1.4 情感抽取任务

任务:讽刺检测、情感词典构建、立场检测、情绪检测

链接1:https://zhuanlan.zhihu.com/p/571220239
链接2:https://www.bilibili.com/video/BV1kQ4y1r7ft/?spm_id_from=333.337.search-card.all.click&vd_source=2aa81cd07cc344789f94654b8878ab57

【IE】信息抽取任务简述相关推荐

  1. 基于语义和规则的Web网页细粒度信息抽取方法

    基于语义和规则的Web网页细粒度信息抽取方法 王晓飞11 (北京邮电大学模式识别实验室) 摘要:本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法.方法首先,利用Web网页的结构和 ...

  2. 知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取)、知识融合算法方案、知识推理、模型优化、模型压缩技术等

    知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取).知识融合算法方案.知识推理.模型优化.模型压缩技术等 专栏链接:NLP知识图谱相关技术业务落地方案和码源 NLP知识图谱相关技术 ...

  3. 第三届“达观杯”文本智能信息抽取挑战赛丰厚奖金,群英集结,等你来战!...

    近日,第三届"达观杯"文本智能信息抽取挑战赛正式上线启动(点击阅读原文,跳转报名页面),6月28日至8月31日,面向所有参赛选手开放竞赛结果提交.本届"达观杯" ...

  4. 关于NLP相关技术全部在这里:预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文本处理...

    NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生. 我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准 ...

  5. 第十七篇:信息抽取Information Extraction

    目录 信息抽取 应用 如何? IE 中的机器学习 大纲 命名实体识别 典型实体标签 NER作为序列标记 IO 标记 IOB 标签 NER作为序列标记,继续 NER:特征 NER 的深度学习 关系抽取 ...

  6. Python基于MASK信息抽取ROI子图并构建基于迁移学习(densenet)的图像分类器实战(原始影像和mask文件都是二维的情况)

    Python基于MASK信息抽取ROI子图并构建基于迁移学习(densenet)的图像分类器实战(原始影像和mask文件都是二维的情况) 目录

  7. Python基于MASK信息抽取ROI子图实战:原始影像和mask文件都是二维的情况

    Python基于MASK信息抽取ROI子图实战:原始影像和mask文件都是二维的情况 目录 Python基于MASK信息抽取ROI子图实战:原始影像和mask

  8. 自然语言处理NLP之文本摘要、机器翻译、OCR、信息检索、信息抽取、校对纠错

    自然语言处理NLP之文本摘要.机器翻译.OCR.信息检索.信息抽取.校对纠错 目录

  9. 一人之力,刷爆三路榜单!信息抽取竞赛夺冠经验分享

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达文 | JayLou娄杰 在现如今的NLP竞赛中,信息抽取(IE)任务已占据半壁江山.来 ...

最新文章

  1. 黑龙江专科大学计算机专业,黑龙江10大最好的专科学校,有你心仪的学校吗?...
  2. 《Head First设计模式》第五章笔记-单件模式
  3. SQL ORDER BY Clause
  4. 静态网页-学校官网(附源码)
  5. 13号线ab线规划图_2018广州地铁13号线二期最新消息:计划今年开工 2022年底建成通车(附线路图+站点)...
  6. JAVA从入门到放弃
  7. android app开发计划
  8. 正态性检验ks和sw区别_非参数检验思路总结,清晰理解就靠它了!
  9. 【放马过来---谈禅修打坐】
  10. 卡耐基计算机专业课程,你以为卡耐基梅隆大学只有计算机专业厉害吗?
  11. 红米手机android在哪里,红米手机usb调试在哪【图文】
  12. Dataframe两个表格合并
  13. 1.3寸 SH1106 OLED 屏幕驱动 基于stm32
  14. c语言str相关的函数
  15. SSL证书.key转.pem的方法
  16. JS中常见的String方法
  17. 六、java版商城之一件代发设置 Spring Cloud+SpringBoot+mybatis+uniapp b2b2c o2o 多商家入驻商城 直播带货商城 电子商务
  18. 全面理解 Unity UI 系统
  19. python与数据分析的课程报告_【最新】python数据分析课程报告论文(附代码数据)...
  20. 07-项目训练_流程与快递表格创建~Express Service编写

热门文章

  1. 无需任何能源就能运作的电厂,你见过么?
  2. Centos 8.1存储多路径配置
  3. Linux设备驱动开发--- DMA
  4. XDMA使用及AXI_SDMA配合测试
  5. 云队友丨阿里彭蕾:我拿什么辅佐马云,提高阿里人的战斗力?
  6. 女朋友问的那些问题—log.info在测试环境正常打印,上了生产就废?
  7. vs、vscode如何让代码全部重新排版
  8. 请推荐高校图书馆数据库绩效评价的国外文献
  9. 论文阅读 | Recurrent Filter Learning for Visual Tracking
  10. Joint Tx-Rx Beamforming Design for Multicarrier MIMO Channels: A Unified Framework (2)