情感分析旨在自动识别和提取文本中的倾向、立场、评价、观点等主观信息。它包含各式各样的任务,比如句子级情感分类、评价对象级情感分类、观点抽取、情绪分类等。情感分析是人工智能的重要研究方向,具有很高的学术价值。同时,情感分析在消费决策、舆情分析、个性化推荐等领域均有重要的应用,具有很高的商业价值。

近日,百度正式发布情感预训练模型SKEP(Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis,情感知识增强的情感预训练)。SKEP利用情感知识增强预训练模型, 在14项中英情感分析典型任务上全面超越SOTA,此工作已经被ACL 2020录用。

SKEP

SKEP是百度研究团队提出的基于情感知识增强的情感预训练算法,此算法采用无监督方法自动挖掘情感知识,然后利用情感知识构建预训练目标,从而让机器学会理解情感语义。SKEP为各类情感分析任务提供统一且强大的情感语义表示。

百度研究团队在三个典型情感分析任务,

句子级情感分类(Sentence-level Sentiment Classification),

评价对象级情感分类(Aspect-level Sentiment Classification)、

观点抽取(Opinion Role Labeling),

共计14个中英文数据

上进一步验证了情感预训练模型SKEP的效果。实验表明,以通用预训练模型ERNIE(内部版本)作为初始化,SKEP相比ERNIE平均提升约1.2%,并且较原SOTA平均提升约2%,具体效果如下表:

任务 数据集合 语言 指标 原SOTA SKEP 数据集地址
句子级情感
分类
SST-2 英文 ACC 97.50 97.60 下载地址
Amazon-2 英文 ACC 97.37 97.61 下载地址
ChnSentiCorp 中文 ACC 95.80 96.50 下载地址
NLPCC2014-SC 中文 ACC 78.72 83.53 下载地址
评价对象级的
情感分类
Sem-L 英文 ACC 81.35 81.62 下载地址
Sem-R 英文 ACC 87.89 88.36 下载地址
AI-challenge 中文 F1 72.87 72.90 暂未开放
SE-ABSA16_PHNS 中文 ACC 79.58 82.91 下载地址
SE-ABSA16_CAME 中文 ACC 87.11 90.06 下载地址
观点
抽取
MPQA-H 英文 b-F1/p-F1 83.67/77.12 86.32/81.11 下载地址
MPQA-T 英文 b-F1/p-F1 81.59/73.16 83.67/77.53 下载地址
COTE_BD 中文 F1 82.17 84.50 下载地址
COTE_MFW 中文 F1 86.18 87.90 下载地址
COTE_DP 中文 F1 84.33 86.30 下载地址

NLP之:百度SKEP相关推荐

  1. 【NLP】国内实力雄厚的自然语言处理(NLP)研究组

    中国大陆地区 1. 腾讯人工智能实验室(Tencent AI Lab) 链接:https://ai.tencent.com/ailab/nlp/ 2. 百度自然语言处理部 链接:https://nlp ...

  2. 别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(19.11.21更新)

    推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。).不过话说回来,面经有多大用呢?最起码对于NLP岗位的面 ...

  3. 别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(2020.4.14更新)...

    推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。).不过话说回来,面经有多大用呢?最起码对于NLP岗位的面 ...

  4. 还原百度AI派系之争:吴恩达出局,马东敏陆奇定胜负

    还原百度AI派系之争:吴恩达出局,马东敏陆奇定胜负(转) 文/<深网>报道组 韩依民 不是所有离职都会被称为功成身退. 百度首席科学家吴恩达昨天突然对外宣布了离职消息,之前没有任何征兆. ...

  5. 实习周报 | 3rd week | 2021.4.19 - 4.23 | 文本摘要,ES语义搜索,SOTA SA

    完成 ES语义搜索dense vector⽅法可行性进一步测试 新数据集:https://www.kaggle.com/asd336655/ccf2019news-so 新闻评论等,筛选出评论⻓长于5 ...

  6. 中文文本纠错算法走到多远了?

    纠错是从互联网起始时就在一直解决的问题,但是一直作为一些重要技术的辅助.附属功能而默默无闻,譬如搜索引擎.譬如火热的智能写作等. 素质整理! 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼 ...

  7. 程序员必修内功,收集了上千本各类编程书籍【免费获取】

    程序员必修内功,收集了上千本各类编程书籍,C,C++,Java,Python,机器学习,深度学习,Linux等等,还收集了很多英文原版书籍,看不惯中文的也可以选择英文哦.这些书籍都是我经过平时的积累, ...

  8. 秋招盛宴 | 大学时代的终极之战!

    知乎ID:SleepyBag 本文由「海边的拾遗者」公众号编辑首发" 前言 2021届秋招基本结束了,而我有幸在灰飞烟灭的一年里,拿到了几个想要的算法岗意向书,也算没有辜负这两年来的努力.目 ...

  9. 史上最大规模ACL大会放榜,百度10篇NLP论文被录用!

    近日,自然语言处理(NLP)领域的国际顶级学术会议"国际计算语言学协会年会"(ACL 2019)公布了今年大会论文录用结果.根据 ACL 2019 官方数据,今年大会的有效投稿数量 ...

  10. 顶会论文9篇,又斩获百度奖学金!哈工大NLP“新生代”正崭露头角

    参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 作者 | 琥珀 出品 | AI科技大本营(ID:rgznai100) "Static OnePlus"? 首次看到这个网名 ...

最新文章

  1. 谷歌CEO为「Jeff Dean开除研究员」事件道歉,却引发持续争议
  2. python第一天作业:字典
  3. mybatisnet - 1 获取 mybatisnet
  4. Lua脚本语法说明(修订)
  5. Kettle使用_8 存储过程结合获取系统信息
  6. 小学奥数_7655回文数个数 python
  7. 设计模式:外观模式(C++)【颜值很重要】
  8. AOP的实现方式比较,cglib vs jdk
  9. [导入]SQL Server存储过程编程经验技巧
  10. 《PHP基础教程》pdf
  11. CDMA关键技术(RAKE、软切换、功率控制
  12. SQP 序列二次规划法
  13. html水调歌头实验总结,水调歌头教学课堂总结
  14. Python报错too many values to unpack解决方案
  15. 如何快速掌握技术和知识点
  16. 我的达内Java培训经历
  17. android系统中区分UDisk和SDCard
  18. Unity 导出 obj, fbx
  19. ICT(计算机通信电子自动化等)专业区别和联系
  20. 陕西师范大学计算机科学学院地址,陕西师范大学有几个校区及校区地址

热门文章

  1. 【转】C#操作sqlServer数据库
  2. WPF-创建超链接文本
  3. 2018.12.20 区块链论文翻译
  4. 我们不知道我们不知道:用同化项目做网络安全
  5. 在Hive中使用Avro
  6. 静态库与动态库的制作
  7. Split()函数的作用
  8. c#中对xml文件的基本操作
  9. osm数据下载 python_用Python编写小工具下载OSM路网数据
  10. wordpress让百度分享支持https