NLP之:百度SKEP
情感分析旨在自动识别和提取文本中的倾向、立场、评价、观点等主观信息。它包含各式各样的任务,比如句子级情感分类、评价对象级情感分类、观点抽取、情绪分类等。情感分析是人工智能的重要研究方向,具有很高的学术价值。同时,情感分析在消费决策、舆情分析、个性化推荐等领域均有重要的应用,具有很高的商业价值。
近日,百度正式发布情感预训练模型SKEP(Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis,情感知识增强的情感预训练)。SKEP利用情感知识增强预训练模型, 在14项中英情感分析典型任务上全面超越SOTA,此工作已经被ACL 2020录用。
SKEP
SKEP是百度研究团队提出的基于情感知识增强的情感预训练算法,此算法采用无监督方法自动挖掘情感知识,然后利用情感知识构建预训练目标,从而让机器学会理解情感语义。SKEP为各类情感分析任务提供统一且强大的情感语义表示。
百度研究团队在三个典型情感分析任务,
句子级情感分类(Sentence-level Sentiment Classification),
评价对象级情感分类(Aspect-level Sentiment Classification)、
观点抽取(Opinion Role Labeling),
共计14个中英文数据
上进一步验证了情感预训练模型SKEP的效果。实验表明,以通用预训练模型ERNIE(内部版本)作为初始化,SKEP相比ERNIE平均提升约1.2%,并且较原SOTA平均提升约2%,具体效果如下表:
任务 | 数据集合 | 语言 | 指标 | 原SOTA | SKEP | 数据集地址 |
句子级情感 分类 |
SST-2 | 英文 | ACC | 97.50 | 97.60 | 下载地址 |
Amazon-2 | 英文 | ACC | 97.37 | 97.61 | 下载地址 | |
ChnSentiCorp | 中文 | ACC | 95.80 | 96.50 | 下载地址 | |
NLPCC2014-SC | 中文 | ACC | 78.72 | 83.53 | 下载地址 | |
评价对象级的 情感分类 |
Sem-L | 英文 | ACC | 81.35 | 81.62 | 下载地址 |
Sem-R | 英文 | ACC | 87.89 | 88.36 | 下载地址 | |
AI-challenge | 中文 | F1 | 72.87 | 72.90 | 暂未开放 | |
SE-ABSA16_PHNS | 中文 | ACC | 79.58 | 82.91 | 下载地址 | |
SE-ABSA16_CAME | 中文 | ACC | 87.11 | 90.06 | 下载地址 | |
观点 抽取 |
MPQA-H | 英文 | b-F1/p-F1 | 83.67/77.12 | 86.32/81.11 | 下载地址 |
MPQA-T | 英文 | b-F1/p-F1 | 81.59/73.16 | 83.67/77.53 | 下载地址 | |
COTE_BD | 中文 | F1 | 82.17 | 84.50 | 下载地址 | |
COTE_MFW | 中文 | F1 | 86.18 | 87.90 | 下载地址 | |
COTE_DP | 中文 | F1 | 84.33 | 86.30 | 下载地址 |
NLP之:百度SKEP相关推荐
- 【NLP】国内实力雄厚的自然语言处理(NLP)研究组
中国大陆地区 1. 腾讯人工智能实验室(Tencent AI Lab) 链接:https://ai.tencent.com/ailab/nlp/ 2. 百度自然语言处理部 链接:https://nlp ...
- 别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(19.11.21更新)
推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。).不过话说回来,面经有多大用呢?最起码对于NLP岗位的面 ...
- 别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(2020.4.14更新)...
推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。).不过话说回来,面经有多大用呢?最起码对于NLP岗位的面 ...
- 还原百度AI派系之争:吴恩达出局,马东敏陆奇定胜负
还原百度AI派系之争:吴恩达出局,马东敏陆奇定胜负(转) 文/<深网>报道组 韩依民 不是所有离职都会被称为功成身退. 百度首席科学家吴恩达昨天突然对外宣布了离职消息,之前没有任何征兆. ...
- 实习周报 | 3rd week | 2021.4.19 - 4.23 | 文本摘要,ES语义搜索,SOTA SA
完成 ES语义搜索dense vector⽅法可行性进一步测试 新数据集:https://www.kaggle.com/asd336655/ccf2019news-so 新闻评论等,筛选出评论⻓长于5 ...
- 中文文本纠错算法走到多远了?
纠错是从互联网起始时就在一直解决的问题,但是一直作为一些重要技术的辅助.附属功能而默默无闻,譬如搜索引擎.譬如火热的智能写作等. 素质整理! 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼 ...
- 程序员必修内功,收集了上千本各类编程书籍【免费获取】
程序员必修内功,收集了上千本各类编程书籍,C,C++,Java,Python,机器学习,深度学习,Linux等等,还收集了很多英文原版书籍,看不惯中文的也可以选择英文哦.这些书籍都是我经过平时的积累, ...
- 秋招盛宴 | 大学时代的终极之战!
知乎ID:SleepyBag 本文由「海边的拾遗者」公众号编辑首发" 前言 2021届秋招基本结束了,而我有幸在灰飞烟灭的一年里,拿到了几个想要的算法岗意向书,也算没有辜负这两年来的努力.目 ...
- 史上最大规模ACL大会放榜,百度10篇NLP论文被录用!
近日,自然语言处理(NLP)领域的国际顶级学术会议"国际计算语言学协会年会"(ACL 2019)公布了今年大会论文录用结果.根据 ACL 2019 官方数据,今年大会的有效投稿数量 ...
- 顶会论文9篇,又斩获百度奖学金!哈工大NLP“新生代”正崭露头角
参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 作者 | 琥珀 出品 | AI科技大本营(ID:rgznai100) "Static OnePlus"? 首次看到这个网名 ...
最新文章
- 谷歌CEO为「Jeff Dean开除研究员」事件道歉,却引发持续争议
- python第一天作业:字典
- mybatisnet - 1 获取 mybatisnet
- Lua脚本语法说明(修订)
- Kettle使用_8 存储过程结合获取系统信息
- 小学奥数_7655回文数个数 python
- 设计模式:外观模式(C++)【颜值很重要】
- AOP的实现方式比较,cglib vs jdk
- [导入]SQL Server存储过程编程经验技巧
- 《PHP基础教程》pdf
- CDMA关键技术(RAKE、软切换、功率控制
- SQP 序列二次规划法
- html水调歌头实验总结,水调歌头教学课堂总结
- Python报错too many values to unpack解决方案
- 如何快速掌握技术和知识点
- 我的达内Java培训经历
- android系统中区分UDisk和SDCard
- Unity 导出 obj, fbx
- ICT(计算机通信电子自动化等)专业区别和联系
- 陕西师范大学计算机科学学院地址,陕西师范大学有几个校区及校区地址