lstm训练情感分析的优点_「情感分析领域」简单调研
简介
情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。
现有研究已经产生了可用于情感分析多项任务的大量技术,包括监督和无监督方法。在监督方法中,早期论文使用所有监督机器学习方法(如支持向量机、最大熵、朴素贝叶斯等)和特征组合。无监督方法包括使用情感词典、语法分析和句法模式的不同方法。现有多本综述书籍和论文,广泛地涵盖了早期的方法和应用。
大约十年前,深度学习成为强大的机器学习技术,在很多应用领域产生了当前最优的结果,包括计算机视觉、语音识别、NLP 等。近期将深度学习应用到情感分析也逐渐变得流行。
情感分析的三种粒度
- 文档粒度(document level):文档级情感分类是指为观点型文档标记整体的情感倾向/极性,即确定文档整体上传达的是积极的还是消极的观点。因此,这是一个二元分类任务,也可以形式化为回归任务,例如为文档按 1 到 5 星评级。一些研究者也将其看成一个五类分类任务。
- 句子粒度(sentence level):语句级情感分类用来标定单句中的表达情感。正如之前所讨论的,句子的情感可以用主观性分类和极性分类来推断,前者将句子分为主观或客观的,而后者则判定主观句子表示消极或积极的情感。在现有的深度学习模型中,句子情感分类通常会形成一个联合的三类别分类问题,即预测句子为积极、中立或消极。
- 短语粒度(aspect level):也称为主题粒度,每一个短语代表了一个主题。与文档级和语句级的情感分类不同,aspect level 情感分类同时考虑了情感信息和主题信息(情感一般都会有一个主题)。给定一个句子和主题特征,aspect level 情感分类可以推断出句子在主题特征的情感极性/倾向。例如,句子「the screen is very clear but the battery life is too short.」中,如果主题特征是「screen」,则情感是积极的,如果主题特征是「battery life」,则情感是消极的。
深度学习模型
- 文档/句子粒度:Kim等人(2013) 提出的CNN文本分类工作,成为句子级情感分类任务的重要baseline之一;
- 文档/句子粒度:基本的lstm模型加上pooling策略构成分类模型,是通常用来做情感分析的方法;
- 短语粒度:Tang等人(2015) 使用两种不同的rnn网络,结合文本和主题进行情感分析;
- 短语粒度:Tang等人(2016) 结合memory-network,解决target-dedependent问题,这里的target理解为前面提过的aspect;
- 短语粒度:Chen等人(2017) 分别使用位置权重记忆和层叠attention的复合机制,建模target词和文本间的相互交互关系,以解决短语级情感分类问题;
- 短语粒度:Schmitt1等人(2018) 将aspect和polarity结合在一起进行分类任务训练,得到情感分析的模型;
- 现在流行模型:大规模语料预训练(词向量/Elmo/GPT/Bert)+ 深度学习分类器(lstm/cnn/transformer),一个很好的示例见AI Challenger 2018:细粒度用户评论情感分类冠军思路总结。
相关数据
情感词典
- 词性字典1 词性字典2
- 大连理工大学中文情感词汇本体库
- 清华大学李军中文褒贬义词典
- 知网情感词典
情感数据集
- 15 Free Sentiment Analysis Datasets for Machine Learning
- 大众点评细粒度用户评论情感数据集
- 汽车行业用户观点主题及情感识别
- 电商评论情感数据
- 酒店评论语料
- SemEval-2014 Task 4数据集
- Citysearch corpus 餐馆评论数据
- NLPCC2014评估任务2_基于深度学习的情感分类
- NLPCC2013评估任务_中文微博观点要素抽取
- NLPCC2013评估任务_中文微博情绪识别
- NLPCC2013评估任务_跨领域情感分类
- NLPCC2012评估任务_面向中文微博的情感分析
- 康奈尔大学影评数据集
其他资源
- Sentiment Analysis with LSTMs in Tensorflow
- Sentiment analysis on tweets using Naive Bayes, SVM, CNN, LSTM, etc.
- Chinese Shopping Reviews sentiment analysis
- AI Challenger 2018:细粒度用户评论情感分类冠军思路总结
文献资料
- 文本情感分析综述(腾讯语义团队)
- Deep learning for sentiment analysis: A survey
- 情感分析资源大全
- Tang D, Qin B, Liu T. Aspect level sentiment classification with deep memory network[J]. arXiv preprint arXiv:1605.08900, 2016.
- Kim Y. Convolutional neural networks for sentence classification[J]. arXiv preprint arXiv:1408.5882, 2014.
lstm训练情感分析的优点_「情感分析领域」简单调研相关推荐
- 信号完整性分析心得体会_「职场技能」这8个常用信号完整性的测试手段,你知道几个?...
信号完整性设计在产品开发中越来越受到重视,而信号完整性的测试手段种类繁多,有频域,也有时域的,还有一些综合性的手段,比如误码测试.这些手段并非任何情况下都适 合使用,都存在这样那样的局限性,合适选用, ...
- 重磅发布!36氪中国新基建之王「大数据领域」TOP50企业揭晓
后信息技术时代,谁是数据海里的小白条? 制榜 | 贺卓媛 制图 | 王茹 出品 | 36氪创投研究院 封面来源 | IC photo 全球逐步进入以"数字化"为代表的后信息技术时代 ...
- R语言 深圳 面授_「深圳侦探电话」用R语言实现深度学习情感分析
04-16阅读数466 作者:黄天元,复旦大学博士在读,目前研究涵盖文本挖掘.社交网络预测和机器学习等.希望与你们分享学习心得,推广并加深R语言在业界的应用.邮箱:huang.tian-yuan... ...
- 多模态语义分析_「CV学霸开讲」卷积神经网络压缩、多模态的语义分析研究
原标题:「CV学霸开讲」卷积神经网络压缩.多模态的语义分析研究 [新智元导读]2017年度百度奖学金10位候选人中,人大的陈师哲和北大的王云鹤所学专业主要集中在计算机视觉,本文将详细呈现CV学子的求学 ...
- 京东的商品搜索功能是如何实现的_「商品架构day8」京东几百亿的商品怎么搜索...
本文来自京东王春明老师的分享,主要介绍京东商品搜索的整体架构. 京东商品搜索简介 京东商品搜索引擎是搜索推荐部自主研发的商品搜索引擎,主要功能是为海量京东用户提供精准.快速的购物体验.目前入口主要有P ...
- python docker自动化_「docker实战篇」python的docker爬虫技术-移动自动化控制工具appium工具(17)...
原创文章,欢迎转载.转载请注明:转载自 IT人故事会,谢谢! 原文链接地址: 「docker实战篇」python的docker爬虫技术-移动自动化控制工具appium工具(17) Appium是一个开 ...
- python情感词典计算得分_基于情感词典的情感打分
原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动). 论文在这里下载:基于情感词典的中文微博情感倾向性研究 (大家可以上 ...
- Python 分析谁才是「权利的游戏」真正的主角?
作者 | 小F 责编 | 伍杏玲 本文经授权转载自法纳斯特(ID:walker398) 上个礼拜权游大结局,最终的结果「布兰」登上了铁王座. 这个结果确实是大家没有想到的. 原本想着如果不是「龙妈」, ...
- 用python做简单的题目_「每日一练」巧用python做小学的数学题
原标题:「每日一练」巧用python做小学的数学题 很多的小学问题其实已经比较复杂了,我们运用传统的算法,可能会比较难以理解,这里我们可以巧用Python来完成一些小学题目的计算! 下边我们就一起来看 ...
- layui 表格数据源_「WPS办公助手」表格数据录入太慢?这个好用的技巧,轻松帮你搞定...
日常使用表格时,常常会需要「数据查找录入」,虽然看似简单,但操作起来并不方便. 比如说下方表格中,右侧的信息对应表,需要在左侧的人员信息表查找并录入对应的数据,要怎么做呢? 肯定会有人觉得:就这么点数 ...
最新文章
- java基本数据类型_Java面试题Java中有几种基本数据类型?它们分别占多大字节?...
- CoolPad backdoor CoolReaper
- Error in configuration process解决方法
- 链接和作用域2 - C++快速入门43
- html怎么引入sass样式,[样式设置] 使用sass格式的方式
- java垃圾回收机制(简述)
- CSocket类的使用
- [one day one question] safari缓存太厉害
- 《Python Cookbook 3rd》笔记(5.11):文件路径名的操作
- excel学习1-查看一列数值是否在另一列中存在
- mac系统升级 brew 是用不了_PostgreSQL数据库默默升级,导致数据库服务不可用
- 计算机安全知识讲座,计算机学院安全知识讲座:防火防电防诈骗 人身安全记心间...
- 数据结构———>队列
- vue2.0 keep-alive 缓存页面数据
- android pcm数据格式,android 实时PCM数据编码成AAC
- 阿里云Hologres外部表的创建及使用
- 【机器学习】TensorFlow共享GPU资源
- 【Unity项目实战】手把手教学:飞翔的小鸟(2)脚本编写
- Android Behavior
- 切尔西为切赫提供新岗位 蓝军盼其“回家”
热门文章
- RPi 2B Raspbian system install
- solr之服务器搭建步骤
- JavaScript中“基本类型”之争
- Windows Server 2008 R2 远程桌面服务RDS和VDI介绍
- 同济大学软件学院院长谈嵌入式方向选择
- Apache/MySQL/PHP 集体升级
- py樱花代码_武汉大学生用代码敲出樱花绽放,这个开源项目也很酷炫
- ARM开发7.3.3 基础实训( 3 ) 独立式键盘的输入系统设计--LPC21XX
- java的datatype_java基本数据类型--Basic Datatypes
- python布局管理_Python入门-图形用户界面-几何布局管理器-grid布局管理器