情感分析之PMI互信息
PMI(Pointwise Mutual Information),这里当然不是指经济上的那个PMI,而是点互信息,作用是衡量两个随机变量的相关性。可以用于情感分析中的情感分数计算,计算公式如下:
pmi(w1,w2)=log(p(w1,w2)p(w1)∗p(w2))=log(p(w1∣w2)p(w1))=log(p(w2∣w1)p(w2))pmi(w_1,w_2)=log(\frac{p(w_1,w_2)}{p(w_1)*p(w_2)})=log(\frac{p(w_1|w_2)}{p(w_1)})=log(\frac{p(w_2|w_1)}{p(w_2)})pmi(w1,w2)=log(p(w1)∗p(w2)p(w1,w2))=log(p(w1)p(w1∣w2))=log(p(w2)p(w2∣w1))
如果w1w_1w1和w2w_2w2分布是相互独立的,那么p(w1,w2)=p(w1)∗p(w2)p(w_1,w_2)=p(w_1)*p(w_2)p(w1,w2)=p(w1)∗p(w2),此时有pmi(w1,w2)=log1=0pmi(w_1,w_2)=log1=0pmi(w1,w2)=log1=0。相反,如果w1w_1w1和w2w_2w2的分布不是相互独立的,那么p(w1,w2)>p(w1)∗p(w2)p(w_1,w_2)>p(w_1)*p(w_2)p(w1,w2)>p(w1)∗p(w2),并且相关性越强pmipmipmi的值越大,说明w1w_1w1和w2w_2w2共现携带的信息越多,越容易共同出现。
情感分析之PMI互信息相关推荐
- 【中文情感分析】SO-PMI算法(HarvestText库的修正以及解析)
简述 在最近的RA过程中,需要使用一个库,同时对其的原理需要理解.然后就研究了一些,发现了几个有趣的,其中一个HarvestText中文情感分析. 我研究了他的源码后,再结合理论知识发现了这个库在情感 ...
- python+机器学习方法进行情感分析
不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会.而且它可使用 ...
- python情感分析步骤_使用python+机器学习方法进行情感分析(详细步骤)
不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会.而且它可使用 ...
- 使用word2vec对微博进行情感分析和分类
Word2vec可以将词语转换为高维向量空间中的向量表示,它能揭示上下文关系.首先使用word2vec,将其训练得到词向量作为特征权重,然后根据情感词典和词性的两种特征选择方法筛选出有价值的特征,最后 ...
- 情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析 公众号: datadw 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中.通过这种 ...
- 使用word2vec对新浪微博进行情感分析
原文发表于:http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6906802 本文仅是对上文的学习和复现 Word2vec可以将词 ...
- python实现情感分析_使用python+机器学习方法进行情感分析(详细步骤)
使用python+机器学习方法进行情感分析(详细步骤) 2021-02-07 不是有词典匹配的方法了吗?怎么还搞多个机器学习方法.因为词典方法和机器学习方法各有千秋.机器学习的方法精确度更高,因为词典 ...
- 使用word2vec对新浪微博进行情感分析和分类
原文发表于:http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6906802 本文仅是对上文的学习和复现 Word2vec可以将词 ...
- [NLP]如何进行情感分析
本文介绍的是如何进行情感识别. 在自然语言中(尤其社交媒体和购物网站中),每一句话都隐含了具体的情感倾向,比如中性.正面.负面.比如:今天天气不错:今天心情不太好:苹果手机不错:地球是圆的.对于人来说 ...
最新文章
- Aquaculture:天津农科院谢凤行团队揭示菌群预测功能与实际代谢特性的相关性...
- 范数(赋范线性空间、向量范数、矩阵范数)
- AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型
- VBA各种查询方法介绍和应用举例
- 鸿蒙系统年底问世视频,鸿蒙系统年底问世 什么时候上市使用
- 编程常用英语词汇 | GitHub
- 团队开发中Git冲突解决
- cmd命令查看本机网外地址
- Otsu最大类间方差法
- office Excel操作
- AI算法之Encoder-Decoder 和 Seq2Seq
- Springboot 热部署----热部署插件的使用
- K8S—二进制部署安装(包含UI界面设置)
- WordPress给博客文章页添加个性名片
- 数据基础---《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑
- 在Chrome安装Edge的插件
- 点线面的意义_聊聊「点线面」的概念
- 3*3 三行三列的圈叉棋
- 【数据结构】链表 - Go 语言实现
- 关于IAP支付,谷歌和苹果订阅商品——最白话,手把手教你做系列。
热门文章
- firefox os android,若能同时使用Android应用,那么你可以接受Firefox OS手机了吗?
- C#:实现麦克劳林级数计算非线性函数算法(附完整源码)
- web buuctf [BJDCTF2020]Mark loves cat1
- 学习笔记——共阳数码管的动态显示
- 融会贯通面对对象编程思想
- 阿里云-云开发平台普及篇——创建应用
- 中国AR智能隐形眼镜市场竞争态势与投资规划分析报告2022-2028年
- 某笔试的一道简单题目
- EC2 Auto Scaling知识点
- 计算机专业报瑞士酒店管理,我适合去瑞士读酒店管理吗?