PMI(Pointwise Mutual Information),这里当然不是指经济上的那个PMI,而是点互信息,作用是衡量两个随机变量的相关性。可以用于情感分析中的情感分数计算,计算公式如下:
pmi(w1,w2)=log(p(w1,w2)p(w1)∗p(w2))=log(p(w1∣w2)p(w1))=log(p(w2∣w1)p(w2))pmi(w_1,w_2)=log(\frac{p(w_1,w_2)}{p(w_1)*p(w_2)})=log(\frac{p(w_1|w_2)}{p(w_1)})=log(\frac{p(w_2|w_1)}{p(w_2)})pmi(w1​,w2​)=log(p(w1​)∗p(w2​)p(w1​,w2​)​)=log(p(w1​)p(w1​∣w2​)​)=log(p(w2​)p(w2​∣w1​)​)
如果w1w_1w1​和w2w_2w2​分布是相互独立的,那么p(w1,w2)=p(w1)∗p(w2)p(w_1,w_2)=p(w_1)*p(w_2)p(w1​,w2​)=p(w1​)∗p(w2​),此时有pmi(w1,w2)=log1=0pmi(w_1,w_2)=log1=0pmi(w1​,w2​)=log1=0。相反,如果w1w_1w1​和w2w_2w2​的分布不是相互独立的,那么p(w1,w2)>p(w1)∗p(w2)p(w_1,w_2)>p(w_1)*p(w_2)p(w1​,w2​)>p(w1​)∗p(w2​),并且相关性越强pmipmipmi的值越大,说明w1w_1w1​和w2w_2w2​共现携带的信息越多,越容易共同出现。

情感分析之PMI互信息相关推荐

  1. 【中文情感分析】SO-PMI算法(HarvestText库的修正以及解析)

    简述 在最近的RA过程中,需要使用一个库,同时对其的原理需要理解.然后就研究了一些,发现了几个有趣的,其中一个HarvestText中文情感分析. 我研究了他的源码后,再结合理论知识发现了这个库在情感 ...

  2. python+机器学习方法进行情感分析

    不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会.而且它可使用 ...

  3. python情感分析步骤_使用python+机器学习方法进行情感分析(详细步骤)

    不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会.而且它可使用 ...

  4. 使用word2vec对微博进行情感分析和分类

    Word2vec可以将词语转换为高维向量空间中的向量表示,它能揭示上下文关系.首先使用word2vec,将其训练得到词向量作为特征权重,然后根据情感词典和词性的两种特征选择方法筛选出有价值的特征,最后 ...

  5. 情感分析的新方法,使用word2vec对微博文本进行情感分析和分类

    向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析  公众号: datadw 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中.通过这种 ...

  6. 使用word2vec对新浪微博进行情感分析

    原文发表于:http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6906802 本文仅是对上文的学习和复现 Word2vec可以将词 ...

  7. python实现情感分析_使用python+机器学习方法进行情感分析(详细步骤)

    使用python+机器学习方法进行情感分析(详细步骤) 2021-02-07 不是有词典匹配的方法了吗?怎么还搞多个机器学习方法.因为词典方法和机器学习方法各有千秋.机器学习的方法精确度更高,因为词典 ...

  8. 使用word2vec对新浪微博进行情感分析和分类

    原文发表于:http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6906802 本文仅是对上文的学习和复现 Word2vec可以将词 ...

  9. [NLP]如何进行情感分析

    本文介绍的是如何进行情感识别. 在自然语言中(尤其社交媒体和购物网站中),每一句话都隐含了具体的情感倾向,比如中性.正面.负面.比如:今天天气不错:今天心情不太好:苹果手机不错:地球是圆的.对于人来说 ...

最新文章

  1. Aquaculture:天津农科院谢凤行团队揭示菌群预测功能与实际代谢特性的相关性...
  2. 范数(赋范线性空间、向量范数、矩阵范数)
  3. AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型
  4. VBA各种查询方法介绍和应用举例
  5. 鸿蒙系统年底问世视频,鸿蒙系统年底问世 什么时候上市使用
  6. 编程常用英语词汇 | GitHub
  7. 团队开发中Git冲突解决
  8. cmd命令查看本机网外地址
  9. Otsu最大类间方差法
  10. office Excel操作
  11. AI算法之Encoder-Decoder 和 Seq2Seq
  12. Springboot 热部署----热部署插件的使用
  13. K8S—二进制部署安装(包含UI界面设置)
  14. WordPress给博客文章页添加个性名片
  15. 数据基础---《利用Python进行数据分析·第2版》第8章 数据规整:聚合、合并和重塑
  16. 在Chrome安装Edge的插件
  17. 点线面的意义_聊聊「点线面」的概念
  18. 3*3 三行三列的圈叉棋
  19. 【数据结构】链表 - Go 语言实现
  20. 关于IAP支付,谷歌和苹果订阅商品——最白话,手把手教你做系列。

热门文章

  1. firefox os android,若能同时使用Android应用,那么你可以接受Firefox OS手机了吗?
  2. C#:实现麦克劳林级数计算非线性函数算法(附完整源码)
  3. web buuctf [BJDCTF2020]Mark loves cat1
  4. 学习笔记——共阳数码管的动态显示
  5. 融会贯通面对对象编程思想
  6. 阿里云-云开发平台普及篇——创建应用
  7. 中国AR智能隐形眼镜市场竞争态势与投资规划分析报告2022-2028年
  8. 某笔试的一道简单题目
  9. EC2 Auto Scaling知识点
  10. 计算机专业报瑞士酒店管理,我适合去瑞士读酒店管理吗?