现如今各种APP、微信订阅号、微博、购物网站等网站都允许用户发表一些个人看法、意见、态度、评价、立场等信息。针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息。例如对商品评论的分析,可以了解用户对商品的满意度,进而改进产品;通过对一个人分布内容的分析,了解他的情绪变化,哪种情绪多,哪种情绪少,进而分析他的性格。怎样知道哪些评论是正面的,哪些评论是负面的呢?正面评价的概率是多少呢?

利用python的第三方模块SnowNLP可以实现对评论内容的情感分析预测,SnowNLP可以方便的处理中文文本内容,如中文分词、词性标注、情感分析、文本分类、提取文本关键词、文本相似度计算等。大概大于等于0.5,可以判断为正面评价——积极情感,小于0.5,可以判断为负面评价——消极情感。

下面分析一组京东上某产品的评论数据并生成折线图:

部分源数据:

实现过程:

#加载情感分析模块

from snownlp importSnowNLP#from snownlp import sentiment

importpandas as pdimportmatplotlib.pyplot as plt#导入样例数据

aa ='F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\京东评论.xls'

#读取文本数据

df=pd.read_excel(aa)#提取所有数据

df1=df.iloc[:,3]print('将提取的数据打印出来:\n',df1)#遍历每条评论进行预测

values=[SnowNLP(i).sentiments for i indf1]#输出积极的概率,大于0.5积极的,小于0.5消极的#myval保存预测值

myval=[]

good=0

bad=0for i invalues:if (i>=0.5):

myval.append("正面")

good=good+1

else:

myval.append("负面")

bad=bad+1df['预测值']=values

df['评价类别']=myval#将结果输出到Excel

df.to_excel('F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\result2.xls')

rate=good/(good+bad)print('好评率','%.f%%' % (rate * 100)) #格式化为百分比#作图

y=values

plt.rc('font', family='SimHei', size=10)

plt.plot(y, marker='o', mec='r', mfc='w',label=u'评价分值')

plt.xlabel('用户')

plt.ylabel('评价分值')#让图例生效

plt.legend()#添加标题

plt.title('京东评论情感分析',family='SimHei',size=14,color='blue')

plt.show()

Excel结果:

作图的结果:

python商品评论分析_python实现电商评论的情感分析相关推荐

  1. Python + 爬虫,分析一波电商评论

    作者 | 李秋键 头图 | 下载于ICphoto 出品 | AI 科技大本营(ID:rgznai100) 引言: 随着电子商务.社交媒体等信息技术的快速发展,在线评论已经成为影响消费者购买决策和产品市 ...

  2. python微博评论情感分析_Python采集微博热评进行情感分析祝你狗年脱单

    Ps: 重要的事情说三遍!!! 结尾有彩蛋,结尾有彩蛋,结尾有彩蛋. 如果自己需要爬(cai)虫(ji)的数据量比较大,为了防止被网站封Ip,可以分时段爬取,另外对于爬到的数据一般是用来存储数据库,这 ...

  3. 利用python分析电商_Python实现爬取并分析电商评论

    现如今各种APP.微信订阅号.微博.购物网站等网站都允许用户发表一些个人看法.意见.态度.评价.立场等信息.针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息.例如对商品评论的 ...

  4. 基于Hadoop的电商广告点击数的分析与可视化(Shell脚本执行与大屏可视化设计)

    目录 摘要 大屏可视化预览 如何安装Hadoop集群 数据集介绍 项目部署流程 一键化配置环境和参数 一键化建立hive数据表 Flume配置及自动加载数据到hive中 数据分析 mysql接收数据表 ...

  5. 电商评论数据聚类实验报告

    电商评论数据聚类实验报告--冯煜博 目录 实验目的 整体思路 数据介绍 代码与实验步骤 4.1 爬虫代码 4.2 数据清洗 4.3 分词 4.4 去停用词 4.5 计算TF-IDF词频与聚类算法应用 ...

  6. 电商运营的业务分析逻辑总结

    分析路径 1.分析的四大思路 判断指标的合理性,不合理通过细分.转化等方式定位问题所在,提出解决方案.指标的对比一定要注意四个一致,包括:对象.时间属性.数据源.指标定义 (1)对比:横向.纵向,判断 ...

  7. 电商数据分析--用户行为分析

    电商数据分析–用户行为分析 数据分析流程: 明确目的 获取数据 数据探索和预处理 分析数据 得出结论 验证结论 结果展现 用户行为是指用户在产品上产生的行为.(登陆.浏览.购买.加入购物车) 用户行为 ...

  8. 电商 竞品分析_电商平台竞品分析报告.docx

    Planning scheme 电商平台竞品分析报告 电商平台竞品分析报告 电商平台竞品分析报告 V1.0 2018-3-18 状态 : [ √ ] 草稿 [ ] 修改中 [ ] 定稿 文件标签: 竞 ...

  9. 目前最详细的对国内跨境电商的纯干货分析

     目前最详细的对国内跨境电商的纯干货分析 *本文作者为贝塔斯曼亚洲投资基金 (BAI) 投资助理杨露茜 2014 年被很多业内人士称为跨境进口电商元年.这一年里,传统零售商.海内外电商巨头.创业公 ...

最新文章

  1. ubuntu root默认密码(初始密码)
  2. 使用echo输出一绝对路径,使用egrep取出其基名
  3. autolisp统计相同元素个数_统计学习基础知识
  4. 编程理论:多态,继承,和开闭原则
  5. VS2008,GDIPlus初步
  6. VS2015配置freegult
  7. 【收集】Python 微优化
  8. NSURLCache缓存使用简介
  9. RTSP摄像机为什么还保留MJPEG编码格式
  10. oracle 11g r2 安装过程与卸载详细图解
  11. 我的世界java占用太多内存_Java 进程占用内存过多,幕后元凶原来是线程太多
  12. windows自带黑体_win7系统黑体字体
  13. NEFU锐格实验一[字符串]
  14. Windows电脑开机后进不了系统的解决方法
  15. 金彩教育:如何设计好主图
  16. SpringMvc标签应用
  17. 计算机考证决心书怎样写
  18. 纺织品行业——瑞士蓝标Bluesign认证
  19. fnl数据下载之requests,urllib等安装
  20. SUSE(Linux操作系统)

热门文章

  1. 云服务器ECS,你真的懂吗?
  2. 默克尔树 Merkle Tree
  3. IBM待遇完全揭密--工资 级别等(完整版)(2010-09-06 22:14 )
  4. python交通流预测算法_基于机器学习的交通流预测技术的研究与应用
  5. Cadence Allegro元件封装制作流程
  6. pytest官方的帮助文档(英文原版)
  7. 华为防火墙(NAT)
  8. 基于S32K148快速调试TJA1101
  9. Python配置R语言包过程、问题及解决
  10. 豆瓣电影api接口数据