尊敬的读者您好:笔者很高兴自己的文章能被阅读,但原创与编辑均不易,所以转载请必须注明本文出处并附上本文地址超链接以及博主博客地址:https://blog.csdn.net/vensmallzeng。若觉得本文对您有益处还请帮忙点个赞鼓励一下,笔者在此感谢每一位读者,如需联系笔者,请记下邮箱:zengzenghe@gmail.com,谢谢合作!

笔者最近主要在研究酒店点评类工作,主要包括内容智能发现、点评文本分类、用户关注点挖掘以及正负向点评可视化等等。今天主要讲一下,对于”酒店正负向点评可视化“,笔者是如何实践的。

1、本次实践目标与任务

① 看大盘的用户点评最关注哪些方向?

② 在这些方向中,用户具体关注哪些点?

2、先梳理一下主要流程

点评文本获取 > 文本预处理 > 文本分类/正负向识别 > 利用词云进行展示

3、

① 看大盘的用户点评最关注哪些方向?

a. 点评文本获取

大盘用户点评量级很大,与业务方沟通后只取近一年

b. 文本预处理

繁体字转换、敏感词汇剔除、过滤特殊字符、去除全部标点和空格以及文本纠错等

c. 文本分类

考虑到是看大盘用户最关注哪些方向,因此该步采用的是文本分类方式,获取了点评对应的类别,另外此处不涉及正负向识别。

d. 利用词云进行展示

采用WordCloud库,并借助generate方法对类别关键词生成词云。

② 在这些方向中,用户具体有很多,这里挑两个比较有意思的方向看看,比如购物和景观方向。

a. 点评文本获取

获取购物和景观类别的用户点评。

b. 文本预处理

繁体字转换、敏感词汇剔除、过滤特殊字符、去除全部标点和空格以及文本纠错等

c. 正负向识别

考虑到景观类的点评量很多,该步采用的是关键词抽取方式以获取词列表。同时购物类的点评量不多,该步直接采用分词方式以获取词列表。然后将每个词用情感模型(SnowNLP)进行情感识别,两头各设一个阈值并将满足条件的词分别放入正向词表和负向词表。

d. 利用词云进行展示

采用WordCloud库,并借助generate方法对正负向此列表生成词云。

景观正向

景观负向

购物正向

购物负向

日积月累,与君共进,增增小结,未完待续。

酒店正负向点评可视化相关推荐

  1. Python爬虫之Selenium爬取途牛全国的酒店数据进行地图可视化

    因为找不太到途牛的url规律,就只能慢慢爬取数据,由于页面加载的时间很慢,用一台电脑爬取4000+数据可能需要数小时,这里只是简单实现了每个城市的第一页数据,可以在这个基础上实现多个页面一起爬和强化翻 ...

  2. python酒店评论分析_对超过1M的酒店点评进行机器学习,发现有趣的见解

    在之前的文章中,我们学会了如何训练一个机器学习分类器,用来检测酒店点评中提到的不同方面.使用这个方面分类器,我们可以自动的知道一个特定的点评是否在谈论清洁.舒适和设施.食品.网络.地点.工作人员以及/ ...

  3. 四、五星级酒店的点评在点评总量中的占比高达79.6%

    酒店点评分析公司Revinate在对7000万条点评进行分析后发现,近4/5写酒店点评的客人对入住体验感到满意. Revinate对过去2年全球点评网站上的点评进行分析后发布了<全球酒店声誉基准 ...

  4. 数据可视化笔记4 结构数据的可视化图形

    文章目录 基本数据图形 描述分布图形 多维数据图形 基本数据图形 基本数据图形--基本数据图形类型 数据本身 柱形图.条形图 折线图 散点图 基本数据图形变体(Cleverland点图 面积图 气泡图 ...

  5. 【Python数据分析及可视化】美国犯罪监禁数据分析与可视化

    文章目录 前言 一.数据描述 二.数据预处理 1.缺失值处理 2.查看数据分布 三.犯罪情况可视化分析 1.州别维度的可视化分析 2.类型维度的可视化分析 3.性别维度的可视化分析 4.年龄维度的可视 ...

  6. 计算机毕业设计SSM大众点评管理系统【附源码数据库】

    项目运行 环境配置: Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclis ...

  7. [附源码]Python计算机毕业设计大众点评管理系统

    项目运行 环境配置: Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs. 项目技术: dj ...

  8. [附源码]Node.js计算机毕业设计大众点评管理系统Express

    项目运行 环境配置: Node.js最新版+ Vscode + Mysql5.7 + HBuilderX+Navicat11+Vue. 项目技术: Express框架 + Node.js+ Vue 等 ...

  9. 干货 | 携程酒店安卓地图开发实践

    作者简介 亦枫,携程资深软件工程师,负责酒店业务 Android 客户端的相关研发工作. 当前大多数移动互联网 App 都会存在地图相关功能,尤其是 LBS(基于位置服务)相关的业务,依赖性更强,携程 ...

最新文章

  1. NLP分析技术的三个层面
  2. Build RESTful client
  3. 验证证书有效期_笔试查分前,教资考试4个有效期你到底弄清楚了没?逾期不补!...
  4. 仿真RM码,及在高斯信道下的译码性能,对RM采用大数逻辑译码算法
  5. 怎么用计算机算立方数,计算器的使用方法
  6. mysql t 保存_检查 (调试) - 离线消息保存到 MySQL - 《EMQ X Enterprise v4.1 中文文档》 - 书栈网 · BookStack...
  7. 华为成立德国实验室属实 但并非为5G牌照
  8. zend studio mysql 配置_php 在Zend Framework中配置数据库参数
  9. php写进度条原理,php实现进度条原理
  10. jidnserror.wo.com.cn:8080错误解决方法
  11. PowerBuilder DataWindow 38个开发技巧
  12. docker php7 mysql分开,Docker nginx+php74+mysql57, 并安装gd和mysql扩展
  13. python (元祖\列表\集合\字典)基础用法
  14. 扬州工业机器人外壳设计排名_世界十大工业机器人制造商公布,排名第一的竟是……...
  15. 360路由器v2刷第三方固件_路由器刷固件图文教程,刷机OpenWrt第三方固件,路由器升级固件...
  16. linux编译 mb_string,linux mb()/rmb()/wmb()
  17. 计算机快捷键大全截图,电脑截图快捷键是哪个?电脑快捷键使用大全
  18. Android JSON:Gson,FastJson解析库的使用和对比分析
  19. SequoiaDB巨杉数据库-配置
  20. 算法-经典趣题-青蛙过河

热门文章

  1. Spring Cloud Netfix Hystrix(断路器)
  2. layer.alert文字换行
  3. Couldn’t write pidfile at /run/prosody/prosody.pid; /run/prosody/prosody.pid: No such file or direct
  4. 宋劲彬《从C到C++》视频
  5. python 是否可以一键修图_还在用美图秀秀的一键美颜?看完这篇让你修图更自然!...
  6. SqlDataAdapter 和 SqlCommand
  7. 【c语言】复习无止境,day2--数组函数篇
  8. oledbCommand.Parameters 图片varbinary存取
  9. 【TCP/IP】TCP/IP 四层分别有哪些协议|OSI四层/五层/七层协议
  10. Canvas2~茜色的调色盘12月1日剧情翻译