本文原创作者: 数据超市 (http://www.data-shop.net)
本文原始链接:http://www.data-shop.net/2018/08/ctrip_hotel_comment_201808/

数据说明:
携程网国内酒店(http://hotels.ctrip.com/)评论数据,数据总数81,636,789条。2018年8月份采集。

更新时间:
2018年8月份。

详细字段说明:
‘hotel_id’(酒店ID), ‘hotel_name’(酒店中文名称), ‘hotel_en_name’(酒店英文名称), ‘city’(酒店所在城市), ‘comment_hotel_level’(酒店评级), ‘comment_score’(酒店评分), ‘comment_item_score’(酒店分项评分), ‘comment_recommend’(推荐度), ‘user_impress’(住客印象), ‘comment_total’(点评总数), ‘recomment_num’(值得推荐数), ‘no_recoment_num’(有待改善数), ‘user_name’(评论用户名), ‘user_comment_score’(用户评分), ‘check_in_type’(入住类型), ‘check_in_date’(入住日期), ‘room_name’(房间类型), ‘comment_txt’(评价内容), ‘comment_time’(评价时间), ‘scrape_url’(酒店详情页url)

示例数据:
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

说明:该文章为 数据超市 (http://www.data-shop.net)原创文章 ,您除了可以发表评论外,还可以转载到别的网站,但是请保留源地址,谢谢!!(尊重他人劳动,我们共同努力)

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30303165/viewspace-2213315/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/30303165/viewspace-2213315/

携程网国内酒店评论数据(超8163万条)相关推荐

  1. python爬携程酒店评论_python爬虫爬取携程网的酒店评论数据时,有个请求参数不知道是怎么生成的?...

    是下面这个代码生成的,看不懂: ,_getElevenValue:function(e){ function o(e){ for(var o=["A","B", ...

  2. scrapy爬取酒店评论数据

    scrapy爬取酒店评论数据 代码 here:GitHub:scrapy_hotel_review 采用scrapy爬取酒店评论数据. 总共有28W条记录. 做某NLP任务,需要一些hotel rev ...

  3. 共享单车数据集超10万条

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 共享单车数据集,包括骑行时间.会员骑行时间.会员类型.骑行路线类别.开始时间.结束时间.开始站 ...

  4. 快手资讯 | 修订快分销平台管理规范,一年拦截风险视频超20万条

    1.快手处置33个"吴勇工作室"仿冒账号 5月30日,快手发布了关于打击仿冒帐号的处罚公告,平台共处理帐号33个. 平台表示,近期通过巡查发现,在部分热点事件中,个别网友为博眼球蹭 ...

  5. 图示LDA主题模型(酒店评论数据演示)

    LDA(Latent Dirichlet Allocation)主题建模是NLP确定文档主题方法,为无监督学习方法,当面对多个文档,能挖掘潜在的主题,类似于聚类方法,但又何聚类实质不一样,LDA从概率 ...

  6. pyhton爬虫(12)——抓取携程酒店评论数据

    本文主要目标是抓取携程酒店基本信息和用户评论数据.具体来说,酒店基本信息包括:酒店名.酒店星级.酒店最低房价.用户推荐比.酒店总评分等:用户评论数据包括:用户评论时间,用户评分,评论内容等. 实现代码 ...

  7. python读取大数据量xml_[C#]_[使用微软OpenXmlSDK (OpenXmlReader)读取xlsx表格] 读取大数据量100万条数据Excel文件解决方案...

    1.OpenXmlSDK是个很好的类库,可惜只能通过C#调用,C#的童鞋又福气了. 2.服务端程序由于没法安装office,所以这个对asp.net网站来说是最理想的库了.需要.net 4.0版本以上 ...

  8. 赶集网家电维修类数据(43万条)

    本文原创作者:数据超市(http://www.data-shop.net) 本文原始链接: http://www.datashop.net/2018/05/%E8%B5%B6%E9%9B%86%E7% ...

  9. Java怎么实现几十万条数据插入(30万条数据插入MySQL仅需13秒)

    本文主要讲述通过MyBatis.JDBC等做大数据量数据插入的案例和结果. 30万条数据插入插入数据库验证 实体类.mapper和配置文件定义 User实体 mapper接口 mapper.xml文件 ...

最新文章

  1. Java实用教程笔记 组件及事件处理
  2. rtp 多媒体流同步控制 实时传输协议 简介
  3. 记录贴-配置HTTPS域名访问到本地局域网网关
  4. 十七、爬虫实战,多线程抓取大搜网新车的数据
  5. c++调用mysql存储过程_C++中ADO调用MySQL存储过程失败,诡异的语法异常,求解中,附源码...
  6. LinbDesk --- 新的extjs4.2 desktop demo : 技术交流Q群:336584192
  7. 支持1050ti显卡的linux系统,NVIDIA 的 GTX1050 Ti 与 GTX1050 显卡登场
  8. ElasticSearch API文档查看
  9. linux驱动之可加载模块
  10. python工业互联网应用实战13—基于selenium的功能测试
  11. n平方的求和公式_极限求解--数列前n项和公式推导(补充知识)
  12. 重庆理工大学图像处理实验二:图像增强
  13. element ui 表格拆分表格_python拆分表格数据
  14. php curl获取404,php使用curl判断网页404(不存在)的方法
  15. NAT 内网穿透原理
  16. 13个适合上班时做的保健小动作
  17. matlab 分数阶混沌系统的完全同步控制
  18. putty连接不上该怎么办
  19. 游戏账号交易平台,是专门为网络游戏提供相关交易服务的电子商务平台,主要从事网络游戏账号的交易。
  20. BUUCTF Easy MD5

热门文章

  1. java mysql resultset count_Java ResultSetMetaData getColumnCount()方法的示例?
  2. jsp中引入css文件不起作用
  3. php 二维排序函数,PHP二维数组排序函数
  4. python scapy traceroute_07python实现traceroute程序
  5. php5.6安装curl,解决PHP5.6的cURL扩展开启失败的问题
  6. 苹果也有对手;魅族、诺基亚都很可怕
  7. C# PropertyInfo 获取实体类属性名称和属性值
  8. strictmode android,Android StrictMode使用
  9. 相律公式表达式_【单选题】相律的数学表达式为()。
  10. DELL服务器RAID配置教程AND为服务器安装centos7系统实验