作者:胡萝卜酱

来源:经管人学数据分析

大家看过《全职高手》的动漫吗?根据同名小说改编的,是一个非常大的IP。作为一个没有玩过任何网游的人,都看的热血沸腾。豆瓣评分在8.2,还算不错。

不过今天我们爬取的不是豆瓣评论,而是B站评论,因为它是在B站发布的,评论更为集中一些。其实是想爬弹幕,但是每一集弹幕最多显示3000条,遂放弃。B站评论按照每集显示,我们这里示范性只爬取了第一集的评论,显示的261930条评论,共4790页,但是这些评论数目加上了楼层回复的,所以按照楼层爬取,小编共获得了95762条评论。

右键找到相应的json文件,点击preview,便能找到我们所需内容。

这个URL为:

https://api.bilibili.com/x/v2/reply?callback=jQuery17203964473758122842_1544603719132&jsonp=jsonp&pn=1&type=1&oid=9659814&sort=0&_=1544603720769

但是别高兴的太早,直接request这个地址是会报错了,于是重新分析该地址

这里内容和URL是对应的,但是其实真正有用的只有三个,pn代表页码,oid代表视频编号,还有type和sort。于是删掉多余的信息,得到最终的URL:

https://api.bilibili.com/x/v2/reply?pn='1&type=1&oid=9659814&sort=0

接下来就非常容易了,写个for循环,存储每一页所需数据。

注意爬取下来的楼不一定是连续的,原因是一些楼层评论涉黄涉暴被删除了。

那么接下来就简单分析一下爬取下来的数据吧。

首先是时间线的评论数目,如下图,

因为第一集上线时间为2017年4月7日,距今时间已经超过1年半了,因此,在虽时间增长,评论数目也在逐渐下降。于是我们只看前一个月的数据。

上线第一天评论数目就超过两万,然后第二天直线下降,随时间增加越来越少,但是在一周后会小幅度增长,应该是有新的一集更新的缘故吧。

任何看看性别分布,如下图:

说实话,小编有点意外,这类讲网游的动漫,小编还以为是男生更多呢,结果女生不仅多余男生,还超的有点多呢。

在B站,一共有7个等级,如下,大概四级以上才算活跃用户。

在评论《全职高手》的用户里面,B站活跃用户占比相当大。

为了探索用户性别和等级的关系,于是做了下图:

等级-性别分布和本身用户性别比看起来似乎没有区别,于是,又做了堆叠图:

看起来,性别和等级果然没有关系。O(∩_∩)O,那么用户观看《全职高手》通常是在什么时间段呢?

用户观看时段最多的是11点-13点,因为全职是在这个时间段更新,大家一般都在更新后立马看。然后在13点之后不断下降,直到16点慢慢增加直到0点。由此可见,大家一般在上午不看,但是在下午和晚上更喜欢观影。

时间段和等级之间的关系如上图,不论是什么等级,拟合情况都和总体观影时段能匹配上的。

针对于评论,小编用SnowNLP简单的分析了其情感,结果如下图:

按照情感得分来看,中立和超级喜欢最多,其余得分分布非常均匀。这和《全职高手》口碑是相符合的,因为对很多人来说,这部剧在国产动漫里面已经是相当不错的,但碍于小说有1700+章,想在短短的20分钟呈现出来,那么必然要进行大幅度删减,于是对于角色的刻画,会存在较大的不同,这也造成了很多人不喜欢它,或考虑国内动漫发展情况,给予中等评价。但是对于另一些人来说,比如小编,这部剧在剧情、人物等方面还是非常吸引人的,于是会给予非常高的评价。

然后基于评价,用jieba分词,做了一个词云图:

全职、荣耀、君莫笑、叶修、叶神等剧情里面的重要事件、人物都是评论常提及的词。啊啊啊也出现的非常多,是因为大部分人在上线后都会发巨多的啊表示激动。

如果分析用户的个人简介和昵称,还会发现这里面有许多死忠粉,在昵称和简介里面会采用和《全职高手》相关信息。

据说《全职高手》第二季在明年出,小编都快等不及了,于是,再看一遍过过瘾吧。

代码在:

https://github.com/summerheday/quanzhigaoshou

GitHub上,大家看完记得给颗小星星啊。

◆ ◆ ◆  ◆ ◆

数据森麟
长按二维码关注我们


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以通过扫描下方管理员二维码,让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢

《全职高手》B站近十万评论,全职为何如此吸引人相关推荐

  1. 互联网晚报 | 11/15 星期二 | 建行客服回应转账失败;每日优鲜全职员工仅剩55人;腾讯发布2022年三季度财报...

    建行客服回应转账失败:系统故障,目前已恢复 16日,建行登上微博热搜,有网友表示实时转账无法到账.建行客服回应称,11月16日上午9:30后系统故障,无法办理各类账务.非账务交易.客服表示,因建行交易 ...

  2. 月薪12K!高学历全职宝妈被骗6000元后幡然醒悟,转行程序员逆风翻盘!

    众所周知,女生在职场上需要比男生付出更多的努力,才能争取到职场上的发展机会,其中最大的一个原因是,女生会因为生育问题而限制发展,从而被贴上"一孕傻三年","有了孩子就不能 ...

  3. 程序人生:月薪12K,高学历全职宝妈被骗6000元后幡然醒悟,转行测试逆风翻盘...

    众所周知,女生在职场上需要比男生付出更多的努力,才能争取到职场上的发展机会,其中最大的一个原因是,女生会因为生育问题而限制发展,从而被贴上"一孕傻三年","有了孩子就不能 ...

  4. 新手全职宝妈用手机,在家做自媒体,每天稳定200,靠的这些站

    我有一个徒弟三十多了之前在家做全职宝妈,没有收入来源.跟我说每次要用钱都要跟老公要看他脸色,很不是滋味. 今年1月份开始跟大周开始学做自媒体,从一个只会用手机刷视频.追剧的小白,到可以自己完成视频剪辑 ...

  5. Python 网络爬虫实战:爬取 B站《全职高手》20万条评论数据

    本周我们的目标是:B站(哔哩哔哩弹幕网 https://www.bilibili.com )视频评论数据. 我们都知道,B站有很多号称"镇站之宝"的视频,拥有着数量极其恐怖的评论和 ...

  6. 入职后发现公司是外包全职_我如何通过全职工作,伴侣和3岁的双胞胎男孩打造产品...

    入职后发现公司是外包全职 by Courtney 通过考特尼 我如何通过全职工作,伴侣和3岁的双胞胎男孩打造产品 (How I built my product with a full-time jo ...

  7. 送书 | 日读论文100+,AI都替代不了!辞去医药研发总监后,她成为了一名全职学术警察...

    大数据文摘出品 作者:笪洁琼.奥????vi丫.lin 密集警告! 先来感受下这场地狱级别的连连看:这是16小块实验数据图,你能看出哪些块存在相似的地方吗? 文摘菌看了一会儿就头昏眼花,但是,你相信吗 ...

  8. 丘成桐全职加入清华,清华已聚齐诺贝尔奖、图灵奖、菲尔兹奖三个“首位华人得主”...

    来源:量子位&AI科技评论 首位菲尔兹奖华人得主丘成桐,受聘清华大学讲席教授! △丘成桐,图源:清华大学官方 这便是清华大学宣布的一则重磅消息. 丘成桐历来有着"数学国王" ...

  9. 日读论文100+,AI都替代不了!辞去医药研发总监后,她成为了一名全职学术警察...

    大数据文摘出品 作者:笪洁琼.奥????vi丫.lin 密集警告! 先来感受下这场地狱级别的连连看:这是16小块实验数据图,你能看出哪些块存在相似的地方吗? 文摘菌看了一会儿就头昏眼花,但是,你相信吗 ...

最新文章

  1. python导入txt文件并绘图-Python读取txt数据文件,并作图
  2. leetcode题目整数颠倒
  3. 关于MULE ESB相关的介绍
  4. idea修改新的git提交地址
  5. Replace Exception with Test(以测试取代异常)
  6. apache过滤恶意频繁访问_采用网关过滤器实现权限验证及对异常统一处理
  7. tf.keras与 TensorFlow混用,trainable=False设置无效
  8. python生成可执行exe控制Microsip自动填写号码并拨打
  9. Linux创建shell脚本文件
  10. 联想重装系统去掉保护_联想硬盘保护系统,小编教你联想硬盘保护系统怎么安装...
  11. 手机识别图片文字的方法
  12. SNN识别手写数字—MNIST数据集
  13. html5 fa图标库,axure官方制作FontAwesome图标元件库V5.5.0版
  14. Oracle11g安装配置(win10环境下)
  15. 树莓派烧写OpenWrt系统后外接4G模块实现4G路由即MiFi
  16. django将返回json里的unicode转换为中文
  17. 论文阅读: Spatial Dual-Modality Graph Reasoning for Key Information Extraction (关键信息提取算法)
  18. 《Planning Algorithm》 第三章:几何表示与变换
  19. VMware如此强大,势必成为开源世界的老大
  20. shell导出txt乱码_【转】Shell乱码文件中的控制字符处理

热门文章

  1. 小白学习应用构建分享-参照用法
  2. memcpy函数及模拟
  3. 失宠资本市场,B站想借长视频翻身?
  4. iwrite提交不了作业_iwrite手机登录网址 可不可以等多几天?着急的话那
  5. app内购截屏传不上去
  6. 软件工程实践第一次作业--准备
  7. 【无标题】呵呵没事的
  8. Jenkins+Docker自动化部署项目
  9. 360市场aapt命令执行出错(appt 解析报错)解决办法
  10. Redis缓存淘汰机制