分析斗鱼弹幕礼物发送情况
分析斗鱼弹幕礼物发送情况
一.数据来源
python抓取斗鱼直播间3168536的弹幕获得
二.数据处理
对得到的数据维度建模、ETL过程最终得到事实表dw_fact_analysis,取2017-12-17日 17时 ~ 24时直播弹幕数据
三.描述性分析
1.房间内每5分钟观众赠送礼物数量
SQL、PYTHON代码部分:
select date_format(data_date, '%Y-%m-%d %H') as date_date, CAST(floor(date_format(data_date, '%i')/5) as signed) as times, count(*) as 'count'
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
group by date_date,times
order by date_date,times asc
x = df.index
y = df['count']
plt.figure(figsize=(10, 5))
plt.plot(x, y, '')
print(df['count'].mean())
print(df['count'].median())
plt.title(u'每5分钟礼物数量', fontproperties=font_set)
plt.xlabel(u'times')
plt.ylabel(u'count(gift)')
通过结果发现在时间段内赠送礼物最多为6939,最少为138
平均赠送数量为920.5
赠送礼物的中位数为582.5
- 赠送礼物人数情况
SQL、PYTHON代码部分:
select count(user_code) as person, gift_code, user_value
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
and user_value <> 'null'
group by gift_code
plt.figure(figsize=(10, 5))
df.reset_index()
df.set_index('gift_code', inplace=True)
df[['person']].plot(kind='bar')
plt.title(u'每种礼物赠送人数', fontproperties=font_set)
plt.xlabel(u'gift_code')
plt.ylabel(u'count(person)')
通过结果发现礼物编号1143赠送人数最多,其次为编号为520的礼物
- 礼物收益情况
SQL、PYTHON代码部分:
select round(sum(user_value), 2) as index_value, gift_code
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
group by gift_code
having index_value <> 'null'
df.reset_index()
df.set_index('gift_code', inplace=True)
df[['index_value']].plot(kind='bar', figsize=(6, 8))
plt.title(u'每种礼物收益情况', fontproperties=font_set)
plt.xlabel(u'gift_code')
plt.ylabel(u'count(price)')
通过结果发现收益前三的礼物编号为1005、1143、1115,与分析结果2比较,其编号1143礼物赠送最多但主播收益却不为最高,编号1005礼物赠送人数量最少但主播收益最大,说明大多数人赠送的都是比较廉价的礼物
四.探索性分析
1.送了一次礼物的人是否还会送第二次
select count(*) from (
select user_code, count(hit_type_code)
from dw_fact_analysis
where data_date between str_to_date('2017-12-17 17:00:00', '%Y-%m-%d %H:%i:%s') and str_to_date('2017-12-17 23:00:00', '%Y-%m-%d %H:%i:%s')
and hit_type_code >='2'
group by user_code
order by user_code
) t1select count(distinct user_code) from dw_fact_analysis
通过结果发现在93951人中, 只有5390 人第二次赠送了礼物
分析斗鱼弹幕礼物发送情况相关推荐
- python爬虫----简单的抓取斗鱼弹幕
近几年来直播越来越火,看直播也成为了人们生活的娱乐项目 个人也是比较喜欢看直播,看着主播的搞笑的操作和弹幕不时会开怀大笑. 于是就想能不能把弹幕抓取下来,带着这个问题我就点开了一个直播间.按照以前学过 ...
- 超级卵杰的自动脚本(1)连接斗鱼弹幕服务器。
这是关于超级卵杰(74751)直播间的python自动化脚本.超级卵杰只会玩卵子图,导致压分压哪输哪.所以做了个自动化脚本替我压分.基本上卵杰直播间的功能都能实现.接受弹幕是根据别人模板改的. 主要是 ...
- 通过websocket抓取斗鱼弹幕和礼物消息
1.斗鱼弹幕协议 到斗鱼官方开放平台看斗鱼通讯协议,网址"斗鱼开放平台",登录后可查看 所以根据斗鱼协议做编码函数: 1 def msg_encode(msg):2 #消息以 \0 ...
- Android 获取斗鱼弹幕
涉及相关的资料可以去斗鱼开发者平台上找 http://dev-bbs.douyutv.com/forum.php 以下内容改编自斗鱼开发者平台上的JAVA版弹幕获取 BarrageActivity.j ...
- PHP点歌插件,斗鱼弹幕点歌插件_小葫芦社区_小葫芦插件交流 - Powered by Discuz!
更新版本:3.3.7更新日期:2017-04-25更新日志:1. 修复 部分斗鱼房间无法连接弹幕的问题(主要是参与主播带你嗨购活动的主播)2. 修复 其他已知问题 更新版本:3.2.16更新日期:20 ...
- B站弹幕姬,弹幕礼物感谢,关注感谢,自动回复,房管工具,房管助手,基于java
运行环境 可在所有主要操作系统上运行,并且仅需要安装Java JDK或JRE版本8或更高版本.要检查,请运行java -version: $ java -version java version &q ...
- python 斗鱼弹幕的爬取一(selenium)
针对弹幕的爬取我们如果只需要获取看到的网页里面的而数据,使用selenium就能实现,对于直播平台来说,往往有第三方平台api让你获取数据(可以获取发弹幕,发弹幕者的名字礼物等等,这需要客户端向弹幕服 ...
- python爬斗鱼直播_Python爬虫:利用API实时爬取斗鱼弹幕
原标题:Python爬虫:利用API实时爬取斗鱼弹幕 这些天一直想做一个斗鱼爬取弹幕,但是一直考试时间不够,而且这个斗鱼的api接口虽然开放了但是我在github上没有找到可以完美实现连接.我看了好多 ...
- php 抓取弹幕,php实现斗鱼弹幕,一起来欣赏弹幕吧~
推荐:<PHP视频教程> 斗鱼弹幕 PHP版本 github地址:https://github.com/wjhtime 之前写过python获取斗鱼的弹幕 传送门,突发奇想,想要用php来 ...
最新文章
- AC日记——字符串最大跨距 openjudge 1.7 26
- 为什么大多数公司都不重视技术?
- 计算机视觉 | 计算机视觉相关算法及工具
- 7360清零方法_兄弟、联想、美能达、富士施乐全系列打印机加粉清零方法
- python编程的常用工具_小白学Python(2)——常用Python编程工具,Python IDE
- 程序员上帝视角解读“旅行青蛙”,你的呱真的在旅行嘛?
- 25.4. Phing
- 再推新机!小米A3正式发布 售价249欧元起
- java dispose方法_java-dispose方法
- vSphere 5.5 VM整合磁盘失败之—文件被锁定无法访问
- strcat与strncat的C/C++实现
- Python基础知识 D9
- Linux之web服务搭建静态网页------综合练习
- Python中各种括号的区别、用途及使用方法
- C# 汉字转拼音(支持GB2312字符集中所有汉字)
- 编译原理——将代码翻译成四元式序列
- opencv识别图片颜色(1)
- 高效能人士的七个习惯(一)由内而外全面造就自己
- ICM20948九轴传感器角速度读取与实际单位转化的换算关系
- Python自动化实践