分析斗鱼弹幕礼物发送情况

一.数据来源
python抓取斗鱼直播间3168536的弹幕获得
二.数据处理
对得到的数据维度建模、ETL过程最终得到事实表dw_fact_analysis,取2017-12-17日 17时 ~ 24时直播弹幕数据
三.描述性分析
1.房间内每5分钟观众赠送礼物数量
SQL、PYTHON代码部分:

select date_format(data_date, '%Y-%m-%d %H') as date_date, CAST(floor(date_format(data_date, '%i')/5) as signed) as times, count(*) as 'count'
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and  str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
group by date_date,times
order by date_date,times asc
x = df.index
y = df['count']
plt.figure(figsize=(10, 5))
plt.plot(x, y, '')
print(df['count'].mean())
print(df['count'].median())
plt.title(u'每5分钟礼物数量', fontproperties=font_set)
plt.xlabel(u'times')
plt.ylabel(u'count(gift)')

通过结果发现在时间段内赠送礼物最多为6939,最少为138
平均赠送数量为920.5
赠送礼物的中位数为582.5

  1. 赠送礼物人数情况
    SQL、PYTHON代码部分:
select count(user_code) as person, gift_code, user_value
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and  str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
and user_value <> 'null'
group by gift_code
plt.figure(figsize=(10, 5))
df.reset_index()
df.set_index('gift_code', inplace=True)
df[['person']].plot(kind='bar')
plt.title(u'每种礼物赠送人数', fontproperties=font_set)
plt.xlabel(u'gift_code')
plt.ylabel(u'count(person)')

通过结果发现礼物编号1143赠送人数最多,其次为编号为520的礼物

  1. 礼物收益情况
    SQL、PYTHON代码部分:
select round(sum(user_value), 2) as index_value, gift_code
from dw_fact_analysis
where data_date between str_to_date('12/17/2017 17:00:00', '%m/%d/%Y %H:%i:%s') and  str_to_date('12/17/2017 23:59:59', '%m/%d/%Y %H:%i:%s')
group by gift_code
having index_value <> 'null'
df.reset_index()
df.set_index('gift_code', inplace=True)
df[['index_value']].plot(kind='bar', figsize=(6, 8))
plt.title(u'每种礼物收益情况', fontproperties=font_set)
plt.xlabel(u'gift_code')
plt.ylabel(u'count(price)')

通过结果发现收益前三的礼物编号为1005、1143、1115,与分析结果2比较,其编号1143礼物赠送最多但主播收益却不为最高,编号1005礼物赠送人数量最少但主播收益最大,说明大多数人赠送的都是比较廉价的礼物

四.探索性分析
1.送了一次礼物的人是否还会送第二次

select count(*) from (
select user_code, count(hit_type_code)
from dw_fact_analysis
where data_date between str_to_date('2017-12-17 17:00:00', '%Y-%m-%d %H:%i:%s') and str_to_date('2017-12-17 23:00:00', '%Y-%m-%d %H:%i:%s')
and hit_type_code >='2'
group by user_code
order by user_code
) t1select count(distinct user_code) from dw_fact_analysis

通过结果发现在93951人中, 只有5390 人第二次赠送了礼物

分析斗鱼弹幕礼物发送情况相关推荐

  1. python爬虫----简单的抓取斗鱼弹幕

    近几年来直播越来越火,看直播也成为了人们生活的娱乐项目 个人也是比较喜欢看直播,看着主播的搞笑的操作和弹幕不时会开怀大笑. 于是就想能不能把弹幕抓取下来,带着这个问题我就点开了一个直播间.按照以前学过 ...

  2. 超级卵杰的自动脚本(1)连接斗鱼弹幕服务器。

    这是关于超级卵杰(74751)直播间的python自动化脚本.超级卵杰只会玩卵子图,导致压分压哪输哪.所以做了个自动化脚本替我压分.基本上卵杰直播间的功能都能实现.接受弹幕是根据别人模板改的. 主要是 ...

  3. 通过websocket抓取斗鱼弹幕和礼物消息

    1.斗鱼弹幕协议 到斗鱼官方开放平台看斗鱼通讯协议,网址"斗鱼开放平台",登录后可查看 所以根据斗鱼协议做编码函数: 1 def msg_encode(msg):2 #消息以 \0 ...

  4. Android 获取斗鱼弹幕

    涉及相关的资料可以去斗鱼开发者平台上找 http://dev-bbs.douyutv.com/forum.php 以下内容改编自斗鱼开发者平台上的JAVA版弹幕获取 BarrageActivity.j ...

  5. PHP点歌插件,斗鱼弹幕点歌插件_小葫芦社区_小葫芦插件交流 - Powered by Discuz!

    更新版本:3.3.7更新日期:2017-04-25更新日志:1. 修复 部分斗鱼房间无法连接弹幕的问题(主要是参与主播带你嗨购活动的主播)2. 修复 其他已知问题 更新版本:3.2.16更新日期:20 ...

  6. B站弹幕姬,弹幕礼物感谢,关注感谢,自动回复,房管工具,房管助手,基于java

    运行环境 可在所有主要操作系统上运行,并且仅需要安装Java JDK或JRE版本8或更高版本.要检查,请运行java -version: $ java -version java version &q ...

  7. python 斗鱼弹幕的爬取一(selenium)

    针对弹幕的爬取我们如果只需要获取看到的网页里面的而数据,使用selenium就能实现,对于直播平台来说,往往有第三方平台api让你获取数据(可以获取发弹幕,发弹幕者的名字礼物等等,这需要客户端向弹幕服 ...

  8. python爬斗鱼直播_Python爬虫:利用API实时爬取斗鱼弹幕

    原标题:Python爬虫:利用API实时爬取斗鱼弹幕 这些天一直想做一个斗鱼爬取弹幕,但是一直考试时间不够,而且这个斗鱼的api接口虽然开放了但是我在github上没有找到可以完美实现连接.我看了好多 ...

  9. php 抓取弹幕,php实现斗鱼弹幕,一起来欣赏弹幕吧~

    推荐:<PHP视频教程> 斗鱼弹幕 PHP版本 github地址:https://github.com/wjhtime 之前写过python获取斗鱼的弹幕 传送门,突发奇想,想要用php来 ...

最新文章

  1. AC日记——字符串最大跨距 openjudge 1.7 26
  2. 为什么大多数公司都不重视技术?
  3. 计算机视觉 | 计算机视觉相关算法及工具
  4. 7360清零方法_兄弟、联想、美能达、富士施乐全系列打印机加粉清零方法
  5. python编程的常用工具_小白学Python(2)——常用Python编程工具,Python IDE
  6. 程序员上帝视角解读“旅行青蛙”,你的呱真的在旅行嘛?
  7. 25.4. Phing
  8. 再推新机!小米A3正式发布 售价249欧元起
  9. java dispose方法_java-dispose方法
  10. vSphere 5.5 VM整合磁盘失败之—文件被锁定无法访问
  11. strcat与strncat的C/C++实现
  12. Python基础知识 D9
  13. Linux之web服务搭建静态网页------综合练习
  14. Python中各种括号的区别、用途及使用方法
  15. C# 汉字转拼音(支持GB2312字符集中所有汉字)
  16. 编译原理——将代码翻译成四元式序列
  17. opencv识别图片颜色(1)
  18. 高效能人士的七个习惯(一)由内而外全面造就自己
  19. ICM20948九轴传感器角速度读取与实际单位转化的换算关系
  20. Python自动化实践

热门文章

  1. 乐视android系统耗电量,乐视手机Max续航能力怎么样?待机时间怎么样?
  2. 载噪比C/N和信噪比S/N
  3. lan8742a_常用以太网PHY芯片DM9161AEP、RTL8201、DP83848CVV、LAN8720A、LAN8742A
  4. 深度学习库 trax 简单事例Trax Quick Intro
  5. k8s pod被驱逐问题分析及解决
  6. 表达一个化学物质,通常使用的方法有
  7. “无人值守”污水站智能化远程管理平台
  8. 必会算法总结2—最小公倍数
  9. 题目:如何判断一个机器是大端还是小端
  10. AutoCAD中计算线加总长度