抖音用户行为分析 (SQL)
最近在寻找一些sql的项目实践,所以虽然此类分析用python会更加的便捷,但是仍旧选用SQL进行。另:文本粘贴 代码格式可能会不标准有误,用powerBI 绘图
1. 通过sql sever 任务 - 导入douyin.csv平面文件 ,同时调整数据类型(此步骤也可通过excel 提前对数据进行处理)
2.查看数据情况
select top 10 * from dbo.douyin -- 查看前10行的数据
3.pv, uv 分析
select H,
count(*)as h_pv,-- 小时:pv
count(distinct uid) as h_uv --小时:uv
from dbo.douyin
group by H
order by h_pv,h_uv desc --由此可见抖音用户主要活跃的时间为晚上19:00-24:00
select dates,
count(*)as day_pv,-- 日期:pv
count(distinct uid) as day_uv --日期:uv
from dbo.douyin
group by dates
order by day_pv desc,day_uv desc --每日活跃pv,uv 10月20号开始uv和pv都达到峰值
每周同理,ps:MySQL用dayofweek取星期几,
通过按星期几分析 周一的抖音用户活跃程度最高,周三周四最低。
4.播放源分析
select channel,
count(uid) as channel_count
from dbo.douyin
group by channel --播放来源,大部分的观看主要来源于渠道0,未明确指出各值的意义,或许为算法推荐
5.播放时长与点赞率的关系
select duration_time,
case when likes_total_count =0 then 0 --避免除数为0时报错
else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate --cast强制转换为float形式,不然db2环境下,结果会只显示0,1
from(select duration_time,
sum(case when likes=1 then 1 else 0 end) as likes_total_count,
sum(case when likes=0 then 1 else 0 end) as unlike_total_count
from dbo.douyin
group by duration_time) as t1
order by likes_rate desc
所以内容时长在0-40秒之间更容易获得点赞
6.播放时长与完整播放率的问题 代码同上 做简单替换 不做进一步展示
7.热门歌曲相关分析
select music_id,
count(uid) as music_count
from dbo.douyin
group by music_id
order by music_count desc --得到热门歌曲
select music_id,music_count,likes_total_count,
case when likes_total_count =0 then 0
else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate
from(select music_id,count(*) as music_count,
sum(case when likes=1 then 1 else 0 end) as likes_total_count,
sum(case when likes=0 then 1 else 0 end) as unlike_total_count
from dbo.douyin
group by music_id) as t1
order by music_count desc,likes_total_count desc --歌曲播放量与获赞率的并无太大关系,但是热门歌曲可以获得更高的点赞量
select music_id,music_count,finish_total_count,
case when finish_total_count =0 then 0
else round(cast(finish_total_count as float)/(finish_total_count+unfinish_total_count),6) end as finish_rate
from(select music_id,count(*) as music_count,
sum(case when likes=1 then 1 else 0 end) as finish_total_count,
sum(case when likes=0 then 1 else 0 end) as unfinish_total_count
from dbo.douyin
group by music_id) as t1
order by music_count desc,finish_rate desc --歌曲播放量与完整播放率的关系,没有太大关系,但是热门歌曲可以获得更高的播放量
8.平台作者分析
select author_id,sum(uid) as num
from dbo.douyin
group by author_id
order by num desc -- 播放量最高的创作者
select author_id,author_count,likes_total_count,
case when likes_total_count =0 then 0
else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate
from(select author_id,count(*) as author_count,
sum(case when likes=1 then 1 else 0 end) as likes_total_count,
sum(case when likes=0 then 1 else 0 end) as unlike_total_count
from dbo.douyin
group by author_id) as t1
order by author_count desc,likes_total_count desc --最受欢迎的创作者
抖音用户行为分析 (SQL)相关推荐
- 需求分析报告应该包含哪些部分_2020最新抖音用户画像分析报告:粉丝都有哪些特点和需求?...
本文相关:抖音用户画像分析.抖音用户画像报告.2020最新抖音用户画像分析等 不管是做抖音运营还是抖音直播,了解粉丝,了解用户的需求是非常重要的!做任何事情,对症下药你才能事半功倍!比如你的粉丝想要梨 ...
- 小红书用户画像分析_抖音用户画像分析及活跃时间点
今天小编来和大家分享一下,抖音用户画像的分析和抖音用户的活跃时间点, 1.重点的画像,是抖音受众人群高低线及分布率. 2.查询数据的技巧,如果是产品的话参考到阿里指数上查看,如果查行业的话,可以在百度 ...
- 抖音用户数据获取分析(未完成)
基于大牛的研究成果(https://blog.csdn.net/wql2014302721/article/details/110563695),使用Fiddler在安卓9手机上抓包,添加用户证书,抓 ...
- 中忻嘉业科技:怎样分析抖音用户群体画像
想要在抖音上面做生意,那么就需要了解抖音平台主要是哪些人在玩,需要进行用户画像分析,在抖音平上才能更加精准的找到自己的精准客户,也能知道自己想要售卖的商品到底适不适合抖音这个平台,那么小编将给大家分享 ...
- Hook抖音用户信息id,secUid
抖音版本16.3.0,hook方式xposed 在采集APP数据的时候很多接口都会用到userId和sec_uid,通过抓取接口webcast/user可以看到id都是由客户端生成的 用户信息 实体类 ...
- 用户使用报告_2020年抖音用户画像报告[附下载] | 行业数据报告研读
▼ 更多专业报告,请关注我们 ▼▼有趣回顾:▼ [小时光面馆]专一先生和善变小姐 油烟情书 甲壳虫的 最后一英里 关注公众号,后台发送关键词"2020抖音用户画像"即可获取完整版P ...
- Python分析抖音用户行为数据,看看发什么样的视频才会爆!
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python分析抖音用户行为数据视频讲解地址 https://www.bilibili.co ...
- python抓取抖音用户画像,摩羯天蝎居然刷得最多?
日刷抖音三百条,悠悠一笑乐逍遥,夜深忽醒窗外事,不知今夕是何年. 要从上个月说起,那天晚上准备睡觉了,然后朋友突然发来一个抖音热门视频. 一向一本正经苟于工作的我,竟然沉醉于小姐姐的甜蜜的笑容,加之想 ...
- 用户使用报告_分享最新2020年抖音用户画像报告
今天给大家分享2020年抖音用户画像报告-巨量算数. 时间周期:本报告数据均采集于2020年1月(除特别说明外) 数据来源:第三方数据取自"QuestMoblie",内部数据取自& ...
最新文章
- Namenode主备切换或报 IPC Server handler 23 on 8020
- Zxing二维码的集成使用
- Eclipse 批量创建多级文件夹
- 使用IntelliJ, 让lombok生效的方式
- Java银行开户,取钱,存钱,查询余额,退出。。。。。
- Java EE 7 Batch中传递属性/参数的2种方式
- 网络服务器分为文件服务器通信服务器和,近代中国落后、贫困的根本原因是()...
- 使用 Nginx + Gunicorn 部署 Flask 项目
- netbeans php 断点调试,windows7 + iis7 + fastcgi + php5 + netbeans + xdebug 调试 php
- 分享四款H5怀旧小游戏魔塔+伏魔记+三国霸业+寻仙纪
- 网线接法只有两头线序一样就行了吗?
- 2019毕业设计总结——基于稀疏表示的人脸图像超分辨率重构
- Linux驱动中私有数据filp-private_data的作用
- win10重置进度条不动了_Windows10系统重置时卡死的处理方法
- 用C语言实现扫雷游戏(详解)
- 支付账户体系(分账接口)的9大价值
- web漏洞之sql注入
- python中seaborn库_[Python学习笔记(四)] Seaborn库基础学习——01
- 量化交易入门(精华必读版)
- Xftp6XShell6下载地址
热门文章
- 做事情需要坚持需要毅力更加需要观察和方法。(人生会遭遇许多事,其中很多是难以解决的,这时心中被盘根错结的烦恼纠缠住,茫茫然不知如何面对?如果能静下心來思考,往往会恍然大悟。 )...
- JAVA集合Connection接口和Map接口常用的类及区别
- 解析法实现一元线性回归
- python生成10个随机密码_Python简单生成8位随机密码的方法
- 矢量场的二阶微商(Feynman‘s explanation)
- 没有计算机的一天英语作文带翻译,我的一天英语作文带翻译
- 新版Web of Science导出文献全记录信息
- minecraft刷怪笼java_Minecraft Java版 21w03a 发布
- 整理的300多个User-Agent,拿去玩
- Python--format()函数使用