最近在寻找一些sql的项目实践,所以虽然此类分析用python会更加的便捷,但是仍旧选用SQL进行。另:文本粘贴 代码格式可能会不标准有误,用powerBI 绘图

1. 通过sql sever 任务 - 导入douyin.csv平面文件 ,同时调整数据类型(此步骤也可通过excel 提前对数据进行处理)

2.查看数据情况

select top 10 * from dbo.douyin -- 查看前10行的数据

 3.pv, uv 分析

select H,
      count(*)as h_pv,-- 小时:pv
      count(distinct uid) as h_uv --小时:uv
from dbo.douyin
group by H 
order by h_pv,h_uv desc --
由此可见抖音用户主要活跃的时间为晚上19:00-24:00

select dates,
    count(*)as day_pv,-- 日期:pv
    count(distinct uid) as day_uv --日期:uv
from dbo.douyin
group by dates
order by day_pv desc,day_uv desc --每日活跃pv,uv 10月20号开始uv和pv都达到峰值

每周同理,ps:MySQL用dayofweek取星期几

通过按星期几分析 周一的抖音用户活跃程度最高,周三周四最低。

4.播放源分析

select channel,
    count(uid) as channel_count
from dbo.douyin 
group by channel --播放来源,大部分的观看主要来源于渠道0,未明确指出各值的意义,或许为算法推荐

5.播放时长与点赞率的关系

select duration_time,
     case when likes_total_count =0 then 0 --避免除数为0时报错
     else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate --cast强制转换为float形式,不然db2环境下,结果会只显示0,1
from(select duration_time,
             sum(case when likes=1 then 1 else 0 end) as likes_total_count,
             sum(case when likes=0 then 1 else 0 end) as unlike_total_count
        from dbo.douyin
        group by duration_time) as t1
order by likes_rate desc

所以内容时长在0-40秒之间更容易获得点赞

6.播放时长与完整播放率的问题 代码同上 做简单替换 不做进一步展示

7.热门歌曲相关分析

select music_id,
    count(uid) as music_count
from  dbo.douyin
group by music_id
order by music_count desc --得到热门歌曲

select music_id,music_count,likes_total_count,
     case when likes_total_count =0 then 0 
     else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate 
from(select music_id,count(*) as music_count,
             sum(case when likes=1 then 1 else 0 end) as likes_total_count,
             sum(case when likes=0 then 1 else 0 end) as unlike_total_count
         from dbo.douyin
         group by music_id) as t1
 order by music_count desc,likes_total_count desc --歌曲播放量与获赞率的并无太大关系,但是热门歌曲可以获得更高的点赞量

 select music_id,music_count,finish_total_count,
     case when finish_total_count =0 then 0 
     else round(cast(finish_total_count as float)/(finish_total_count+unfinish_total_count),6) end as finish_rate 
from(select music_id,count(*) as music_count,
              sum(case when likes=1 then 1 else 0 end) as finish_total_count,
              sum(case when likes=0 then 1 else 0 end) as unfinish_total_count
        from dbo.douyin
       group by music_id) as t1
   order by music_count desc,finish_rate desc --歌曲播放量与完整播放率的关系,没有太大关系,但是热门歌曲可以获得更高的播放量

8.平台作者分析

select author_id,sum(uid) as num
from dbo.douyin
group by author_id
order by num desc -- 播放量最高的创作者

select author_id,author_count,likes_total_count,
     case when likes_total_count =0 then 0 
     else round(cast(likes_total_count as float)/(likes_total_count+unlike_total_count),6) end as likes_rate 
from(select author_id,count(*) as author_count,
            sum(case when likes=1 then 1 else 0 end) as likes_total_count,
            sum(case when likes=0 then 1 else 0 end) as unlike_total_count
        from dbo.douyin
        group by author_id) as t1
order by author_count desc,likes_total_count des
c --最受欢迎的创作者

抖音用户行为分析 (SQL)相关推荐

  1. 需求分析报告应该包含哪些部分_2020最新抖音用户画像分析报告:粉丝都有哪些特点和需求?...

    本文相关:抖音用户画像分析.抖音用户画像报告.2020最新抖音用户画像分析等 不管是做抖音运营还是抖音直播,了解粉丝,了解用户的需求是非常重要的!做任何事情,对症下药你才能事半功倍!比如你的粉丝想要梨 ...

  2. 小红书用户画像分析_抖音用户画像分析及活跃时间点

    今天小编来和大家分享一下,抖音用户画像的分析和抖音用户的活跃时间点, 1.重点的画像,是抖音受众人群高低线及分布率. 2.查询数据的技巧,如果是产品的话参考到阿里指数上查看,如果查行业的话,可以在百度 ...

  3. 抖音用户数据获取分析(未完成)

    基于大牛的研究成果(https://blog.csdn.net/wql2014302721/article/details/110563695),使用Fiddler在安卓9手机上抓包,添加用户证书,抓 ...

  4. 中忻嘉业科技:怎样分析抖音用户群体画像

    想要在抖音上面做生意,那么就需要了解抖音平台主要是哪些人在玩,需要进行用户画像分析,在抖音平上才能更加精准的找到自己的精准客户,也能知道自己想要售卖的商品到底适不适合抖音这个平台,那么小编将给大家分享 ...

  5. Hook抖音用户信息id,secUid

    抖音版本16.3.0,hook方式xposed 在采集APP数据的时候很多接口都会用到userId和sec_uid,通过抓取接口webcast/user可以看到id都是由客户端生成的 用户信息 实体类 ...

  6. 用户使用报告_2020年抖音用户画像报告[附下载] | 行业数据报告研读

    ▼ 更多专业报告,请关注我们 ▼▼有趣回顾:▼ [小时光面馆]专一先生和善变小姐 油烟情书 甲壳虫的 最后一英里 关注公众号,后台发送关键词"2020抖音用户画像"即可获取完整版P ...

  7. Python分析抖音用户行为数据,看看发什么样的视频才会爆!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python分析抖音用户行为数据视频讲解地址 https://www.bilibili.co ...

  8. python抓取抖音用户画像,摩羯天蝎居然刷得最多?

    日刷抖音三百条,悠悠一笑乐逍遥,夜深忽醒窗外事,不知今夕是何年. 要从上个月说起,那天晚上准备睡觉了,然后朋友突然发来一个抖音热门视频. 一向一本正经苟于工作的我,竟然沉醉于小姐姐的甜蜜的笑容,加之想 ...

  9. 用户使用报告_分享最新2020年抖音用户画像报告

    今天给大家分享2020年抖音用户画像报告-巨量算数. 时间周期:本报告数据均采集于2020年1月(除特别说明外) 数据来源:第三方数据取自"QuestMoblie",内部数据取自& ...

最新文章

  1. Namenode主备切换或报 IPC Server handler 23 on 8020
  2. Zxing二维码的集成使用
  3. Eclipse 批量创建多级文件夹
  4. 使用IntelliJ, 让lombok生效的方式
  5. Java银行开户,取钱,存钱,查询余额,退出。。。。。
  6. Java EE 7 Batch中传递属性/参数的2种方式
  7. 网络服务器分为文件服务器通信服务器和,近代中国落后、贫困的根本原因是()...
  8. 使用 Nginx + Gunicorn 部署 Flask 项目
  9. netbeans php 断点调试,windows7 + iis7 + fastcgi + php5 + netbeans + xdebug 调试 php
  10. 分享四款H5怀旧小游戏魔塔+伏魔记+三国霸业+寻仙纪
  11. 网线接法只有两头线序一样就行了吗?
  12. 2019毕业设计总结——基于稀疏表示的人脸图像超分辨率重构
  13. Linux驱动中私有数据filp-private_data的作用
  14. win10重置进度条不动了_Windows10系统重置时卡死的处理方法
  15. 用C语言实现扫雷游戏(详解)
  16. 支付账户体系(分账接口)的9大价值
  17. web漏洞之sql注入
  18. python中seaborn库_[Python学习笔记(四)] Seaborn库基础学习——01
  19. 量化交易入门(精华必读版)
  20. Xftp6XShell6下载地址

热门文章

  1. 做事情需要坚持需要毅力更加需要观察和方法。(人生会遭遇许多事,其中很多是难以解决的,这时心中被盘根错结的烦恼纠缠住,茫茫然不知如何面对?如果能静下心來思考,往往会恍然大悟。 )...
  2. JAVA集合Connection接口和Map接口常用的类及区别
  3. 解析法实现一元线性回归
  4. python生成10个随机密码_Python简单生成8位随机密码的方法
  5. 矢量场的二阶微商(Feynman‘s explanation)
  6. 没有计算机的一天英语作文带翻译,我的一天英语作文带翻译
  7. 新版Web of Science导出文献全记录信息
  8. minecraft刷怪笼java_Minecraft Java版 21w03a 发布
  9. 整理的300多个User-Agent,拿去玩
  10. Python--format()函数使用