1. 同期群分析理论回顾

参考 https://www.jianshu.com/p/145a13355fa1

2. 构造练习数据(Excel)

我们设计一份数据, 2019年期间某店铺的成交订单明细, 包含以下4个字段:

这里使用Excel中的rand函数, 来构造随机数据, 具体操作略(用户id需要重复)
最终, 获取10万条随机的数据

3. 数据处理思路

  1. 生成每月新增用户明细
  2. 生成每个月份的用户明细
  3. 将上面生成的数据按用户id关联生成总表
  4. 总表按月份聚合
  5. 调整格式

4. 用pandas实现整个处理过程

  1. 导入相关模块, 并加载数据

    date已经是datetime格式了

  2. 需要按月份来做同期群分析, 所以新增一列, 这里就简单取该日期的1号
    用到了datetime模块中date类的replace方法

  3. 生成每月新增的用户明细
    用pandas中的groupby, 按user_id取dt最小值聚合, 最后加reset_index()是为保留dataframe格式

  4. 生成每个月的客户明细(以2019-02为例)
    df.loc切片, datetime.date()构造日期

  5. 用merge关联df_00 与 df_1902

  6. 最终重复4.5步骤

  7. 重复的工作让电脑去做, 定义一个函数, 参数是dataframe

  8. 通过序号的循环, 生成最终符合格式的数据

5. 其他思路与方法

待补充

pandas练习_同期群分析(Cohort Analysis)相关推荐

  1. 使用Python进行同期群分析(Cohort Analysis)

    技术作者:小小明 理论修订:才哥 原文链接:https://blog.csdn.net/as604049322/article/details/116505941 文章目录 同期群分析 同期群分析概念 ...

  2. [转] 同期群分析Cohort Analysis

    一个漂亮的平均数完全是用数据创造出来的虚幻景象,会给我们的决策造成误导,因此我们需要掌握一个行之有效的方法来剖析真实的用户行为和用户价值,这个方法就是同期群分析(Cohort Analysis).事实 ...

  3. 『数据分析』使用python进行同期群分析

    目录: 同期群分析概念 数据读取 分析方向 数据预处理 同期群分析 从留存率角度进行同期群分析 从人均付款金额角度进行同期群分析 从人均购买次数角度进行同期群分析 每月总体付费情况 将结果导出网页或截 ...

  4. 数据分析方法 - 同期群分析

    记录通过网上各类文章学习关于同期群分析的笔记,如有侵权,请联系本人删除文章. 举例 该例出自知乎"同期群"分析的好处是什么? - 于晓松 例 1:一个 App,某一天有 100 位 ...

  5. 同期群分析(Cohort Analysis)

    什么是同期群? 将相同时间段内具有共同行为特征的用户划分为同一个群体,其被称为同期群."共同行为特征"是指在某个时间段内的行为相似.最常见的是按不同时间的新增用户来划分,然后分析留 ...

  6. 零售行业交易数据分析(3)——群组/同期群分析(留存率分析)

    内容简介 本文介绍了群组分析(同期群分析)的方法以及Python实现过程,并继续对一家零售公司的交易数据进行用户留存分析和可视化. 本系列的文章: <零售行业交易数据分析(1)--客户终身价值( ...

  7. 同期群分析是什么?教你用 SQL 来搞定

    目录 一.同期群分析的定义 二.SQL 步骤 1. 查看数据 2. 根据 uid .年月聚合用户人数 3. 计算年月的差额(天数) 4. 计算年月的差额(月数) 5. 透视(根据 uid .首次付费年 ...

  8. 分群思维(五)特殊的分群思维-同期群分析

    分群思维(五)特殊的分群思维-同期群分析 小P:小H,用户留存率降了,增长也缓慢了,这是什么原因啊,会不会是新用户出了问题啊,还是说老用户不满意了? 小H:可以尝试同期群分析,看看新老用户的差异. i ...

  9. (金融)线上消费贷风控优化(单变量分析)与用户留存(同期群分析)项目——数据分析

    (金融)线上消费贷风控优化(单变量分析)与用户留存项目(同期群分析)--数据分析 一.首逾率单变量分析 案例背景: 日常监控发现某款消费贷产品首逾率有逐渐升高的趋势,需要把首逾率降下来以减少产品带来的 ...

最新文章

  1. 为什么你总办不到大额信用卡?
  2. springboot干什么的_Spring Boot 项目的这些文件都是干啥用的?
  3. kafka:topic为什么要进行分区?副本机制是如何做的?
  4. 理解搜索引擎并且善用google
  5. 清明节,如何用代码让网页变灰
  6. 重装了新版IDEA,但我之前的个人配置全丢了,太烦了!
  7. Silverlight Xap和Html Asp.net参数传递
  8. cfile清空文件内容_DBA日常任务清单--定期清理Oracle审计文件
  9. 计算机导论第4版第五章答案,《计算机导论》习题答案.doc
  10. 自制STM32F205最小系统板
  11. IDirectXFileData::GetData 在dx9c中没有了
  12. 投影仪融合+拼接处理系统制作原理
  13. C# 使用MemeryStream进行序列化
  14. Error response from daemon: Container XXX is restarting, wait until the container is running
  15. 【业务分析】如何设计A/B test,以及如何对实验结果检验、结果分析?
  16. 2018 世界杯:科技辅助裁判是否靠谱?
  17. jquery、js去除浏览器(ff、ie)缓存问题
  18. 技术类人员的职业发展方向
  19. 微信小程序入门10-微信公众号token验证失败
  20. 制作你自己的yolov5数据集并进行训练

热门文章

  1. 超级计算机也无法算尽圆周率,如果圆周率算尽了,会出现什么后果?
  2. SAP 银企直连 常用事务代码,表名,类名
  3. SAP 银企直连交易明细查询的分页与FTP读取
  4. Swagger简单使用之从入门到精通
  5. 十字军之王3 mac中文版
  6. 80端口和443端口的区别
  7. Lambda和Stream流
  8. lambda表达式的分析及使用
  9. 转行学软件测试,月薪5k到30k,给IT赶路人一些个人建议...
  10. Python处理中文路径