本文基于淘宝用户行为数据,建立RFM模型,探究用户的价值。如果想要了解如何使用SQL建立RFM模型,那就继续看下去吧。

本文的数据源于阿里云天池(User Behavior Data from Taobao for Recommendation)。

数据源链接:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1

数据分析工具:SQL+EXCEL

注:以下操作截取了其中100,000条数据记录,而非全部数据,并已完成了一些数据清洗工作。

1. 概念

1.1 RFM模型

RFM模型是会员管理系统中一种会员消费行为分析模型,RFM的含义如下:

  • R(Recency)代表最近一次消费距今时间
  • F(Frequency)代表特定时间内的消费频率
  • M(Monetary)代表特定时间内的消费总金额

RFM模型还是要结合具体的应用场景发挥其价值。

2. 模型建立

本数据集有个小缺陷,就是缺少金额这一字段,所以不能建立完整的RFM模型了,只能建立RF模型,嘿嘿

(1)数据概况

(2)计算每个用户最近一次购买距今天数(R)和购买频次(F)

create view RF_Values as
select userID, max(dt) as last_date, datediff('17-12-03', max(dt)) as R, count(1) as F
from userbehavior_archived1
where behavior = 'buy'
group by userID;

结果如下:

具体地,利用直方图来看一下R值的分布和F值的分布:

(3)建立RF的评分标准,并计算每个用户的R、F评分

RF评分标准如下:

计算各用户的R、F评分:

create view RF_Scores as
select userID,( case when R between 0 and 2 then 4 when R between 3 and 4 then 3when R between 5 and 6 then 2when R between 7 and 8 then 1end) as R_score,( case when F between 1 and 2 then 1 when F between 3 and 4 then 2when F between 5 and 10 then 3when F > 10 then 4end) as F_score
from RF_Values;

结果如下:

接着计算RF评分的平均值:

select avg(R_score), avg(F_score) from RF_Scores;

结果如下:

(4)以RF评分的平均值为基准,评价每个用户的价值

create view user_type as
select userID,( case  when R_score > 3.2846 and F_score > 1.6587 then '价值客户'when R_score > 3.2846 and F_score < 1.6587 then '发展客户'when R_score < 3.2846 and F_score > 1.6587 then '保持客户'when R_score < 3.2846 and F_score < 1.6587 then '挽留客户'end ) as user_type
from RF_Scores;

结果如下:

(5)统计不同用户类型的分布情况

select user_type, count(user_type) as number
from user_type
group by user_type

结果呈现:

3. 小结和建议

从结果看,价值客户和挽留客户占比很高。

对于价值客户,要提供更高质量的VIP服务;

对于发展客户,消费频率较低,需要通过发放优惠券等方式,提高消费频率;

对于保持客户,曾消费频率比较高,最近消费距今比较远,需要通过及时通知近期的活动、感兴趣的产品等方式,促进其消费;

对于挽留客户,可能正在流失,则需要考虑下顾客流失的原因可能是什么,再有针对性地激励对方消费。

淘宝用户行为---用户价值分析相关推荐

  1. 2014年淘宝双十二期间用户行为分析

    2014年淘宝双十二期间用户行为分析 用户行为分析的数据是淘宝某店铺11月18日至12月18日之间的用户行为数据,主要使用MYSQL进行分析. 数据中一共有五个字段,分别是用户id,商品id,用户行为 ...

  2. 关于淘宝橱窗推荐--用户行为追踪--http协议深入

    http://blog.chinaunix.net/uid-28387257-id-3775638.html 一.引言 最近发现了一件有趣的事:在淘宝搜索相关产品后,到糗事百科或者其他外站浏览资讯时, ...

  3. 伯乐发卡系统高级版源码 高仿淘宝模板 带用户中心

    介绍: 内置高仿淘宝模板,带用户中心  分销代理等等 推荐使用宝塔面板安装,设置运行目录为public,测试环境为php7.0 mysql5.5 伪静态选择为thinkphp 授权已经去了,后台是/h ...

  4. 美团、微信、淘宝“频繁定位”用户?iOS15升级后,App集体“沦陷”

    伴随着<数字安全法>的生效,<个人信息安全法>也将于11月1日正式施行,关于用户信息安全与互联网平台的信息获取边界依然存在讨论空间. 10月10日,有数码博主爆料称,在升级苹果 ...

  5. Javascript小案例(一):仿淘宝搜索框用户输入事件的实现

    淘宝是我们经常用的一个网上购物平台,打开淘宝网首页,找到淘宝首页的搜索框,如下如所示: (截图日期:2017年6月18日) 大家可以看到,当页面一打开,搜索框中就可以看到灰色字体"少女高跟鞋 ...

  6. 淘宝如何实现用户与订单的绑定

    今天一位业内的朋友,在做APP,咨询了一个问题: 淘宝推荐商品的APP,如何实现用户与订单的绑定,比如后台订单看到某商品卖了10件,那这10件商品是谁买的? 我给了两个解决方案: 第一,实现用户与PI ...

  7. 使用Python对淘宝用户行为进行数据分析

    淘宝用户数据分析 1 分析背景与意义 2 分析思路 3 分析内容 3.1 提出问题 3.2 理解数据 3.3 数据清洗 3.3.1 数据导入 3.3.2 缺失值分析 3.3.3 选取时间范围 3.3. ...

  8. MySQL—淘宝用户行为分析

    文章目录 一.项目背景 二.结论先行 2.1用户行为漏斗转化分析 2.2时间维度分析用户行为 2.3商品维度分析用户行为 2.4RFM模型用户价值分析 三.数据分析 3.1数据来源 3.2数据说明 3 ...

  9. 如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

    分析背景 淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品. 作为电商行业的标杆,淘宝网 ...

  10. 电商淘宝用户行为分析

    一.项目介绍 本次实战的数据是来自阿里巴巴提供的一个淘宝用户行为数据集,用于隐式反馈推荐问题的研究. 数据下载:https://tianchi.aliyun.com/dataset/dataDetai ...

最新文章

  1. mysql timestamp比较查询
  2. Python会消亡吗?
  3. 云计算带来企业管理的革命
  4. html5在线考试开发,基于HTML5的无纸化在线考试系统.docx
  5. 搭建基于hyperledger fabric的联盟社区(九) --检索状态数据库
  6. Android开发之EditText输入显示文字hint大小设置
  7. LeetCode 625. 最小因式分解(贪心)
  8. 关于CentOS-6的默认带的mysql启动和安装问题
  9. C#_基础_结构Struct(八)
  10. mysql的错误代码4999_mysql相关错误以及对应解决方法总结
  11. python项目结构图_python 项目目录结构设置
  12. 静态路由的设置以及缺省路由的发布
  13. 注意!这13件事会毁掉你的信用,千万别做!
  14. 王垠:完全用Linux工作及其后续
  15. cocos2d-x 植入广告(一) 百度横屏、插屏广告
  16. 《痞子衡嵌入式半月刊》 第 68 期
  17. [附源码]Python计算机毕业设计SSM流浪动物救助及领养平台(程序+LW)
  18. 微信iPad协议-超稳定不封号版
  19. 烈火如歌手游找回服务器,烈火如歌手游闪退怎么办 游戏登陆不进去解决方法...
  20. 用于解决listview嵌套GridView时显示不全的问题。

热门文章

  1. 龙芯1C ls1c300b的openwrt以及安装过程
  2. Pixhawk学习5.2——传感器标定之陀螺仪
  3. Linux命令常见错误处理 rm无法删除目录
  4. 数据库系统概论 第二章 关系数据库
  5. Android—Java层与Native层对象的关联
  6. SQLServer 创建dtsx包更新统计信息(示例)
  7. 序列模型与注意力机制
  8. 【习题答案】计网第二章_物理层
  9. OpenWrt 获取 WAN口 IPv4的IP 两种方式
  10. JGit使用ssh免密认证