本文为《数据挖掘与数据化运营实战:思路、方法、技巧与应用》一书第三章的笔记与总结。

一个成功的数据挖掘项目,首先要有准确的业务需求描述,之后则要求项目相关人员自始至终对业务有正确的理解和判断 对业务的理解和思考,永远高于项目的分类和分析技术的选择。

目标客户的特征分析

目的:找准目标客户,目标受众,才能进行精细化运营

在目标客户的典型特征分析中,有两种业务场景:

  • 试运营前的虚拟特征探索

  • 试运营后的真实数据探索

试运营前:没有真实的业务环境,没有真实的用户数据,需要寻找类似的业务场景中的历史数据来进行模拟和推断根据产品设计理念、产品定位、经验推测等因素来输出期望的目标客户典型特征,后续根据试运营后的真实数据再作调整。

试运营后:基于真实的业务场景中的用户数据进行数据分析,提取出的目标用户特征更准确更可行,也更贴近业务。最终输出该产品的核心目标用户特征分析报告,为运营团队的精准营销提供支撑。

目标客户的预测(相应、分类)模型

包括:

  • 流失预警模型

  • 付费预测模型

  • 续费预测模型

  • 运营活动相应模型

  • ...

目的:预测个体相应的概率,展示变量之间的关系

例:建立预测响应模型,判断特定时间段发生交易的概率

输入变量:近一个月曝光,店铺评分,...

输出变量:是否在线交易

最终发现近一个月曝光,店铺评分两个变量和输出变量最大正相关,则有理由相信,提高曝光,提高评分可以促进交易量。

运营群体活跃度定义

活跃度的定义没有统一标准,一般是根据特定的业务场景和运营需求来量身定做的。其中定义活跃度最常见的两个基本点是:

  • 活跃度组成指标应该是该业务场景中最核心的行为因素

  • 衡量活跃度的定义合适与否的重要判断依据是其能否有效回答业务需求的终极目标

例:某产品可以向卖家提供与买家洽谈功能,免费版提供基本功能,付费版提供所有功能。现在需要为该产品定义一个用户活跃度,来促进用户从免费版转化为付费版。

关键指标:用户登陆次数,用户使用核心功能次数

评判该定义是否合适,需要看按照该定义出来的活跃用户中,覆盖了多少实际付费的用户。覆盖率越高,则该定义越好。也可以理解为该定义是否有效的分离了免费用户和付费用户。

用户路径分析

主要分析用户在网页/app上流转的规律和特点,发现频繁访问的路径模式,这些路径的发现可以有很多业务用途,包括提炼特定用户群体的主流路径网页设计的优化和改版特定群体的浏览特征等。

路径分析的目的:

  • 监控运营活动(或目标客户)的典型路径,通过分析调整运营策略,最终提升用户点击页面的效率

  • 发现并提炼新的有价值的频繁路径模式,提升运营效率和特定效果。

交叉销售模型

理论依据:客户付费后,企业会想办法保留或延长客户对企业的生命周期和利润贡献

两个运营方向:

  • 延缓客户流失

  • 提高顾客消费

第一个方向,通常是客户流失预警模型发挥作用,利用流失预警模型,提前锁定可能会流失的有价值客户,通过各种手段挽留客户,降低流失率

第二个方向,通过数据挖掘,找出客户的潜在消费需求,从而更好引导、满足、迎合客户需求,最终促使客户更多的消费。其中主要用到交叉销售模型。

交叉销售模型通过对用户历史消费数据的分析挖掘,找出有明显关联性质的商品组合,然后用不同的建模方法,去构建消费者购买这些关联商品组合的可能性模型,再用其中优秀的模型去预测新客户中购买特定组合商品的可能性。

4种思路:

  • 购物篮分析(有针对性的促销和捆绑)

  • 对重要商品建立预测响应模型,向可能性最高的前5%顾客进行精准营销和推广

  • 让重要商品两两组合,建立预测响应模型,找出最有可能消费的潜在客户进行推广

  • 决策树

其中的建模技术包括

  • 关联分析(Apriori)

  • 序列分析(在关联分析基础上增加先后顺序)

  • 预测(响应、分类)模型:逻辑回归,决策树

信息质量模型

举个例子:在同等条件下,一个要素齐备,布局合理,界面友好的店铺或商品详情页一定比不具备核心要素,布局不合理,界面不友好的更加容易达成交易,更容易获得买家的好感。这其中就体现了信息质量的重要价值。

信息质量模型主要应用场合包括:

  • 商品Offer优化

  • 网店质量优化

  • 论坛发帖质量优化

  • 违禁信息的过滤优化

  • 其他设计信息质量监控和优化的场景

策略:专家打分,模型拟合

信息质量模型师电子商务和网上交易的基本保障,其主要目的是确保商品基本信息的优质和高效,让买家更容易全面、清楚、高效的了解商品主要细节,让卖家更容易,更高效的展示自己的商品。

服务保障模型

作用:为卖家提供有价值的服务去支持、保障卖家生意的发展

例:

  • 让卖家购买合适的增值产品

  • 让卖家续费合适的增值产品

  • 卖家商业信息的违禁过滤

  • 卖家社区发帖的冷热判断

模型:预测(响应、分类)模型

用户(买家、卖家)分层模型

分层模型是介于粗放式运营与基于个体概率预测模型之间的一种折中和过渡模型,其既兼顾了(相比较粗放运营而言)精细化的需要,又不需要(太多资源)投入到预测模型的搭建和维护中

常用场景:

  • 客户服务团队需要根据分层模型来针对不同的群体提供不同的说辞和相应的服务套餐

  • 企业管理层需要基于在线交易卖家数量来形成以其为核心的卖家分层进化视图

  • 运营团队用客户分层模型指导相应运营方案的制定和执行,从而提高运营效率和付费转化率

这些分层模型既可以为管理层、决策层提供基于特定目的的的统一进化视图,又可以给业务部门做具体的数据化运营提供分群(分层)依据和参考。

分层模型的关键:根据实际业务经验定义不同层级的含义,根据实际经验及数据划分不同层级间的阈值

比较常见的分层模型:RFM

卖家(买家)交易模型

目的:为买卖双方服务,帮助卖家获得更多的买家反馈,促进卖家完成更多的交易、获得持续的商业利益

其中涉及的主要分析类型包括:

  • 自动匹配(预测)买家感兴趣的商品(即商品推荐模型

  • 交易漏斗分析(找出交易环节的流失漏斗,帮助提升交易效率)

  • 买家细分(帮助提供个性化的商品和服务

  • 优化交易路径设计(提升买家消费体验

  • 。。。

信用风险模型

包括:

  • 欺诈预警

  • 纠纷预警

  • 高位用户判断

  • 。。。

一般的信用风险模型由专门的风控团队负责,但从数据挖掘的角度来看,信用风险模型搭建和常规的数据挖掘没有太大区别,算法思路基本相同,其中的区别在于业务背景。相比与常规的数据挖掘,信用风险分析有以下特点:

  • 分析结论或欺诈模型的时效更短,需要优化(更新)的频率更高

  • 行骗手段是随机性的,所以欺诈预警模型对及时性和准确度要求很高

  • 对预测模型提炼出的因子进行规则梳理和罗列,可以在风控管理的初期阶段有效锁定潜在目标群体

本文为转载分享&推荐阅读,若侵权请联系后台删除

麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。管理员二维码:

7个常见的数据分析项目模型!赶紧收藏!相关推荐

  1. 算法与实战 - (3) 常见数据分析项目类型

    文章目录 1. 用户特征分析(用户分层) 2. 活跃度定义(指标定义) 3. 路径分析与漏斗分析 4. 交叉销售模型 5. 商品推荐模型 6. 信用风险模型 7. 客户预测模型 Reference 本 ...

  2. 大数据学习——常用的数据分析法和模型

    产品的基本数据指标 新增:日新增.月新增 活跃:如日活跃(DAU).月活跃(MAU)等 留存率:用户会在多长时间内使用产品,如:次日留存率.周留存率等 传播:平均每位老用户会带来几位新用户 流失率:一 ...

  3. 基于 flink 的电商用户行为数据分析【9】| 电商常见指标汇总 + 项目总结

    本文已收录github:https://github.com/BigDataScholar/TheKingOfBigData,里面有大数据高频考点,Java一线大厂面试题资源,上百本免费电子书籍,作者 ...

  4. 上手!深度学习最常见的26个模型练习项目汇总

    作者:沧笙踏歌 转载自AI部落联盟(id:AI_Tribe) 今天更新关于常见深度学习模型适合练手的项目.这些项目大部分是我之前整理的,基本上都看过,大概俩特点:代码不长,一般50-200行代码,建议 ...

  5. Kaggle经典数据分析项目:泰坦尼克号生存预测!1. 数据概述与可视化2. 数据预处理3. 模型训练4. 模型优化(调参)

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习 ,不错过 Datawhale干货 作者:陈锴,中山大学,Datawhale成员 最近有很多读者留言,希望 ...

  6. Kaggle经典数据分析项目:泰坦尼克号生存预测!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:陈锴,中山大学,Datawhale成员 最近有很多读者留言,希望能 ...

  7. python利器app怎么查文献-科研人必备:一个工具搞定文献查阅、数据分析、模型搭建...

    原标题:科研人必备:一个工具搞定文献查阅.数据分析.模型搭建 写论文有多难?这首诗形容得好: 进入学校先选题,踌躇满志万人敌:发现前辈都做过,满脸懵逼加惊奇. 终于找到大空白,我真是个小天才:左试右试 ...

  8. 常见的数据分析思维方式有哪些

    数据思维具有框架性引导作用能够帮助确认分析角度.搭配分析方法.选择指标体系得出分析结论.但要知道数据思维不是一下子就学会了的需要长期的培养,日常生活中常用的数据分析思维技巧我们一起来学习一下. 常见的 ...

  9. 5.Python数据分析项目之文本分类-自然语言处理

    1.总结 预测类数据分析项目 流程 具体操作 基本查看 查看缺失值(可以用直接查看方式isnull.图像查看方式查看缺失值missingno).查看数值类型特征与非数值类型特征.一次性绘制所有特征的分 ...

最新文章

  1. windows下用elasticdump导入json数据到Elasticsearch中
  2. Dynamics CRM中跨域调用Web API 2
  3. SVN 使用方法(228)
  4. 轻松简单地开发Web Services 2
  5. 【robot framework日志】更改log地址(简)
  6. 【第十六章】模板实参推断
  7. mysq5.7 主主同步
  8. cocoapods的安装与使用
  9. SpringBoot写后端接口,看这一篇就够了!
  10. oracle 11g数据库安装教程
  11. 医院职工离职申请证明模板,共计10篇
  12. STM32 HAL库 结构
  13. OSEK直接网络管理(NM)
  14. ubuntu下使用命令行查看opencv版本
  15. SSH框架之文件上传
  16. 利用 echarts 绘制江苏省的地图之三
  17. 计算机毕业设计Java城市智能公交系统(源码+系统+mysql数据库+lw文档)
  18. 倾斜摄影——三维建模软件ContextCapture (简体中文版安装教程-附软件下载)
  19. BetterTouchTool使用指南——TouchBar篇
  20. MySQL UDF 提权

热门文章

  1. 如何查找SCI期刊的iso缩写?
  2. GIS基于智慧城市建设的作用
  3. .NET MF 4.2 RTM (QFE2)发布
  4. 几种常见四足机器人的特点和区别
  5. 御方宝贝—天然有方 快乐成长
  6. springBoot极速入门
  7. 分享一个明日方舟脚本工具
  8. 二分排序法(折半插入法)
  9. android电视分辨率是多少合适,电视机分辨率多少比较合适,电视机分辨率设置方法!...
  10. 淘宝开店必知之数据分析