数据分析流程主要分为五个关键环节:明确数据分析目的、明确数据源及数据口径、数据处理、数据分析、输出

一、明确数据分析目的

任何一件事在做之前都是有目的性的,数据分析也是如此,在进行数据分析之前首先要明确数据分析为什么要做?
下面通过用户、需求、场景三要素拆解法来明确数据分析的目的。

1、用户

这里提到的用户是指数据分析内容或者结果给谁看?这里的目标用户主要分三类:你自己、企业内部业务部门、外部客户。这里主要对后两种进行解析。

企业内部业务部门:

这类用户通常会通过制定不同策略提升企业某些指标的提升,可以是市场部门、运营部门或者是维系部门。他们往往指导企业内部积累了大量数据,但是不知道如何使用,如何通过数据分析形成有效的决策。

外部客户:

这类用户通常不具有某一领域或多个领域的行业数据,希望通过这些数据了解他的用户或市场,而恰巧你的企业具备这样的数据,这种情况下通过数据价值变现,形成对外的数据分析输出,对外部用户来说可以更好的了解市场,对于你来说也可以通过数据形成价值变现,为企业带来收益。

2、需求

你的用户即数据分析问题提出者为什么要做数据分析,他们是希望通过数据分析发现问题还是希望提升某个业务指标,这些都是在做数据分析前需要了解的,只有了解了需求才能制定更合理的数据分析思路(后面会介绍到数据分析方法)。

3、场景

场景更多体现的是数据分析的场景,如业务部门想了解用户在注册流程中的用户流失原因,那么这就是问题的场景,要根据场景去定义问题,梳理数据分析思路,选择数据分析的方法。

二、明确数据源及数据口径

1、数据源

数据的获取主要有三种方式,第一种通过一些基于前端页面的数据采集工具获取,如GrowingIO等可视化的数据采集产品;第二种是在产品设计过程中通过数据埋点的方式,在需要数据时可以进行简单提取,这种方式的前提是在产品规划阶段就已经对未来的数据获取提前做好了准备;第三种是如果前期没有进行功能埋点、可视化的采集工具也无法获取数据时,找研发团队通过后台脚本或技术研发的方式获取数据。

2、数据口径

数据口径,即定义某一个数据指标的含义。举个简单栗子来说,针对于用户流失指标的定义,不同的产品或者不同的领域会有所不同。对于普通电商产品来说,用户三天之内没有登录或购买就是流失,但是对于奢侈品电商来说,仅仅用几天没有登录或购买即算作用户流失是不合理的。

对于数据口径的明确,需要结合数据分析任务提出者的需求以及具体业务场景,定义清晰的数据口径对后面的数据处理以及数据分析具有关键的意义。

三、数据处理

数据处理阶段主要做的工作是数据清洗、数据补全、数据整合。

1、数据清洗

发现数据中的异常值,如对连续多天的用户登录数据进行处理时,如果有一天的登录数远远超过正常值,那么就需要分析,该天是否有重大营销活动,还是采集数据时出现的错误,通过异常值不仅可以发现数据采集方法的问题,同时可能通过异常值找到数据分析的目标。比如对信用卡诈骗的分析,就是通过查找异常数据的方式。

2、数据补全

针对数据缺失的情况如何解决,一种方式是根据数据前后的关联关系填充平均值等方式,另一种则是直接选择丢失该条记录不用于数据分析。两种方式各有优劣,建议结合具体问题具体分析。

3、数据整合

在采集数据时,不同类型数据之间可能存在潜在关联关系,通过数据的整合,丰富数据维度,更利于发现更多有价值的信息。如用户注册数据与用户购买数据相关联,可以通过用户的基础属性信息判断用户购买的商品是自己使用还是送人等等。

四、数据分析

数据分析思路又叫数据分析方法,数据分析一定是以目的为导向的,通过目的选择数据分析的方法。通常来说主要有以下集中分析思路

1、异常分析

通过数据分析发现异常情况,找到解决异常问题的方法。

2、寻找关联关系

关联关系也可以成为购物车分析,耳熟能详的沃尔玛尿布与啤酒的案例就是关联关系的最佳实践,通过分析不用商品或不同行为之间的关系,发现用户的习惯。

3、分类、分层

通过用户特征、用户行为对用户进行分类分层,形成精细化运营、精准化业务推荐,进一步提升运营效率和转化率。

4、预测

通过用户历史行为预测用户未来可能的行为,提升用户感知和使用体验。

五、输出

在前面层提到,数据分析的目的是通过数据清晰的了解用户、产品和当前业务形态,从而得到有效的战略决策指导下一步的发展。

如何通过数据清晰了解用户、产品和业务生态?一行行枯燥的数字是无法让业务部门或外部客户直观了解数据背后的含义的,所以需要通过数据可视化的方法,简单来说就是将一行行的数据转化为图表,直观化展现数据的趋势、数据之间的关联关系等等。在对数据可视化时,需要着重考虑数据有几个维度、数据要向看的人展现什么,这些都影响着数据可视化的形式。

如针对注册用户男女性别比例的展现可以用饼状图,展现注册用户数随时间变化的增长趋势可以用曲线图,展现注册用户归属地可以通过柱状图或地图等等。在选择可视化方式时,要充分考虑数据的特点以及希望用图表展现出来的内涵是什么,这样才能用合理的方式展现出更直观的分析结果。

此外,数据分析的输出通常以数据分析报告的形式展现,数据分析报告的主要结构如下:

数据分析背景
数据来源及数据说明
数据分析方法
数据可视化
数据决策

以上是一份较为正式的数据分析报告的大体框架,如果针对日报一类并不要求正式性的数据分析结果展现,则可以具体问题具体分析。

六、总结

数据分析方法论一定是为指导具体工作实践而服务的,所以仅仅掌握方法论并不够,还要通过实践不断完善优化方法。只有当你真正去做数据分析这件事时,才能发现自己的不足,说再多不如直接去做。

数据分析5大关键环节相关推荐

  1. 数据分析和构建大数据分析基础设施的关键环节 Building a BigData Analytics Infrastructure

    作者:禅与计算机程序设计艺术 1.简介 2010年,谷歌搜索引擎爆炸性的流量导致其搜索结果无法显示全面而失败,此后数十年的时间里,谷歌始终秉持着让用户获得快速.及时的信息检索体验的使命,致力于提供最好 ...

  2. 项目冲突管理机制的4大关键环节

    1.冲突预防功能 预先采取一些措施防止冲突的产生,如建立有效的沟通机制.在项目开始前,制定沟通计划.沟通频率和方式,以确保项目成员充分了解自我职责和任务,并自愿分享和讨论.通过有效的沟通机制,最大限度 ...

  3. 数据分析实战:数据分析的5大关键环节

    大数据及移动互联网时代,每一个使用移动终端的人无时无刻不在生产数据,而作为互联网服务提供的产品来说,也在持续不断的积累数据.数据如同人工智能一样,往往能表现出更为客观.理性的一面,数据可以让人更加直观 ...

  4. 【干货下载】大数据分析的四个关键环节

    本文提炼自神策数据与 Ping++ 联合举办的沙龙 Growth Workshop 中神策数据创始人 & CEO 桑文锋的分享,主题为<大数据分析的四个关键环节>.PPT 干货获取 ...

  5. 大数据分析的四个关键环节

    ▌ 什么是大数据? 随着大数据时代的到来,AI 概念的火热,人们的认知有所提高.为什么说大数据有价值?这是不是只是一个虚的概念?大家怎么考虑数据驱动问题?为什么掌握更多的数据就会更有效?这些问题很难回 ...

  6. 解析云原生2.0架构设计的8大关键趋势

    摘要:在云原生2.0阶段,我们到底需要构建一个什么样的架构?华为云首席架构师为你一一解答. 本文分享自华为云社区<华为云首席架构师独家分享:云原生2.0架构设计的8大关键趋势>,作者:技术 ...

  7. 数据分析-PART2--10大数据分析模型

    数据分析-PART0--数据分析综合 数据分析-PART1--数据获取和步骤 数据分析-PART2--10大数据分析模型 数据分析-PART3--数据分析常用指标 数据分析-PART4--数据分析方法 ...

  8. 水滴数据建设实践及思考:2大关键问题,4大破局措施

    近日,水滴公司数据平台产品部负责人SKY在「让业务用起来 · 观远数据2022智能决策峰会暨产品发布会」北京站现场带来<水滴数据建设实践及思考>主题分享.SKY在分享中讲述了水滴数据团队在 ...

  9. ETL学习心得:探求数据仓库关键环节ETL的本质【转】

    ETL学习心得:探求数据仓库关键环节ETL的本质 做数据仓库系统,ETL是关键的一环.说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具.回忆 一下工作这么些年来,处理数据迁移.转换的工作倒还 ...

最新文章

  1. 使用metasploit收集邮箱
  2. 运动目标的背景建模-混合高斯背景建模和KNN模型建模的OpenCV代码实现
  3. java8 CompletableFuture异步编程
  4. java面向对象(类与对象,局部变量成员变量,基本类型和引用类型作为参数传递)...
  5. fileviewfinder.php,Laravel在FileViewFinder.php中查找视图的错误处理程序
  6. Struts2与Spring整合
  7. autotype安全 fastjson_Fastjson 安全更新,建议升级到 1.2.28 或更新版本
  8. C#模板编程(1):有了泛型,为什么还需要模板?
  9. __try,__except,__finally,__leave
  10. jsp+aJax 登陆成功
  11. SQL server中如何使用return,break和continue
  12. 目标检测(三) Fast R-CNN
  13. java实现格拉布斯准则_格拉布斯准则附件.pdf
  14. 机房服务器巡视项目,年底,机房巡检不能少
  15. linux配置中端代理
  16. 缓解眼疲劳电脑窗口设置
  17. 美团点评运营数据产品化应用与实践
  18. 北大先修课 计算机,北大先修课
  19. 在线通过dd命令备份分区
  20. 蓝奏网盘带密码文件分享下载链接分析思路

热门文章

  1. 【转】Cron表达式简介
  2. 你的灯亮着吗?阅读笔记之三
  3. JAVA 多线程学习总结
  4. Mac下使用Fiddler
  5. hibernate4中主要的配置文件配置
  6. 解决系统关机变重启故障
  7. CYQ.Data 轻量数据层之路 V3.0版本发布-Xml绝对杀手(三十二)
  8. Lucene.Net的中文分词组件AdvancedChineseAnalyzer
  9. 如何在有限的时间内编写完整有效的测试用例?
  10. FlowDocumentPageViewer