数据分析报告的通用结构
根据阅读《数据分析师养成宝典》及个人理解后所得。
完成一份数据分析报告的整个流程:
- 明确业务目标;
- 数据准备;
- 数据指标与分析;
- 撰写分析报告;
明确业务目标
了解必须的业务信息,明确问题类型,因为不同的问题类型,要解决的问题不同。
问题类型 | 必解决的问题 | 可延伸的问题 |
---|---|---|
描述类 | 发生了什么事 | 无 |
因果类 | 发生了什么事,为什么会发生 | 无 |
预测类 | 发生了什么事,未来会如何发展 | 为什么会发生 |
咨询类 | 发生了什么事,该如何应对 | 为什么会发生,未来会如何发展 |
数据准备
目标是识别出异常的数据,将其处理成可使用的数据,故分为两个环节,第一个是识别异常数据的数据探索,第二个是处理数据的数据清洗。
数据探索
目的是识别出异常数据,主要有缺失值,异常值,重复值三类。以下介绍各类型的识别方法:
缺失值识别办法:
- 字段值为Null即为缺失;
异常值识别办法:
- 由业务规则设定在什么范围内为异常值;
- 3σ原则,即可靠性95%以内;
- 箱线图,根据人眼直观感受;
重复值识别办法:
- 一般确定唯一字段是否有重复值即可;
数据清洗
目的是将异常数据处理成可用数据。
缺失值处理办法:
- 最优先:根据业务规则进行填充;
- 优先:当缺失值占比小于1%时,可考虑直接剔除记录;
- 用值填充(众数>中位数>>均值);
- 由其它字段分析,找到与该条记录最相似的且该字段有值的记录,用该记录的值来填充;
- 对于时序型记录,可考虑用窗口平均值填充;
异常值处理办法:
- 当成缺失值处理;
重复值处理办法:
- 确定来源,一般去重即可;
数据指标与分析
数据指标是指根据对业务目标的理解,确定出影响业务的指标有哪些,颗粒度如何;
数据分析是指分析出哪些指标会影响到业务;
两者是一个相结合的步骤。
此步骤有两种分析方法,分别对应不同的问题:
- 维度遍历法:用于解决新问题;
- 关键维度分析法:用于解决已确定关键维度的老问题;
维度遍历法的步骤:
- 进行各个维度的单变量分析,一般是描述性结果,仅用于了解项目的背景;
- 进行两两维度之间的多变量分析,一般是描述性结果,仅用于了解项目的背景;
- 进行聚类分析,不仅可用于描述项目的背景,还可用于解决咨询类问题;
关键维度分析法:
- 类似于维度遍历法,只是只处理那些之前被确认是重要的维度;
如何维度分析:
需要先将数据处理成可以直接用来分析的专家数据源,再将数据转化为指标用于分析业务;
- 获取专家数据源,需进行数据统一格式化:
- 归一化;
- 标准化;
- 归约(减少维度来压缩数据量,进而减少计算量);
- 数据变换(将有偏转为无偏,将颗粒度转化为业务需要的颗粒度);
- 专家数据转化为指标:
- 根据需要进行建模;
- 评估模型效果,知道模型可用;
撰写分析报告
一个完整的分析报告,包含四个结构:背景,目标,分析结论 —— 分析思路 —— 分析主体 —— 结论与建议。
背景,目标,分析结论的内容:
- 报告的背景;
- 报告的目的;
- 报告的结论;
分析思路:
- 以 目标-分解目标-细分目标-相关因素-因素影响力-影响力验证-(背后的现象)-目标决策 的逻辑说明即可;
分析主体:
- 跟分析思路类似,区别在于说明具体是如何做的,并摆出数据;
结论与建议:
- 跟 报告的结论 类似,但是更为细化的说明;
- 目标 - 现状 - 差异 :细分区域1 - 谁的责任 - 该如何做;细分区域2 - 谁的责任 - 该如何做;…
数据分析报告的通用结构相关推荐
- 2018年8月以太坊DApp数据分析报告
近日,链塔数据BlockData发布了<2018年8月以太坊DApp数据分析报告>,报告显示,以太坊上的DApp数量多达775个,形成了一个较为完善的开发生态圈,累计交易笔数多达3.003 ...
- 8天后,有份独家小程序数据分析报告重磅来袭
写下这个标题的时候,小编的内心是有点小激动的. 目前夏日葵电商成功涉及的小程序有:旅游.餐饮.技术服务.生鲜电商以及耗材等行业: 为了让更多想做小程序的人掌握先机, 夏日葵电商将与这5类小程序商家联手 ...
- 产品经理经验谈50篇(二):如何写好一份规范的数据分析报告?我想你需要知道这些
01 结构规范及写作 报告常用结构: 1. 架构清晰.主次分明 数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达.虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文 ...
- 掌握5个核心要点,做一个高质量的数据分析报告
作为职场人,在日常工作中肯定少不了要写月报.年报等各种分析报告.虽然时下数据分析已成为人人必备的技能,但不会写数据分析报告的人还是很多,大多数人的通病是分析报告只是呈现数据.罗列事实,但却没有结论,或 ...
- python 豆瓣评论数据分析_Python爬虫实战案例:豆瓣影评大数据分析报告之网页分析...
个人希望,通过这个完整的爬虫案例(预计总共4篇短文),能够让爬虫小白学会怎么做爬虫的开发,所以在高手们看来,会有很多浅显的废话,如果觉得啰嗦,可以跳过一些内容~ 上一篇文章给大家简单介绍了Python ...
- sql能查到数据 dataset对象里面没有值_新零售数据分析报告
零售项目数据分析报告 一.项目背景 随着零售市场的竞争日趋激烈,在试图满足客户期望时,最优化服务业务流程的能力是最重要的.通道化和管理数据,以争取客户的利益以及创造利润为目标,对生存至关重要. 理想情 ...
- 如何查询一个表中除某几个字段外其他所有的字段_一个小故事告诉你:如何写好数据分析报告?...
关注并将「人人都是产品经理」设为星标 每天早 07 : 45 按时送达 给你一份数据,你能完美的出一份数据报告吗?本文结合一个小故事,来告诉大家如何写好一份数据分析报告,enjoy~ 作者:Haby ...
- pandas_profiling :教你一行代码生成数据分析报告
分析报告全貌 什么是探索性数据分析 熟悉pandas的童鞋估计都知道pandas的describe()和info()函数,用来查看数据的整体情况,比如平均值.标准差之类,就是所谓的探索性数据分析- ...
- 和你谈谈数据分析报告
简介:做一份好的数据分析报告,大到成为能否帮助企业做出正确的商业决策,小到成为能否说服老板获取业务资源的关键因素.因此做出一份高质量的数据分析报告是一个职场人必备的利器. 前言: -更多关于数智化转型 ...
最新文章
- MySQL这样写UPDATE语句,劝退
- ABAP-在SMARTFORMS中取消使用WORD作为编辑器
- boost::system模块实现初始化顺序的测试程序
- influxdb tsm文件_Influxdb中的Compaction操作
- linuc和python常用命令是一样的么_Linux常用命令大全(非常全!!!)(2)|简明python教程|python入门|python教程...
- 第三方插件渗透攻击之KingView
- linux扫描目标主机开放端口
- 关于ajax跨域的问题
- 应届java开发简历,一文全懂
- AMS1117-3.3电源芯片损坏分析
- 恩格列净治疗心衰获得FDA快速通道资格
- ppt上显示无法显示图片计算机可能,把手机里做好的PPT导入电脑,为何有些图片会显示不出来?该如何解决?...
- mongodb lbs java_利用mongodb开发lbs应用实践
- 大数据时代下的SQL Server第三方负载均衡方案 ----Moebius测试
- 美团:落地 Service Mesh 的挑战与实践!
- Y470N 显卡超频了GT550m 完美2.10 bios
- 西瓜视频直播助手下载与安装过程 0523
- 解决github频繁输入密码问题和git@github.com:Permission denied (publickey)问题
- KO88冲销工单结算
- android 类似按键精灵脚本_Android拓展 lua实现类似按键精灵效果