根据阅读《数据分析师养成宝典》及个人理解后所得。

完成一份数据分析报告的整个流程:

  1. 明确业务目标;
  2. 数据准备;
  3. 数据指标与分析;
  4. 撰写分析报告;

明确业务目标

了解必须的业务信息,明确问题类型,因为不同的问题类型,要解决的问题不同。

问题类型 必解决的问题 可延伸的问题
描述类 发生了什么事
因果类 发生了什么事,为什么会发生
预测类 发生了什么事,未来会如何发展 为什么会发生
咨询类 发生了什么事,该如何应对 为什么会发生,未来会如何发展

数据准备

目标是识别出异常的数据,将其处理成可使用的数据,故分为两个环节,第一个是识别异常数据的数据探索,第二个是处理数据的数据清洗。

数据探索

目的是识别出异常数据,主要有缺失值,异常值,重复值三类。以下介绍各类型的识别方法:

缺失值识别办法:

  1. 字段值为Null即为缺失;

异常值识别办法:

  1. 由业务规则设定在什么范围内为异常值;
  2. 3σ原则,即可靠性95%以内;
  3. 箱线图,根据人眼直观感受;

重复值识别办法:

  1. 一般确定唯一字段是否有重复值即可;

数据清洗

目的是将异常数据处理成可用数据。

缺失值处理办法:

  1. 最优先:根据业务规则进行填充;
  2. 优先:当缺失值占比小于1%时,可考虑直接剔除记录;
  3. 用值填充(众数>中位数>>均值);
  4. 由其它字段分析,找到与该条记录最相似的且该字段有值的记录,用该记录的值来填充;
  5. 对于时序型记录,可考虑用窗口平均值填充;

异常值处理办法:

  1. 当成缺失值处理;

重复值处理办法:

  1. 确定来源,一般去重即可;

数据指标与分析

数据指标是指根据对业务目标的理解,确定出影响业务的指标有哪些,颗粒度如何;
数据分析是指分析出哪些指标会影响到业务;
两者是一个相结合的步骤。

此步骤有两种分析方法,分别对应不同的问题:

  1. 维度遍历法:用于解决新问题;
  2. 关键维度分析法:用于解决已确定关键维度的老问题;

维度遍历法的步骤:

  1. 进行各个维度的单变量分析,一般是描述性结果,仅用于了解项目的背景;
  2. 进行两两维度之间的多变量分析,一般是描述性结果,仅用于了解项目的背景;
  3. 进行聚类分析,不仅可用于描述项目的背景,还可用于解决咨询类问题;

关键维度分析法:

  1. 类似于维度遍历法,只是只处理那些之前被确认是重要的维度;

如何维度分析:

需要先将数据处理成可以直接用来分析的专家数据源,再将数据转化为指标用于分析业务;

  1. 获取专家数据源,需进行数据统一格式化:

    1. 归一化;
    2. 标准化;
    3. 归约(减少维度来压缩数据量,进而减少计算量);
    4. 数据变换(将有偏转为无偏,将颗粒度转化为业务需要的颗粒度);
  2. 专家数据转化为指标:
    1. 根据需要进行建模;
    2. 评估模型效果,知道模型可用;

撰写分析报告

一个完整的分析报告,包含四个结构:背景,目标,分析结论 —— 分析思路 —— 分析主体 —— 结论与建议。

背景,目标,分析结论的内容:

  1. 报告的背景;
  2. 报告的目的;
  3. 报告的结论;

分析思路:

  1. 以 目标-分解目标-细分目标-相关因素-因素影响力-影响力验证-(背后的现象)-目标决策 的逻辑说明即可;

分析主体:

  1. 跟分析思路类似,区别在于说明具体是如何做的,并摆出数据;

结论与建议:

  1. 跟 报告的结论 类似,但是更为细化的说明;

    1. 目标 - 现状 - 差异 :细分区域1 - 谁的责任 - 该如何做;细分区域2 - 谁的责任 - 该如何做;…

数据分析报告的通用结构相关推荐

  1. 2018年8月以太坊DApp数据分析报告

    近日,链塔数据BlockData发布了<2018年8月以太坊DApp数据分析报告>,报告显示,以太坊上的DApp数量多达775个,形成了一个较为完善的开发生态圈,累计交易笔数多达3.003 ...

  2. 8天后,有份独家小程序数据分析报告重磅来袭

    写下这个标题的时候,小编的内心是有点小激动的. 目前夏日葵电商成功涉及的小程序有:旅游.餐饮.技术服务.生鲜电商以及耗材等行业: 为了让更多想做小程序的人掌握先机, 夏日葵电商将与这5类小程序商家联手 ...

  3. 产品经理经验谈50篇(二):如何写好一份规范的数据分析报告?我想你需要知道这些

    01 结构规范及写作 报告常用结构: 1. 架构清晰.主次分明 数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达.虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文 ...

  4. 掌握5个核心要点,做一个高质量的数据分析报告

    作为职场人,在日常工作中肯定少不了要写月报.年报等各种分析报告.虽然时下数据分析已成为人人必备的技能,但不会写数据分析报告的人还是很多,大多数人的通病是分析报告只是呈现数据.罗列事实,但却没有结论,或 ...

  5. python 豆瓣评论数据分析_Python爬虫实战案例:豆瓣影评大数据分析报告之网页分析...

    个人希望,通过这个完整的爬虫案例(预计总共4篇短文),能够让爬虫小白学会怎么做爬虫的开发,所以在高手们看来,会有很多浅显的废话,如果觉得啰嗦,可以跳过一些内容~ 上一篇文章给大家简单介绍了Python ...

  6. sql能查到数据 dataset对象里面没有值_新零售数据分析报告

    零售项目数据分析报告 一.项目背景 随着零售市场的竞争日趋激烈,在试图满足客户期望时,最优化服务业务流程的能力是最重要的.通道化和管理数据,以争取客户的利益以及创造利润为目标,对生存至关重要. 理想情 ...

  7. 如何查询一个表中除某几个字段外其他所有的字段_一个小故事告诉你:如何写好数据分析报告?...

    关注并将「人人都是产品经理」设为星标 每天早 07 : 45 按时送达 给你一份数据,你能完美的出一份数据报告吗?本文结合一个小故事,来告诉大家如何写好一份数据分析报告,enjoy~ 作者:Haby ...

  8. pandas_profiling :教你一行代码生成数据分析报告

    分析报告全貌 ‍ 什么是探索性数据分析 熟悉pandas的童鞋估计都知道pandas的describe()和info()函数,用来查看数据的整体情况,比如平均值.标准差之类,就是所谓的探索性数据分析- ...

  9. 和你谈谈数据分析报告

    简介:做一份好的数据分析报告,大到成为能否帮助企业做出正确的商业决策,小到成为能否说服老板获取业务资源的关键因素.因此做出一份高质量的数据分析报告是一个职场人必备的利器. 前言: -更多关于数智化转型 ...

最新文章

  1. MySQL这样写UPDATE语句,劝退
  2. ABAP-在SMARTFORMS中取消使用WORD作为编辑器
  3. boost::system模块实现初始化顺序的测试程序
  4. influxdb tsm文件_Influxdb中的Compaction操作
  5. linuc和python常用命令是一样的么_Linux常用命令大全(非常全!!!)(2)|简明python教程|python入门|python教程...
  6. 第三方插件渗透攻击之KingView
  7. linux扫描目标主机开放端口
  8. 关于ajax跨域的问题
  9. 应届java开发简历,一文全懂
  10. AMS1117-3.3电源芯片损坏分析
  11. 恩格列净治疗心衰获得FDA快速通道资格
  12. ppt上显示无法显示图片计算机可能,把手机里做好的PPT导入电脑,为何有些图片会显示不出来?该如何解决?...
  13. mongodb lbs java_利用mongodb开发lbs应用实践
  14. 大数据时代下的SQL Server第三方负载均衡方案 ----Moebius测试
  15. 美团:落地 Service Mesh 的挑战与实践!
  16. Y470N 显卡超频了GT550m 完美2.10 bios
  17. 西瓜视频直播助手下载与安装过程 0523
  18. 解决github频繁输入密码问题和git@github.com:Permission denied (publickey)问题
  19. KO88冲销工单结算
  20. android 类似按键精灵脚本_Android拓展 lua实现类似按键精灵效果

热门文章

  1. 软件工程之功能性需求和非功能性需求
  2. 安全漏洞-报错页面泄露文件路径
  3. 2022下半年软件设计师中级考试通过
  4. 一起做网店的商品主图的批量采集的步骤
  5. 客观评价,一起看看iPhone 12是否值得你入手?
  6. 自媒体账号十万粉丝如何变现?
  7. MOS管中的N型/P型是什么意思?沟道呢?金属氧化物膜又是什么
  8. echarts地图的常见用法:基本使用、区域颜色分级、水波动画、区域轮播、给地图添加背景图片和图标、3d地图
  9. 我的第一个安卓应用程序_我如何设计我的第一个应用程序
  10. 使用Beego撸了一个社区