你好,我在技术社区,有一个网络昵称叫作:“胖子哥”,你在任何一个搜索引擎搜索关键字:“胖子哥 大数据”,就可以找到我过往分享的文章。

我从事数据领域工作超过 15 年的时间,主攻数据仓库、数据产品和数据分析等几个领域,积累了丰富的实践经验,曾经主导过多个日均百亿级的,大型分布式系统的数据架构、数仓建模和数据可视化平台建设。

为什么你要学习数据可视化分析?

我们都知道,伴随大数据的发展,当今已经是一个数字化的世界,企业的业务运营、主营业务增长和商业模式创新,都需要依赖数字化转型,而数据分析是企业实现数字化转型中最重要的一环。历经数十年的信息化建设,各个企业其实已经积累了大量的数据,建立起了数据平台和数据体系,数据基础设施日益完善,如何发现、挖掘和利用好这些数据,从而呈现业务、发现异常、分析问题、定位原因,并且进一步赋能业务成为各项工作的关键。

而这其中,数据可视化分析作为数据分析的新型实现手段和方法,成为不容忽视的一环,数据可视化分析的应用随处可见,比如:

  • 指挥中心:交通部门通过数据可视化,监测并预测拥堵情况,为交通优化提供合理策略。

  • 个人账单:支付宝年度账单,让用户更直观地了解自己的购物、饮食等消费习惯。

  • 疫情地图:让疫情传播链条和地区分布情况一目了然。

  • 报表平台:企业通过数据可视化发现企业盈亏,从而调整自己的运营策略和发展方向。

相较于生涩的统计数字,数据可视化报告和报表因其直观、可视化的呈现特点,成为连接数据分析师和企业管理者、业务运营人员、商业分析师、市场营销人员最好的纽带。这点我们很好理解,那么什么是数据可视化分析呢?

数据可视化分析,是通过构建数据可视化图表,展示数据特征,从中发现数据信息的过程。它包括两个步骤:数据可视化呈现和数据分析洞察。

数据可视化分析,是数据分析师必须掌握的一项核心技能。但在不同企业中,执行数据可视化分析动作的角色或岗位会有不同:

  • 比如设立数据可视化分析师,并且配备相应的技术人员;

  • 比如设立数据可视化开发工程师,可见企业对于数据可视化分析的重视;

  • 同时,数据可视化分析能力,也是业务运营人员(包括流量运营、内容运营、交易运营等)、商业分析师和企业管理人员的必备能力。

这类市场需求信息,我们可以通过拉勾网的平台搜索功能查看到,如下图所示。由于数据可视化存在的巨大商业价值,相关人才供不应求,无论一线互联网企业,还是传统企业都在大量招聘,而且薪资待遇也比较感人。




在本课时,我将对数据分析、数据挖掘、数据可视化和数据可视化分析这 4 个概念进行剖析、对比,借此让你对数据可视化分析建立一个直观的认知,更好地区分开数据分析和数据挖掘,了解各自的知识体系。明确各自的区分和差异后,你在工作中,可以依据具体的业务场景,来选择适合的工作方法和技术体系。

数据可视化分析全览

在介绍几个概念之前,我们先来看一个关于数据可视化分析的典型案例,通过直观的、可视化的案例对其建立一个整体印象。最常见的场景之一就是数据仪表盘,如下图所示:

数据仪表盘图

图中包含了数据指标卡、折线图、饼图和表格等,这些都是我们经常使用的,后面也将会详细讲解每种图的设计和使用方法。

数据可视化分析包括数据可视化呈现(制作可视化图表)和数据分析洞察(基于图表识别信息) 两个过程。在实际的工作和业务场景中,通常用于发现业务运营过程中出现的问题,以及进行辅助决策,比如可以:

  • 通过数据指标卡的同环比数据,发现当前指标是否出现波动:

  • 通过折线图发现指标的发展和变化趋势;

  • 通过柱状图发现指标之间的对比关系;

  • 通过饼状图发现指标之间的比例关系。

数据可视化分析包括业务监控、运营分析系统和即席查询系统(临时性的 SQL 需求),并以数据报表、数据仪表盘、可视化数据大屏等形式呈现数据内容,以便直观地呈现数据指标。

直观地了解了数据可视化分析后,你是否会对它产生以下 4 个疑问:

  • 如何构建一个完整的数据可视化分析系统,用于实现业务监控和运营分析呢?

  • 实现数据可视化分析需要掌握哪些能力?

  • 如何实现数据的可视化呈现?

  • 如何基于呈现的数据可视化图表,进行数据分析和业务洞察呢?

在接下来这整个课程中,我将围绕上述 4 个问题,逐个知识点、逐类常用图表,以案例的方式来介绍数据可视化分析系统的设计和使用;课程的最后,我还会以一个完整的 Web 站点的方式,带你实现一个完整的数据可视化分析项目。

数据分析和数据挖掘的区别

通常情况下,我们所说的数据分析是指狭义的数据分析,它和数据挖掘合起来才是一个完整的数据分析过程,即广义的数据分析。因此,在学习数据可视化分析之前,先弄清楚数据分析和数据挖掘的概念很有必要。

数据科学诞生于英文的世界,其实翻译过来:

  • 数据挖掘(Data Mining)是基于机器学习算法模型,挖掘数据背后隐藏知识的过程;

  • 数据分析(Data Analysis)是利用统计学,发现数据规律的过程。

相较于数据挖掘,数据分析更加直观,利用的是数据的浅层特征(可以直接发现);而数据挖掘是必须借助机器学习算法模型,才能够发现数据背后的知识。

通过上面简短的分析,你应该已经看出二者的部分差异了,但这还不够明确。接下来,我用一张图来带你详细拆解下狭义数据分析和数据挖掘的差异,以及各个维度的对比。

数据分析和数据挖掘对比图

图中红色和蓝色分别代表了狭义数据分析和数据挖掘相关的内容。接下来我将结合图中的 6 个方面,为你逐个剖析它们的差异。

狭义数据分析

  • 数据资源,数据分析的对象,即数据资源,一般都是数值数据。

  • 工作方法,基于统计分析,主要采用指标监控、趋势分析、对比分析和组成分析等常用方法。比如,可以通过数据指标卡来监控业务指标的完成情况;还可以通过同环比,发现业务指标是否超出了设定的波动范围。

  • 工作流程,一般分为 7 个步骤,包括业务理解、指标定义、维度定义、呈现设计、代码设计、数据发布和分析洞察,如下图所示。这部分内容我将结合第三部分的第一个实战案例进行详细讲解,并贯穿本课程实战部分的始终。

数据分析工作流程图

  • 业务场景包括宏观决策、业务监控、运营分析和即席查询等。

  • 输出结果是计算之后的各种指标,比如均值、方差、最大值、最小值、关联系数等,通常以数据可视化报表或数据分析报告的形式存在。

  • 工具平台,常用平台的开源版本有 Redash、Metabase、Superset,商业版本有 PowerBI、Quick BI、网易有数等。推荐你使用开源版本 Redash,其最核心的特点是用户接口设计的直观,容易操作。

数据挖掘

  • 数据资源,除了数值数据之外,还包括多种形式,比如文本数据、语音数据、视频数据等。举个例子,淘宝或京东的商品评论数据就是一个典型的文本数据,这类数据可以通过情感识别的算法模型,进行用户情感评价。

  • 工作方法,基于机器学习和人工智能,发现数据潜藏的价值,主要采用决策树算法、逻辑回归算法、神经网络算法、贝叶斯分类算法、聚类算法、关联分析算法等算法模型。比如,用户分类画像问题,就可以通过聚类算法来处理。

  • 工作流程,有一个行业标准过程模型,即 CRISP-DM,它把该流程分为了 6 个环节,包括业务理解、数据理解、数据准备、数据建模、模型评估和模型发布,如下图所示:

数据挖掘工作流程图

  • 业务场景,包括分类问题、聚类问题、关联分析、回归预测和异常检测等。比如,基于历史交易数据进行交易量预测的问题,就是一个典型的回归预测问题。

  • 输出结果,是训练好的数据模型和输入数据训练的结果,比如,分类标签、聚类结果、关联系数和回归结果等。还可以基于训练好的分类模型,输入新的数据样本,从而获得该样本的分类标签。

  • 工具平台,数据挖掘的则是机器学习和深度学习方面的库,比如 SKlearn、TensorFlow、PyTorch、Caffe2、SparkML 等。

在这里讲述数据分析和数据挖掘的概念与区别,只是为了帮你梳理清楚这二者之间的区别,为你建立起一个完整的数据分析世界观,从而为学习本课程的内容扫清不必要的障碍。接下来我就继续讲解数据可视化的内容,也是本课程的重点内容。

数据可视化及其表现形式

数据可视化起源于 1960 年计算机图形学,是利用图表呈现数据内容的一种方法。数据可视化的概念中,有一个关键信息——数据可视化研究的对象是数据可视化的表现形式。

那么什么是数据可视化的表现形式呢?其实就是各种点、线、面和体的图表,比如散点图、折线图、柱状图、漏斗图等。不同的图表为你展现的数据信息是不同的,比如:

  • 折线图,展现指标随着时间变化趋势的场景;

  • 柱状图,展现多个指标下的数据变化对比情况的场景。

常用的数据可视化图表有 16 种,如下图所示:

常用的数据可视化图表

这部分内容我将在第三部分“实战案例篇”进行详细讲解,并且在后面的案例中我也会告诉你,它们适用的业务场景,所以在本课时我就不一一赘述了。但是我希望你可以在本课时中对它们建立一个初步的印象,带着自己的疑问和见解去学习下一课时。

6 个维度拆解数据可视化分析

数据可视化分析是利用数据可视化呈现能力,进行数据分析的一种方法,通过可视化呈现的图表,发现有用的信息,得出数据结论和辅助宏观决策。简单来说,就是把枯燥的数字变成各种各样的图表,更好地帮助你发现其中有价值的信息。数据可视化分析是实现广义数据分析的一种模式,具有与狭义数据分析相同的体系结构,并且在某些方面,拓展了数据可视化的内容。

由于后面的课时我会针对这个过程从多个维度进行呈现,所以在这里我就不详细讲解了。为了方便你与上面两个概念进行对比,我依旧会从 6 个方面为你拆解数据可视化分析的内容。

总结

本课时,我为你详细介绍了数据分析、数据挖掘、数据可视化和数据可视化分析的概念和体系结构,旨在让你对于数据可视化分析有一个明确的认知。明确了它们的概念,再回到我在本课时一开始提到的业务案例,你是否已经有了明确的答案呢?不妨结合我讲述的知识体系,尝试着寻找答案。欢迎你将你的思考写在留言区,与我和其他同学进行讨论。


精选评论

**宇:

捧场!

*未:

这个是不是更多的讲的是工具的使用啊,而不是分析的方法思维层面的呢

讲师回复:

本课程不讲工具如何使用,工具只是个附属品。课程重点讲述三个方面的东西:1. 数据可视化分析的方法论;2. 基于python如何首先图表可视化呈现;3. 基于可视化图表,如何做数据分析和洞察。

**同学:

内容很棒,学习到了

数据分析可视化01 掌握数字化转型时代的必备技能相关推荐

  1. 一文了解马化腾,数字化转型时代的困惑、思考与转身

    马化腾是数字化转型时代最大的困惑,所有的目光都在盯着腾讯在企业数字化转型时期的大转身.作为互联网上半场最成功的企业和企业家代表,腾讯与马化腾是一个时代的标签.自2004年6月上市,腾讯的股价到2009 ...

  2. IDC:大数据——数字化转型时代的大商机

    2015年5月27日–IDC中国在贵阳举办了年度中国ICT市场趋势论坛,论坛的主题是:"加速创新实现数字化转型". 在本次论坛上,贵阳市副市长毛有碧女士致开幕词,她重点介绍了贵阳举 ...

  3. 数字化转型时代,如何让你的 App 摆脱“内卷”?

    编者按:现在各行各业都在讲"内卷".普通消费者手机上的App,也面临几大巨头的超级平台 App "内卷",很多应用场景与功能,日益被作为某种形态的"插 ...

  4. 数字化转型时代的企业数据新基建 | 爱分析报告

    前言 刚刚过去的21世纪的第二个十年,是消费互联网蓬勃发展的十年,也是云计算.大数据.人工智能等新一代信息技术,即"数字化技术"快速崛起的十年. 在这一时期,以信息服务为主的消费互 ...

  5. 数字化转型时代!你一定要了解的低代码

    随着低代码/无代码平台的兴起,如今,代码开发生产力领域有了很大的变化,无论你会不会编程,出于以下三方面的原因,你都需要了解低代码开发,甚至快速上手编写企业应用. 一.低代码开发能缩短开发周期 代码开发 ...

  6. 数字化转型时代,人人都是攀登者

    点击上方关注我们! 杜甫有诗:"会当凌绝顶,一览众山小."登高,是中国文人墨客的一种情怀和抱负,也是中国传统文化中所推崇的一种精神.这种精神传承到当代,也可以理解为是一种在中国女排 ...

  7. “前线”与“后方”—数字化转型时代理解华为品质服务的价值

    文 | 曾响铃 来源 | 科技向令说(xiangling0815) 如果说过去政企对数字化转型或多或少还有一些观望心态,那么现在几乎都在积极拥抱这个浪潮--IDC一份报告把企业数字化转型阶段分为入门者 ...

  8. 数字化转型时代,我们为什么越来越需要数据库云管平台?

    2022年<政府工作报告>再次强调"促进产业数字化转型".作为制造业和互联网大国,我国在产业数字化转型方面具备丰富的应用场景.广阔的市场空间和强大的内生动力.目前,数字 ...

  9. 数字化转型时代的主流商业模式 ——订阅服务

    传统上,人们购买某种产品时习惯于一次性付款(即一锤子买卖).而世界正在从产品转向服务,订阅模式不只是收费形式转变,经营与工作思维也将彻底转变,从产品导向的一次买断,变成与订户建立持续服务的长期关系,这 ...

最新文章

  1. php用ajaxs上传图片_php+ajax实现图片文件上传功能实例
  2. 雾里散步——这次聊聊自已
  3. Spring RSocket:基于服务注册发现的 RSocket 负载均衡
  4. vscode 使用flask
  5. 51汇编与c语言混合编程,C51与汇编混合编程详解
  6. 51nod 最小方差
  7. CamShift算法,OpenCV实现2-Mean Shift算法
  8. Atitit 高级人员要看哪些源码 目录 1. Ati看过的源码 1 1.1. Ui类 1 1.2. Mvc类 1 1.3. 数据库类 1 1.4. 算法类 1 2. 看源码的意义 2 2.1. 一
  9. 多层陶瓷电容器用处_具有综合优异电卡性能的无铅多层陶瓷电容器研究新进展...
  10. python中fg是什么意思_Python fg
  11. AE开发之主窗体通过Base Comand和IHookHelper接口向子窗体转递图层信息方法模板
  12. sphinx启动searchd进程出现search error failed to open No such file or directory
  13. 基于tensorflow、CNN网络识别花卉的种类(图像识别)
  14. TI公司之DSP结构与芯片
  15. hive -- return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
  16. 编程语言只是一个工具
  17. 二十二.jmeter在linux下运行
  18. JavaScript实现字符串翻转
  19. php网站标签加小图标,phpweb如何添加ico图标
  20. 使用iTools、PP助手清理垃圾前后目录对比图

热门文章

  1. 梯度提升树(GBDT)详解之三:原理推导
  2. 银行家算法(文件读入输出)
  3. C语言 全角半角 测试
  4. 开启微信悬浮窗权限有什么用_魅族这个值得吹爆的功能,你也能用上了
  5. 苹果home键在哪里设置_苹果屏幕上的home键在哪里设置出来
  6. 有符号数和无符号数的区别
  7. 开源AI智能客服系统源码 人工智能对话软件源码 完整程序包+搭建教程
  8. 什么是LSM-Tree
  9. linux系统配置Vim命令,vim配置 LINUX操作系统VIM的安装和配置
  10. 导出数据Excel打开乱码问题