能分清直方图和柱状图,你就是图表届的“头号”玩家|图表家族#36
镝摘
虽然直方图是柱状图的一种(毕竟乍眼看都是很多柱子的样子),但是其实它俩一个喜欢数多少,一个喜欢比大小。
直方图展示数据分布
猜猜看哪个是直方图?
直方图(Histogram)是一种可视化在连续间隔,或者是特定时间段内数据分布情况的图表,经常被用在统计学领域。简单来说,直方图描述的是一组数据的频次分布,例如把年龄分成“0-5,5-10,……,80-85”17个组,统计一下中国人口年龄的分布情况。直方图有助于我们知道数据的分布情况,诸如众数、中位数的大致位置、数据是否存在缺口或者异常值。
(注:众数是指一组数据中出现次数最多的数据值,众数可能是一个数,但也可能是多个数。中位数是指可将数值集合划分为相等的上下两部分的数。)
根据数据分布状况不同,直方图展示的数据有不同的模式,包括对称单峰、偏左单峰、偏右单峰、双峰、多峰以及对称多峰。
直方图的数据模式
来源:Wikipedia
直方图的百年历史
一般认为,直方图最早是由数理统计学家Karl Pearson引入的,1891年他在文章“Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material”中,运用直方图展示了均质材料中的偏差。
Karl Pearson
Contributions to the Mathematical Theory of Evolution II:
Skew Variation in Homogeneous Material
Karl Pearson
随后,他也统计了欧洲250位君主的在位长度,以每3年为一个区间,发现在位时间在9-12年的君主数量最多(众数)。除此之外,我们也能看到没有人的在位时间是在51-54年,整体来说,在位时间长的君主很少。
图片来源:Statistical Approaches to Length of Reign
直方、柱状大不同
直方图和柱状图最让人迷惑的地方,就是它们长得非常相似。实际上,直方图和柱状图无论是在图表意义、适用数据上,还是图表绘制上,都有很大的不同。
1.直方图展示数据的分布,柱状图比较数据的大小。
这是直方图与柱状图最根本的区别。举个例子,有10个苹果,每个苹果重量不同。如果使用直方图,就展示了重量在0-10g的苹果有多少个,10-20g的苹果有多少个;如果使用柱状图,则展示每个苹果的具体重量。
所以直方图展示的是一组数据中,在你划分的区间里,这些数据的分布情况,但是我们不知道在一个区间里,单个数据的具体大小。下图展现了游客在博物馆的游览时间,其中,将近40%的游客仅逗留了0-10分钟。但是我们无法知道这些游客中,每个人具体的游览时间是多少。
图片来源:A Histogram is NOT a Bar Chart
而在柱状图里,我们能看到的是每个数据的大小,并且进行比较。下图就比较了在12次展览中,参观者参观时间的中位数,我们能够知道参观的具体用时。
图片来源:A Histogram is NOT a Bar Chart
2.直方图X轴为定量数据,柱状图X轴为分类数据。
由图表的原理就决定了,X轴在直方图与柱状图中的用法是不一样的。在直方图中,X轴上的变量是一个个连续的区间,这些区间通常表现为数字,例如代表苹果重量的“0-10g,10-20g……”,代表时间长度的“0-10min,10-20min……”。而在柱状图中,X轴上的变量是一个个分类数据,例如不同的国家名称、不同的游戏类型。
图片来源:www.mathsisfun.com
因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。而柱状图上的每根柱子是可以随意排序的,有的情况下需要按照分类数据的名称排列,有的则需要按照数值的大小排列。
3.直方图柱子无间隔,柱状图柱子有间隔
因为直方图中的区间是连续的,因此柱子之间不存在间隙。而柱状图的柱子之间是存在间隔。还有一个值得注意的地方,在直方图中,第一根柱子应该和Y轴有一定的间隔,即使都是从“0”这个值开始的。因为X轴与Y轴上“0”的意义不同,而且很多直方图上的区间并不是从0开始的。
4.直方图柱子宽度可不一,柱状图柱子宽度须一致
柱状图柱子的宽度因为没有数值含义,所以宽度必须一致。但是在直方图中,柱子的宽度代表了区间的长度,根据区间的不同,柱子的宽度可以不同,但理论上应为单位长度的倍数。
例如,美国人口普查局(The U.S. Census Bureau)调查了12.4亿人的上班通勤时间,由于通勤时间在45-150分钟的人数太少,因此区间改为45-60分钟、60-90分钟、90-150分钟,其他组距则均为5。
通勤数据
来源:Wikipedia
可以看到,Y轴的数据为“人数/组距”,在这种情况下,每个柱子的面积相加就等于调查的总人数,柱子的面积就有了意义。
通勤时间直方图
来源:Wikipedia
当上图的Y轴表达的是“区间人数/总人数/组距”,这个直方图就是我们初中学习的“频率分布直方图”,频率指的是“区间数量/总数量”。在这样的直方图中,所有柱子的面积相加就等于1啦。
使用直方小窍门
1.注意组距
组距会影响直方图呈现出来的数据分布,因此在绘制直方图的时候需要多次尝试改变组距。
组距较大的直方图
组距较小的直方图
2.X轴上为左闭右开区间
一般来说,X轴上的区间遵循“左闭右开”的原则,即在一个“a-b”的区间里,数据x应为“a≤x<b”。
3.注意Y轴所代表的变量
Y轴上的变量可以是频次(数据出现了多少次)、频率(频次/总次数)、频率/组距,不同的变量会让直方图描述的数据分布意义不同。
隐藏在身边的直方图
生活中,我们接触比较多的的应该是RGB直方图,这种直方图常出现在在PS、相机等场景中。
来源:Thomas看看世界,知乎
在RGB模式下,图片的颜色与红(Red)绿(Green)蓝(Blue)组成,各自的数值范围均为0-255。其中,红色直方图就描述了0-255这个数值范围内,像素的分布情况。但这种直方图的X、Y轴没有具体数值,我们只能数据分布模式大致判定照片情况。
从今往后,你就能一眼找到那个在柱状图海洋的直方图啦!如果你有遇到有趣的直方图,欢迎在评论跟大家分享喔~
世界读书日来点福利!明天19:00前点赞数最多的小伙伴,获得《可视化沟通用:信息图表设计让数据说话》一本。让读书成为习惯,天天都是世界读书日。
更多镝数使用问题请参看以下文章,如果仍有无法解决的问题,请发送邮件至public@dydata.io或者直接在后台留言。
咱们下期再见!
参考文章
Statistical Approaches to Length of Reign
http://slideplayer.com/slide/7812080/
How to Draw a Histogram
https://www.wikihow.com/Draw-a-Histogram
A Histogram is NOT a Bar Chart
https://www.forbes.com/sites/naomirobbins/2012/01/04/a-histogram-is-not-a-bar-chart/#fc6366a6d775
往期回顾
条柱形图 工作报表 饼图
时序图表 折线图 散点图
气泡图 面积图 弦图
主题配色 配色技巧 矩形树图
雷达图 瀑布图 旭日图
漏斗图 桑基图 箱线图
玫瑰图 折线家族 热力图
柱图家族 饼图家族 词云图
力向导图 数据可视化误区
来源:http://dy.163.com/v2/article/detail/DG3OF9N605118F5T.html
能分清直方图和柱状图,你就是图表届的“头号”玩家|图表家族#36相关推荐
- 直方图和柱状图的区别有哪些
直方图和柱状图的区别有哪些,结合自己的理解和查找的做一个总结: 1.柱状图是根据数据直接得到一个数据的结果,只是比较数据的大小,直方图是根据原数据做一个频次的分布 2.直方图柱子无间隔,柱状图柱子有间 ...
- mpAndroidchart 坐标和图表距离_数据对比图表,如何让你的总结报告更具说服力!...
数据对比大揭秘,业绩PK看这里. "数据解锁表达,用好PPT图表,让我们的演示更有说服力." 数据,作为PPT报告中最重要的呈现要素,借助图表的展示形式,能够将冰冷的文本数据更直观 ...
- Excel的图表:组成元素、图表类型与用途、图表可视化大全
文章目录 一.Excel组成元素 二.Excel图表类型与用途 三.Excel可视化大全-应用 1.饼状图 2.折线图 3.条形图 4.对称图表比较两公司 5.散点图 6.气泡图 7.雷达图 8.组合 ...
- 【在线图表生成】掌握这些图表,年终报表根本不用愁!
年底啦,你的年终数据报表做了吗?是不是在发愁如何做一份让老板满意的.好看的年终数据报表?若还没搞定,别方,让BDP来帮你-看完此文,一份图文并茂.直观且好看的年终数据报表就产生啦! 一.在线制作数据图 ...
- 免费而优秀的图表JS插件、js图表、html图表--百度的Echart、Highcharts、阿里的G2、Chart.js...
免费而优秀的图表JS插件 1.百度的Echart ECharts,缩写来自Enterprise Charts,是百度推出的一款开源的,商业级数据图表,它最初是为了满足百度公司商业体系里各种业务系统(如 ...
- 网页图表Highcharts实践教程之图表区
网页图表Highcharts实践教程之图表区 网页图表Highcharts图表区 图表区是图表的基本区域.所有的数据和图形都是绘制在图表区中.从图形绘制范围来分,图表区域分为外层图表区和绘图区.本章将 ...
- 网页图表Highcharts实践教程之图表代码构成
网页图表Highcharts实践教程之图表代码构成 Highcharts第一个实例 下面我们来实现本书的第一个Highcharts实例. [实例1-1]下面来制作北京连续一周最高温度折线图.操作过程 ...
- 网页图表Highcharts实践教程之图表代码构成
网页图表Highcharts实践教程之图表代码构成 Highcharts第一个实例 下面我们来实现本书的第一个Highcharts实例. [实例1-1]下面来制作北京连续一周最高温度折线图.操作过程如 ...
- axure中图表背影_Axure制作可视化图表的几种方法
做产品经理的过程中,后台的产品做了不少,画可视化图表总共经历了三个不同的阶段,分别是:表格截图.Axure钢笔工具.Axure元件(文末附下载方式). 一.使用钢笔工具制作数据可视化图表 Excel表 ...
最新文章
- 矢量对比_「插画原画必学教程」ps入门——03 图层、位图矢量图、调色
- 《科学》杂志展望2020年十大科学头条
- 泰语7个元音变形_大概是最全的音标总结--元音部分
- 项目Alpha冲刺——随笔集合
- 如何在Marketing Cloud的弹出UI窗口里添加扩展字段
- 后端解决跨域问题---SpringBoot
- 【渝粤教育】国家开放大学2018年春季 0599-21T工程造价管理基础理论与相关法规 参考试题
- 清理操作系统垃圾批处理文件
- Bailian2932 期末考试第三题——最大最小数之差【文本+进制】
- Win10设置WSL大小写敏感
- 北大生物信息学学习(2) 生物学及生物学信息学的发展
- 微软数据视界:图解数据分析价值
- ASP.NET MVC3+EF4+Oracle入门实例(五)
- 有道Java_有道词典java版下载-有道词典java豪华版v1.0.7 安卓版 - 极光下载站
- 清华大学计算机系网络课程视屏,清华大学计算机系网络课程
- 用c语言可以写一个编译器吗,为什么C语言编译器能用C语言编写?
- java shiro_shiro(java安全框架)
- Neyman-Pearson 奈曼-皮尔逊决策分析
- windows服务器ie兼容视图信息注册表项
- 有没有什么推荐的视频剪辑软件