镝摘

  虽然直方图是柱状图的一种(毕竟乍眼看都是很多柱子的样子),但是其实它俩一个喜欢数多少,一个喜欢比大小。

  直方图展示数据分布

  

  猜猜看哪个是直方图?

  直方图(Histogram)是一种可视化在连续间隔,或者是特定时间段内数据分布情况的图表,经常被用在统计学领域。简单来说,直方图描述的是一组数据的频次分布,例如把年龄分成“0-5,5-10,……,80-85”17个组,统计一下中国人口年龄的分布情况。直方图有助于我们知道数据的分布情况,诸如众数、中位数的大致位置、数据是否存在缺口或者异常值

  (注:众数是指一组数据中出现次数最多的数据值,众数可能是一个数,但也可能是多个数。中位数是指可将数值集合划分为相等的上下两部分的数。)

  

  根据数据分布状况不同,直方图展示的数据有不同的模式,包括对称单峰、偏左单峰、偏右单峰、双峰、多峰以及对称多峰。

  

  直方图的数据模式

  来源:Wikipedia

  直方图的百年历史

  一般认为,直方图最早是由数理统计学家Karl Pearson引入的,1891年他在文章“Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material”中,运用直方图展示了均质材料中的偏差。

  

  Karl Pearson

  

  Contributions to the Mathematical Theory of Evolution II:

  Skew Variation in Homogeneous Material

  Karl Pearson

  随后,他也统计了欧洲250位君主的在位长度,以每3年为一个区间,发现在位时间在9-12年的君主数量最多(众数)。除此之外,我们也能看到没有人的在位时间是在51-54年,整体来说,在位时间长的君主很少。

  

  图片来源:Statistical Approaches to Length of Reign

  直方、柱状大不同

  直方图和柱状图最让人迷惑的地方,就是它们长得非常相似。实际上,直方图和柱状图无论是在图表意义、适用数据上,还是图表绘制上,都有很大的不同。

  1.直方图展示数据的分布,柱状图比较数据的大小。

  这是直方图与柱状图最根本的区别。举个例子,有10个苹果,每个苹果重量不同。如果使用直方图,就展示了重量在0-10g的苹果有多少个,10-20g的苹果有多少个;如果使用柱状图,则展示每个苹果的具体重量。

  所以直方图展示的是一组数据中,在你划分的区间里,这些数据的分布情况,但是我们不知道在一个区间里,单个数据的具体大小。下图展现了游客在博物馆的游览时间,其中,将近40%的游客仅逗留了0-10分钟。但是我们无法知道这些游客中,每个人具体的游览时间是多少。

  

  图片来源:A Histogram is NOT a Bar Chart

  而在柱状图里,我们能看到的是每个数据的大小,并且进行比较。下图就比较了在12次展览中,参观者参观时间的中位数,我们能够知道参观的具体用时。

  

  图片来源:A Histogram is NOT a Bar Chart

  2.直方图X轴为定量数据,柱状图X轴为分类数据。

  由图表的原理就决定了,X轴在直方图与柱状图中的用法是不一样的。在直方图中,X轴上的变量是一个个连续的区间,这些区间通常表现为数字,例如代表苹果重量的“0-10g,10-20g……”,代表时间长度的“0-10min,10-20min……”。而在柱状图中,X轴上的变量是一个个分类数据,例如不同的国家名称、不同的游戏类型。

  

  图片来源:www.mathsisfun.com

  因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。而柱状图上的每根柱子是可以随意排序的,有的情况下需要按照分类数据的名称排列,有的则需要按照数值的大小排列。

  3.直方图柱子无间隔,柱状图柱子有间隔

  因为直方图中的区间是连续的,因此柱子之间不存在间隙。而柱状图的柱子之间是存在间隔。还有一个值得注意的地方,在直方图中,第一根柱子应该和Y轴有一定的间隔,即使都是从“0”这个值开始的。因为X轴与Y轴上“0”的意义不同,而且很多直方图上的区间并不是从0开始的。

  

  4.直方图柱子宽度可不一,柱状图柱子宽度须一致

  柱状图柱子的宽度因为没有数值含义,所以宽度必须一致。但是在直方图中,柱子的宽度代表了区间的长度,根据区间的不同,柱子的宽度可以不同,但理论上应为单位长度的倍数。

  例如,美国人口普查局(The U.S. Census Bureau)调查了12.4亿人的上班通勤时间,由于通勤时间在45-150分钟的人数太少,因此区间改为45-60分钟、60-90分钟、90-150分钟,其他组距则均为5。

  

  通勤数据

  来源:Wikipedia

  可以看到,Y轴的数据为“人数/组距”,在这种情况下,每个柱子的面积相加就等于调查的总人数,柱子的面积就有了意义。

  

  通勤时间直方图

  来源:Wikipedia

  当上图的Y轴表达的是“区间人数/总人数/组距”,这个直方图就是我们初中学习的“频率分布直方图”,频率指的是“区间数量/总数量”。在这样的直方图中,所有柱子的面积相加就等于1啦。

  使用直方小窍门

  1.注意组距

  组距会影响直方图呈现出来的数据分布,因此在绘制直方图的时候需要多次尝试改变组距。

  

  组距较大的直方图

  

  组距较小的直方图

  2.X轴上为左闭右开区间

  一般来说,X轴上的区间遵循“左闭右开”的原则,即在一个“a-b”的区间里,数据x应为“a≤x<b”。

  3.注意Y轴所代表的变量

  Y轴上的变量可以是频次(数据出现了多少次)、频率(频次/总次数)、频率/组距,不同的变量会让直方图描述的数据分布意义不同。

  隐藏在身边的直方图

  生活中,我们接触比较多的的应该是RGB直方图,这种直方图常出现在在PS、相机等场景中。

  

  来源:Thomas看看世界,知乎

  在RGB模式下,图片的颜色与红(Red)绿(Green)蓝(Blue)组成,各自的数值范围均为0-255。其中,红色直方图就描述了0-255这个数值范围内,像素的分布情况。但这种直方图的X、Y轴没有具体数值,我们只能数据分布模式大致判定照片情况。

  从今往后,你就能一眼找到那个在柱状图海洋的直方图啦!如果你有遇到有趣的直方图,欢迎在评论跟大家分享喔~

  世界读书日来点福利!明天19:00前点赞数最多的小伙伴,获得《可视化沟通用:信息图表设计让数据说话》一本。让读书成为习惯,天天都是世界读书日。

  

  更多镝数使用问题请参看以下文章,如果仍有无法解决的问题,请发送邮件至public@dydata.io或者直接在后台留言

  咱们下期再见!

  参考文章

  Statistical Approaches to Length of Reign

  http://slideplayer.com/slide/7812080/

  How to Draw a Histogram

  https://www.wikihow.com/Draw-a-Histogram

  A Histogram is NOT a Bar Chart

  https://www.forbes.com/sites/naomirobbins/2012/01/04/a-histogram-is-not-a-bar-chart/#fc6366a6d775

  往期回顾

  条柱形图 工作报表 饼图

  时序图表 折线图 散点图

  气泡图 面积图 弦图

  主题配色 配色技巧 矩形树图

  雷达图 瀑布图 旭日图

  漏斗图 桑基图 箱线图

  玫瑰图 折线家族 热力图

  柱图家族 饼图家族 词云图

  力向导图 数据可视化误区

来源:http://dy.163.com/v2/article/detail/DG3OF9N605118F5T.html

能分清直方图和柱状图,你就是图表届的“头号”玩家|图表家族#36相关推荐

  1. 直方图和柱状图的区别有哪些

    直方图和柱状图的区别有哪些,结合自己的理解和查找的做一个总结: 1.柱状图是根据数据直接得到一个数据的结果,只是比较数据的大小,直方图是根据原数据做一个频次的分布 2.直方图柱子无间隔,柱状图柱子有间 ...

  2. mpAndroidchart 坐标和图表距离_数据对比图表,如何让你的总结报告更具说服力!...

    数据对比大揭秘,业绩PK看这里. "数据解锁表达,用好PPT图表,让我们的演示更有说服力." 数据,作为PPT报告中最重要的呈现要素,借助图表的展示形式,能够将冰冷的文本数据更直观 ...

  3. Excel的图表:组成元素、图表类型与用途、图表可视化大全

    文章目录 一.Excel组成元素 二.Excel图表类型与用途 三.Excel可视化大全-应用 1.饼状图 2.折线图 3.条形图 4.对称图表比较两公司 5.散点图 6.气泡图 7.雷达图 8.组合 ...

  4. 【在线图表生成】掌握这些图表,年终报表根本不用愁!

    年底啦,你的年终数据报表做了吗?是不是在发愁如何做一份让老板满意的.好看的年终数据报表?若还没搞定,别方,让BDP来帮你-看完此文,一份图文并茂.直观且好看的年终数据报表就产生啦! 一.在线制作数据图 ...

  5. 免费而优秀的图表JS插件、js图表、html图表--百度的Echart、Highcharts、阿里的G2、Chart.js...

    免费而优秀的图表JS插件 1.百度的Echart ECharts,缩写来自Enterprise Charts,是百度推出的一款开源的,商业级数据图表,它最初是为了满足百度公司商业体系里各种业务系统(如 ...

  6. 网页图表Highcharts实践教程之图表区

    网页图表Highcharts实践教程之图表区 网页图表Highcharts图表区 图表区是图表的基本区域.所有的数据和图形都是绘制在图表区中.从图形绘制范围来分,图表区域分为外层图表区和绘图区.本章将 ...

  7. ​网页图表Highcharts实践教程之图表代码构成

    ​网页图表Highcharts实践教程之图表代码构成 Highcharts第一个实例 下面我们来实现本书的第一个Highcharts实例. [实例1-1]下面来制作北京连续一周最高温度折线图.操作过程 ...

  8. 网页图表Highcharts实践教程之图表代码构成

    网页图表Highcharts实践教程之图表代码构成 Highcharts第一个实例 下面我们来实现本书的第一个Highcharts实例. [实例1-1]下面来制作北京连续一周最高温度折线图.操作过程如 ...

  9. axure中图表背影_Axure制作可视化图表的几种方法

    做产品经理的过程中,后台的产品做了不少,画可视化图表总共经历了三个不同的阶段,分别是:表格截图.Axure钢笔工具.Axure元件(文末附下载方式). 一.使用钢笔工具制作数据可视化图表 Excel表 ...

最新文章

  1. 矢量对比_「插画原画必学教程」ps入门——03 图层、位图矢量图、调色
  2. 《科学》杂志展望2020年十大科学头条
  3. 泰语7个元音变形_大概是最全的音标总结--元音部分
  4. 项目Alpha冲刺——随笔集合
  5. 如何在Marketing Cloud的弹出UI窗口里添加扩展字段
  6. 后端解决跨域问题---SpringBoot
  7. 【渝粤教育】国家开放大学2018年春季 0599-21T工程造价管理基础理论与相关法规 参考试题
  8. 清理操作系统垃圾批处理文件
  9. Bailian2932 期末考试第三题——最大最小数之差【文本+进制】
  10. Win10设置WSL大小写敏感
  11. 北大生物信息学学习(2) 生物学及生物学信息学的发展
  12. 微软数据视界:图解数据分析价值
  13. ASP.NET MVC3+EF4+Oracle入门实例(五)
  14. 有道Java_有道词典java版下载-有道词典java豪华版v1.0.7 安卓版 - 极光下载站
  15. 清华大学计算机系网络课程视屏,清华大学计算机系网络课程
  16. 用c语言可以写一个编译器吗,为什么C语言编译器能用C语言编写?
  17. java shiro_shiro(java安全框架)
  18. Neyman-Pearson 奈曼-皮尔逊决策分析
  19. windows服务器ie兼容视图信息注册表项
  20. 有没有什么推荐的视频剪辑软件

热门文章

  1. ps怎么一下选中多个图层_PS图层基本操作,零基础小白必学
  2. css隐藏状态,CSS元素隐藏和显示
  3. css画横线箭头_2020年你应该关注这50款前端热门工具:CSS HTML 工具篇
  4. Sqoop(二)常用命令及常数解析
  5. phoenix数据类型,语法,方法
  6. hbase数据库介绍,HBASE的特点,表结构逻辑视图,Row Key,列族,时间戳,Cell
  7. CCTMXTiledMap的使用
  8. C++ vector的用法
  9. 整数划分递归相关问题
  10. Open vSwitch系列实验(一):Open vSwitch使用案例扩展实验