直观地识别数据集中的异常值(查看离群点)。

判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度)。

实例:

12位商学院毕业生月起薪的样本在这里按升序重复如下。

2710 2755 2850 | 2880 2880 2890 | 2920 2940 2950 | 3050 3130 3325

Q1 = 2865 Q2 = 2905(中位数) Q3 = 3000

中位数是2 905,第一个四分位数Q1 = 2865,第三个四分位数Q3 = 3000。检查这些数据,最小值为2710,最大值为3325。因此,薪水数据的五数概括数据为2710、2865、2905、3000、3325。大约1/4或25%的观察值在五数概括的相邻两个数字之间。

箱线图是在五数概括的基础上对数据进行描述的图形方法。绘制箱线图的关键是计算中位数、四分位数Q1和Q3。也可以使用四分位数全距IQR = Q3 − Q1。图1是月起薪数据的箱线图。

绘制箱线图的步骤如下:

1.画一只箱子,箱子两端分别位于第一个和第三个四分位数上。对于薪水数据来说,Q1 = 2865以及Q3 = 3000。这个箱子包括中间50%的数据。

2.在箱子中位数(薪水数据是2905)的位置画一条垂直线。

3.用四分位数全距IQR = Q3 − Q1,确定限制线的位置。箱线图的上、下限制线分别在比Q1低1.5(IQR)和比Q3高1.5(IQR)的位置上。对于薪水数据来说,IQR = Q3 − Q1 = 3000 − 2865 = 135。因此,限制线的位置在2865 − 1.5(135) = 2662.5和3000 + 1.5(135) = 3202.5处。两条限制线以外的数据可以认为是异常值。

4.图1中的虚线称为触须线。触须线从箱子两端开始绘制,直至第3步中计算的限制线内的最小值和最大值。因此,薪水数据的触须线分别在2 710和3 130处结束。

5.最后,每个异常值的位置都用星号“*”表示出来。在图1中,我们可以看到一个异常值,即3325。

在图1中,我们画出了表示上下界限位置的直线。画这些线是为了说明如何计算薪水数据的限制线并标出其位置。虽然限制线通常要计算出来,但是在箱线图中一般并不标示出来。图2显示了薪水数据的常见箱线图的形状。

seaborn(sns)调用举例:

importseaborn as sns

sns.set_style("whitegrid")

tips= sns.load_dataset("tips")#绘制箱线图

ax = sns.boxplot(x=tips["total_bill"])#竖着放的箱线图,也就是将x换成y

ax = sns.boxplot(y=tips["total_bill"])

Ref:

1.盒图(boxplot): http://www.blogjava.net/norvid/articles/317235.html

2. 箱线图: http://wiki.mbalib.com/wiki/%E7%AE%B1%E7%BA%BF%E5%9B%BE#_ref-1

3. Seaborn(sns)官方文档学习笔记(第五章 分类数据的绘制) https://zhuanlan.zhihu.com/p/27683042

4.

java boxplot_箱线图(boxplot)简介与举例相关推荐

  1. 箱线图怎么判断异常值_原创【六西格玛工具解读】02——箱线图(Boxplot)

    为方便从事质量工作的小伙伴系统了解相关管理工具,小编整理出六西格玛工具系列的应用解读.旨在相关爱好者交流探讨,也可供报考六西格玛黄带.绿带或黑带的朋友参考.因个人水平有限,难免存在疏忽和错误,还请各位 ...

  2. 【MATLAB】进阶绘图 ( Boxplot 箱线图 | boxplot 函数 | Error Bar 误差条线图 | errorbar 函数 )

    文章目录 一.Boxplot 箱线图 1.boxplot 函数 2.代码示例 二.Error Bar 误差条线图 1.errorbar 函数 2.代码示例 一.Boxplot 箱线图 1.boxplo ...

  3. 箱线图boxplot

    1 主要函数 1.1 boxplot pyplot中绘制箱线图的函数为boxplot,其语法格式如下. matplotlib.pyplot.boxplot(x,notch=None,sym=None, ...

  4. 【读书笔记->统计学】03-01 各种“距”和“差”-极差(全距)、四分位距(数)、百分位数、箱线图概念简介

    各种"距"和"差" 上一章中我们学习了平均数,但是它有自己的有限性.为了得到更多的信息,我们开始学习各种"距"和"差". ...

  5. matlab 画箱线图boxplot简单用法

    代码示例: data1=rand(5,1);%列向量 data2=rand(5,1);%列向量 data3=rand(5,1);%列向量 data=[data1,data2,data3]; boxpl ...

  6. Matlab箱线图Boxplot横坐标x轴设置

    修改横坐标 数组 X (6列) 1. 修改横坐标标签 boxplot(X, 'Labels', {'40 R-L', '40 L-R', '50 R-L', '50 L-R', '60 R-L', ' ...

  7. matlab横坐标轴设置,Matlab箱线图Boxplot横坐标x轴设置

    修改横坐标 数组 X (6列) 1. 修改横坐标标签 boxplot(X, 'Labels', {'40 R-L', '40 L-R', '50 R-L', '50 L-R', '60 R-L', ' ...

  8. 箱线图(Boxplot)也称箱须图(Box-whisker Plot)

    简述: 箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值.第一四分位数.中位数.第三四分位数与最大值来描述数据的一种方法.它也可以粗略地看出数据 ...

  9. python boxplot 多组_Matlab boxplot for Multiple Groups(多组数据的箱线图)

    由于matlab具有强大的计算功能,用其统计数据功能优点显而易见,这里分享使用matlab中的boxplot的一些技巧,供大家参考. 命令 格式如下 :产生矩阵X的每一列的盒图和"须&quo ...

最新文章

  1. 使用oracle和sqlserver的几点区别【转】
  2. 启动服务错误5拒绝访问_【Go API 开发实战 5】基础1:启动一个最简单的 RESTful API 服务器...
  3. 【Linux】27_网站服务静态站点
  4. 【5分钟一本书】暗时间:用时间管理把握产品的进度条
  5. labview数据枚举数据服务器,枚举器报告'未指定的错误,不能枚举服务器
  6. 传递实体类对象_Java I/O 流之对象流中的序列化和反序列化
  7. 用matlab实现人脸识别,Matlab实现简单的人脸识别程序
  8. 蓄水池采样算法的python实现_蓄水池抽样算法(Reservoir Sampling)
  9. Linux中磁盘读写速度测试
  10. Lua进行二进制文件的位操作
  11. Iphone攻与防-一
  12. 整车电源状态 K15 KL30 KL31
  13. 百度员工抱怨:1月离职,没有年终奖。。。
  14. Java常用缓存组件和方法
  15. 黑苹果论坛被封_Mac论坛==黑苹果==大集合超级索引
  16. matlab中输入参数数目不足怎么回事,matlab输入参数数目不足
  17. 言简意赅之二进制运算符口诀
  18. Unity中OnTriggerEnter2D 和OnCollisionEnter2D 的使用情形及容易掉的坑
  19. 汽车理论matlab编程,汽车理论1.3和2.7matlab编程答案
  20. 最新报告丨深入洞察九大车主 APP,落地汽车行业解决方案及最佳实践

热门文章

  1. 下载Excel模板样例。
  2. 【FaceBook系列二】再见了,Facebook_scraper?Python的session请求获取Facebook的群组数据。
  3. mingw+cmake编译Assimp库遇到undefine问题
  4. python iloc函数_Python pandas.DataFrame.iloc函数方法的使用
  5. java web漏洞_如何安全检测Java Web应用网站漏洞
  6. 输出图片python
  7. php 删除文件夹及文件
  8. python 除法 商 和余数
  9. 子沐课堂——Mysq从入门到精通(二)
  10. 计算机考研最后四十天,考研 | 最后40多天,千万不该有的做法!