简析方差、标准差与数值离散程度
方差(variance): 变量与其均值的差的平方和除以(变量数+1)。
如有一组数据: [1,2,3,4,5], 其均值就是 (1+2+3+4+5) / 5 = 3
所以其方差为: ((1-3)^2 + (2-3)^2 +(3-3)^2 + (4-3)^2 + (5-3)^2) /( 5+1) = 1.6666....
标准差(standard deviation):方差的算术平方根
方差和标准差反应了一组数据的离散程度:
当方差越小时,数据的离散程度越小
而当方差越大时,数据的离散程度也就越大。
如有两组数据
A = [1,2,3,4,5]
B=[1,5,7,9,11]
A 的方差为2 、B的方差为11.84 ,从方差的大小比较,var(A)<var(B)
所以B的离散程度比A的离散程度高
为什么方差可以体现数据的离散程度?
由公式可知:
当所有的变量值都一样时,均值等于变量值
所以方差为0,此时离散程度为0。当各个变量值里均值都有一定距离时
方差大于0。
例子:
通过使用 from sklearn.datasets.samples_generator import make_blobs 围绕3个中心点来生成数据集
红色的点代表 中心点
蓝色的点代表 生成点
通过修改make_blobs里面的cluster_std参数来控制 生成点 与 中心点之间的离散程度。而cluster_std参数
对应就是标准差
(1)当标准差为 0.60时:
(2) 当标准差为 0.3时
图像反映了不同标准差之间数据发布的情况
由此也反映了标准差与数值离散程度之间的对应关系。
转载于:https://www.cnblogs.com/qiutenglong/p/10958128.html
简析方差、标准差与数值离散程度相关推荐
- 03 ,平均数,极差,方差,标准差 : 数据的离散程度
1 ,数据例子 : 14 个数字 : 1,2,3,3,4,4,4,5,6,10 2 ,极差 : 最大值 - 最小值 10 - 1 = 9 3 ,平均数 : 定义 : 总值 / 总数 如图 : 4 ,方 ...
- 数据的离散程度度量:极差、四分位差、平均差、方差、标准差、异众比率、离散系数
数据的离散程度即衡量一组数据的分散程度如何,其衡量的标准和方式有很多,而具体选择哪一种方式则需要依据实际的数据要求进行抉择. 首先针对不同的衡量方式的应用场景大体归纳如下: 极差:极差为数据样本中的最 ...
- 离散程度度量:平均差、方差、标准差
数据的离散程度即衡量一组数据的分散程度如何,其衡量的标准和方式有很多,而具体选择哪一加粗样式种方式则需要依据实际的数据要求进行抉择. 首先针对不同的衡量方式的应用场景大体归纳如下: **极差:**极差 ...
- 数据的离散程度:极差、方差和标准差
数据的离散程度 如下两组数据: A:1,2,5,8,9 B:3,4,5,6,7 两组数据的均值都是 5,但是 B 组的数据更接近 5. 很多时候有描述集中趋势的统计量是不够的,还要有描述数据的离散程度 ...
- 数据离散程度的指标——标准差
标准差(Standard Deviation) 标准差,在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量.反应组内个体间的离散程度. 标准差的计算(Calcu ...
- 简析王者荣耀的匹配机制
本文以王者荣耀为主体,结合多款MOBA类游戏,对其匹配机制进行的一些猜想, 1.匹配机制的基础 分别从why.who.how三个角度简析. 1.1Why 王者荣耀有实战对抗模式,娱乐模式,排位赛模式等 ...
- 离散系数的计算公式_如何求不同变量之间的离散程度
变异系数 前面介绍的极差.方差和标准差都是反映一组数值变异程度的绝对值,其数值的大小,不仅取决于数值的变异程度,而且还与变量值水平的高低.计量单位的不同有关.所以,不宜直接利用上述变异指标对不同水平. ...
- 求离散数据的突变点_数据的离散程度分析1
在统计学中,把反映现象总体中各个体的变量值之间差异程度的指标称为离散程度,也称为离中趋势. 描述一组数据离散程度常用极差.四分位差.方差和标准差.变异系数等. 极差 极差(Range)也叫全距,是一组 ...
- 转:衡量数据的离散程度
衡量数据的离散程度 我们通常使用均值.中位数.众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度.常用的可以反 ...
最新文章
- 一个简单的程序来使用WiredTiger 存储引擎
- Spring Boot 中 @EnableXXX 注解的驱动逻辑
- 测试缺陷分析务实篇-转
- mysql oracle 查询语句执行顺序_MySQL sql语句执行顺序
- 【风控策略】大数据风控策略逻辑
- 一、专栏作者润森闲谈数据分析
- android开发期间使用真机调试但系统无法识别出真机
- RTL行为级仿真、综合后门级功能仿真和时序仿真
- D. Best Edge Weight(最小生成树 + 树链剖分)(Codeforces Round #423 (Div. 1, rated, based on VK Cup Finals))
- c++入门之类继承初步
- AcWing 2041. 干草堆(差分)
- Windows 8正式版亮点与新功能抢先看
- 5月2日下午学习日志
- 4-adjacent
- 高并发系统设计——API网关技术选型
- antd页面多表单校验
- 期末操作系统之HXL所给知识点(速成)
- Excel自学笔记 第五节 怎么在列后加统一固定字符?
- html按住语音如何看前面内容,单音语音内容.html
- hjr-MUD游戏(五):字符串与二进制与protobuf通信