方差和标准差是概率与统计学里经常用到的知识

在网上看到不少关于方差的研究和讨论,所以这里整合一下

方差和标准差的区别

一般来说方差的公式是(σ^2)S^2=……

而标准差则是将方差开根号S(σ)=……

由于方差和标准差差一个根号,所以接下来我主要介绍样本方差和母体方差,样本标准差和母体标准差的区别可以依样画葫芦

样本方差和母体方差的区别

这里我先举一个例子简单的说明一下

假设我们要开发疫苗需要对10000样本进行分析,这时我们需要对样本的一个特性值进行方差分析,由于机械的数量有限和时间紧迫,我们只能抽取其中的1000组进行估计分析,那我们第一步进行每一项与平均数(1000个样本的)做差的平方求和,如下

按照方差的定义我们接下来只要除以一个数就可以得到方差

这时我们试着除以1到n的每一个数,我们这n个结果将结果都保留下来

这时如果你去将10000样本全部进行分析,然后按照高中里的标准求方差的公式求结果,你会发现这个结果会接近我们1000个样本估计分析时的除以n-1时的结果(先不要吃惊和迷惑,下面就会讲解为什么)

所以我们高中里学的公式其实是母体方差

而抽样的方法则是样本方差

图片来源百度https://baike.baidu.com/pic/标准差公式/7238847/0/472309f79052982281674d51ddca7bcb0b46d4c8?fr=lemma&ct=single#aid=0&pic=472309f79052982281674d51ddca7bcb0b46d4c8

注意S是样本方差,σ才是母体方差

要解释为什么是除以n-1而不是除以n,那我们就要扯到二者的关系(概率论与统计的知识)

以下两图推理来自于大佬https://www.sohu.com/a/245370205_99916544?spm=smpc.content.share.1.1583725392654GUA6MlE#comment_area

第一行是E(S^2)=E(…………)

这就解释了样本方差和母体方差的公式关系

那么我们高中学的方差(母体方差)是整么表示出来的呢

我们称样本方差无偏估计值计算式,母体方差纯在偏估计值计算

样本方差和母体方差的使用

那么什么时候该用样本方差,什么时候应该使用母体方差呢

一般来说,我们要以样本的一小部分来估算整体的时候,存在估算(不确定)这个概念的时候就是样本方差

而我们对每一组数据都是已知的情况,再算方差时,就是母体方差,毕竟数据都已经确定了

如果涉及到样本的离散程度,那么就要用母体方差(个人认为要涉及样本的离散程度是一个精确的问题,而不是估计)

在结果要求不精密的计算里头n-1和n的区别不大(因为样本数量多,n会很大)

总的来说,在数据研究和人工智能、科学研究里头所说的方差一般是S(样本方差),即除以n-1

参考文献

https://zhidao.baidu.com/question/2058213861483942347.html

https://baike.baidu.com/item/方差/3108412?fr=aladdin

https://www.sohu.com/a/245370205_99916544?spm=smpc.content.share.1.1583725392654GUA6MlE#comment_area

https://baike.baidu.com/item/标准差公式/7238847

样本方差、母体方差、样本标准差、母体标准差相关推荐

  1. torch.var()、样本方差、母体方差

    文章目录 方差的分类 torch.var 方差的分类 这两者有显然的区别,为什么会有这个区别呢? 区别有二,这两个区别互相联系,不可分割: 数据的多少.上面这个只有一部分样本,而下面这个是有完整数据, ...

  2. 样本均值和方差对总体均值和方差的无偏估计证明、样本方差的方差

    样本均值和样本方差 首先对于样本$x_1...x_n$来说,他们的均值为与方差分别为: $\bar{x} = \frac{1}{n}\sum\limits_{i=1}^{n}x_i$ $s^2 = \ ...

  3. 样本均值和样本方差的无偏性证明、正态分布样本方差的方差

    样本均值和样本方差的无偏性 对于独立同分布的样本$x_1...x_n$来说,他们的均值为与方差分别为: $ \begin{aligned}&\bar{x} = \frac{1}{n}\sum\ ...

  4. 频域特征指标及其MATLAB代码实现(重心频率、均方频率、均方根频率、频率方差、频率标准差)

    以前我们梳理过常用的有量纲时域特征指标和无量纲时域特征指标,其实特征提取方法中,一些频谱特征指标也是十分有用的. 下述频域特征指标是根据信号的功率谱求得的.在故障诊断或者其他应用场景下,可以与时域指标 ...

  5. C语言实现总体方差,总体标准差,样本方差,样本标准差

    /**方差计算 *****注意数据类型 *参数 data[] 数据 *使用注意 需要重定义数据类型 typedef unsigned char uint8; typedef unsigned int ...

  6. 有了方差为什么需要标准差?

    标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便. 比如一个班男生的平均身高是170cm,标准差是10cm,那么方差就是100cm^2.可以进行的比较简便的描述是本班男生身高 ...

  7. MSE均方误差、RMSE均方根误差、MAE平均绝对误差、方差、SD标准差、协方差Covariance

    均方误差MSE(Mean Square Error) MSE=1m∑i=1m(hi(x)−yi)2MSE = \frac{1}{m}\sum_{i=1}^m (h_i(x) - y_i)^2MSE=m ...

  8. 平均值(Mean)、方差(Variance)、标准差(Standard Deviation)

    http://blog.shaochuancs.com/mean-variance-sd/ 方差 https://en.wikipedia.org/wiki/Variance#Product_of_i ...

  9. 总体X服从正态分布,样本方差的方差D(S^2) 等于多少?

最新文章

  1. 单应性Homograph估计:从传统算法到深度学习
  2. java 使用正则表达式从网页上提取网站标题
  3. 项目百态:软件项目管理面面观
  4. oracle往mysql数据同步存储过程_Oracle数据库之间数据同步
  5. Knockout.Js案例一Introduction
  6. python如何运行一个python程序_在python中,如何运行一个命令行程序,它在发送Ctrl+D之前不会返回...
  7. 【转】Android M新控件之AppBarLayout,NavigationView,CoordinatorLayout,CollapsingToolbarLayout的使用...
  8. ping 中的“TTL是什么意思
  9. android数据库开发案例教程,Android Studio项目开发教程 第6章 数据库编程(30页)-原创力文档...
  10. DevExpress GridControl双击获取行内容
  11. java显示字母数字组合_Java字母加数字组合比较大小
  12. python周末_python周末作业—刘宏升
  13. 最新消息:苹果M1芯片为何如此之快?
  14. 1013-----C语言----------几个va_宏函数的使用
  15. 2022年黑马程序员火爆全网的自学Java必刷教程(价值2w+的教程免费分享)
  16. 苹果激活锁怎么解除?手把手教你关闭激活锁
  17. 搜狗浏览器显示服务器dns,为你设置win10系统下搜狗浏览器无法解析服务器的dns地址的处理对策...
  18. 记录一下Base64 在线编码解码
  19. AutoRun机制详解
  20. 机器学习:软件漏洞分析

热门文章

  1. mysql左连接和内连接区别_MYSQL 左连接右连接和内连接的详解及区别
  2. java-php-python-ssm选课排课系统计算机毕业设计
  3. xargs的简单介绍
  4. Meego Linux 联想Z370(蓝)官方报4999
  5. python zipfile模块分卷_python zipfile模块用法详解
  6. 爱奇艺EPG(复刻平板端)
  7. 计算机传奇人物之唐纳德·克努特
  8. QProcess设置运行环境
  9. 市北教师教育GHOST_XP_SP2 博采众长完美版
  10. 网页中时光轴的简单实现