概念系列1:标准差标准误
自说自话:本博主觉得学不好这个知识是因为概念的别名太多辽哈哈哈(标准差的名称有 10 余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等1)
标准差&标准误
标准差
标准差(Standard Deviation)是是随机误差绝对值的统计均值,标准差的定义式为
σ=1N∑i=1N(xi−μ)2\sigma = \sqrt{ \frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}σ=N1i=1∑N(xi−μ)2
但这个式子其实只有理论上的意义,μ\muμ 实际上是无法计算出来的。所以,一般是用样本参数来估计总体的参数,即用样本标准差 sss 的值作为总体标准差 σ\sigmaσ 的估计值。
s=1n−1∑i=1N(xi−xˉ)2s= \sqrt{ \frac{1}{n-1} \sum_{i=1}^N (x_i - \bar{x})^2}s=n−11i=1∑N(xi−xˉ)2
当 n→∞,s→σn \rightarrow \infty, s \rightarrow \sigman→∞,s→σ。
标准差的作用是反映一个样本或者一个总体里的个体之间区别有多大,如果不能理解这句解释,没关系!还有几个解释,总有一款适合你:
- 标准差 === 一次抽样中个体分数间的离散程度,反映了个体分数对样本均值的代表性,用于描述统计2
- 表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标
- …
众所周知,不整例子就不算接地气的解释,那就走一个,比如我们有总体是1、2、3、4、5、6、7、8、9和10,总体平均数是5.5,样本标准差为
s=110[(1−5.5)2+⋯+(10−5.5)2]s = \sqrt{\frac{1}{10}[(1-5.5)^2+\cdots+(10-5.5)^2]}s=101[(1−5.5)2+⋯+(10−5.5)2]
标准差就是一组数据的每一个数与该组数据的平均值比较,通过标准差可以看出这组数据的离散程度。
标准误
标准误(Standard Error of Mean)是在重复抽样中,每次抽出的样本的平均数所计算得到的标准差。标准误的全名其实是样本平均数的标准误,它的理论公式是
σxˉ=σn\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}σxˉ=nσ
和总体标准差不能直接计算一样,我们也是习惯去用样本标准误来接近这个理论值
sxˉ=sns_{\bar{x}} = \frac{s}{\sqrt{n}}sxˉ=ns
当 n→∞,sxˉ→σxˉn \rightarrow \infty, s_{\bar{x}} \rightarrow \sigma_{\bar{x}}n→∞,sxˉ→σxˉ。
咋个理解呢?标准误的作用从一个总体里取样本,样本之间的区别有多大。还有几个其他的理解:
- 标准误 === 多次抽样中样本均值间的离散程度,反映了样本均值对总体均值的代表性,用于推论统计2
- 反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小
- …
来来来,举例举例:比如我们有总体是1、2、3、4、5、6、7、8、9和10,总体平均数是5.5。第一次对总体进行抽样,可能得到 5、8、3、25、8、3、25、8、3、2 平均数是 4.5;第二次对总体进行抽样,得到 3、7、9、23、7、9、23、7、9、2 平均数 5.25;第三次对总体抽样,得到 4、6、9、2、4、14、6、9、2、4、14、6、9、2、4、1 平均数为 4.3,⋯\cdots⋯ 那么,4.5, 5.25 ,4.3 ⋯\cdots⋯ 组成一个新分布,这是一个以样本平均数为分布的,这个分布的标准差就是标准误3。
两个概念的比较
随着样本数(或测量次数)nnn 的增大,标准差趋向某个稳定值,即样本标准差 sss 越接近总体标准差 σ\sigmaσ。
而标准误则随着样本数(或测量次数)nnn 的增大逐渐减小,即样本平均数越接近总体平均数 μ\muμ。
故在实验中也经常采用适当增加样本数(或测量次数)nnn 减小 sxˉs_{\bar{x}}sxˉ 的方法来减小实验误差,但样本数太大意义也不大。
标准差是最常用的统计量,一般用于表示一组样本变量的分散程度;标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等。
标准差与标准误既有明显区别,又密切相关:标准误是标准差的 1n\frac{1}{n}n1;二者都是衡量样本变量(观测值)随机性的指标,只是从不同角度来反映误差;二者在统计推断和误差分析中都有重要的应用。
参考资料
郝拉娣,《标准差与标准误》,编辑学报http://image.sciencenet.cn/olddata/kexue.com.cn/upload/blog/file/2010/12/20101226211028645.pdf ↩︎
知乎:包寒吴霜——统计学上标准差与标准误的区别与联系是什么?https://www.zhihu.com/question/22864111 ↩︎ ↩︎
知乎:高翠林——standard deviation 和standard error的区别,能讲的通俗些吗?https://www.zhihu.com/question/21925923 ↩︎
概念系列1:标准差标准误相关推荐
- 标准差 标准误 偏度系数和峰度系数的作用
标准差和标准误是两个不同的概念,标准差就是一个变量的所有数据的离均差平方和再平均之后开平方,它是度量离散程度的指标.标准误用于估计参数的可信区间,进行假设检验等.它们与样本含量的关系不同:当样本含量 ...
- 计算机辅助教学的基本概念,心理学基本概念系列文库:计算机辅助教学
心理学基本概念系列-- 计算机辅助教学计算机辅助教学 形而上是人类区别于动物的重要文明之一, 情志,即现在所说的心理学, 在人类医学有重要地位. 本文提供对心理学基本概念 "计算机辅助教学& ...
- C#编程概念系列(一):面向对象编程
系列文章索引目录:http://www.cnblogs.com/loner/archive/2013/05/09/3068211.html 引子: 面向对象编程:这个在当下已不是什么时髦的概念,但通过 ...
- 33 个 JavaScript 核心概念系列(三): 显式 (名义) 与 隐式 (鸭子)类型转换
原文地址:落明的博客 一. 前言 说实话,JavaScript 的类型转换是个相当头疼的问题,无论是对于初学者还是有经验的老司机.它的难处并不在于概念多难理解,而是情况多且杂,看似相同的情况结果却又出 ...
- 图论算法-图论的表示、分类及基本概念(系列1)
什么是图论 图论的应用: 2. 图论的表示 3. 图论的分类 4. 图的基本概念 邻接矩阵:
- java-初识JVM的内存分配(5个区域)概念--系列(一)
JVM基本概念: JVM 是可运行 Java 代码的假想计算机 ,包括一套字节码指令集.一组寄存器.一个栈.一个垃圾回收,堆 和 一个存储方法域.JVM 是运行在操作系统之上的,它与硬件没有直接的交互 ...
- 33 个 JavaScript 核心概念系列(四): == 与 ===
原文地址:落明的博客,转载请注明出处! 一.前言 作为一个程序员,我想大家在第一次看到 a = b 的语句时一定是懵逼的.后来才知道 = 在编程语言中是用来赋值的,而不是用来判断两个值是否相等. 那该 ...
- 光学基础概念系列之——景深、工作距离、物像
距离 景深 通俗而言,景深即在镜头架设好后,与被测物体间相对距离不做任何调节的情况下,可接受的能清晰成像的物方空间范围. 在机器视觉中,相机芯片为光学系统的像平面,物方与像平面共轭的平面称为对准平面. ...
- PolarisMesh系列文章——概念系列(一)
北极星是什么? 项目地址:https://github.com/polarismesh/polaris 北极星是腾讯开源的服务发现和治理中心,致力于解决分布式或者微服务架构中的服务可见.故障容错.流量 ...
最新文章
- mysql配置文件没有spring_spring cloud config使用mysql存储配置文件
- mac os x 查看网络端口情况
- web前端开发--列表
- python xgboost参数_如何对XGBoost模型进行参数调优
- 深圳电信网速测试工具
- DynaSLAM跑通的辛酸之路
- boost::sort模块实现带有右移函子排序示例的整数排序的测试程序
- 牛客 -- leetcode -- max-points-on-a-line
- vue传中文标点_vue项目引入第三方高德地图实现标点定位
- leetcode 134. 加油站 思考分析
- ZMQ模式详解——发布/订阅模式
- 《深入理解JVM虚拟机》读书笔记(一)
- 客户下单邮件跟进书写
- Linux实用命令之 xdg-open 打开资源管理器
- ARM的开发步骤:让你思路更清晰
- java 纯真ip数据库_Java 快速把2016最新版纯真ip数据库导入mysql的方法
- 亚马逊资源名称 (ARN) 和 AWS 服务命名空间
- QQ在线客服设置-QQ开启临时会话教程
- CSR867X sink例程的VM工程属性编译选项简析
- 程序员视角的计算机系统 第一章 计算机系统之旅
热门文章
- De novo 测序基础知识
- iOS开发 - 怎么让支持iPad/iPhone的app取消支持iPad或者iPhone中的一项
- 文本挖掘是的过程是什么,主要划分为几个步骤?
- 豹变猫?实时场景转变?NVIDIA多模式图像转换技术都能实现
- mysql 多进程 分批_多线程分批处理数据
- 短信拦截木马背后的黑色产业
- 哈尔滨工业大学-计算机系统-2022春-大作业
- 【专题3:电子工程师 之 上位机】 之 【44.使用ffmpeg对视频解码、视频像素和尺寸转换、重采样】
- java soot_java代码优化框架 soot
- Grandi‘s series