1)基本概念

我们先从最基本的一些概念入手。

如下图,脑子里要浮现出总体样本,还有一系列随机选取的样本。只要是样本,脑子里就要浮现出它的集合属性,它不是单个个体,而是一堆随机个体集合。样本是总体样本中随机抽取一系列个体组成的集合,它是总体样本的一部分。

应该把样本和总体样本一样进行抽象化理解,因此样本也存在期望和方差

这里有一个重要的假设,就是随机选取的样本与总体样本同分布,它的意思就是说他们的统计特性是完全一样的,即他们的期望值一样,他们的方差值也是一样的:

另外,由于每个样本的选取是随机的,因此可以假设不相关(意味着协方差为0,即),根据方差性质就有:

另外,还需要知道方差另外一个性质:

为常数。

还有一个,别忘了方差的基本公式:

以上的公式都很容易百度得到,也非常容易理解。这里不赘述。

2)无偏估计

接下来,我们来理解下什么叫无偏估计。

定义:设统计量是总体中未知参数的估计量,若,则称无偏估计量;否则称为有偏估计量。

上面这个定义的意思就是说如果你拿到了一堆样本观测值,然后想通过这一堆观测值去估计某个统计量,一般就是想估计总体的期望或方差,如果你选择的方法所估计出来的统计量的期望值与总体样本的统计量相等,那么我们称这种方法下的估计量是无偏估计,否则,就称这种方法下的估计量为有偏估计量。

按照这么理解,那么有偏无偏是针对你选择估计的方法所说的,它并不是针对具体某一次估计出来的估计量结果。如果方法不对,即使你恰好在某一次计算出来一个值和总体样本统计量值相同,也并不代表你选的这个方法是无偏的。为什么呢?这是因为单次值是和你选取的样本相关的,每次样本(更加严格的意义是某次样本快照)的值变化了,那么每次的值就有可能跟着变化,你就需对这么多求期望值来判断的可信程度,如果一直重复这个试验,然后它的期望值与总体样本的统计量一样,那么称按照这种方法估计出来的统计量是无偏的。

来一点题外话:

但凡是想通过有限的信息去"估计"一个整体的"量",这种情形下谈这个"估计"的方法“有偏”\“无偏”才有意义。一般来说,这种情形下,这个被估计的"量"肯定是有碍于技术或者现实情况无法严格准确获取,比如因为成本过高这些"量"无法通过穷举或者其他办法获知。否则,如果被估计的"量"很容易获取,就不需要"估计"了,采用统计方法就可以了。

如果你只是要进行简单的"统计"就能获得你想要的"量",那么没必要去关心所采用的方法是"有偏"还是“无偏";尤其是当整体信息很容易获取的情况下谈"有偏"还是“无偏"就毫无意义。比如要谈某个班级的身高的平均值,直接将身高总数除以班级人数就可以了,因为根本没必要去"估计",因为它仅仅是个"统计"问题;同样的,求一个班级的身高方差也不用任何纠结,求方差过程中除以班级人数就OK了,没有必要非常变态的研究是除以"班级总人数"还是"班级总人数-1",你要是去纠结这个,那就是吃饱了撑的了。但是,假如学校有几万人,你要统计的是整个学校所有的人的平均身高,这个时候一个一个进行统计是不现实的,反而需要使用的"估计"的方法。你采用的方法是随便抓100个人过来,将这100人总的身高数值除以100,估计出来的平均值就可以假设认为是整个学校的身高平均值,因为,你是用部分样本估计了总体样本的一个”量“,所以这个是"估计";此时,要是估计整个学校学生身高的方差,如果要想估计方法"无偏", 那就不是除以100了,而是除以99。当然,如果你是一位粗人,无所谓啥"有偏"还是“无偏"的束缚,那么你直接除以100也不会遭到嘲笑的,具体原因得继续往下看。总之,无法通过整体直接"统计"获得你想要的"量"时,你只能通过"部分样本"来做"整体样本""量"的估计时,谈估计方法的"有偏"还是"无偏"才是有意义的。

3)样本均值的无偏估计

接下来探讨一下下面的结论:

定理1:样本均值是总体样本均值的无偏估计。

注意:这里样本均值不是指某个样本的均值。

这里需要看上面这张图,这里的均指的是特定某次样本集合的快照(上图红色框),显然这个快照也是一个样本,只不过这个样本它的样本大小固定为n,这与抽象的样本不一样(一般我们想象抽象的样本,比如,是无限大的)。

明显,

第一个样本(快照)均值是长这样子的:

第二个样本(快照)均值是长这样子的:

....依此类推...

表示第次随机从从本获取一个个体。

试验一直进行下去,你就会有一些列估计出来的样本(快照)均值,实际上这也称为了一个样本,我们称为均值的样本,既然是样本,它就也有统计量。我们这里重点关注这个均值样本的期望。因为按照估计量的有偏无偏定义,如果,那么按照这个方法估计的均值就是无偏的。仔细思考,估计量有偏无偏它是针对你所选定的某个估计方法所形成的估计量样本空间来讨论的,讨论单次试验形成的估计量是没有太大意义的,只有针对形成的估计量样本空间才有意义。

下面验证上面的方法形成的估计是无偏的。

这么一来,就和教科书和网上的资料结果上都对上了,教科书上的公式在下面列出(符号用代替):

有了前面的分析,上面的教科书公式就很好理解了,注意,里头的是原始样本,也是样本!!!  公式推导过程中,表示了原始的样本快照求和后再除以n形成的估计量样本,所以是可以对其再进行求期望的。

讨论完估计量样本的均值,我们别忘了,既然它是个样本,那么可以计算的方差(后面会用到):

所以,样本(快照)均值的期望还是总体期望,但是,样本(快照)均值的方差却不是原来的方差了,它变成原来方差的1/n。这也容易理解,方差变小了是由于样本不是原来的样本了,现在的样本是均值化后的新样本,既然均值化了,那么比起原来的老样本,它的离散程度显然是应当变小的。

4)样本方差的无偏估计

定理2:样本方差是总体样本方差的无偏估计。

也就是需要证明下面的结论:

首先,脑子里要非常清楚,你截至目前,仅仅知道以下内容:

其中前面5个来自1),最后2个来自3)。

至于为什么是,而不是,需要看下面的证明。

那么为什么会导致这么个奇怪的结果,不是而是  ?

仔细看上面的公式,如果,那么就应该是了,但是残酷的事实是(除非本身就等于0),导致的罪魁祸首是。这就有告诉我们,虽然将方差缩小了n倍,但是仍然还有残存,除非本身就等于0,才会有,但这就意味着所有样本的个体处处等于

还有一种情况,如果你事先就知道,那么就是的无偏估计,这个时候就是了。

---------------------------------------------------------------------------------------------------------------------------------------------

有人还是问我为什么(总体均值)已知,就可以用作为总体方差的无偏估计,这个完全直接推导就可以证明。证明如下:

这个结论告诉我们,如果某个人很牛逼,他可以知道确切的总体样本均值,那么就可以用来估计总体样本方差,并且这个估计方法是保证你无偏的。

而上面的,请睁大眼睛看清楚,用的是。大部分的实际应用情况下,谁也不知道总体样本均值(请问你知道全球人均身高么?鬼知道,地球上没有一个人可以知道!我想即使是外星爸爸也不知道!),但是我还是想在全球人都不知道的情况下去估计总体的身高方差,怎么办?现在有个办法,我们可以去抓一些人(部分样本)来做一个部分样本均值,那就用部分样本均值也就是来近似代表(上面的定理1告诉我们这种方法对于估计是无偏的),但是现在我想估计另外一个东东,那个东东叫总体样本方差。好了,我们可以也用代入来估计总体样本方差,并且如前面所分析的,这个估计方法针对是无偏的。(至于为啥是奇怪的,简单直接的原因是因为我不知道总体样本均值,因为如果你能够知道,我们就可以不需要用奇怪的,我们就可以用去估计总体样本方差)。

总之,是理论上的总体样本方差。是实际应用中采用的总体样本方差估计。

------------------------------------------------------------------------------------------------------------------------------------------------------------------

统计学中还有一个"自由度"的概念。为什么是除以n-1还可以从自由度角度进行解释,具体可以参看下面百度的解释:

自由度 (统计学的自由度)

总体样本方差的无偏估计样本方差为什么除以n-1相关推荐

  1. 方差,样本方差,修正样本方差,均值,样本均值等概念

    首先,明确一点,方差,均值,是对一个随机变量而言的.样本均值,样本方差是针对一个样本而言的. 举个例子,x是一个随机变量,,服从0均值,方差.根据x的分布,我们可以抽样的到N个样本. 针对于x这个随机 ...

  2. 简单抽样技术——简单随机样本方差是总体方差的无偏估计

    来一点废话,帮助大家理解概率的精髓: 1) 只要谈估计,那就是告诉你一种方法,利用这个方法可以管中规豹似的获取某个统计量(这个统计量很可能限于人力物力无法真正获取,而我们又很想知道). 2) 只要是谈 ...

  3. 样本方差是总体方差的无偏估计

    总体均值 μ=1N∑xi\mu = \frac{1}{N}\sum x_iμ=N1​∑xi​, 总体方差 σ2=1N∑i(xi−μ)2\sigma^2 = \frac{1}{N}\sum_i (x_i ...

  4. 为什么样本方差是总体方差的无偏估计?

  5. 样本方差公式推导--为什么样本方差的分母是n-1

    概要 因为使用n作为分母会导致方差被低估,将分母替换为n-1可以保证样本方差是一种无偏估计 理想情况 首先,我们假定随机变量 X X X的数学期望 μ \mu μ是已知的,然而方差 σ 2 {{\si ...

  6. (大数据分析学习)16、标准化变量的广义样本方差和总样本方差

    标准化变量的广义方差: 总体样本方差:

  7. RMSE 和 STD 的区别

    文章目录 一.概念理解 二.公式推导 三.总结 一.概念理解 首先看一下两个的概念: RMSE: root mean square error 均方根误差,测绘学科中常称作中误差.它是指一组观测值与真 ...

  8. 做统计分析课程设计时回忆的一些知识

    真的全忘了... 泊松.指数.伽马分布 泊松分布: 已知某事件单位时间的平均发生率 λ λ \lambda,能给出单位时间内实际上发生X次的概率.可以证明二项分布取极限(试无数次)就是泊松分布,也就是 ...

  9. 样本方差与总体方差的区别

    为什么80%的码农都做不了架构师?>>>    之前一直对于样本方差与总体方差的概念区分不清,对于前者不仅多了"样本"两个字,而且公式中除数是N-1,而不是N.现 ...

最新文章

  1. 一致性哈希算法介绍,及java实现
  2. 15.泡菜:pickle模块
  3. 风寒感冒与风热感冒的区分与治疗
  4. [vue] 你有看过vue推荐的风格指南吗?列举出你知道的几条
  5. Perhaps you are running on a JRE rather than a JDK? 关于 idea maven 缓存的问题 清理 idea maven 缓存
  6. 解决安装python当中的.whl文件结尾的第三方库
  7. 真正的帅哥没人说帅_“浩南哥”这话你敢信?郑伊健:在香港,没人夸我帅
  8. mysql日期相关的函数
  9. 使用 Design Pattern Toolkit 进行模型驱动的开发入门
  10. RHCSA红帽认证考点2022(红帽认证系统管理员)
  11. 图解大数据 | 大数据生态与应用导论
  12. 总结js中关于路径的写法
  13. DSPE-PEG-NHS;磷脂-聚乙二醇-活性脂,可用于基因转染和疫苗传递(科研试剂)
  14. 新版Jenkins关闭CSRF“HTTP ERROR 403 No valid crumb was included in the request“
  15. python与金融数据分析论文_python 金融大数据分析 pdf
  16. python自动化交易_用Python寫自動交易程式的入門平台: Quantopian
  17. 病毒木马查杀实战第007篇:熊猫烧香之逆向分析(下)
  18. “暗黑天使”降临:DarkAngels勒索病毒全解密
  19. 10月23日,相约全球边缘计算大会·上海站
  20. 刚发布!美国今年要砸8.5亿美元布局AI,这两件事,程序员一定做准备了!

热门文章

  1. java textfield长度_java textfield 中如何设置文本长度
  2. gstreamer 的 elements
  3. CentOS 6.4的安装--史上最全-CRPER木木
  4. [晋飞扬][茗润堂]5pt; FONT-W
  5. 那年,我北漂-----闲话2016
  6. C++结构体定义及初始化
  7. OpenVINO系列02-深度学习部署工具包(DLDT)介绍
  8. JavaSE基础笔记—集合之Collection
  9. 教育资源平台空间装扮html代码,教育资源平台横幅标语
  10. vue中 使用element-ui 图标和阿里字体图标结合使用