为什么样本标准差分母为n-1

我们知道总体标准差（σ）是按照下面的公式来计算的：

但是在真实世界中，找到一个总体的标准差是不现实的。大多数情况下，我们都是通过计算样本标准差（s）来估计总体标准差（σ）的。但是s的计算公式是这样的：

分母为什么要（n-1）呢，而不是n？

维基百科给出的解释有点费解：

看过很多统计学的教程和问答，一个比较利于理解的通俗的解释是：__
分母为n的话算出来的s会低估总体标准差（σ）。__

下面用MATLAB编程来证明这一点。大体是，我们随机生成1000个整数作为总体，然后从这个总体里抽取100个数，作为1个sample，共抽取1000个sample。然后我们用两种方式计算一下这个sample的标准差，即分母为n-1或者n，然后我们数一下这两种计算方式得到的s低于总体标准差（σ）的个数，这
里我们统计1000次的结果，代码在最后面。结果如下图，果不其然，分母为n的时候会较多的低估总体标准差（1000个sample平均有550个低估了总体标准差），而分母为（n-1）的时候基本大差不差（1000个sample基本有一半低估，一半高估）。

代码如下,可直接copy运行：

%% 总体（1000个1-100之间的整数）,总体均值和总体标准差
population = [1:1000]
mean_population = mean(population);
sigma_population =sqrt(sum((population-mean_population).^2)/1000);%% 统计1000次结果，每次1000个sample，看有多少次标准差低估总体标准差的
No_underestimate = [];
No_underestimate_real = [];
for m = 1:1000sigma_sample = [];real_sigma_sample = [];%随机取1000次samplefor i = 1:1000%从population里随机选取100个数作为sampleidx_sample = randi(1000,100,1);sample = population(idx_sample);%样本的均值和“标准差（分母不减一）”mean_sample = mean(sample);sigma_sample = [sigma_sample sqrt(sum((sample-mean_sample).^2)/length(sample))];%样本的标准差，分母减一real_sigma_sample = [real_sigma_sample sqrt(sum((sample-mean_sample).^2)/(length(sample)-1))];end%分母不减一求样本标准差时候低估总体标准差的个数No_underestimate =[No_underestimate length(sigma_sample(sigma_sample<= sigma_population))];%分母减一求样本标准差时候低估总体标准差的个数No_underestimate_real = [No_underestimate_real length(real_sigma_sample(real_sigma_sample<= sigma_population))];
end
%绘图
figure(1)
plot(No_underestimate)
title('分母不减一求样本标准差')
figure(2)
plot(No_underestimate_real)
title('实际求样本标准差（分母减一）')

为什么样本标准差分母为n-1相关推荐

python方差的计算公式为什么减一_样本标准差分母为何是n-1
欢迎各位学习从0到1Python数据科学之旅,腾讯课堂和网易云课堂入口分别如下: (腾讯课堂新营业,报名可领取20元优惠券) 微信公众号:pythonEducation 模型和统计项目QQ:23146 ...
EXCEL描述统计输出详解：标准误、置信度、偏度、峰度和JB检验
本文介绍EXCEL描述统计输出的各个细节,主要围绕标准差相关指标展开.包括: 解释标准差.标准误差.置信度之间的关系介绍各指标在EXCEL中如何单独计算介绍各指标的统计学公式重点强调一下峰度和偏 ...
Python笔记-上证指数收益率计算
代码如下: import pandas as pd from scipy import statsvalueList = [-0.010185, 0.011844, -0.00852, -0.0188 ...
样本方差之n-1理论推导及计算机实验证明
样本方差计算中,取值n-1的依据: 数学理论依据: https://www.zhihu.com/question/28964121 作者:Yeung Evan 链接:https://www.zhihu ...
主成分分析法(PCA)及其python实现
主成分分析法(Principal Component Analysis,PCA)是一种用于把高维数据降成低维,使分析变得更加简便的分析方法.比如我们的一个样本可以由nnn维随机变量(X1,X2,... ...
总体标准差、样本标准差、标准误差
我们之前学的标准差,指的是总体标准差,但是在现实中,由于样本数量很大,且都具有随机性,我们不可能得到全部的样本,所以要计算出总体标准差是不现实的. 通常情况下,我们只能从某个事物中进行抽样,然后从抽样 ...
总体标准差-样本标准差
总体标准差和样本标准差公式: 解释: 1,求一组数据的标准差,该组数据就是总体,此时是求总体标准差,公式中分母为n: 2,总体太大或未知,只能每次抽取样本,此时是求样本标准差,分母为n-1. 图片来源 ...
智能车竞赛技术报告 | 智能车视觉 - 中原工学院 - 逐鹿 - 分母队
学校:中原工学院队伍名称:逐鹿-分母队参赛队员:王泽南张志宇徐程升带队教师:但永平耿世勇第一章引言智能车辆是一个集环境感知.规划决策.多等级辅助 ...
java二维矩阵怎么进行转置_矩阵求导的本质与分子布局、分母布局的本质（矩阵求导——本质篇）...
〇. 前言在一个多月前,针对有同学关于矩阵求导中分子布局.分母布局两者的区别的疑问,我写了如下的这篇答案. 矩阵求导中布局约定,两者布局的意义是什么?www.zhihu.com 虽然这篇答案给出了 ...

为什么样本标准差分母为n-1

为什么样本标准差分母为n-1相关推荐

最新文章

热门文章