我们知道总体标准差(σ)是按照下面的公式来计算的:

但是在真实世界中,找到一个总体的标准差是不现实的。大多数情况下,我们都是通过计算样本标准差(s)来估计总体标准差(σ)的。但是s的计算公式是这样的:

分母为什么要(n-1)呢,而不是n?

维基百科给出的解释有点费解:

看过很多统计学的教程和问答,一个比较利于理解的通俗的解释是:__
分母为n的话算出来的s会低估总体标准差(σ)。__

下面用MATLAB编程来证明这一点。大体是,我们随机生成1000个整数作为总体,然后从这个总体里抽取100个数,作为1个sample,共抽取1000个sample。然后我们用两种方式计算一下这个sample的标准差,即分母为n-1或者n,然后我们数一下这两种计算方式得到的s低于总体标准差(σ)的个数,这
里我们统计1000次的结果,代码在最后面。结果如下图,果不其然,分母为n的时候会较多的低估总体标准差(1000个sample平均有550个低估了总体标准差),而分母为(n-1)的时候基本大差不差(1000个sample基本有一半低估,一半高估)。

代码如下,可直接copy运行:

%% 总体(1000个1-100之间的整数),总体均值和总体标准差
population = [1:1000]
mean_population = mean(population);
sigma_population =sqrt(sum((population-mean_population).^2)/1000);%% 统计1000次结果,每次1000个sample,看有多少次标准差低估总体标准差的
No_underestimate = [];
No_underestimate_real = [];
for m = 1:1000sigma_sample = [];real_sigma_sample = [];%随机取1000次samplefor i = 1:1000%从population里随机选取100个数作为sampleidx_sample = randi(1000,100,1);sample = population(idx_sample);%样本的均值和“标准差(分母不减一)”mean_sample = mean(sample);sigma_sample = [sigma_sample sqrt(sum((sample-mean_sample).^2)/length(sample))];%样本的标准差,分母减一real_sigma_sample = [real_sigma_sample sqrt(sum((sample-mean_sample).^2)/(length(sample)-1))];end%分母不减一求样本标准差时候低估总体标准差的个数No_underestimate =[No_underestimate length(sigma_sample(sigma_sample<= sigma_population))];%分母减一求样本标准差时候低估总体标准差的个数No_underestimate_real = [No_underestimate_real length(real_sigma_sample(real_sigma_sample<= sigma_population))];
end
%绘图
figure(1)
plot(No_underestimate)
title('分母不减一求样本标准差')
figure(2)
plot(No_underestimate_real)
title('实际求样本标准差(分母减一)')

为什么样本标准差分母为n-1相关推荐

  1. python方差的计算公式为什么减一_样本标准差分母为何是n-1

    欢迎各位学习从0到1Python数据科学之旅,腾讯课堂和网易云课堂入口分别如下: (腾讯课堂新营业,报名可领取20元优惠券) 微信公众号:pythonEducation 模型和统计项目QQ:23146 ...

  2. EXCEL描述统计输出详解:标准误、置信度、偏度、峰度和JB检验

    本文介绍EXCEL描述统计输出的各个细节,主要围绕标准差相关指标展开.包括: 解释标准差.标准误差.置信度之间的关系 介绍各指标在EXCEL中如何单独计算 介绍各指标的统计学公式 重点强调一下峰度和偏 ...

  3. Python笔记-上证指数收益率计算

    代码如下: import pandas as pd from scipy import statsvalueList = [-0.010185, 0.011844, -0.00852, -0.0188 ...

  4. 样本方差之n-1理论推导及计算机实验证明

    样本方差计算中,取值n-1的依据: 数学理论依据: https://www.zhihu.com/question/28964121 作者:Yeung Evan 链接:https://www.zhihu ...

  5. 主成分分析法(PCA)及其python实现

    主成分分析法(Principal Component Analysis,PCA)是一种用于把高维数据降成低维,使分析变得更加简便的分析方法.比如我们的一个样本可以由nnn维随机变量(X1,X2,... ...

  6. 总体标准差、样本标准差、标准误差

    我们之前学的标准差,指的是总体标准差,但是在现实中,由于样本数量很大,且都具有随机性,我们不可能得到全部的样本,所以要计算出总体标准差是不现实的. 通常情况下,我们只能从某个事物中进行抽样,然后从抽样 ...

  7. 总体标准差-样本标准差

    总体标准差和样本标准差公式: 解释: 1,求一组数据的标准差,该组数据就是总体,此时是求总体标准差,公式中分母为n: 2,总体太大或未知,只能每次抽取样本,此时是求样本标准差,分母为n-1. 图片来源 ...

  8. 智能车竞赛技术报告 | 智能车视觉 - 中原工学院 - 逐鹿 - 分母队

    学 校:中原工学院  队伍名称:逐鹿-分母队 参赛队员:王泽南    张志宇    徐程升    带队教师:但永平    耿世勇    第一章 引言   智能车辆是一个集环境感知.规划决策.多等级辅助 ...

  9. java二维矩阵怎么进行转置_矩阵求导的本质与分子布局、分母布局的本质(矩阵求导——本质篇)...

    〇. 前言 在一个多月前,针对有同学关于矩阵求导中分子布局.分母布局两者的区别的疑问,我写了如下的这篇答案. 矩阵求导中布局约定,两者布局的意义是什么?​www.zhihu.com 虽然这篇答案给出了 ...

最新文章

  1. 大神们请看python日期是这样转换的
  2. MySQL和PGSQL事务锁等待超时时间
  3. C++选择排序(附完整源码)
  4. 虚拟主机不支持mysql_虚拟主机能用mysql么
  5. yum安装jdk1.8
  6. freeradius+mysql+交换机认证
  7. flutter html 加载_Flutter 加载本地 HTML 文件
  8. 还在死磕 Ajax?那可就 out 了!
  9. 【转】JMeter学习(十八)JMeter测试Java(二)
  10. java怎样学_告诉你java如何学
  11. 基于python的学生管理系统的设计开题报告_学生信息管理系统设计开题报告
  12. 北京理工大学计算机学院嵩天,嵩天教授做客我校信息学院
  13. 《创业维艰》笔记 2
  14. 百度网页快照删除服务恢复运营
  15. 2017.7.14 阿里巴巴校招面经
  16. 计算机win7如何加快开机速度,电脑启动越来越慢如何提升win7开机速度
  17. Android如何分析排查ANR
  18. ESP8266-天猫精灵(智能家居)
  19. 计算机网络(六)——因特网中的电子邮件
  20. match在java中文翻译_match是什么意思_match的翻译_音标_读音_用法_例句_爱词霸在线词典...

热门文章

  1. 【MySQL 数据的操作二】
  2. 实践教学管理系统设计与实现
  3. 阮一峰与王建硕的对话
  4. python中发送邮件
  5. 《the cave》攻略及感悟
  6. netty入门前置知识-NIO
  7. 各位相加 另一种解法
  8. c语言编程实现飞机飞行速度,C语言实现简单飞机大战.pdf
  9. java facets_Eclipse的Project Facets属性设置解决项目无故报错
  10. c语言光显示算法,[转载]C语言常见算法