统计学系列目录(文末有惊喜彩蛋
统计学①——概率论基础及业务实战
统计学②——概率分布(几何,二项,泊松,正态分布)
统计学③——总体与样本
统计学⑤——假设验证

上一篇写了如何通过样本的均值和方差,也叫点估计量,去估计总体的均值和方差,给出的是一个精确值。但是仅仅依靠一个样本得出的假设就一定可靠吗?虽然我们已经尽量抽取无偏样本了,得到的结果已经是最佳的点估计量,但是也只能说很接近总体的真值,但是有多接近也不知道。

因此,在给总体估计参数时,不是给一个精确值,而是一个范围,而且能保证总体参数有多大把握在这个范围,会比给一个精确值能令人信服的多,风险性也较小,这就是置信区间

一、置信区间如何求?

1、选择总体统计量
2、求出其抽样分布
3、决定置信水平
4、求出置信区间上下限

一般来说,只要知道抽样分布,就可以求出置信区间,比如均值抽样分布和比例抽样分布,就是经常需要求置信区间的。

二、均值求置信区间实例(大样本)

问题:求总体均值的95%的置信区间
1、总体统计量:μ
2、求抽样分布
假设总体的均值为μ(未知),σ^2(未知),则样本均值的抽取分布为:

总体σ2未知,可以用样本的点估计量s2近似,这样均值的抽样分布的均值和方差为:

求出了均值和方差后,要知道符合哪种分布才能求置信区间,上一节介绍了中心极限定理,不管总体是否符合正态分布,当抽取的样本足够大时,样本均值可以近似为正态分布,本次假设是大样本,因此可以得到分布如下:

3、决定置信水平
题目是求95%的置信度,那就表示总体均值处于置信区间的概率为95%

4、求出置信区间上下限
得到分布后,可以通过标准化转化为标准分,通过查表就可以得到概率。再将概率=95%的C值求出,代入可得到置信区间

其实并不用每一次都这么麻烦,这里提供了一些简便算法:


三、均值求置信区间实例(小样本)

如果是小样本的情况下,总体均值的置信区间求法会有一点点不同,在于均值的抽样分布不能近似为正态分布,原因是在总体方差未知时,是要用样本方差来估计总体方差的,但是小样本会带来较大的误差——比使用大样本大得多,会导致得到的置信区间不够精准。

这时会采用T分布,是一种外形光滑,对称的曲线,确切形状取决于样本大小,当样本很大时,T分布外形就很像正态分布,当样本很小时,曲线较为扁平,有两条粗粗的尾巴。它只有一个参数:ν,v=n-1,n为样本大小。

T分布与正态分布一样,通过均值和标准差转化成标准分,再通过t分布概率表查询概率即可

其它步骤与大样本一样了。


总体比例的置信区间与均值基本一致,这里就不多说啦


本人互联网数据分析师,目前已出Excel,SQL,Pandas,Matplotlib,Seaborn,机器学习,统计学,个性推荐,关联算法,工作总结系列。


微信搜索并关注 " 数据小斑马" 公众号,回复“统计”可以免费获取下方深入浅出统计学、统计学原理、赤裸裸的统计学9本统计学入门到精通必备经典教材

统计学④——置信区间怎么算相关推荐

  1. 【无标题】求大神教下光谱曲线相关性分析置信区间怎么算的?

    置信区间值是怎么得出来的?5种光谱曲线处理方法得到的相关系数为什么共用一个置信区间,p=0.01对应的相关系数怎么算的

  2. 统计学②——概率分布(几何,二项,泊松,正态分布)

    统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学③--总体与样本 统计学④--置信区间 统计学⑤--假设验证 概率分布描述了一个给定变量的所有可能取值结果的概率,历史上伟大 ...

  3. 统计学⑤——假设验证

    统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学④--置信区间 一.什么是假设验证? 当你从广告 ...

  4. 一次性掌握机器学习基础知识脉络 | 公开课笔记

    来源 | AI科技大本营在线公开课 嘉宾 | 张相於 整理 | suiling 本次公开课AI科技大本营邀请到了阿里巴巴的高级算法专家张相於,他将从数据的概率分布开始介绍机器学习核心概念之间的有机关系 ...

  5. 独家 | 11步转行数据科学家 (送给数据员/ MIS / BI分析师)

    来源:Analytics Vidhya 翻译:国相洁 校对:丁楠雅 本文约7100字,建议阅读10+分钟. 本文为从数据分析/数据仓库/商业智能跳转到数据科学家提供了学习路径. 数据科学作为一个专业领 ...

  6. 七阶拉丁方阵_拉丁方阵

    一个7x7的拉丁方阵 拉丁方阵(英语:Latin square)是一种 n × n 的方阵,在这种 n × n 的方阵里,恰有 n 种不同的元素,每一种不同的元素在同一行或同一列里只出现一次.以下是两 ...

  7. 一次性掌握机器学习基础知识脉络 | 百万人学AI

    我们这次分享的题目叫做<机器学习第二次入门>.我先简单自我介绍一下,我现在在做算法工作,在阿里做高级算法专家,主要关注的领域是在推荐系统.机器学习.金融风控这些方面. 本次分享包括三个内容 ...

  8. 统计学之中心极限定理和置信区间

    本文介绍中心极限定律和置信区间. 首先是中心极限定理.中心极限定理是统计学中比较重要的一个定理. 只有真正理解了中心极限定理才能更好的理解统计学中其他的知识,比如正态分布. 那么什么是中心极限定理(C ...

  9. 置信区间、显著性检验和统计学意义

    置信区间 估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间. 对于任意参数θ在可能的取值范围内,P{θ1<θ ...

最新文章

  1. 解决Latex图片或者表格浮动
  2. 2021亚太内容分发大会 阿里云荣获三项大奖
  3. java圆形进度条_可拖拽圆形进度条组件(支持移动端)
  4. Linux进程管理:内核中的优先级继承互斥(rtmutex.h):防止优先级反转
  5. 学习SQL:INNER JOIN与LEFT JOIN
  6. 管理赚得多还是程序员多_程序员如何为自己开辟出更多的收入渠道
  7. 开课吧Java课堂:如何使用isAlive()和join()
  8. python3 输出系统信息
  9. ABP项目后台初始化数据库
  10. 自组织特征映射网络1
  11. Gambit 5.调试
  12. 四川华为EC6108V9C悦me和CA高安版_卡刷固件包
  13. Multiple Instance Detection Network with Online Instance Classifier Refinement
  14. 在Blender中使用代码控制人物模型的头部姿态 - 前置知识
  15. 手机上网占多大流量?WiFi要不要进行限速?
  16. 统计学的那些冷门思考(各种检验+中心极限)
  17. rs_D455相机内外参标定+imu联合标定
  18. 常见的几种距离量度(欧式距离、曼哈顿距离、切比雪夫距离等)
  19. 百度细雨算法2.0解读
  20. 学习心得(华清远见)

热门文章

  1. 庖丁解牛分词器增加对日文,韩文分词的支持
  2. 【故障诊断发展学习记录四——数字孪生与控制系统健康管理(DT PHM)】
  3. 虚拟机复制网卡的配置
  4. Information:java: Errors occurred while compiling module IDEA报错
  5. DEDECMS生成RRS绝对路径
  6. Matlab-结构数组
  7. ASP.NET 多媒体电子报刊设计思路
  8. 背包算法 java_背包问题算法java实现
  9. qt for mac工程设置相关
  10. 在线图片处理服务器,在线图片处理神器:PhotoFunia