统计学④——置信区间怎么算
统计学系列目录(文末有惊喜彩蛋
):
统计学①——概率论基础及业务实战
统计学②——概率分布(几何,二项,泊松,正态分布)
统计学③——总体与样本
统计学⑤——假设验证
上一篇写了如何通过样本的均值和方差,也叫点估计量,去估计总体的均值和方差,给出的是一个精确值。但是仅仅依靠一个样本得出的假设就一定可靠吗?虽然我们已经尽量抽取无偏样本了,得到的结果已经是最佳的点估计量,但是也只能说很接近总体的真值,但是有多接近也不知道。
因此,在给总体估计参数时,不是给一个精确值,而是一个范围,而且能保证总体参数有多大把握在这个范围,会比给一个精确值能令人信服的多,风险性也较小,这就是置信区间。
一、置信区间如何求?
1、选择总体统计量
2、求出其抽样分布
3、决定置信水平
4、求出置信区间上下限
一般来说,只要知道抽样分布,就可以求出置信区间,比如均值抽样分布和比例抽样分布,就是经常需要求置信区间的。
二、均值求置信区间实例(大样本)
问题:求总体均值的95%的置信区间
1、总体统计量:μ
2、求抽样分布
假设总体的均值为μ(未知),σ^2(未知),则样本均值的抽取分布为:
总体σ2未知,可以用样本的点估计量s2近似,这样均值的抽样分布的均值和方差为:
求出了均值和方差后,要知道符合哪种分布才能求置信区间,上一节介绍了中心极限定理,不管总体是否符合正态分布,当抽取的样本足够大时,样本均值可以近似为正态分布,本次假设是大样本,因此可以得到分布如下:
3、决定置信水平
题目是求95%的置信度,那就表示总体均值处于置信区间的概率为95%
4、求出置信区间上下限
得到分布后,可以通过标准化转化为标准分,通过查表就可以得到概率。再将概率=95%的C值求出,代入可得到置信区间
其实并不用每一次都这么麻烦,这里提供了一些简便算法:
三、均值求置信区间实例(小样本)
如果是小样本的情况下,总体均值的置信区间求法会有一点点不同,在于均值的抽样分布不能近似为正态分布,原因是在总体方差未知时,是要用样本方差来估计总体方差的,但是小样本会带来较大的误差——比使用大样本大得多,会导致得到的置信区间不够精准。
这时会采用T分布,是一种外形光滑,对称的曲线,确切形状取决于样本大小,当样本很大时,T分布外形就很像正态分布,当样本很小时,曲线较为扁平,有两条粗粗的尾巴。它只有一个参数:ν,v=n-1,n为样本大小。
T分布与正态分布一样,通过均值和标准差转化成标准分,再通过t分布概率表查询概率即可
其它步骤与大样本一样了。
总体比例的置信区间与均值基本一致,这里就不多说啦
本人互联网数据分析师,目前已出Excel,SQL,Pandas,Matplotlib,Seaborn,机器学习,统计学,个性推荐,关联算法,工作总结系列。
微信搜索并关注 " 数据小斑马
" 公众号,回复“统计
”可以免费获取下方深入浅出统计学、统计学原理、赤裸裸的统计学
等9本统计学入门到精通必备经典教材
统计学④——置信区间怎么算相关推荐
- 【无标题】求大神教下光谱曲线相关性分析置信区间怎么算的?
置信区间值是怎么得出来的?5种光谱曲线处理方法得到的相关系数为什么共用一个置信区间,p=0.01对应的相关系数怎么算的
- 统计学②——概率分布(几何,二项,泊松,正态分布)
统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学③--总体与样本 统计学④--置信区间 统计学⑤--假设验证 概率分布描述了一个给定变量的所有可能取值结果的概率,历史上伟大 ...
- 统计学⑤——假设验证
统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学④--置信区间 一.什么是假设验证? 当你从广告 ...
- 一次性掌握机器学习基础知识脉络 | 公开课笔记
来源 | AI科技大本营在线公开课 嘉宾 | 张相於 整理 | suiling 本次公开课AI科技大本营邀请到了阿里巴巴的高级算法专家张相於,他将从数据的概率分布开始介绍机器学习核心概念之间的有机关系 ...
- 独家 | 11步转行数据科学家 (送给数据员/ MIS / BI分析师)
来源:Analytics Vidhya 翻译:国相洁 校对:丁楠雅 本文约7100字,建议阅读10+分钟. 本文为从数据分析/数据仓库/商业智能跳转到数据科学家提供了学习路径. 数据科学作为一个专业领 ...
- 七阶拉丁方阵_拉丁方阵
一个7x7的拉丁方阵 拉丁方阵(英语:Latin square)是一种 n × n 的方阵,在这种 n × n 的方阵里,恰有 n 种不同的元素,每一种不同的元素在同一行或同一列里只出现一次.以下是两 ...
- 一次性掌握机器学习基础知识脉络 | 百万人学AI
我们这次分享的题目叫做<机器学习第二次入门>.我先简单自我介绍一下,我现在在做算法工作,在阿里做高级算法专家,主要关注的领域是在推荐系统.机器学习.金融风控这些方面. 本次分享包括三个内容 ...
- 统计学之中心极限定理和置信区间
本文介绍中心极限定律和置信区间. 首先是中心极限定理.中心极限定理是统计学中比较重要的一个定理. 只有真正理解了中心极限定理才能更好的理解统计学中其他的知识,比如正态分布. 那么什么是中心极限定理(C ...
- 置信区间、显著性检验和统计学意义
置信区间 估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间. 对于任意参数θ在可能的取值范围内,P{θ1<θ ...
最新文章
- 解决Latex图片或者表格浮动
- 2021亚太内容分发大会 阿里云荣获三项大奖
- java圆形进度条_可拖拽圆形进度条组件(支持移动端)
- Linux进程管理:内核中的优先级继承互斥(rtmutex.h):防止优先级反转
- 学习SQL:INNER JOIN与LEFT JOIN
- 管理赚得多还是程序员多_程序员如何为自己开辟出更多的收入渠道
- 开课吧Java课堂:如何使用isAlive()和join()
- python3 输出系统信息
- ABP项目后台初始化数据库
- 自组织特征映射网络1
- Gambit 5.调试
- 四川华为EC6108V9C悦me和CA高安版_卡刷固件包
- Multiple Instance Detection Network with Online Instance Classifier Refinement
- 在Blender中使用代码控制人物模型的头部姿态 - 前置知识
- 手机上网占多大流量?WiFi要不要进行限速?
- 统计学的那些冷门思考(各种检验+中心极限)
- rs_D455相机内外参标定+imu联合标定
- 常见的几种距离量度(欧式距离、曼哈顿距离、切比雪夫距离等)
- 百度细雨算法2.0解读
- 学习心得(华清远见)