学习笔记
学习书籍:《统计学:从数据到结论》-吴喜之;
参考书目:《统计学》-贾俊平


用估计量估计总体参数

我们都知道样本的函数称之为统计量,而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同,所以估计量就是随机变量,并有其分布。如果样本已经得到,把数据带入后,估计量就有了一个数值,也就不是随机的了,这个数值就是该估计量的一个实现或取值,也称为一个估计值。

点估计和区间估计

这里介绍两种估计,一种是点估计,也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计,它是包括估计量在内的一个区间,该区间很有可能包含总体参数。

点估计

任何统计量,只要人们觉得合适就可以当成估计量。我们知道的最常用的估计量就是:样本均值、样本标准差等。

那么什么是好估计量的标准呢?一种统计量称为无偏估计量。所谓无偏性,就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格来说,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。因此,无偏性仅仅是非常多次重复抽样时的一个渐进概念。在无偏估计量中,人们还希望找寻方差最小的估计量,称为最小方差无偏估计量,方差小则说明反复抽样产生的许多估计值差别不大,因此更加精确。

区间估计

当描述一个人的身高时,我们不会说,某人高180.2cm,而可能会说,某人身高在175 ~ 185之间,这时,我们提供的这个范围就是某种区间估计。在抽样调查中,我们也常用到点估计加区间估计的说法。比如:某人的支持率为80%,误差为±4\pm 4±4 %,置信度为95%.

这种说法意味着:支持率为80%是样本比例作为总体比例ppp的点估计; 估计范围在80%±4\pm 4±4%,即区间为(76%, 84%); 如果以类似的方式,重复大量抽取样本,产生的大量区间中,有些会覆盖真正的总体比例ppp,而有些则不会,但这些区间中大约有95%会覆盖真正的总体比例。

这样得到的区间,被称为总体比例ppp的置信度为95%的置信区间,这里的置信度又称为置信水平或置信系数。显然,置信度又是一个大量重复抽样时的渐进概念。

在这里,我们得到的区间(76%, 84%)是固定的,而总体比例ppp也是固定的,只不过未知而已。因此只有两种可能,要么这个区间包含总体比例ppp,要么不总体比例ppp,这当中没有概率可言。

事实上,置信区间都是由统计量来确定的,依样本而变,是随机变量。因此,可以说,构造置信度为100*(1-α\alphaα)%的随机区间,以1-α\alphaα的概率覆盖待估参数,但该区间相应于一个样本的实现值,就是固定的了,无法知道其是否真正覆盖需要估计的参数。

《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量相关推荐

  1. 《R数据科学》学习笔记|Note5:使用dplyr进行数据转换(下)

    点击蓝字 关注我! 写在前面 本系列为<R数据科学>(R for Data Science)的学习笔记.相较于其他R语言教程来说,本书一个很大的优势就是直接从实用的R包出发,来熟悉R及数据 ...

  2. 斯坦福大学数据可视化课程学习笔记:第一节 可视化的发展与目标

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  3. 斯坦福大学数据可视化课程学习笔记:第二节 从数据到图像

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  4. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  5. 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据

    使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...

  6. 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...

  7. hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶

    hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶 一.回顾知识 1.myschool数据库和数据表的创建 (1)创建数据库 (2)数据库模型图 (3)创建数据表grand (4) ...

  8. 金融风控-贷款违约预测学习笔记(Part3:特征工程)

    金融风控-贷款违约预测学习笔记(Part3:特征工程) 1.特征预处理 1.1 处理类别型特征和数值型特征 1.2 缺失值填充 1.3 时间格式处理 1.4 将对象类型特征转换到数值 1.5 类别特征 ...

  9. oracle数据变化记录,学习笔记:Oracle伪列函数ora_rowscn 记录表中行数据的修改时间...

    天萃荷净 Oracle数据库开发时使用伪列函数ora_rowscn查询出数据库表中行数据的修改时间 一.默认情况下 –创建t_orascn测试表 SQL> create table t_oras ...

最新文章

  1. 2022-2028年中国抗肿瘤药物行业市场分析调研及发展趋势研究报告
  2. 就挺凡尔赛的!李开复谈20年后的AI,崔宝秋论开源之道,清华唐杰的PPT成了“香饽饽” | MEET2021智能未来大会...
  3. c语言防止缓冲区数据作为有效字符被读入
  4. Spring Boot 定时任务
  5. 网络安全泡沫是否即将破灭?
  6. 计算机高效课堂建设,打造职业学校计算机高效课堂.doc
  7. leetcode 二进制求和 addBinary
  8. C#LeetCode刷题之#859-亲密字符串​​​​​​​​​​​​​​(Buddy Strings)
  9. Linux网络编程——端口复用(多个套接字绑定同一个端口----避免服务器重启时,端口绑定不上)
  10. Excel-舒尔特方格(专注力训练)
  11. Word可折叠多级标题
  12. 直方图均衡化算法、直方图匹配算法 C++ 代码
  13. 香港90年代电视剧推荐
  14. 鸿蒙818工艺,荣耀智慧屏系列发布:鸿鹄818芯片+首款鸿鹄系统产品,未来家庭中心已来,3799元起售...
  15. Android通知的使用及设置
  16. (轉貼) 寶蘭開發工具部門將分割成完全獨立的子公司 (C/C++) (News)
  17. 【PNP与NPN两种三极管使用方法(工作在开关状态)】
  18. java五子棋小游戏含免费源码
  19. CPU架构之ARM优化
  20. C语言 吃鱼还是吃肉

热门文章

  1. 12伏的蓄电池有几个单格组成_福建汤浅蓄电池ups电源机房一体化
  2. ORA-12170: TNS:Connect timeout occurred
  3. psycopg2模块安装问题
  4. 在WordPress中添加简书风格的连载目录和文章导航
  5. 在c++中使用for循环遍历map并删除map中的元素的注意事项
  6. vs2015+opencv+qt打包exe的问题
  7. 谈及未来的 AI, 也许你已身处其中 —— 记 InfoQ 对青云QingCloud 联合创始人林源的采访...
  8. tomcat配置与优化
  9. JDBC连接不同数据库的连接参数
  10. linux下ARP防御