背景

一个平平无奇的下午,领导突然问我会不会做区间估计,我心想:啊哈,这不是我的老本行么?终于可以创造价值了!我摩拳擦掌,跃跃欲试,准备大展身手。结果嘛,反而给咋们学统计的丢脸了!学艺不精惹的祸,之前学的知识差不多忘了,搜集了大半个小时的资料,凭借着自己模糊的记忆才想起来的。
根据领导整理出来的数据,他需要我把七日差值跟28日差值分别看作一个整体,然后估计总体均值的范围。

理论基础

对于单个正态总体X,
(注:实际业务中,“总体分布为正态分布”这一论断有待检验,检验的方法也有很多种,最简单的方法就是画QQ图或者经验分布函数图初步观察判断,后续可以做W检验等等)
如果X服从于N(μ,σ2)X服从于N(\mu,\sigma^2)X服从于N(μ,σ2),那么总体的均值Xˉ\bar{X}Xˉ服从正态分布,即:
Xˉ服从于N(μ,σ2/n)\bar{X}服从于N(\mu,\sigma^2/n)Xˉ服从于N(μ,σ2/n)

方差已知

当方差已知时,若想对均值进行区间估计,那么可以构造枢轴量
Z=Xˉ−μσ/nZ=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}Z=σ/n​Xˉ−μ​
由于ZZZ服从于标准正态分布,这时就好办了,我们可以通过查分位数表,进而反解出置信区间。
假如我们给定置信度为95%,即α=0.05\alpha=0.05α=0.05,有
P(∣Z∣≤z0.025)=0.95P(\vert Z\vert \leq z_{0.025})=0.95P(∣Z∣≤z0.025​)=0.95
其中z0.025z_{0.025}z0.025​是上0.025分位数,也就是
P(−z0.025≤Z≤z0.025)=0.95P( -z_{0.025} \leq Z \leq z_{0.025})=0.95P(−z0.025​≤Z≤z0.025​)=0.95
通过查表或者利用R语言的qnorm(0.975)分位数函数,可知上α\alphaα分位数z0.025=1.959964z_{0.025}=1.959964z0.025​=1.959964。(注:上α\alphaα分位数和分位数是两个不同的概念)
反解得关于均值为μ\muμ,置信度为95%的双侧置信区间为
[Xˉ−σnZα/2,Xˉ+σnZα/2][\bar{X}- \frac{\sigma}{\sqrt{n}}Z_{\alpha/2},\bar{X}+ \frac{\sigma}{\sqrt{n}}Z_{\alpha/2}][Xˉ−n​σ​Zα/2​,Xˉ+n​σ​Zα/2​]

方差未知

但是在实际情况下,既然我们连总体均值都不知道,那又怎么能知道总体的方差呢?这时就需要构造另外一个枢轴量
T=Xˉ−μs/nT=\frac{\bar{X}-\mu}{s/\sqrt{n}}T=s/n​Xˉ−μ​
此时T服从于t(n−1)t(n-1)t(n−1)分布
同样的,我们依旧可以反解出关于μ\muμ的置信区间为:
[Xˉ−sntα/2(n−1),Xˉ+sntα/2(n−1)][\bar{X}- \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1),\bar{X}+ \frac{s}{\sqrt{n}}t_{\alpha/2}(n-1)][Xˉ−n​s​tα/2​(n−1),Xˉ+n​s​tα/2​(n−1)]
其中tα/2(n−1)t_{\alpha/2}(n-1)tα/2​(n−1)是自由度为n-1的上α/2\alpha/2α/2分位数,通过R语言的关于t分布的分位数函数qt(p,df)得知,其中p=1−α/2p=1-\alpha/2p=1−α/2,df是自由度n-1。

上机实战

方法一 :Excel

最笨的办法就是按照公式把均值、方差都算出来,然后查一下上α\alphaα分位数,最后加加减减就可以把结果算出来了。当然,对Excel用得滚过烂熟的大佬可能一分钟就搞定了。
计算结果附图(红框就是最终结果):

统计量 公式
均值 =AVERAGE(J2:J457)
方差 =VAR.P(J2:J457)
标准差 =SQRT(J459)
n =COUNTA(J2:J457)
根号n =SQRT(J461)
qt(0.975,456) 1.96518
=J458-J460*J463/J462
=J458+J460*J463/J462

结果很简单,关键是理解原理,知道用那个模型来做。

方法二:R语言

1、读入数据

R软件是不能直接导入xlx、xlsx文件,首先得把xlx、xlsx文件转换为txt、csv形式的文件。
在转换为csv或txt的过程中,只能转换其中一个工作表,如果有多个sheet,那么会出现下面这种提示:

所以只能一个一个转化sheet啦
我这转换成了txt格式的,部分数据如下:

ok,在转换的过程时,如果是多维变量,要保证不能有缺失值,要不然在用read.table("路径")读入的过程中就会出现以下提示:

当然,用scan("路径")也可以读入,但是这个函数对于矩阵来说就不太友好了,不太好处理了,一维的还能用。
okk,接下来,还得做一件事情,就是要把txt文件所在的文件夹在RStudio里面设置为working directory(在session里面)
最后可以正常读入数据了

w <-read.table("data.txt")
w

读入的数据如下:

处理数据

R语言的t.test()可以做假设检验的同时也可以做区间估计
比如我要对w的第一列数据的均值进行区间估计,可以这样:

t.test(w[,1])

结果如下:

红色框框就是置信区间啦,另外,这组样本的均值为1.256692
两行代码就解决了,unbiliveble!
还是那句老话,虽然代码简单,关键是知道用什么模型来做区间估计。比如说这里用的是t.test()这个函数估计,但是用chisq.test()也会有一个结果。别慌,不要乱!如果是单个总体,t.test()是对总体均值的估计,chisq.test()是对总体方差的估计。

本人水平有限,如文章有说错或说得不好的地方,请各位指正。

R语言实战——单个总体均值的区间估计相关推荐

  1. 备受推崇的《R语言实战》真的值得如此好评吗?

    作者:刘洋溢  R语言中文社区专栏作者 知乎ID:https://zhuanlan.zhihu.com/p/51396601 阅前思考: R语言入门必看的<R语言实战>真的是很好的入门书籍 ...

  2. R语言实战(九)主成分和因子分析

    本文对应<R语言实战>第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分. 探索性因子分析(EFA)是 ...

  3. R语言实战笔记--第十四章 主成分和因子分析

    R语言实战笔记–第十四章 主成分和因子分析 标签(空格分隔): R语言 主成分分析 因子分析 原理及区别 主成分分析与因子分析很接近,其目的均是为了降维,以更简洁的数据去解释结果,但这两种方法其实是相 ...

  4. R语言实战笔记--第八章 OLS回归分析

    R语言实战笔记–第八章 OLS回归分析 标签(空格分隔): R语言 回归分析 首先,是之前的文章,数理统计里面的简单回归分析,这里简单回顾一下: 简单回归分析的原理:最小二乘法,即使回归函数与实际值之 ...

  5. R语言实战(七)图形进阶

    本文对应<R语言实战>第11章:中级绘图:第16章:高级图形进阶 基础图形一章,侧重展示单类别型或连续型变量的分布情况:中级绘图一章,侧重展示双变量间关系(二元关系)和多变量间关系(多元关 ...

  6. R语言必看推荐:R语言入门经典版(中文版)+R语言实战第二版(中文完整版)

    R语言入门经典(中文版)R for beginners R语言经典教材 第二版 适合初学者 作者:Emmanuel Paradis R 语言实战第二版(中文完整版) R语言实战(第2版)注重实用性,是 ...

  7. R语言实战笔记--第十五章 处理缺失数据

    R语言实战笔记–第十五章 处理缺失数据 标签(空格分隔): R语言 处理缺失数据 VIM mice 缺失值(NA),是导致我们计算错误的一大来源,处理缺失数据在实际的应用中有着较为重要的作用. 基本方 ...

  8. R语言实战:机器学习与数据分析源代码5

    本文辑录了<R语言实战--机器学习与数据分析>(电子工业出版社2016年出版)一书第6章至第7章前半部分(至136页)之代码.本书引言请见如下链接: http://blog.csdn.ne ...

  9. R语言实战笔记--第十二章 重抽样(置换检验)与自助法

    R语言实战笔记–第十二章 重抽样(置换检验)与自助法 标签(空格分隔): R语言 重抽样 自助法 置换检验 置换检验 双样本均值检验的时候,假设检验的方法就是,检查正态性.独立性.方差齐性,分别对应的 ...

  10. R语言实战-读书笔记(第1 章 R语言介绍)

    *R语言实战所有学习笔记,如涉及侵权,请联系撤稿.* **标题号与书中标题号对应** R语言实战 第1章 R语言介绍     1.2 R的获取与安装         R可以在CRAN(Comprehe ...

最新文章

  1. 哪种营销方法效果最差_网络营销推广中如何监控评测网络效果?
  2. 用aspiration造句_aspiration
  3. java_spring_依赖注入(构造器)
  4. PHP Warning: date() [function.date]解决方案
  5. 蚂蚁金服 Service Mesh 大规模落地系列 - 运维篇
  6. Redis面试 - Redis的持久化机制
  7. php 阶乘函数,什么是PHP中的RECURSIVE函数?
  8. [Z]Java Architecture for XML Binding (JAXB)
  9. 使用Nginx制作下载站点
  10. 医疗物联网解决方案提供商“识凌科技”完成C轮融资
  11. 中间表为什么可以不用实体类_法国蜗牛供不应求,为什么不用中国蜗牛代替?看完才知道真不可以...
  12. oracle 表列统计信息,Oracle中收集表与列统计信息
  13. php 活动报名,活动报名小程序 - 微信小程版的活动在线报名,支持付费活动发布! – 基于ThinkPHP和Bootstrap的极速后台开发框架...
  14. 38. Python批量翻译英语单词
  15. 计算机TTL逻辑电平信号,ttl电平是什么意思
  16. 上传图片预览图片方向错误
  17. 【sv】enum赋值
  18. 平安科技Java开发三面面经(2018年12月)
  19. dB与倍数换算速查表
  20. 理论物理极础10:泊松括号,角动量和对称性

热门文章

  1. 抖音培训教程,抖音培训班,抖音培训课程(2019实时更新中) -
  2. 史上最详细金卡介绍以及金卡制作教程(附风暴数码CID转换码链接)
  3. 西南民族大学计算机院方导师,暨南大学信息科学技术学院导师教师师资介绍简介-高博宇...
  4. 搜狗拼音linux 知乎,搜狗拼音知乎专版下载
  5. safari遮罩无效
  6. 川蔚蓝:追求品质、创新发展;以诚为根,以客为本
  7. 快手投放广告,快手广告优势有哪些呢?
  8. linux pam鉴定令牌错误,linux – chsh:PAM身份验证失败
  9. 手把手教你使用Python提取快递信息
  10. Django Setting的时区设置