文章目录

一、基本概念
- 1.1 区间估计
- 1.2 置信水平（置信度）
- 1.3 置信系数
- 1.4 置信区间
- 1.5 单侧置信限
- 1.6 置信域
二、枢轴量法
- 2.1 上侧α\alphaα分位数
- 2.2 小样本情况下的步骤
- 2.3 大样本情况下
- 2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间
三、两个正态总体的置信区间
- 3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间
- - 3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时
  - 3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时
  - 3.1.3 m=nm=nm=n时
  - 3.1.4 当m,nm, nm,n都充分大时
- 3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间

数理统计复习笔记三——点估计介绍了若干点估计的方法和准则，本文介绍区间估计。

区间估计是介于估计和检验之间的内容，且区间估计与检验紧密相连，因此有的也把区间估计看作是检验的一种。

一、基本概念

1.1 区间估计

设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自分布族F={f(x,θ),θ∈Θ}\mathcal F=\{f(x,\theta), \theta\in\Theta\}F={f(x,θ),θ∈Θ}的样本，θ\thetaθ为一维未知参数。如果θ^L(X)\hat\theta_L(\bm X)θ^L(X)，θ^U(X)\hat\theta_U(\bm X)θ^U(X)为两个统计量，且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L(X)≤θ^U(X)，则称随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的一个区间估计。

1.2 置信水平（置信度）

既然是估计，就应该有一个好坏的衡量指标。

当参数的真值为θ\thetaθ时，随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]包含θ\thetaθ的概率Pθ{[θ^L(X)≤θ≤θ^U(X)]}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}Pθ{[θ^L(X)≤θ≤θ^U(X)]}就称为置信水平或置信度。

对于一个区间估计来说，肯定希望置信水平或置信度越大越好。由于这个置信水平依赖于参数真值，故我们自然希望对于参数空间Θ\ThetaΘ中的每一个θ\thetaθ，其置信水平都很大。

1.3 置信系数

设随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的一个区间估计，则称inf⁡θ∈ΘPθ{[θ^L(X)≤θ≤θ^U(X)]}\inf_{\theta\in\Theta}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}θ∈ΘinfPθ{[θ^L(X)≤θ≤θ^U(X)]}为该区间估计的置信系数。

区间估计有时要用开区间或半开半闭区间，但从置信水平的角度看，这几种区间估计没有本质的区别

在计算某区间估计的置信水平时，我们应该知道θ^L(X)\hat\theta_L(\bm X)θ^L(X)，θ^U(X)\hat\theta_U(\bm X)θ^U(X)的联合分布。如果不知道其联合分布，则很难求得其置信系数，这就是构造置信区间的技巧所在

1.4 置信区间

设[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]是参数θ\thetaθ的一个区间估计，如果对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1)，有Pθ{[θ^L(X)≤θ≤θ^U(X)]}≥1−α,∀θ∈Θ(2)P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}\ge1-\alpha , \forall\theta\in\Theta\tag{2}Pθ{[θ^L(X)≤θ≤θ^U(X)]}≥1−α,∀θ∈Θ(2)
则称[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的置信水平为1−α1-\alpha1−α的置信区间，θ^L(X)\hat\theta_L(\bm X)θ^L(X)，θ^U(X)\hat\theta_U(\bm X)θ^U(X)分别称为置信下限和置信上限。

实际中也称满足Pθ{[θ^L(X)≤θ≤θ^U(X)]}=1−αP_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}=1-\alphaPθ{[θ^L(X)≤θ≤θ^U(X)]}=1−α的区间估计为置信区间

详见杂记——贝叶斯可信区间与频率置信区间的区别

1.5 单侧置信限

有时人们感兴趣的指标是望大或望小指标（指标越大/小越好）。

设θ^L(X)\hat\theta_L(\bm X)θ^L(X)，θ^U(X)\hat\theta_U(\bm X)θ^U(X)为两个统计量，对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1)，有Pθ{θ^L(X)≤θ}≥1−α,∀θ∈Θ(3)P_\theta\{\hat\theta_L(\bm X)\le\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{3}Pθ{θ^L(X)≤θ}≥1−α,∀θ∈Θ(3)
Pθ{θ^U(X)≥θ}≥1−α,∀θ∈Θ(4)P_\theta\{\hat\theta_U(\bm X)\ge\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{4}Pθ{θ^U(X)≥θ}≥1−α,∀θ∈Θ(4)
则分别称θ^L(X)\hat\theta_L(\bm X)θ^L(X)与θ^U(X)\hat\theta_U(\bm X)θ^U(X)为θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信下限和单侧置信上限。

与双侧置信限的关系：

设θ^L(X)\hat\theta_L(\bm X)θ^L(X)与θ^U(X)\hat\theta_U(\bm X)θ^U(X)为θ\thetaθ的置信水平为1−α11-\alpha_11−α1和1−α21-\alpha_21−α2的单侧置信下限和单侧置信上限，且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L(X)≤θ^U(X)，则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]是θ\thetaθ的置信水平为1−(α1+α2)1-(\alpha_1+\alpha_2)1−(α1+α2)的置信区间。

1.6 置信域

设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自分布族F={f(x,θ),θ∈Θ⊆Rk}\mathcal F=\{f(x,\theta), \theta\in\Theta\subseteq\bm R^k\}F={f(x,θ),θ∈Θ⊆Rk}的样本，θ=(θ1,⋯,θk)T\theta=(\theta_1,\cdots,\theta_k)^Tθ=(θ1,⋯,θk)T，如果统计量S(X)S(\bm X)S(X)满足

对任一样本观测值x\bm xx，S(x)S(\bm x)S(x)是Θ\ThetaΘ的一个子集；
对给定的α∈(0,1)\alpha\in(0,1)α∈(0,1)，Pθ{θ∈S(X)}≥1−α,∀θ∈ΘP_\theta\{\theta\in S(\bm X)\}\ge1-\alpha, \forall\theta\in\ThetaPθ{θ∈S(X)}≥1−α,∀θ∈Θ
则称S(X)S(\bm X)S(X)是θ\thetaθ的置信水平为1−α1-\alpha1−α的置信域，而概率Pθ{θ∈S(X)}P_\theta\{\theta\in S(\bm X)\}Pθ{θ∈S(X)}在Θ\ThetaΘ上的下确界就称为置信系数

二、枢轴量法

求取参数的置信区间的方法有很多，本文主要介绍最常用的枢轴量法，尤其是对于连续型分布族。

2.1 上侧α\alphaα分位数

记Φ(x)\Phi(x)Φ(x)和ϕ(x)\phi(x)ϕ(x)分别表示标准正态分布N(0,1)N(0, 1)N(0,1)的CDFCDFCDF和PDFPDFPDF，且用满足方程Φ(uα)=1−α(5)\Phi(u_\alpha)=1-\alpha\tag{5}Φ(uα)=1−α(5)的uαu_\alphauα表示标准正态分布的上侧α\alphaα分位数，如下图

类似的，用χα2(n)\chi_\alpha^2(n)χα2(n)，tα(n)t_\alpha(n)tα(n)，Fα(m,n)F_\alpha(m, n)Fα(m,n)表示χ2(n)\chi^2(n)χ2(n)，t(n)t(n)t(n)，F(m,n)F(m, n)F(m,n)的上侧α\alphaα分位数。

2.2 小样本情况下的步骤

找一个与待估参数g(θ)g(\theta)g(θ)无关的统计量TTT，一般是它的一个很好的点估计
设法找出TTT与g(θ)g(\theta)g(θ)的某函数S(T,g(θ))S(T, g(\theta))S(T,g(θ))，使得S(T,g(θ))S(T, g(\theta))S(T,g(θ))的分布F(x)F(x)F(x)与θ\thetaθ无关，SSS就称为枢轴量，一般令分布为正态分布、χ2\chi^2χ2分布、ttt分布或FFF分布
适当的选取两个常数c,dc, dc,d，使对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1)，有Pθ{c≤S(T,g(θ))≤d}=1−α(6)P_\theta\{c\le S(T, g(\theta))\le d\}=1-\alpha\tag{6}Pθ{c≤S(T,g(θ))≤d}=1−α(6)即F(d)−F(c)=1−αF(d)-F(c)=1-\alphaF(d)−F(c)=1−α，一般取d=Fα/2d=F_{\alpha/2}d=Fα/2，c=F1−α/2c=F_{1-\alpha/2}c=F1−α/2
如果能把(6)(6)(6)式中的不等式c≤S(T,g(θ))≤d}=1−αc\le S(T, g(\theta))\le d\}=1-\alphac≤S(T,g(θ))≤d}=1−α等价的改写成θ^L(X)≤g(θ)≤θ^U(X)\hat\theta_L(\bm X)\le g(\theta)\le\hat\theta_U(\bm X)θ^L(X)≤g(θ)≤θ^U(X)，其中θ^L(X)\hat\theta_L(\bm X)θ^L(X)，θ^U(X)\hat\theta_U(\bm X)θ^U(X)只与c,dc, dc,d和TTT有关，而与θ\thetaθ无关，则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为g(θ)g(\theta)g(θ)的置信水平为1−α1-\alpha1−α的置信区间

第2步寻找枢轴量最关键

例子：

设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自正态总体N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)的IIDIIDIID样本，μ,σ2\mu, \sigma^2μ,σ2均未知，试求μ\muμ的置信水平为1−α1-\alpha1−α的置信区间。

由于X‾\overline XX是μ\muμ的一个很好的点估计，故我们在第一步取T=X‾T=\overline XT=X
虽然n(X‾−μ)/σ∼N(0,1)\sqrt{n}(\overline X-\mu)/\sigma\sim N(0,1)n(X−μ)/σ∼N(0,1)，但σ\sigmaσ未知，所以想到用SnS_nSn来代替，而n(X‾−μ)/Sn∼t(n−1)\sqrt{n}(\overline X-\mu)/S_n\sim t(n-1)n(X−μ)/Sn∼t(n−1)，所以可取枢轴量S=n(X‾−μ)/SnS=\sqrt{n}(\overline X-\mu)/S_nS=n(X−μ)/Sn
由于S∼t(n−1)S\sim t(n-1)S∼t(n−1)，所以可取c=t1−α/2(n−1)=−tα/2(n−1)c=t_{1-\alpha/2}(n-1)=-t_{\alpha/2}(n-1)c=t1−α/2(n−1)=−tα/2(n−1)，d=tα/2(n−1)d=t_{\alpha/2}(n-1)d=tα/2(n−1)
因为−tα/2(n−1)≤n(X‾−μ)/Sn≤tα/2(n−1)-t_{\alpha/2}(n-1)\le \sqrt{n}(\overline X-\mu)/S_n\le t_{\alpha/2}(n-1)−tα/2(n−1)≤n(X−μ)/Sn≤tα/2(n−1)
所以X‾−Snntα/2(n−1)≤μ≤X‾+Snntα/2(n−1)\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)\le\mu\le\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)X−nSntα/2(n−1)≤μ≤X+nSntα/2(n−1)
所以μ\muμ的置信水平为1−α1-\alpha1−α的置信区间为[X‾−Snntα/2(n−1),X‾+Snntα/2(n−1)][\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1),\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)][X−nSntα/2(n−1),X+nSntα/2(n−1)]

2.3 大样本情况下

枢轴量法更适用于连续性随机变量，对于离散型随机变量，并不容易操作，其原因在于给定的α\alphaα，一般不存在确切的分位点。

例子：

设X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn为来自伯努利分布b(1,p)b(1,p)b(1,p)的IIDIIDIID样本，试求ppp的置信水平为1−α1-\alpha1−α的置信区间。

关键还是找枢轴量。

我们知道1n∑i=1nXi\frac{1}{n}\sum\limits_{i=1}^nX_in1i=1∑nXi是ppp的一个很好的估计，那么枢轴量应该与Tn=∑i=1nXiT_n=\sum\limits_{i=1}^nX_iTn=i=1∑nXi有关。而Tn∼B(n,p)T_n\sim B(n, p)Tn∼B(n,p)，其分布与ppp有关，所以不能直接把TnT_nTn作为枢轴量。

但由中心极限定理可知，当n→∞n\to\inftyn→∞时，Tn−npnp(1−p)∼N(0,1)(7)\frac{T_n-np}{\sqrt{np(1-p)}}\sim N(0, 1)\tag{7}np(1−p)Tn−np∼N(0,1)(7) 即当nnn充分大时，我们有P{Tn−npnp(1−p)<x}=Φ(x)(8)P\{\frac{T_n-np}{\sqrt{np(1-p)}}\lt x\}=\Phi(x)\tag8P{np(1−p)Tn−np<x}=Φ(x)(8) 且与ppp无关，所以可将Tn−npnp(1−p)\frac{T_n-np}{\sqrt{np(1-p)}}np(1−p)Tn−np当作枢轴量。
所以当nnn充分大时，有P{−uα/2≤Tn−npnp(1−p)≤uα/2}(9)P\{-u_{\alpha/2}\le\frac{T_n-np}{\sqrt{np(1-p)}}\le u_{\alpha/2}\}\tag9P{−uα/2≤np(1−p)Tn−np≤uα/2}(9)
再进行化简即可

当nnn充分大时，上述方法求得的置信区间非常接近水平为1−α1-\alpha1−α的置信区间。在实际中，当n≥30n\ge30n≥30时，就可以认为是充分大了。

由上述例子可知，对于离散型的随机变量，我们可以通过中心极限定理转化为正态分布来求解置信区间。

2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间

X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn为来自正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的IIDIIDIID样本

参数情况	枢轴量	置信区间
σ2\sigma^2σ2已知，估计μ\muμ	n(X‾−μ)/σ∼N(0,1)\sqrt n(\overline X-\mu)/\sigma\sim N(0,1)n(X−μ)/σ∼N(0,1)	[X‾−uα/2σn,X‾+uα/2σn][\overline X-u_{\alpha/2}\frac{\sigma}{\sqrt n}, \overline X+u_{\alpha/2}\frac{\sigma}{\sqrt n}][X−uα/2nσ,X+uα/2nσ]
σ2\sigma^2σ2未知，估计μ\muμ	n(X‾−μ)/Sn∼t(n−1)\sqrt n(\overline X-\mu)/S_n\sim t(n-1)n(X−μ)/Sn∼t(n−1)	[X‾−tα/2(n−1)Snn,X‾+tα/2(n−1)Snn][\overline X-t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}, \overline X+t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}][X−tα/2(n−1)nSn,X+tα/2(n−1)nSn]
μ\muμ已知，估计σ2\sigma^2σ2	∑i=1n(Xi−μ)2/σ2∼χ2(n)\sum\limits_{i=1}^n(X_i-\mu)^2/\sigma^2\sim \chi^2(n)i=1∑n(Xi−μ)2/σ2∼χ2(n)	[∑i=1n(Xi−μ)2χα/2(n)2,∑i=1n(Xi−μ)2χ1−α/2(n)2][\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{\alpha/2(n)}},\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\alpha/2(n)}}][χα/2(n)2i=1∑n(Xi−μ)2,χ1−α/2(n)2i=1∑n(Xi−μ)2]
μ\muμ未知，估计σ2\sigma^2σ2	(n−1)Sn2/σ2∼χ2(n−1)(n-1)S_n^2/\sigma^2\sim\chi^2(n-1)(n−1)Sn2/σ2∼χ2(n−1)	[(n−1)Sn2χα/2(n−1)2,(n−1)Sn2χ1−α/2(n−1)2][\frac{(n-1)S_n^2}{\chi^2_{\alpha/2(n-1)}},\frac{(n-1)S_n^2}{\chi^2_{1-\alpha/2(n-1)}}][χα/2(n−1)2(n−1)Sn2,χ1−α/2(n−1)2(n−1)Sn2]

三、两个正态总体的置信区间

设X1,⋯,XmX_1,\cdots,X_mX1,⋯,Xm和Y1,⋯,YnY_1,\cdots,Y_nY1,⋯,Yn分别为来自正态总体N(μ1,σ12)N(\mu_1,\sigma^2_1)N(μ1,σ12)和N(μ2,σ22)N(\mu_2,\sigma^2_2)N(μ2,σ22)的样本，且全样本独立，其中μ1,μ2,σ12,σ22\mu_1,\mu_2,\sigma^2_1,\sigma^2_2μ1,μ2,σ12,σ22为参数。样本均值为X‾=1m∑i=1mXi\overline X=\frac{1}{m}\sum\limits_{i=1}^mX_iX=m1i=1∑mXi，Y‾=1n∑i=1nYi\overline Y=\frac{1}{n}\sum\limits_{i=1}^nY_iY=n1i=1∑nYi，样本方差为S1m2=1m−1∑i=1m(Xi−X‾)2S_{1m}^2=\frac{1}{m-1}\sum\limits_{i=1}^m(X_i-\overline X)^2S1m2=m−11i=1∑m(Xi−X)2，S2n2=1n−1∑i=1n(Yi−Y‾)2S_{2n}^2=\frac{1}{n-1}\sum\limits_{i=1}^n(Y_i-\overline Y)^2S2n2=n−11i=1∑n(Yi−Y)2

3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间

3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时

由数理统计复习笔记一——统计中常用的抽样分布(卡方分布，t分布，F分布)可知T=mn(m+n−2)m+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2∼t(m+n−2)(10)T=\sqrt{\frac{mn(m+n-2)}{m+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}}\sim t(m+n-2)\tag{10}T=m+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2(Yˉ−Xˉ)−δ∼t(m+n−2)(10)
所以可令其为枢轴量，进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]m+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2(11)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}\tag{11}[Y−X∓tα/2(m+n−2)]mn(m+n−2)m+n(m−1)S1m2+(n−1)S2n2(11)

3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时

因为T=mn(m+n−2)mθ+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2/θ∼t(m+n−2)(12)T=\sqrt{\frac{mn(m+n-2)}{m\theta+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}}\sim t(m+n-2)\tag{12}T=mθ+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2/θ(Yˉ−Xˉ)−δ∼t(m+n−2)(12)
所以可令其为枢轴量，进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]mθ+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2/θ(13)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m\theta+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}\tag{13}[Y−X∓tα/2(m+n−2)]mn(m+n−2)mθ+n(m−1)S1m2+(n−1)S2n2/θ(13)

3.1.3 m=nm=nm=n时

此时Zi=Yi−Xi∼N(δ,σ12+σ22)Z_i=Y_i-X_i\sim N(\delta, \sigma^2_1+\sigma^2_2)Zi=Yi−Xi∼N(δ,σ12+σ22)，i=1,⋯,ni=1,\cdots,ni=1,⋯,n且相互独立，于是可知Z‾∼N(δ,(σ12+σ22)/n)\overline Z\sim N(\delta, (\sigma^2_1+\sigma^2_2)/n)Z∼N(δ,(σ12+σ22)/n)，∑i=1n(Zi−Z‾)2/(σ12+σ22)∼χ2(n−1)\sum\limits_{i=1}^n(Z_i-\overline Z)^2/(\sigma^2_1+\sigma^2_2)\sim\chi^2(n-1)i=1∑n(Zi−Z)2/(σ12+σ22)∼χ2(n−1)，所以有n(n−1)(Z‾−δ)∑i=1n(Zi−Z‾)2∼t(n−1)(14)\frac{\sqrt{n(n-1)}(\overline Z-\delta)}{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}\sim t(n-1)\tag{14}i=1∑n(Zi−Z)2n(n−1)(Z−δ)∼t(n−1)(14)
所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Z‾∓tα/2(n−1)∑i=1n(Zi−Z‾)2n(n−1)](15)[\overline Z\mp t_{\alpha/2}(n-1)\frac{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}{\sqrt{n(n-1)}}]\tag{15}[Z∓tα/2(n−1)n(n−1)i=1∑n(Zi−Z)2](15)

3.1.4 当m,nm, nm,n都充分大时

因为S1m2→σ12S_{1m}^2\to\sigma^2_1S1m2→σ12，S2n2→σ22S_{2n}^2\to\sigma^2_2S2n2→σ22，且Y‾−X‾∼N(δ,σ12/m+σ22/n)\overline Y-\overline X\sim N(\delta, \sigma^2_1/m+ \sigma^2_2/n)Y−X∼N(δ,σ12/m+σ22/n)，所以Tˇ=Y‾−X‾−δS1m2/m+S2n2/n∼N(0,1)(16)\check T=\frac{\overline Y-\overline X-\delta}{\sqrt{S_{1m}^2/m+S_{2n}^2/n}}\sim N(0,1)\tag{16}Tˇ=S1m2/m+S2n2/nY−X−δ∼N(0,1)(16)

所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓uα/2S1m2/m+S2n2/n][\overline Y-\overline X\mp u_{\alpha/2}\sqrt{S_{1m}^2/m+S_{2n}^2/n}][Y−X∓uα/2S1m2/m+S2n2/n]

3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间

因为(m−1)S1m2/σ12∼χ2(m−1)(m-1)S_{1m}^2/\sigma^2_1\sim\chi^2(m-1)(m−1)S1m2/σ12∼χ2(m−1)，(n−1)S2n2/σ22∼χ2(n−1)(n-1)S_{2n}^2/\sigma^2_2\sim\chi^2(n-1)(n−1)S2n2/σ22∼χ2(n−1)，且二者是独立的，于是F=S1m2/σ12S2n2/σ22∼F(m−1,n−1)(17)F=\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\sim F(m-1,n-1)\tag{17}F=S2n2/σ22S1m2/σ12∼F(m−1,n−1)(17)
可以作为枢轴量，并且P{F1−α/2(m−1,n−1)≤S1m2/σ12S2n2/σ22≤Fα/2(m−1,n−1)}(18)P\{F_{1-\alpha/2}(m-1,n-1)\le\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\le F_{\alpha/2}(m-1,n-1)\}\tag{18}P{F1−α/2(m−1,n−1)≤S2n2/σ22S1m2/σ12≤Fα/2(m−1,n−1)}(18)
进而可得置信区间为[S1m2/S2n2Fα/2(m−1,n−1),S1m2/S2n2F1−α/2(m−1,n−1)](19)[\frac{S_{1m}^2/S_{2n}^2}{F_{\alpha/2}(m-1,n-1)}, \frac{S_{1m}^2/S_{2n}^2}{F_{1-\alpha/2}(m-1,n-1)}]\tag{19}[Fα/2(m−1,n−1)S1m2/S2n2,F1−α/2(m−1,n−1)S1m2/S2n2](19)

数理统计复习笔记四——区间估计相关推荐

数理统计复习笔记五——假设检验之显著性检验
一.基本概念在统计中,我们把需要用样本去推断"正确"与否的命题称为一个假设.当然,假设是可以关于参数的,也可以是关于分布的. 通过样本对一个假设作出"对"或& ...
数理统计复习笔记一——统计中常用的抽样分布(卡方分布，t分布，F分布)
前言: 总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念 1.1 次序统计量 1.2 样本偏度与样本峰度 1.3 经验分布函数 1.4 抽样 ...
操作系统复习笔记(四)
10.司机和售票员之间要协同工作:一方面只有售票员把车门关好了司机才能开车,因此售票员关好车门应通知司机开车;另一方面只有当汽车已经停下时,售票员才能开门让乘客上下客,司机停车后应该通知售票员,假定某 ...
《微型计算机原理与接口技术》复习笔记（四）
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著微机原理复习笔记一微机原理复习笔记二微机原理复习笔记三微机原理复习笔记四中断系统 1 ...
《微型计算机原理与接口技术》复习笔记（二）
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著默认存储器单元的地址编排顺序从上往下,地址从低向高编排微机原理复习笔记一微机原理复习笔记 ...
《微型计算机原理与接口技术》复习笔记（三）
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著微机原理复习笔记一微机原理复习笔记二微机原理复习笔记四微机原理复习笔记三 1. 存储器 ...
《微型计算机原理与接口技术》复习笔记（一）
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著微机原理复习笔记二微机原理复习笔记三微机原理复习笔记四微机复习笔记(一) 1. 二进制 ...
数理统计期末复习笔记（一）
数理统计期末复习笔记主要内容: 数据压缩,点估计,假设检验,区间检验 Reference: Statistical Inference, Casella&Berger Chapter 6 D ...
哈工大机器学习复习笔记（四）
本篇文章是在参考西瓜书.PPT课件.网络上相关博客等资料的基础上整理出的机器学习复习笔记,希望能给大家的机器学习复习提供帮助.这篇笔记只是复习的一个参考,大家一定要结合书本.PPT来进行复习,有些公式 ...
【线性代数复习笔记】同济大学版第三章和第四章矩阵的初等变换与线性方程组与向量组的线性相关性
[线性代数复习笔记]同济大学版第三章和第四章矩阵的初等变换与线性方程组与向量组的线性相关性 1.矩阵的初等变换矩阵的三种初等变换及性质行阶梯形矩阵矩阵的初等变换的性质 2.矩阵的秩矩阵的秩的 ...

数理统计复习笔记四——区间估计

文章目录

一、基本概念

1.1 区间估计

1.2 置信水平（置信度）

1.3 置信系数

1.4 置信区间

1.5 单侧置信限

1.6 置信域

二、枢轴量法

2.1 上侧α\alphaα分位数

2.2 小样本情况下的步骤

2.3 大样本情况下

2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间

三、两个正态总体的置信区间

3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间

3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时

3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时

3.1.3 m=nm=nm=n时

3.1.4 当m,nm, nm,n都充分大时

3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间

数理统计复习笔记四——区间估计相关推荐

最新文章

热门文章

数理统计复习笔记四——区间估计

文章目录

一、基本概念

1.1 区间估计

1.2 置信水平（置信度）

1.3 置信系数

1.4 置信区间

1.5 单侧置信限

1.6 置信域

二、枢轴量法

2.1 上侧α\alphaα分位数

2.2 小样本情况下的步骤

2.3 大样本情况下

2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间

三、两个正态总体的置信区间

3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2​−μ1​的置信区间

3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12​=σ22​=σ2未知时

3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22​/σ12​已知时

3.1.3 m=nm=nm=n时

3.1.4 当m,nm, nm,n都充分大时

3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12​/σ22​的置信区间

数理统计复习笔记四——区间估计相关推荐

最新文章

热门文章

3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间

3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时

3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时

3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间