文章目录

  • 一、基本概念
    • 1.1 区间估计
    • 1.2 置信水平(置信度)
    • 1.3 置信系数
    • 1.4 置信区间
    • 1.5 单侧置信限
    • 1.6 置信域
  • 二、枢轴量法
    • 2.1 上侧α\alphaα分位数
    • 2.2 小样本情况下的步骤
    • 2.3 大样本情况下
    • 2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间
  • 三、两个正态总体的置信区间
    • 3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2​−μ1​的置信区间
      • 3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12​=σ22​=σ2未知时
      • 3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22​/σ12​已知时
      • 3.1.3 m=nm=nm=n时
      • 3.1.4 当m,nm, nm,n都充分大时
    • 3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12​/σ22​的置信区间

数理统计复习笔记三——点估计介绍了若干点估计的方法和准则,本文介绍区间估计。

区间估计是介于估计和检验之间的内容,且区间估计与检验紧密相连,因此有的也把区间估计看作是检验的一种。

一、基本概念

1.1 区间估计

设X1,⋯,XnX_1, \cdots, X_nX1​,⋯,Xn​为来自分布族F={f(x,θ),θ∈Θ}\mathcal F=\{f(x,\theta), \theta\in\Theta\}F={f(x,θ),θ∈Θ}的样本,θ\thetaθ为一维未知参数。如果θ^L(X)\hat\theta_L(\bm X)θ^L​(X),θ^U(X)\hat\theta_U(\bm X)θ^U​(X)为两个统计量,且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L​(X)≤θ^U​(X),则称随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]为θ\thetaθ的一个区间估计

1.2 置信水平(置信度)

既然是估计,就应该有一个好坏的衡量指标。

当参数的真值为θ\thetaθ时,随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]包含θ\thetaθ的概率Pθ{[θ^L(X)≤θ≤θ^U(X)]}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}Pθ​{[θ^L​(X)≤θ≤θ^U​(X)]}就称为置信水平或置信度

对于一个区间估计来说,肯定希望置信水平或置信度越大越好。由于这个置信水平依赖于参数真值,故我们自然希望对于参数空间Θ\ThetaΘ中的每一个θ\thetaθ,其置信水平都很大。

1.3 置信系数

设随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]为θ\thetaθ的一个区间估计,则称inf⁡θ∈ΘPθ{[θ^L(X)≤θ≤θ^U(X)]}\inf_{\theta\in\Theta}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}θ∈Θinf​Pθ​{[θ^L​(X)≤θ≤θ^U​(X)]}为该区间估计的置信系数。

  1. 区间估计有时要用开区间或半开半闭区间,但从置信水平的角度看,这几种区间估计没有本质的区别
  2. 在计算某区间估计的置信水平时,我们应该知道θ^L(X)\hat\theta_L(\bm X)θ^L​(X),θ^U(X)\hat\theta_U(\bm X)θ^U​(X)的联合分布。如果不知道其联合分布,则很难求得其置信系数,这就是构造置信区间的技巧所在

1.4 置信区间

设[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]是参数θ\thetaθ的一个区间估计,如果对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{[θ^L(X)≤θ≤θ^U(X)]}≥1−α,∀θ∈Θ(2)P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}\ge1-\alpha , \forall\theta\in\Theta\tag{2}Pθ​{[θ^L​(X)≤θ≤θ^U​(X)]}≥1−α,∀θ∈Θ(2)
则称[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]为θ\thetaθ的置信水平为1−α1-\alpha1−α的置信区间,θ^L(X)\hat\theta_L(\bm X)θ^L​(X),θ^U(X)\hat\theta_U(\bm X)θ^U​(X)分别称为置信下限和置信上限。

实际中也称满足Pθ{[θ^L(X)≤θ≤θ^U(X)]}=1−αP_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}=1-\alphaPθ​{[θ^L​(X)≤θ≤θ^U​(X)]}=1−α的区间估计为置信区间

详见杂记——贝叶斯可信区间与频率置信区间的区别

1.5 单侧置信限

有时人们感兴趣的指标是望大或望小指标(指标越大/小越好)。

设θ^L(X)\hat\theta_L(\bm X)θ^L​(X),θ^U(X)\hat\theta_U(\bm X)θ^U​(X)为两个统计量,对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{θ^L(X)≤θ}≥1−α,∀θ∈Θ(3)P_\theta\{\hat\theta_L(\bm X)\le\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{3}Pθ​{θ^L​(X)≤θ}≥1−α,∀θ∈Θ(3)
Pθ{θ^U(X)≥θ}≥1−α,∀θ∈Θ(4)P_\theta\{\hat\theta_U(\bm X)\ge\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{4}Pθ​{θ^U​(X)≥θ}≥1−α,∀θ∈Θ(4)
则分别称θ^L(X)\hat\theta_L(\bm X)θ^L​(X)与θ^U(X)\hat\theta_U(\bm X)θ^U​(X)为θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信下限和单侧置信上限。

与双侧置信限的关系

设θ^L(X)\hat\theta_L(\bm X)θ^L​(X)与θ^U(X)\hat\theta_U(\bm X)θ^U​(X)为θ\thetaθ的置信水平为1−α11-\alpha_11−α1​和1−α21-\alpha_21−α2​的单侧置信下限和单侧置信上限,且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L​(X)≤θ^U​(X),则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]是θ\thetaθ的置信水平为1−(α1+α2)1-(\alpha_1+\alpha_2)1−(α1​+α2​)的置信区间。

1.6 置信域

设X1,⋯,XnX_1, \cdots, X_nX1​,⋯,Xn​为来自分布族F={f(x,θ),θ∈Θ⊆Rk}\mathcal F=\{f(x,\theta), \theta\in\Theta\subseteq\bm R^k\}F={f(x,θ),θ∈Θ⊆Rk}的样本,θ=(θ1,⋯,θk)T\theta=(\theta_1,\cdots,\theta_k)^Tθ=(θ1​,⋯,θk​)T,如果统计量S(X)S(\bm X)S(X)满足

  • 对任一样本观测值x\bm xx,S(x)S(\bm x)S(x)是Θ\ThetaΘ的一个子集;
  • 对给定的α∈(0,1)\alpha\in(0,1)α∈(0,1),Pθ{θ∈S(X)}≥1−α,∀θ∈ΘP_\theta\{\theta\in S(\bm X)\}\ge1-\alpha, \forall\theta\in\ThetaPθ​{θ∈S(X)}≥1−α,∀θ∈Θ
    则称S(X)S(\bm X)S(X)是θ\thetaθ的置信水平为1−α1-\alpha1−α的置信域,而概率Pθ{θ∈S(X)}P_\theta\{\theta\in S(\bm X)\}Pθ​{θ∈S(X)}在Θ\ThetaΘ上的下确界就称为置信系数

二、枢轴量法

求取参数的置信区间的方法有很多,本文主要介绍最常用的枢轴量法,尤其是对于连续型分布族。

2.1 上侧α\alphaα分位数

记Φ(x)\Phi(x)Φ(x)和ϕ(x)\phi(x)ϕ(x)分别表示标准正态分布N(0,1)N(0, 1)N(0,1)的CDFCDFCDF和PDFPDFPDF,且用满足方程Φ(uα)=1−α(5)\Phi(u_\alpha)=1-\alpha\tag{5}Φ(uα​)=1−α(5)的uαu_\alphauα​表示标准正态分布的上侧α\alphaα分位数,如下图

类似的,用χα2(n)\chi_\alpha^2(n)χα2​(n),tα(n)t_\alpha(n)tα​(n),Fα(m,n)F_\alpha(m, n)Fα​(m,n)表示χ2(n)\chi^2(n)χ2(n),t(n)t(n)t(n),F(m,n)F(m, n)F(m,n)的上侧α\alphaα分位数。

2.2 小样本情况下的步骤

  1. 找一个与待估参数g(θ)g(\theta)g(θ)无关的统计量TTT,一般是它的一个很好的点估计
  2. 设法找出TTT与g(θ)g(\theta)g(θ)的某函数S(T,g(θ))S(T, g(\theta))S(T,g(θ)),使得S(T,g(θ))S(T, g(\theta))S(T,g(θ))的分布F(x)F(x)F(x)与θ\thetaθ无关,SSS就称为枢轴量,一般令分布为正态分布、χ2\chi^2χ2分布、ttt分布或FFF分布
  3. 适当的选取两个常数c,dc, dc,d,使对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{c≤S(T,g(θ))≤d}=1−α(6)P_\theta\{c\le S(T, g(\theta))\le d\}=1-\alpha\tag{6}Pθ​{c≤S(T,g(θ))≤d}=1−α(6)即F(d)−F(c)=1−αF(d)-F(c)=1-\alphaF(d)−F(c)=1−α,一般取d=Fα/2d=F_{\alpha/2}d=Fα/2​,c=F1−α/2c=F_{1-\alpha/2}c=F1−α/2​
  4. 如果能把(6)(6)(6)式中的不等式c≤S(T,g(θ))≤d}=1−αc\le S(T, g(\theta))\le d\}=1-\alphac≤S(T,g(θ))≤d}=1−α等价的改写成θ^L(X)≤g(θ)≤θ^U(X)\hat\theta_L(\bm X)\le g(\theta)\le\hat\theta_U(\bm X)θ^L​(X)≤g(θ)≤θ^U​(X),其中θ^L(X)\hat\theta_L(\bm X)θ^L​(X),θ^U(X)\hat\theta_U(\bm X)θ^U​(X)只与c,dc, dc,d和TTT有关,而与θ\thetaθ无关,则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L​(X),θ^U​(X)]为g(θ)g(\theta)g(θ)的置信水平为1−α1-\alpha1−α的置信区间

第2步寻找枢轴量最关键

例子

设X1,⋯,XnX_1, \cdots, X_nX1​,⋯,Xn​为来自正态总体N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)的IIDIIDIID样本,μ,σ2\mu, \sigma^2μ,σ2均未知,试求μ\muμ的置信水平为1−α1-\alpha1−α的置信区间。

  1. 由于X‾\overline XX是μ\muμ的一个很好的点估计,故我们在第一步取T=X‾T=\overline XT=X
  2. 虽然n(X‾−μ)/σ∼N(0,1)\sqrt{n}(\overline X-\mu)/\sigma\sim N(0,1)n​(X−μ)/σ∼N(0,1),但σ\sigmaσ未知,所以想到用SnS_nSn​来代替,而n(X‾−μ)/Sn∼t(n−1)\sqrt{n}(\overline X-\mu)/S_n\sim t(n-1)n​(X−μ)/Sn​∼t(n−1),所以可取枢轴量S=n(X‾−μ)/SnS=\sqrt{n}(\overline X-\mu)/S_nS=n​(X−μ)/Sn​
  3. 由于S∼t(n−1)S\sim t(n-1)S∼t(n−1),所以可取c=t1−α/2(n−1)=−tα/2(n−1)c=t_{1-\alpha/2}(n-1)=-t_{\alpha/2}(n-1)c=t1−α/2​(n−1)=−tα/2​(n−1),d=tα/2(n−1)d=t_{\alpha/2}(n-1)d=tα/2​(n−1)
  4. 因为−tα/2(n−1)≤n(X‾−μ)/Sn≤tα/2(n−1)-t_{\alpha/2}(n-1)\le \sqrt{n}(\overline X-\mu)/S_n\le t_{\alpha/2}(n-1)−tα/2​(n−1)≤n​(X−μ)/Sn​≤tα/2​(n−1)
    所以X‾−Snntα/2(n−1)≤μ≤X‾+Snntα/2(n−1)\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)\le\mu\le\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)X−n​Sn​​tα/2​(n−1)≤μ≤X+n​Sn​​tα/2​(n−1)
    所以μ\muμ的置信水平为1−α1-\alpha1−α的置信区间为[X‾−Snntα/2(n−1),X‾+Snntα/2(n−1)][\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1),\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)][X−n​Sn​​tα/2​(n−1),X+n​Sn​​tα/2​(n−1)]

2.3 大样本情况下

枢轴量法更适用于连续性随机变量,对于离散型随机变量,并不容易操作,其原因在于给定的α\alphaα,一般不存在确切的分位点

例子

设X1,⋯,XnX_1,\cdots,X_nX1​,⋯,Xn​为来自伯努利分布b(1,p)b(1,p)b(1,p)的IIDIIDIID样本,试求ppp的置信水平为1−α1-\alpha1−α的置信区间。

关键还是找枢轴量。

我们知道1n∑i=1nXi\frac{1}{n}\sum\limits_{i=1}^nX_in1​i=1∑n​Xi​是ppp的一个很好的估计,那么枢轴量应该与Tn=∑i=1nXiT_n=\sum\limits_{i=1}^nX_iTn​=i=1∑n​Xi​有关。而Tn∼B(n,p)T_n\sim B(n, p)Tn​∼B(n,p),其分布与ppp有关,所以不能直接把TnT_nTn​作为枢轴量。

但由中心极限定理可知,当n→∞n\to\inftyn→∞时,Tn−npnp(1−p)∼N(0,1)(7)\frac{T_n-np}{\sqrt{np(1-p)}}\sim N(0, 1)\tag{7}np(1−p)​Tn​−np​∼N(0,1)(7) 即当nnn充分大时,我们有P{Tn−npnp(1−p)<x}=Φ(x)(8)P\{\frac{T_n-np}{\sqrt{np(1-p)}}\lt x\}=\Phi(x)\tag8P{np(1−p)​Tn​−np​<x}=Φ(x)(8) 且与ppp无关,所以可将Tn−npnp(1−p)\frac{T_n-np}{\sqrt{np(1-p)}}np(1−p)​Tn​−np​当作枢轴量。
所以当nnn充分大时,有P{−uα/2≤Tn−npnp(1−p)≤uα/2}(9)P\{-u_{\alpha/2}\le\frac{T_n-np}{\sqrt{np(1-p)}}\le u_{\alpha/2}\}\tag9P{−uα/2​≤np(1−p)​Tn​−np​≤uα/2​}(9)
再进行化简即可

当nnn充分大时,上述方法求得的置信区间非常接近水平为1−α1-\alpha1−α的置信区间。在实际中,当n≥30n\ge30n≥30时,就可以认为是充分大了。

由上述例子可知,对于离散型的随机变量,我们可以通过中心极限定理转化为正态分布来求解置信区间。

2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间

X1,⋯,XnX_1,\cdots,X_nX1​,⋯,Xn​为来自正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的IIDIIDIID样本

参数情况 枢轴量 置信区间
σ2\sigma^2σ2已知,估计μ\muμ n(X‾−μ)/σ∼N(0,1)\sqrt n(\overline X-\mu)/\sigma\sim N(0,1)n​(X−μ)/σ∼N(0,1) [X‾−uα/2σn,X‾+uα/2σn][\overline X-u_{\alpha/2}\frac{\sigma}{\sqrt n}, \overline X+u_{\alpha/2}\frac{\sigma}{\sqrt n}][X−uα/2​n​σ​,X+uα/2​n​σ​]
σ2\sigma^2σ2未知,估计μ\muμ n(X‾−μ)/Sn∼t(n−1)\sqrt n(\overline X-\mu)/S_n\sim t(n-1)n​(X−μ)/Sn​∼t(n−1) [X‾−tα/2(n−1)Snn,X‾+tα/2(n−1)Snn][\overline X-t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}, \overline X+t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}][X−tα/2​(n−1)n​Sn​​,X+tα/2​(n−1)n​Sn​​]
μ\muμ已知,估计σ2\sigma^2σ2 ∑i=1n(Xi−μ)2/σ2∼χ2(n)\sum\limits_{i=1}^n(X_i-\mu)^2/\sigma^2\sim \chi^2(n)i=1∑n​(Xi​−μ)2/σ2∼χ2(n) [∑i=1n(Xi−μ)2χα/2(n)2,∑i=1n(Xi−μ)2χ1−α/2(n)2][\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{\alpha/2(n)}},\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\alpha/2(n)}}][χα/2(n)2​i=1∑n​(Xi​−μ)2​,χ1−α/2(n)2​i=1∑n​(Xi​−μ)2​]
μ\muμ未知,估计σ2\sigma^2σ2 (n−1)Sn2/σ2∼χ2(n−1)(n-1)S_n^2/\sigma^2\sim\chi^2(n-1)(n−1)Sn2​/σ2∼χ2(n−1) [(n−1)Sn2χα/2(n−1)2,(n−1)Sn2χ1−α/2(n−1)2][\frac{(n-1)S_n^2}{\chi^2_{\alpha/2(n-1)}},\frac{(n-1)S_n^2}{\chi^2_{1-\alpha/2(n-1)}}][χα/2(n−1)2​(n−1)Sn2​​,χ1−α/2(n−1)2​(n−1)Sn2​​]

三、两个正态总体的置信区间

设X1,⋯,XmX_1,\cdots,X_mX1​,⋯,Xm​和Y1,⋯,YnY_1,\cdots,Y_nY1​,⋯,Yn​分别为来自正态总体N(μ1,σ12)N(\mu_1,\sigma^2_1)N(μ1​,σ12​)和N(μ2,σ22)N(\mu_2,\sigma^2_2)N(μ2​,σ22​)的样本,且全样本独立,其中μ1,μ2,σ12,σ22\mu_1,\mu_2,\sigma^2_1,\sigma^2_2μ1​,μ2​,σ12​,σ22​为参数。样本均值为X‾=1m∑i=1mXi\overline X=\frac{1}{m}\sum\limits_{i=1}^mX_iX=m1​i=1∑m​Xi​,Y‾=1n∑i=1nYi\overline Y=\frac{1}{n}\sum\limits_{i=1}^nY_iY=n1​i=1∑n​Yi​,样本方差为S1m2=1m−1∑i=1m(Xi−X‾)2S_{1m}^2=\frac{1}{m-1}\sum\limits_{i=1}^m(X_i-\overline X)^2S1m2​=m−11​i=1∑m​(Xi​−X)2,S2n2=1n−1∑i=1n(Yi−Y‾)2S_{2n}^2=\frac{1}{n-1}\sum\limits_{i=1}^n(Y_i-\overline Y)^2S2n2​=n−11​i=1∑n​(Yi​−Y)2

3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2​−μ1​的置信区间

3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12​=σ22​=σ2未知时

由数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)可知T=mn(m+n−2)m+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2∼t(m+n−2)(10)T=\sqrt{\frac{mn(m+n-2)}{m+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}}\sim t(m+n-2)\tag{10}T=m+nmn(m+n−2)​​(m−1)S1m2​+(n−1)S2n2​​(Yˉ−Xˉ)−δ​∼t(m+n−2)(10)
所以可令其为枢轴量,进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]m+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2(11)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}\tag{11}[Y−X∓tα/2​(m+n−2)]mn(m+n−2)m+n​​(m−1)S1m2​+(n−1)S2n2​​(11)

3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22​/σ12​已知时

因为T=mn(m+n−2)mθ+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2/θ∼t(m+n−2)(12)T=\sqrt{\frac{mn(m+n-2)}{m\theta+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}}\sim t(m+n-2)\tag{12}T=mθ+nmn(m+n−2)​​(m−1)S1m2​+(n−1)S2n2​/θ​(Yˉ−Xˉ)−δ​∼t(m+n−2)(12)
所以可令其为枢轴量,进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]mθ+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2/θ(13)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m\theta+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}\tag{13}[Y−X∓tα/2​(m+n−2)]mn(m+n−2)mθ+n​​(m−1)S1m2​+(n−1)S2n2​/θ​(13)

3.1.3 m=nm=nm=n时

此时Zi=Yi−Xi∼N(δ,σ12+σ22)Z_i=Y_i-X_i\sim N(\delta, \sigma^2_1+\sigma^2_2)Zi​=Yi​−Xi​∼N(δ,σ12​+σ22​),i=1,⋯,ni=1,\cdots,ni=1,⋯,n且相互独立,于是可知Z‾∼N(δ,(σ12+σ22)/n)\overline Z\sim N(\delta, (\sigma^2_1+\sigma^2_2)/n)Z∼N(δ,(σ12​+σ22​)/n),∑i=1n(Zi−Z‾)2/(σ12+σ22)∼χ2(n−1)\sum\limits_{i=1}^n(Z_i-\overline Z)^2/(\sigma^2_1+\sigma^2_2)\sim\chi^2(n-1)i=1∑n​(Zi​−Z)2/(σ12​+σ22​)∼χ2(n−1),所以有n(n−1)(Z‾−δ)∑i=1n(Zi−Z‾)2∼t(n−1)(14)\frac{\sqrt{n(n-1)}(\overline Z-\delta)}{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}\sim t(n-1)\tag{14}i=1∑n​(Zi​−Z)2​n(n−1)​(Z−δ)​∼t(n−1)(14)
所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Z‾∓tα/2(n−1)∑i=1n(Zi−Z‾)2n(n−1)](15)[\overline Z\mp t_{\alpha/2}(n-1)\frac{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}{\sqrt{n(n-1)}}]\tag{15}[Z∓tα/2​(n−1)n(n−1)​i=1∑n​(Zi​−Z)2​​](15)

3.1.4 当m,nm, nm,n都充分大时

因为S1m2→σ12S_{1m}^2\to\sigma^2_1S1m2​→σ12​,S2n2→σ22S_{2n}^2\to\sigma^2_2S2n2​→σ22​,且Y‾−X‾∼N(δ,σ12/m+σ22/n)\overline Y-\overline X\sim N(\delta, \sigma^2_1/m+ \sigma^2_2/n)Y−X∼N(δ,σ12​/m+σ22​/n),所以Tˇ=Y‾−X‾−δS1m2/m+S2n2/n∼N(0,1)(16)\check T=\frac{\overline Y-\overline X-\delta}{\sqrt{S_{1m}^2/m+S_{2n}^2/n}}\sim N(0,1)\tag{16}Tˇ=S1m2​/m+S2n2​/n​Y−X−δ​∼N(0,1)(16)

所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓uα/2S1m2/m+S2n2/n][\overline Y-\overline X\mp u_{\alpha/2}\sqrt{S_{1m}^2/m+S_{2n}^2/n}][Y−X∓uα/2​S1m2​/m+S2n2​/n​]

3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12​/σ22​的置信区间

因为(m−1)S1m2/σ12∼χ2(m−1)(m-1)S_{1m}^2/\sigma^2_1\sim\chi^2(m-1)(m−1)S1m2​/σ12​∼χ2(m−1),(n−1)S2n2/σ22∼χ2(n−1)(n-1)S_{2n}^2/\sigma^2_2\sim\chi^2(n-1)(n−1)S2n2​/σ22​∼χ2(n−1),且二者是独立的,于是F=S1m2/σ12S2n2/σ22∼F(m−1,n−1)(17)F=\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\sim F(m-1,n-1)\tag{17}F=S2n2​/σ22​S1m2​/σ12​​∼F(m−1,n−1)(17)
可以作为枢轴量,并且P{F1−α/2(m−1,n−1)≤S1m2/σ12S2n2/σ22≤Fα/2(m−1,n−1)}(18)P\{F_{1-\alpha/2}(m-1,n-1)\le\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\le F_{\alpha/2}(m-1,n-1)\}\tag{18}P{F1−α/2​(m−1,n−1)≤S2n2​/σ22​S1m2​/σ12​​≤Fα/2​(m−1,n−1)}(18)
进而可得置信区间为[S1m2/S2n2Fα/2(m−1,n−1),S1m2/S2n2F1−α/2(m−1,n−1)](19)[\frac{S_{1m}^2/S_{2n}^2}{F_{\alpha/2}(m-1,n-1)}, \frac{S_{1m}^2/S_{2n}^2}{F_{1-\alpha/2}(m-1,n-1)}]\tag{19}[Fα/2​(m−1,n−1)S1m2​/S2n2​​,F1−α/2​(m−1,n−1)S1m2​/S2n2​​](19)

数理统计复习笔记四——区间估计相关推荐

  1. 数理统计复习笔记五——假设检验之显著性检验

    一.基本概念 在统计中,我们把需要用样本去推断"正确"与否的命题称为一个假设.当然,假设是可以关于参数的,也可以是关于分布的. 通过样本对一个假设作出"对"或& ...

  2. 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)

    前言:   总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念  1.1 次序统计量  1.2 样本偏度与样本峰度  1.3 经验分布函数  1.4 抽样 ...

  3. 操作系统复习笔记(四)

    10.司机和售票员之间要协同工作:一方面只有售票员把车门关好了司机才能开车,因此售票员关好车门应通知司机开车;另一方面只有当汽车已经停下时,售票员才能开门让乘客上下客,司机停车后应该通知售票员,假定某 ...

  4. 《微型计算机原理与接口技术》复习笔记(四)

    使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记一 微机原理复习笔记二 微机原理复习笔记三 微机原理复习笔记四 中断系统 1 ...

  5. 《微型计算机原理与接口技术》复习笔记(二)

    使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 默认存储器单元的地址编排顺序从上往下,地址从低向高编排 微机原理复习笔记一 微机原理复习笔记 ...

  6. 《微型计算机原理与接口技术》复习笔记(三)

    使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记一 微机原理复习笔记二 微机原理复习笔记四 微机原理复习笔记三 1. 存储器 ...

  7. 《微型计算机原理与接口技术》复习笔记(一)

    使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记二 微机原理复习笔记三 微机原理复习笔记四 微机复习笔记(一) 1. 二进制 ...

  8. 数理统计期末复习笔记(一)

    数理统计期末复习笔记 主要内容: 数据压缩,点估计,假设检验,区间检验 Reference: Statistical Inference, Casella&Berger Chapter 6 D ...

  9. 哈工大机器学习复习笔记(四)

    本篇文章是在参考西瓜书.PPT课件.网络上相关博客等资料的基础上整理出的机器学习复习笔记,希望能给大家的机器学习复习提供帮助.这篇笔记只是复习的一个参考,大家一定要结合书本.PPT来进行复习,有些公式 ...

  10. 【线性代数复习笔记】同济大学版第三章和第四章 矩阵的初等变换与线性方程组与向量组的线性相关性

    [线性代数复习笔记]同济大学版第三章和第四章 矩阵的初等变换与线性方程组与向量组的线性相关性 1.矩阵的初等变换 矩阵的三种初等变换及性质 行阶梯形矩阵 矩阵的初等变换的性质 2.矩阵的秩 矩阵的秩的 ...

最新文章

  1. 在docker镜像中加入环境变量
  2. 以太坊在哪里买_DeFi只是以太坊的开胃小菜,以太坊2.0才是重头戏
  3. cf1555B. Two Tables
  4. java 动态单元格涂色_如何编写自定义DefaultTableCellRenderer来着色特定单元格并“保留”其他单元格的颜色,Java...
  5. Linux 软件写文件权限,Linux 文件和目录的读写执行权限详解
  6. 星巴克在东京开设四层楼的全沉浸式优质咖啡体验门店
  7. android scheme 参数解析,Android 利用scheme协议进行跳转
  8. 2020杭电计算机考研经验帖
  9. 浏览器输入url后怎样请求服务的
  10. c语言如何画出多个散点图,如何制作多参数散点图
  11. EXCEL设置下拉选项,选项带颜色
  12. NLP基础入门:Word2Vec模型
  13. 《房债》书中的精髓:现代金融系统让全世界的人同处一艘经济大船上,一些人搞坏了船,所有的人都跟着遭殃。
  14. 美允许4G技术与WiFi共享5G频段;全球移动用户将达50亿│IoT黑板报
  15. 怎样在word中画横线
  16. android_10.0.0_r41自定义驱动编译+Framework层调用_2(自定义驱动)
  17. 农村出身的 90 后程序员,如何逆袭为中产阶级?| 程序员有话说
  18. 点云数据按高程赋色渲染
  19. 〖全域运营实战白宝书 - 运营角色认知篇③〗- 运营的底层逻辑是什么?
  20. cad 执行 autolisp 出现错误:错误: no function definition: VLAX-ENAME->VLA-OBJECT

热门文章

  1. 基于动态规划DTW算法加速衡量两个不同的时间序列的相似性
  2. 手把手教你自学单片机,三个步骤请做好笔记
  3. Java的第20年:Java和我的故事
  4. QT学习笔记——06-Day15_C++_QT
  5. Android智能硬件开发心得总结(一)
  6. 《移动通信原理与系统》——第二章《移动通信电波传播与传播预测模型》——笔记
  7. 真正UltraISO 9.5.5.2960中文完美注册版
  8. 个人笔记-C#txt文本分割器
  9. 原生JS实现图片幻灯片效果
  10. editplus html格式化,Editplus 格式化js,css,html工具