数理统计复习笔记四——区间估计
文章目录
- 一、基本概念
- 1.1 区间估计
- 1.2 置信水平(置信度)
- 1.3 置信系数
- 1.4 置信区间
- 1.5 单侧置信限
- 1.6 置信域
- 二、枢轴量法
- 2.1 上侧α\alphaα分位数
- 2.2 小样本情况下的步骤
- 2.3 大样本情况下
- 2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间
- 三、两个正态总体的置信区间
- 3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间
- 3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时
- 3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时
- 3.1.3 m=nm=nm=n时
- 3.1.4 当m,nm, nm,n都充分大时
- 3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间
数理统计复习笔记三——点估计介绍了若干点估计的方法和准则,本文介绍区间估计。
区间估计是介于估计和检验之间的内容,且区间估计与检验紧密相连,因此有的也把区间估计看作是检验的一种。
一、基本概念
1.1 区间估计
设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自分布族F={f(x,θ),θ∈Θ}\mathcal F=\{f(x,\theta), \theta\in\Theta\}F={f(x,θ),θ∈Θ}的样本,θ\thetaθ为一维未知参数。如果θ^L(X)\hat\theta_L(\bm X)θ^L(X),θ^U(X)\hat\theta_U(\bm X)θ^U(X)为两个统计量,且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L(X)≤θ^U(X),则称随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的一个区间估计。
1.2 置信水平(置信度)
既然是估计,就应该有一个好坏的衡量指标。
当参数的真值为θ\thetaθ时,随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]包含θ\thetaθ的概率Pθ{[θ^L(X)≤θ≤θ^U(X)]}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}Pθ{[θ^L(X)≤θ≤θ^U(X)]}就称为置信水平或置信度。
对于一个区间估计来说,肯定希望置信水平或置信度越大越好。由于这个置信水平依赖于参数真值,故我们自然希望对于参数空间Θ\ThetaΘ中的每一个θ\thetaθ,其置信水平都很大。
1.3 置信系数
设随机区间[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的一个区间估计,则称infθ∈ΘPθ{[θ^L(X)≤θ≤θ^U(X)]}\inf_{\theta\in\Theta}P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}θ∈ΘinfPθ{[θ^L(X)≤θ≤θ^U(X)]}为该区间估计的置信系数。
- 区间估计有时要用开区间或半开半闭区间,但从置信水平的角度看,这几种区间估计没有本质的区别
- 在计算某区间估计的置信水平时,我们应该知道θ^L(X)\hat\theta_L(\bm X)θ^L(X),θ^U(X)\hat\theta_U(\bm X)θ^U(X)的联合分布。如果不知道其联合分布,则很难求得其置信系数,这就是构造置信区间的技巧所在
1.4 置信区间
设[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]是参数θ\thetaθ的一个区间估计,如果对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{[θ^L(X)≤θ≤θ^U(X)]}≥1−α,∀θ∈Θ(2)P_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}\ge1-\alpha , \forall\theta\in\Theta\tag{2}Pθ{[θ^L(X)≤θ≤θ^U(X)]}≥1−α,∀θ∈Θ(2)
则称[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为θ\thetaθ的置信水平为1−α1-\alpha1−α的置信区间,θ^L(X)\hat\theta_L(\bm X)θ^L(X),θ^U(X)\hat\theta_U(\bm X)θ^U(X)分别称为置信下限和置信上限。
实际中也称满足Pθ{[θ^L(X)≤θ≤θ^U(X)]}=1−αP_\theta\{[\hat\theta_L(\bm X)\le\theta\le\hat\theta_U(\bm X)]\}=1-\alphaPθ{[θ^L(X)≤θ≤θ^U(X)]}=1−α的区间估计为置信区间
详见杂记——贝叶斯可信区间与频率置信区间的区别
1.5 单侧置信限
有时人们感兴趣的指标是望大或望小指标(指标越大/小越好)。
设θ^L(X)\hat\theta_L(\bm X)θ^L(X),θ^U(X)\hat\theta_U(\bm X)θ^U(X)为两个统计量,对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{θ^L(X)≤θ}≥1−α,∀θ∈Θ(3)P_\theta\{\hat\theta_L(\bm X)\le\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{3}Pθ{θ^L(X)≤θ}≥1−α,∀θ∈Θ(3)
Pθ{θ^U(X)≥θ}≥1−α,∀θ∈Θ(4)P_\theta\{\hat\theta_U(\bm X)\ge\theta\}\ge1-\alpha, \forall\theta\in\Theta\tag{4}Pθ{θ^U(X)≥θ}≥1−α,∀θ∈Θ(4)
则分别称θ^L(X)\hat\theta_L(\bm X)θ^L(X)与θ^U(X)\hat\theta_U(\bm X)θ^U(X)为θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信下限和单侧置信上限。
与双侧置信限的关系:
设θ^L(X)\hat\theta_L(\bm X)θ^L(X)与θ^U(X)\hat\theta_U(\bm X)θ^U(X)为θ\thetaθ的置信水平为1−α11-\alpha_11−α1和1−α21-\alpha_21−α2的单侧置信下限和单侧置信上限,且θ^L(X)≤θ^U(X)\hat\theta_L(\bm X)\le \hat\theta_U(\bm X)θ^L(X)≤θ^U(X),则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]是θ\thetaθ的置信水平为1−(α1+α2)1-(\alpha_1+\alpha_2)1−(α1+α2)的置信区间。
1.6 置信域
设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自分布族F={f(x,θ),θ∈Θ⊆Rk}\mathcal F=\{f(x,\theta), \theta\in\Theta\subseteq\bm R^k\}F={f(x,θ),θ∈Θ⊆Rk}的样本,θ=(θ1,⋯,θk)T\theta=(\theta_1,\cdots,\theta_k)^Tθ=(θ1,⋯,θk)T,如果统计量S(X)S(\bm X)S(X)满足
- 对任一样本观测值x\bm xx,S(x)S(\bm x)S(x)是Θ\ThetaΘ的一个子集;
- 对给定的α∈(0,1)\alpha\in(0,1)α∈(0,1),Pθ{θ∈S(X)}≥1−α,∀θ∈ΘP_\theta\{\theta\in S(\bm X)\}\ge1-\alpha, \forall\theta\in\ThetaPθ{θ∈S(X)}≥1−α,∀θ∈Θ
则称S(X)S(\bm X)S(X)是θ\thetaθ的置信水平为1−α1-\alpha1−α的置信域,而概率Pθ{θ∈S(X)}P_\theta\{\theta\in S(\bm X)\}Pθ{θ∈S(X)}在Θ\ThetaΘ上的下确界就称为置信系数
二、枢轴量法
求取参数的置信区间的方法有很多,本文主要介绍最常用的枢轴量法,尤其是对于连续型分布族。
2.1 上侧α\alphaα分位数
记Φ(x)\Phi(x)Φ(x)和ϕ(x)\phi(x)ϕ(x)分别表示标准正态分布N(0,1)N(0, 1)N(0,1)的CDFCDFCDF和PDFPDFPDF,且用满足方程Φ(uα)=1−α(5)\Phi(u_\alpha)=1-\alpha\tag{5}Φ(uα)=1−α(5)的uαu_\alphauα表示标准正态分布的上侧α\alphaα分位数,如下图
类似的,用χα2(n)\chi_\alpha^2(n)χα2(n),tα(n)t_\alpha(n)tα(n),Fα(m,n)F_\alpha(m, n)Fα(m,n)表示χ2(n)\chi^2(n)χ2(n),t(n)t(n)t(n),F(m,n)F(m, n)F(m,n)的上侧α\alphaα分位数。
2.2 小样本情况下的步骤
- 找一个与待估参数g(θ)g(\theta)g(θ)无关的统计量TTT,一般是它的一个很好的点估计
- 设法找出TTT与g(θ)g(\theta)g(θ)的某函数S(T,g(θ))S(T, g(\theta))S(T,g(θ)),使得S(T,g(θ))S(T, g(\theta))S(T,g(θ))的分布F(x)F(x)F(x)与θ\thetaθ无关,SSS就称为枢轴量,一般令分布为正态分布、χ2\chi^2χ2分布、ttt分布或FFF分布
- 适当的选取两个常数c,dc, dc,d,使对给定的α∈(0,1)\alpha\in(0, 1)α∈(0,1),有Pθ{c≤S(T,g(θ))≤d}=1−α(6)P_\theta\{c\le S(T, g(\theta))\le d\}=1-\alpha\tag{6}Pθ{c≤S(T,g(θ))≤d}=1−α(6)即F(d)−F(c)=1−αF(d)-F(c)=1-\alphaF(d)−F(c)=1−α,一般取d=Fα/2d=F_{\alpha/2}d=Fα/2,c=F1−α/2c=F_{1-\alpha/2}c=F1−α/2
- 如果能把(6)(6)(6)式中的不等式c≤S(T,g(θ))≤d}=1−αc\le S(T, g(\theta))\le d\}=1-\alphac≤S(T,g(θ))≤d}=1−α等价的改写成θ^L(X)≤g(θ)≤θ^U(X)\hat\theta_L(\bm X)\le g(\theta)\le\hat\theta_U(\bm X)θ^L(X)≤g(θ)≤θ^U(X),其中θ^L(X)\hat\theta_L(\bm X)θ^L(X),θ^U(X)\hat\theta_U(\bm X)θ^U(X)只与c,dc, dc,d和TTT有关,而与θ\thetaθ无关,则[θ^L(X),θ^U(X)][\hat\theta_L(\bm X), \hat\theta_U(\bm X)][θ^L(X),θ^U(X)]为g(θ)g(\theta)g(θ)的置信水平为1−α1-\alpha1−α的置信区间
第2步寻找枢轴量最关键
例子:
设X1,⋯,XnX_1, \cdots, X_nX1,⋯,Xn为来自正态总体N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)的IIDIIDIID样本,μ,σ2\mu, \sigma^2μ,σ2均未知,试求μ\muμ的置信水平为1−α1-\alpha1−α的置信区间。
- 由于X‾\overline XX是μ\muμ的一个很好的点估计,故我们在第一步取T=X‾T=\overline XT=X
- 虽然n(X‾−μ)/σ∼N(0,1)\sqrt{n}(\overline X-\mu)/\sigma\sim N(0,1)n(X−μ)/σ∼N(0,1),但σ\sigmaσ未知,所以想到用SnS_nSn来代替,而n(X‾−μ)/Sn∼t(n−1)\sqrt{n}(\overline X-\mu)/S_n\sim t(n-1)n(X−μ)/Sn∼t(n−1),所以可取枢轴量S=n(X‾−μ)/SnS=\sqrt{n}(\overline X-\mu)/S_nS=n(X−μ)/Sn
- 由于S∼t(n−1)S\sim t(n-1)S∼t(n−1),所以可取c=t1−α/2(n−1)=−tα/2(n−1)c=t_{1-\alpha/2}(n-1)=-t_{\alpha/2}(n-1)c=t1−α/2(n−1)=−tα/2(n−1),d=tα/2(n−1)d=t_{\alpha/2}(n-1)d=tα/2(n−1)
- 因为−tα/2(n−1)≤n(X‾−μ)/Sn≤tα/2(n−1)-t_{\alpha/2}(n-1)\le \sqrt{n}(\overline X-\mu)/S_n\le t_{\alpha/2}(n-1)−tα/2(n−1)≤n(X−μ)/Sn≤tα/2(n−1)
所以X‾−Snntα/2(n−1)≤μ≤X‾+Snntα/2(n−1)\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)\le\mu\le\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)X−nSntα/2(n−1)≤μ≤X+nSntα/2(n−1)
所以μ\muμ的置信水平为1−α1-\alpha1−α的置信区间为[X‾−Snntα/2(n−1),X‾+Snntα/2(n−1)][\overline X-\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1),\overline X+\frac{S_n}{\sqrt n}t_{\alpha/2}(n-1)][X−nSntα/2(n−1),X+nSntα/2(n−1)]
2.3 大样本情况下
枢轴量法更适用于连续性随机变量,对于离散型随机变量,并不容易操作,其原因在于给定的α\alphaα,一般不存在确切的分位点。
例子:
设X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn为来自伯努利分布b(1,p)b(1,p)b(1,p)的IIDIIDIID样本,试求ppp的置信水平为1−α1-\alpha1−α的置信区间。
关键还是找枢轴量。
我们知道1n∑i=1nXi\frac{1}{n}\sum\limits_{i=1}^nX_in1i=1∑nXi是ppp的一个很好的估计,那么枢轴量应该与Tn=∑i=1nXiT_n=\sum\limits_{i=1}^nX_iTn=i=1∑nXi有关。而Tn∼B(n,p)T_n\sim B(n, p)Tn∼B(n,p),其分布与ppp有关,所以不能直接把TnT_nTn作为枢轴量。
但由中心极限定理可知,当n→∞n\to\inftyn→∞时,Tn−npnp(1−p)∼N(0,1)(7)\frac{T_n-np}{\sqrt{np(1-p)}}\sim N(0, 1)\tag{7}np(1−p)Tn−np∼N(0,1)(7) 即当nnn充分大时,我们有P{Tn−npnp(1−p)<x}=Φ(x)(8)P\{\frac{T_n-np}{\sqrt{np(1-p)}}\lt x\}=\Phi(x)\tag8P{np(1−p)Tn−np<x}=Φ(x)(8) 且与ppp无关,所以可将Tn−npnp(1−p)\frac{T_n-np}{\sqrt{np(1-p)}}np(1−p)Tn−np当作枢轴量。
所以当nnn充分大时,有P{−uα/2≤Tn−npnp(1−p)≤uα/2}(9)P\{-u_{\alpha/2}\le\frac{T_n-np}{\sqrt{np(1-p)}}\le u_{\alpha/2}\}\tag9P{−uα/2≤np(1−p)Tn−np≤uα/2}(9)
再进行化简即可
当nnn充分大时,上述方法求得的置信区间非常接近水平为1−α1-\alpha1−α的置信区间。在实际中,当n≥30n\ge30n≥30时,就可以认为是充分大了。
由上述例子可知,对于离散型的随机变量,我们可以通过中心极限定理转化为正态分布来求解置信区间。
2.4 单个正态总体参数的置信水平为1−α1-\alpha1−α的置信区间
X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn为来自正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的IIDIIDIID样本
参数情况 | 枢轴量 | 置信区间 |
---|---|---|
σ2\sigma^2σ2已知,估计μ\muμ | n(X‾−μ)/σ∼N(0,1)\sqrt n(\overline X-\mu)/\sigma\sim N(0,1)n(X−μ)/σ∼N(0,1) | [X‾−uα/2σn,X‾+uα/2σn][\overline X-u_{\alpha/2}\frac{\sigma}{\sqrt n}, \overline X+u_{\alpha/2}\frac{\sigma}{\sqrt n}][X−uα/2nσ,X+uα/2nσ] |
σ2\sigma^2σ2未知,估计μ\muμ | n(X‾−μ)/Sn∼t(n−1)\sqrt n(\overline X-\mu)/S_n\sim t(n-1)n(X−μ)/Sn∼t(n−1) | [X‾−tα/2(n−1)Snn,X‾+tα/2(n−1)Snn][\overline X-t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}, \overline X+t_{\alpha/2}(n-1)\frac{S_n}{\sqrt n}][X−tα/2(n−1)nSn,X+tα/2(n−1)nSn] |
μ\muμ已知,估计σ2\sigma^2σ2 | ∑i=1n(Xi−μ)2/σ2∼χ2(n)\sum\limits_{i=1}^n(X_i-\mu)^2/\sigma^2\sim \chi^2(n)i=1∑n(Xi−μ)2/σ2∼χ2(n) | [∑i=1n(Xi−μ)2χα/2(n)2,∑i=1n(Xi−μ)2χ1−α/2(n)2][\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{\alpha/2(n)}},\frac{\sum\limits_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\alpha/2(n)}}][χα/2(n)2i=1∑n(Xi−μ)2,χ1−α/2(n)2i=1∑n(Xi−μ)2] |
μ\muμ未知,估计σ2\sigma^2σ2 | (n−1)Sn2/σ2∼χ2(n−1)(n-1)S_n^2/\sigma^2\sim\chi^2(n-1)(n−1)Sn2/σ2∼χ2(n−1) | [(n−1)Sn2χα/2(n−1)2,(n−1)Sn2χ1−α/2(n−1)2][\frac{(n-1)S_n^2}{\chi^2_{\alpha/2(n-1)}},\frac{(n-1)S_n^2}{\chi^2_{1-\alpha/2(n-1)}}][χα/2(n−1)2(n−1)Sn2,χ1−α/2(n−1)2(n−1)Sn2] |
三、两个正态总体的置信区间
设X1,⋯,XmX_1,\cdots,X_mX1,⋯,Xm和Y1,⋯,YnY_1,\cdots,Y_nY1,⋯,Yn分别为来自正态总体N(μ1,σ12)N(\mu_1,\sigma^2_1)N(μ1,σ12)和N(μ2,σ22)N(\mu_2,\sigma^2_2)N(μ2,σ22)的样本,且全样本独立,其中μ1,μ2,σ12,σ22\mu_1,\mu_2,\sigma^2_1,\sigma^2_2μ1,μ2,σ12,σ22为参数。样本均值为X‾=1m∑i=1mXi\overline X=\frac{1}{m}\sum\limits_{i=1}^mX_iX=m1i=1∑mXi,Y‾=1n∑i=1nYi\overline Y=\frac{1}{n}\sum\limits_{i=1}^nY_iY=n1i=1∑nYi,样本方差为S1m2=1m−1∑i=1m(Xi−X‾)2S_{1m}^2=\frac{1}{m-1}\sum\limits_{i=1}^m(X_i-\overline X)^2S1m2=m−11i=1∑m(Xi−X)2,S2n2=1n−1∑i=1n(Yi−Y‾)2S_{2n}^2=\frac{1}{n-1}\sum\limits_{i=1}^n(Y_i-\overline Y)^2S2n2=n−11i=1∑n(Yi−Y)2
3.1 δ=μ2−μ1\delta=\mu_2-\mu_1δ=μ2−μ1的置信区间
3.1.1 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2σ12=σ22=σ2未知时
由数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)可知T=mn(m+n−2)m+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2∼t(m+n−2)(10)T=\sqrt{\frac{mn(m+n-2)}{m+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}}\sim t(m+n-2)\tag{10}T=m+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2(Yˉ−Xˉ)−δ∼t(m+n−2)(10)
所以可令其为枢轴量,进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]m+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2(11)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}}\tag{11}[Y−X∓tα/2(m+n−2)]mn(m+n−2)m+n(m−1)S1m2+(n−1)S2n2(11)
3.1.2 θ=σ22/σ12\theta=\sigma^2_2/\sigma^2_1θ=σ22/σ12已知时
因为T=mn(m+n−2)mθ+n(Yˉ−Xˉ)−δ(m−1)S1m2+(n−1)S2n2/θ∼t(m+n−2)(12)T=\sqrt{\frac{mn(m+n-2)}{m\theta+n}}\frac{(\bar Y-\bar X)-\delta}{\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}}\sim t(m+n-2)\tag{12}T=mθ+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2/θ(Yˉ−Xˉ)−δ∼t(m+n−2)(12)
所以可令其为枢轴量,进而可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓tα/2(m+n−2)]mθ+nmn(m+n−2)(m−1)S1m2+(n−1)S2n2/θ(13)[\overline Y-\overline X\mp t_{\alpha/2}(m+n-2)]\sqrt{\frac{m\theta+n}{mn(m+n-2)}}\sqrt{(m-1)S^2_{1m}+(n-1)S^2_{2n}/\theta}\tag{13}[Y−X∓tα/2(m+n−2)]mn(m+n−2)mθ+n(m−1)S1m2+(n−1)S2n2/θ(13)
3.1.3 m=nm=nm=n时
此时Zi=Yi−Xi∼N(δ,σ12+σ22)Z_i=Y_i-X_i\sim N(\delta, \sigma^2_1+\sigma^2_2)Zi=Yi−Xi∼N(δ,σ12+σ22),i=1,⋯,ni=1,\cdots,ni=1,⋯,n且相互独立,于是可知Z‾∼N(δ,(σ12+σ22)/n)\overline Z\sim N(\delta, (\sigma^2_1+\sigma^2_2)/n)Z∼N(δ,(σ12+σ22)/n),∑i=1n(Zi−Z‾)2/(σ12+σ22)∼χ2(n−1)\sum\limits_{i=1}^n(Z_i-\overline Z)^2/(\sigma^2_1+\sigma^2_2)\sim\chi^2(n-1)i=1∑n(Zi−Z)2/(σ12+σ22)∼χ2(n−1),所以有n(n−1)(Z‾−δ)∑i=1n(Zi−Z‾)2∼t(n−1)(14)\frac{\sqrt{n(n-1)}(\overline Z-\delta)}{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}\sim t(n-1)\tag{14}i=1∑n(Zi−Z)2n(n−1)(Z−δ)∼t(n−1)(14)
所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Z‾∓tα/2(n−1)∑i=1n(Zi−Z‾)2n(n−1)](15)[\overline Z\mp t_{\alpha/2}(n-1)\frac{\sqrt{\sum\limits_{i=1}^n(Z_i-\overline Z)^2}}{\sqrt{n(n-1)}}]\tag{15}[Z∓tα/2(n−1)n(n−1)i=1∑n(Zi−Z)2](15)
3.1.4 当m,nm, nm,n都充分大时
因为S1m2→σ12S_{1m}^2\to\sigma^2_1S1m2→σ12,S2n2→σ22S_{2n}^2\to\sigma^2_2S2n2→σ22,且Y‾−X‾∼N(δ,σ12/m+σ22/n)\overline Y-\overline X\sim N(\delta, \sigma^2_1/m+ \sigma^2_2/n)Y−X∼N(δ,σ12/m+σ22/n),所以Tˇ=Y‾−X‾−δS1m2/m+S2n2/n∼N(0,1)(16)\check T=\frac{\overline Y-\overline X-\delta}{\sqrt{S_{1m}^2/m+S_{2n}^2/n}}\sim N(0,1)\tag{16}Tˇ=S1m2/m+S2n2/nY−X−δ∼N(0,1)(16)
所以可得δ\deltaδ的置信水平为1−α1-\alpha1−α的置信区间为[Y‾−X‾∓uα/2S1m2/m+S2n2/n][\overline Y-\overline X\mp u_{\alpha/2}\sqrt{S_{1m}^2/m+S_{2n}^2/n}][Y−X∓uα/2S1m2/m+S2n2/n]
3.2 方差比σ12/σ22\sigma^2_1/\sigma^2_2σ12/σ22的置信区间
因为(m−1)S1m2/σ12∼χ2(m−1)(m-1)S_{1m}^2/\sigma^2_1\sim\chi^2(m-1)(m−1)S1m2/σ12∼χ2(m−1),(n−1)S2n2/σ22∼χ2(n−1)(n-1)S_{2n}^2/\sigma^2_2\sim\chi^2(n-1)(n−1)S2n2/σ22∼χ2(n−1),且二者是独立的,于是F=S1m2/σ12S2n2/σ22∼F(m−1,n−1)(17)F=\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\sim F(m-1,n-1)\tag{17}F=S2n2/σ22S1m2/σ12∼F(m−1,n−1)(17)
可以作为枢轴量,并且P{F1−α/2(m−1,n−1)≤S1m2/σ12S2n2/σ22≤Fα/2(m−1,n−1)}(18)P\{F_{1-\alpha/2}(m-1,n-1)\le\frac{S_{1m}^2/\sigma^2_1}{S_{2n}^2/\sigma^2_2}\le F_{\alpha/2}(m-1,n-1)\}\tag{18}P{F1−α/2(m−1,n−1)≤S2n2/σ22S1m2/σ12≤Fα/2(m−1,n−1)}(18)
进而可得置信区间为[S1m2/S2n2Fα/2(m−1,n−1),S1m2/S2n2F1−α/2(m−1,n−1)](19)[\frac{S_{1m}^2/S_{2n}^2}{F_{\alpha/2}(m-1,n-1)}, \frac{S_{1m}^2/S_{2n}^2}{F_{1-\alpha/2}(m-1,n-1)}]\tag{19}[Fα/2(m−1,n−1)S1m2/S2n2,F1−α/2(m−1,n−1)S1m2/S2n2](19)
数理统计复习笔记四——区间估计相关推荐
- 数理统计复习笔记五——假设检验之显著性检验
一.基本概念 在统计中,我们把需要用样本去推断"正确"与否的命题称为一个假设.当然,假设是可以关于参数的,也可以是关于分布的. 通过样本对一个假设作出"对"或& ...
- 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)
前言: 总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念 1.1 次序统计量 1.2 样本偏度与样本峰度 1.3 经验分布函数 1.4 抽样 ...
- 操作系统复习笔记(四)
10.司机和售票员之间要协同工作:一方面只有售票员把车门关好了司机才能开车,因此售票员关好车门应通知司机开车;另一方面只有当汽车已经停下时,售票员才能开门让乘客上下客,司机停车后应该通知售票员,假定某 ...
- 《微型计算机原理与接口技术》复习笔记(四)
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记一 微机原理复习笔记二 微机原理复习笔记三 微机原理复习笔记四 中断系统 1 ...
- 《微型计算机原理与接口技术》复习笔记(二)
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 默认存储器单元的地址编排顺序从上往下,地址从低向高编排 微机原理复习笔记一 微机原理复习笔记 ...
- 《微型计算机原理与接口技术》复习笔记(三)
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记一 微机原理复习笔记二 微机原理复习笔记四 微机原理复习笔记三 1. 存储器 ...
- 《微型计算机原理与接口技术》复习笔记(一)
使用教材为 <微型计算机原理与接口技术>(慕课版) 孙丽娟.李爱群.陈燕俐.周宁宁.邓玉龙编著 微机原理复习笔记二 微机原理复习笔记三 微机原理复习笔记四 微机复习笔记(一) 1. 二进制 ...
- 数理统计期末复习笔记(一)
数理统计期末复习笔记 主要内容: 数据压缩,点估计,假设检验,区间检验 Reference: Statistical Inference, Casella&Berger Chapter 6 D ...
- 哈工大机器学习复习笔记(四)
本篇文章是在参考西瓜书.PPT课件.网络上相关博客等资料的基础上整理出的机器学习复习笔记,希望能给大家的机器学习复习提供帮助.这篇笔记只是复习的一个参考,大家一定要结合书本.PPT来进行复习,有些公式 ...
- 【线性代数复习笔记】同济大学版第三章和第四章 矩阵的初等变换与线性方程组与向量组的线性相关性
[线性代数复习笔记]同济大学版第三章和第四章 矩阵的初等变换与线性方程组与向量组的线性相关性 1.矩阵的初等变换 矩阵的三种初等变换及性质 行阶梯形矩阵 矩阵的初等变换的性质 2.矩阵的秩 矩阵的秩的 ...
最新文章
- 在docker镜像中加入环境变量
- 以太坊在哪里买_DeFi只是以太坊的开胃小菜,以太坊2.0才是重头戏
- cf1555B. Two Tables
- java 动态单元格涂色_如何编写自定义DefaultTableCellRenderer来着色特定单元格并“保留”其他单元格的颜色,Java...
- Linux 软件写文件权限,Linux 文件和目录的读写执行权限详解
- 星巴克在东京开设四层楼的全沉浸式优质咖啡体验门店
- android scheme 参数解析,Android 利用scheme协议进行跳转
- 2020杭电计算机考研经验帖
- 浏览器输入url后怎样请求服务的
- c语言如何画出多个散点图,如何制作多参数散点图
- EXCEL设置下拉选项,选项带颜色
- NLP基础入门:Word2Vec模型
- 《房债》书中的精髓:现代金融系统让全世界的人同处一艘经济大船上,一些人搞坏了船,所有的人都跟着遭殃。
- 美允许4G技术与WiFi共享5G频段;全球移动用户将达50亿│IoT黑板报
- 怎样在word中画横线
- android_10.0.0_r41自定义驱动编译+Framework层调用_2(自定义驱动)
- 农村出身的 90 后程序员,如何逆袭为中产阶级?| 程序员有话说
- 点云数据按高程赋色渲染
- 〖全域运营实战白宝书 - 运营角色认知篇③〗- 运营的底层逻辑是什么?
- cad 执行 autolisp 出现错误:错误: no function definition: VLAX-ENAME->VLA-OBJECT
热门文章
- 基于动态规划DTW算法加速衡量两个不同的时间序列的相似性
- 手把手教你自学单片机,三个步骤请做好笔记
- Java的第20年:Java和我的故事
- QT学习笔记——06-Day15_C++_QT
- Android智能硬件开发心得总结(一)
- 《移动通信原理与系统》——第二章《移动通信电波传播与传播预测模型》——笔记
- 真正UltraISO 9.5.5.2960中文完美注册版
- 个人笔记-C#txt文本分割器
- 原生JS实现图片幻灯片效果
- editplus html格式化,Editplus 格式化js,css,html工具