东北大学应用数理统计第二章知识点总结—

参数估计

一、点估计

1.1 矩估计：Vk=EXk=1n∑i=1nXikV_k=EX^k=\frac{1}{n}\sum_{i=1}^{n} X_i^kVk=EXk=n1∑i=1nXik

定义：用样本的有关矩去作为总体有关矩的估计。
重要结论
（1）样本均值作为总体期望的估计
（2）样本二阶中心矩作为总体方差的估计
（3）样本中位数（众数）作为总体中位数（众数）的估计
理论依据：大数律。矩估计基本上都是依概率或者几乎处处收敛到未知参数。
需注意问题
（1）总体的参数不能表示成矩的函数时（一般是总体矩不存在），就不能使用矩估计
（2）如果能够用低阶的矩估计，就不要用高阶矩
（3）按照矩估计的理论应该用样本的二阶中心矩来估计总体的方差，但是在实际应用中人们总是采用样本方差作为总体方差的的估计。
最大优点：简单实用，与总体分布形势没有关系。只要知道总体随机变量一些矩存在，就可以做相应的矩估计。
几个常见分布的矩估计
（1）二项分布 B(N,p),NB(N,p),NB(N,p),N已知
p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^=NX
（2）均匀分布 U(a,b)U(a,b)U(a,b)
b^,a^=X‾±3(n−1)nS\hat{b}, \hat{a} = \overline{X} \pm \sqrt{\frac{3(n-1)}{n}} S b^,a^=X±n3(n−1)S
（3）泊松分布 P(λ)P(\lambda)P(λ)
λ^=X‾\hat{\lambda}=\overline{X} λ^=X
（4）参数为 λ\lambdaλ 的指数总体
λ^=1X‾\hat{\lambda}=\frac{1}{\overline{X}} λ^=X1
（5）正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
μ^=X‾,σ^2=n−1nS2\hat{\mu}=\overline{X}, \hat{\sigma}^2=\frac{n-1}{n} S^2 μ^=X,σ^2=nn−1S2
σ^=n−1nS\hat{\sigma}=\sqrt{\frac{n-1}{n}} S σ^=nn−1S

1.2 极大似然估计：L(θ)=f(x,θ)L(\theta) = f(x, \theta)L(θ)=f(x,θ)

定义：所有情况中，“看起来最像”的那个估计。求参数 θ\thetaθ 使已知条件发生的可能性最大。
重要结论
（1）对离散总体，似然函数是样本联合分布律
（2）对连续总体，它是样本联合密度函数
如何理解：总体参数 θ\thetaθ 的极大似然估计就是使得似然函数在 Θ\ThetaΘ 参数空间中达到极大。
∀θ∈Θ,L(θ^)=maxL(θ)\forall \theta \in \Theta, L(\hat{\theta}) = maxL(\theta) ∀θ∈Θ,L(θ^)=maxL(θ)
求解方式
（1）建立极大似然方程组，求对数，导数等于0
（2）用定义
几个常见分布的似然函数
（1）二项分布 B(N,p),NB(N,p),NB(N,p),N已知
L(θ)=[∏(Nxk)]p∑xk(1−p)nN−∑xkL(\theta) = [\prod{\dbinom{N}{x_k}}] p^{\sum x_k} (1-p)^{nN - \sum x_k} L(θ)=[∏(xkN)]p∑xk(1−p)nN−∑xk
∂∂θln[L(θ)]=x‾p−N−x‾1−p=0\frac{\partial}{\partial \theta} ln[L(\theta)] = \frac{\overline x}{p} - \frac{N - \overline{x}}{1-p} = 0 ∂θ∂ln[L(θ)]=px−1−pN−x=0
（2）正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
L(θ)=(2πσ2)−n2exp{−12σ2∑k=1n(xk−μ)2}L(\theta) = (2\pi \sigma^2)^{-\frac{n}{2}}exp\{-\frac{1}{2\sigma^2} \sum_{k=1}^n(x_k-\mu)^2\} L(θ)=(2πσ2)−2nexp{−2σ21k=1∑n(xk−μ)2}
{1σ2(x‾−μ)=0−n2σ2+12(σ2)2∑k=1n(xk−μ)2=0\begin{cases} \frac{1}{\sigma^2}(\overline{x}-\mu) = 0 \\ -\frac{n}{2\sigma^2}+\frac{1}{2(\sigma^2)^2} \sum_{k=1}^n(x_k-\mu)^2 =0 \end{cases} {σ21(x−μ)=0−2σ2n+2(σ2)21∑k=1n(xk−μ)2=0
（3）均匀分布 U(a,b)U(a,b)U(a,b)
L(θ)=1,θ<x(1),...,x(n)<θ+1L(\theta) = 1, \theta < x_{(1)}, ... , x_{(n)} < \theta + 1 L(θ)=1,θ<x(1),...,x(n)<θ+1
几个常见分布的极大似然估计
（1）二项分布 B(N,p),NB(N,p),NB(N,p),N已知
p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^=NX
（2）均匀分布 U(a,b)U(a,b)U(a,b)
a^,b^=X(1),X(n)\hat{a}, \hat{b} = X_{(1)}, X_{(n)} a^,b^=X(1),X(n)
（3）泊松分布 P(λ)P(\lambda)P(λ)
λ^=X‾\hat{\lambda}=\overline{X} λ^=X
（4）参数为 λ\lambdaλ 的指数总体
λ^=1X‾\hat{\lambda}=\frac{1}{\overline{X}} λ^=X1
（5）正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
μ^=X‾,σ^2=n−1nS2\hat{\mu}=\overline{X}, \hat{\sigma}^2=\frac{n-1}{n} S^2 μ^=X,σ^2=nn−1S2
σ^=n−1nS\hat{\sigma}=\sqrt{\frac{n-1}{n}} S σ^=nn−1S

1.3 比较

矩估计不需要知道总体分布，只要求总体的矩存在
极大似然估计必须要知道总体来自哪一种分布类型，有更多数学上的良好性质

二、估计的优良标准

1.1 无偏性：Eϕ(X1,...,Xn)=g(θ)E\phi(X_1,...,X_n)=g(\theta)Eϕ(X1,...,Xn)=g(θ)

定义：估计量的数学期望要等于参数
利用充分统计量构造无偏估计

1.2 有效性

定义：估计量的方差要比较小（主要限制在无偏估计的范围内）
如何衡量估计的偏差
MSE(φ)=E[φ(X1,...,X2)−−g(θ)]2MSE(\varphi)=E[\varphi(X_1,...,X_2)--g(\theta)]^2 MSE(φ)=E[φ(X1,...,X2)−−g(θ)]2
限制在UE中的最优估计：一致最小方差无偏估计（UMVUE）
一般情况下如何寻找UMVUE
如果TTT是充分、完备的统计量，φ(T)\varphi(T)φ(T)是g(θ)g(\theta)g(θ)的一个无偏估计，则ϕ(t)\phi(t)ϕ(t)就是g(θ)g(\theta)g(θ)的UMVUE
关于一些常见分布的参数的UMVUE
（1）二项分布 B(N,p),NB(N,p),NB(N,p),N已知
p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^=NX
（2）泊松分布 P(λ)P(\lambda)P(λ)
λ^=X‾\hat{\lambda}=\overline{X} λ^=X
（3）参数为 λ\lambdaλ 的指数总体
λ^=n−1nX‾\hat{\lambda}=\frac{n-1}{n\overline{X}} λ^=nXn−1
（4）正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
μ^=X‾,σ^2=S2\hat{\mu}=\overline{X}, \hat{\sigma}^2=S^2 μ^=X,σ^2=S2

1.3 相合性：φn\varphi_nφn依概率收敛到g(θ)g(\theta)g(θ)

定义：当样本容量趋于无限多时，估计量应该收敛到参数
公式
P{∣φn−g(θ)∣>ε}→0P\{|\varphi_n-g(\theta)|>\varepsilon\}\to0 P{∣φn−g(θ)∣>ε}→0
强相合估计
P{φn→g(θ)}=1P\{\varphi_n\to g(\theta)\}\ = 1 P{φn→g(θ)} =1
渐进正态估计
n12[φn−g(θ)]σ→N(0,1)\frac{n^{\frac{1}{2}}[\varphi_n-g(\theta)]}{\sigma} \to N(0,1) σn21[φn−g(θ)]→N(0,1)

三、区间估计

1.1 置信区间

定义：给定一个常数0<α<10<\alpha<10<α<1，对于总体未知参数g(θ)g(\theta)g(θ)，如果存在两个统计量φ1、φ2\varphi_1、\varphi_2φ1、φ2满足：则称(φ1,φ2)(\varphi_1,\varphi_2)(φ1,φ2)是g(θ)g(\theta)g(θ)的置信度1−α1-\alpha1−α的置信区间。
相关概念：置信下限、置信上限、置信区间、置信度、置信水平等

1.2 求解思路

找一个枢轴变量Z(X,θ)Z(X,\theta)Z(X,θ)
对于给定的置信度1−α1-\alpha1−α，求出两个常数a、ba、ba、b
变换不等式，成为的等价的形式。因此区间(φ1,φ2)(\varphi_1,\varphi_2)(φ1,φ2)就是g(θ)g(\theta)g(θ)的一个置信度为1−α1-\alpha1−α的区间估计
a<Z(X,θ)<b→φ1(X)<g(θ)<φ2(X)a<Z(X,\theta)<b \to \varphi_1(X) < g(\theta) < \varphi_2(X) a<Z(X,θ)<b→φ1(X)<g(θ)<φ2(X)

1.3 常见的区间估计

**总体属性比例的置信区间（ps,p,1−αp_s,p,1-\alphaps,p,1−α）（最短区间）
X−npnp(1−p)=Xn−pp(1−p)n→N(0,1)\frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} \to N(0,1) np(1−p)X−np=np(1−p)nX−p→N(0,1)
(ps−uα/2ps(1−ps)n,ps+uα/2ps(1−ps)n)(p_s-u_{\alpha/2} \sqrt{\frac{p_s(1-p_s)}{n}}, p_s+u_{\alpha/2} \sqrt{\frac{p_s(1-p_s)}{n}}) (ps−uα/2nps(1−ps),ps+uα/2nps(1−ps))
**指数总体参数的置信区间（λ,1−α\lambda, 1-\alphaλ,1−α）（不一定是最短区间）
2λ∑i=1nXi→Γ(2n2,12)=χ2(2n)2\lambda \sum_{i=1}^n X_i \to \Gamma(\frac{2n}{2},\frac{1}{2})=\chi^2(2n) 2λi=1∑nXi→Γ(22n,21)=χ2(2n)
(χ1−α/22(2n)2nX‾,χα/22(2n)2nX‾)( \frac{\chi_{1-\alpha/2}^2(2n)}{2n\overline{X}}, \frac{\chi_{\alpha/2}^2(2n)}{2n\overline{X}}) (2nXχ1−α/22(2n),2nXχα/22(2n))
**正态总体均值的置信区间（X‾,1−α\overline{X}, 1-\alphaX,1−α）（最短区间）
（1）总体方差已知（σ2=σ02,N(μ,σ02n)\sigma^2=\sigma_0^2, N(\mu, \frac{\sigma_0^2}{n})σ2=σ02,N(μ,nσ02)）
P{∣n(X‾−μ)σ0∣≤uα/2}=1−αP\{|\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0}|\le u_{\alpha/2}\} = 1-\alpha P{∣σ0n(X−μ)∣≤uα/2}=1−α
(X‾−uα/2σ0n,X‾+uα/2σ0n)(\overline{X}-u_{\alpha/2}\frac{\sigma_0}{\sqrt{n}}, \overline{X}+u_{\alpha/2}\frac{\sigma_0}{\sqrt{n}}) (X−uα/2nσ0,X+uα/2nσ0)
（2）总体方差未知
n(X‾−μ)S→t(n−1)\frac{\sqrt{n}(\overline{X}-\mu)}{S} \to t(n-1) Sn(X−μ)→t(n−1)
(X‾−tα/2(n−1)Sn,X‾+tα/2(n−1)Sn)(\overline{X}-t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}, \overline{X}+t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}) (X−tα/2(n−1)nS,X+tα/2(n−1)nS)
正态总体方差的置信区间（σ2,1−α\sigma^2, 1-\alphaσ2,1−α）
(n−1)S2σ2→χ2(n−1)\frac{(n-1)S^2}{\sigma^2} \to \chi^2(n-1) σ2(n−1)S2→χ2(n−1)
((n−1)S2χα/22(n−1),(n−1)S2χ1−α/22(n−1))(\frac{(n-1)S^2}{\chi_{\alpha/2}^{2}(n-1)}, \frac{(n-1)S^2}{\chi_{1 - \alpha/2}^{2}(n-1)}) (χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
两个正态总体均值差的置信区间（μ1−μ2,N(μ1,σ12)→n1,N(μ2,σ22)→n2\mu_1 - \mu_2, N(\mu_1, \sigma_1^2) \to n_1, N(\mu_2, \sigma_2^2) \to n_2μ1−μ2,N(μ1,σ12)→n1,N(μ2,σ22)→n2）
(X‾−Y‾)−(μ1−μ2)Sw1n1+1n2→t(n1+n2−2)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\to t(n_1+n_2-2) Swn11+n21(X−Y)−(μ1−μ2)→t(n1+n2−2)
Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
(X‾−Y‾−tα/2(n1+n2−2)Sw1n1+1n2,X‾−Y‾+tα/2(n1+n2−2)Sw1n1+1n2)(\overline{X}-\overline{Y} - t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \overline{X}-\overline{Y} + t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}) (X−Y−tα/2(n1+n2−2)Swn11+n21,X−Y+tα/2(n1+n2−2)Swn11+n21)
两个正态总体方差比的置信区间（σ12/σ22,1−α\sigma_1^2/\sigma_2^2, 1-\alphaσ12/σ22,1−α）
S12/S22σ12/σ22→F(n1−1,n2−1)\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \to F(n_1-1, n_2-1) σ12/σ22S12/S22→F(n1−1,n2−1)
(S12/S22Fα/2(n1−1,n2−1),S12/S22F1−α/2(n1−1,n2−1))(\frac{S_1^2/S_2^2}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2/S_2^2}{F_{1 - \alpha/2}(n_1-1,n_2-1)}) (Fα/2(n1−1,n2−1)S12/S22,F1−α/2(n1−1,n2−1)S12/S22)

1.4 其他（置信水平的理解，样本容量对区间长度的影响）

置信水平的理解：如果采用某种方法构造出一个置信水平 0.95 的区间（这个区间的两个端点是统计量的函数），当我们代入 100 次统计量的数据从而得到 100 个区间时，平均有 95 个区间要包含总体参数。
样本容量对区间长度的影响：以 95% 的区间估计为例
4倍的样本容量，抽样误差才可能缩减一半
（1）总体比例
2×1.96ps(1−ps)n2 \times 1.96\sqrt{\frac{p_s(1-p_s)}{n}} 2×1.96nps(1−ps)
（2）方差未知正态总体
2×t0.025(n−1)sn2 \times t_{0.025}(n-1)\frac{s}{\sqrt{n}} 2×t0.025(n−1)ns
（3）方差已知正态总体
2×1.96σ0n2 \times 1.96 \frac{\sigma_0}{\sqrt{n}} 2×1.96nσ0

四、常考题型及解题思路

求参数的矩估计量
求参数的最大似然估计量
频率估计概率的原理求某参数的估计值
求参数，使估计量满足无偏性
求估计量的方差，判断哪个估计量更有效
求置信区间

PDF版本下载

东北大学应用数理统计第二章知识点总结——参数估计相关推荐

2021-08-08概率论与数理统计-第二章
文章目录概率论与数理统计-第二章概率论与数理统计-第二章
java第二章复习_JAVA第二章知识点
JAVA第二章知识点本章知识梳理 2.1 关键字 2.2 标识符 2.3 变量 2.4运算符 2.5 程序流程控制 2.6 方法 2.1 关键字关键字(keyword)的定义和特点定义:被ja ...
java第二章_JAVA第二章知识点
JAVA第二章知识点本章知识梳理 2.1 关键字 2.2 标识符 2.3 变量 2.4运算符 2.5 程序流程控制 2.6 方法 2.1 关键字关键字(keyword)的定义和特点定义:被ja ...
计算机应用基础第一章第二章知识点,全国2013年自考《计算机应用基础》教材大纲第二章...
第二章计算机操作系统 (一)课程内容第 1 节操作系统基本知识第 2 节 Windows2000 基本内容第 3 节 Windows 安装和操作第 4 节 Windows 的应用程序第 ...
2020-08-07 光纤通信第二章知识点整理
目录 2.1 半导体激光器 2 2.1.1 激光原理的基础知识 2 2.1.2 激光激射条件 3 2.1.3 结构理论 4 2.1.4 典型分类 6 2.1.5 模式概念 7 2．1.6 基本性质 8 ...
死锁操作系统第二章知识点归纳总结
系列文章第一章操作系统概述第二章进程管理之进程描述与控制第二章进程管理之进程调度第二章进程管理之进程同步第二章进程管理死锁一组相互竞争系统资源或进行通信的进程间的永久阻塞 2. ...
进程调度操作系统第二章知识点归纳总结
系列文章第一章操作系统概述第二章进程的描述与控制第二章进程管理 -调度 2.7 调度的类型长程调度:决定哪个程序能进入系统成为进程,是创建进程的部分,用时最长中程调度:决定哪个进程能进 ...
进程的描述与控制操作系统第二章知识点归纳总结
系列文章第一章操作系统概述第二章进程调度第二章进程的描述与控制 2.1 什么是进程程序代码+相关数据+程序控制块PCB 当处理器开始执行一个程序的代码时,称这个执行的实体为进程 2.1. ...
数值分析(第五版) 第二章知识点总结
仅供大致参考,有许多定义存在不严谨的地方:不同学校的考察重点自然是不同的第二章插值法拉格朗日插值 Pn(x)=Ln(x)=∑i=0nf(xi)li(x)P_{n}(x)=L_{n}(x)=\su ...

东北大学应用数理统计第二章知识点总结——参数估计

参数估计

一、点估计

1.1 矩估计：Vk=EXk=1n∑i=1nXikV_k=EX^k=\frac{1}{n}\sum_{i=1}^{n} X_i^kVk=EXk=n1∑i=1nXik

1.2 极大似然估计：L(θ)=f(x,θ)L(\theta) = f(x, \theta)L(θ)=f(x,θ)

1.3 比较

二、估计的优良标准

1.1 无偏性：Eϕ(X1,...,Xn)=g(θ)E\phi(X_1,...,X_n)=g(\theta)Eϕ(X1,...,Xn)=g(θ)

1.2 有效性

1.3 相合性：φn\varphi_nφn依概率收敛到g(θ)g(\theta)g(θ)

三、区间估计

1.1 置信区间

1.2 求解思路

1.3 常见的区间估计

1.4 其他（置信水平的理解，样本容量对区间长度的影响）

四、常考题型及解题思路

东北大学应用数理统计第二章知识点总结——参数估计相关推荐

最新文章

热门文章

东北大学应用数理统计第二章知识点总结——参数估计

参数估计

一、点估计

1.1 矩估计：Vk=EXk=1n∑i=1nXikV_k=EX^k=\frac{1}{n}\sum_{i=1}^{n} X_i^kVk​=EXk=n1​∑i=1n​Xik​

1.2 极大似然估计：L(θ)=f(x,θ)L(\theta) = f(x, \theta)L(θ)=f(x,θ)

1.3 比较

二、估计的优良标准

1.1 无偏性：Eϕ(X1,...,Xn)=g(θ)E\phi(X_1,...,X_n)=g(\theta)Eϕ(X1​,...,Xn​)=g(θ)

1.2 有效性

1.3 相合性：φn\varphi_nφn​依概率收敛到g(θ)g(\theta)g(θ)

三、区间估计

1.1 置信区间

1.2 求解思路

1.3 常见的区间估计

1.4 其他（置信水平的理解，样本容量对区间长度的影响）

四、常考题型及解题思路

东北大学应用数理统计第二章知识点总结——参数估计相关推荐

最新文章

热门文章

1.1 矩估计：Vk=EXk=1n∑i=1nXikV_k=EX^k=\frac{1}{n}\sum_{i=1}^{n} X_i^kVk=EXk=n1∑i=1nXik

1.1 无偏性：Eϕ(X1,...,Xn)=g(θ)E\phi(X_1,...,X_n)=g(\theta)Eϕ(X1,...,Xn)=g(θ)

1.3 相合性：φn\varphi_nφn依概率收敛到g(θ)g(\theta)g(θ)