参数估计

一、点估计

1.1 矩估计:Vk=EXk=1n∑i=1nXikV_k=EX^k=\frac{1}{n}\sum_{i=1}^{n} X_i^kVk​=EXk=n1​∑i=1n​Xik​

  1. 定义:用样本的有关矩去作为总体有关矩的估计。
  2. 重要结论
    (1)样本均值作为总体期望的估计
    (2)样本二阶中心矩作为总体方差的估计
    (3)样本中位数(众数)作为总体中位数(众数)的估计
  3. 理论依据:大数律。矩估计基本上都是依概率或者几乎处处收敛到未知参数。
  4. 需注意问题
    (1)总体的参数不能表示成矩的函数时(一般是总体矩不存在),就不能使用矩估计
    (2)如果能够用低阶的矩估计,就不要用高阶矩
    (3)按照矩估计的理论应该用样本的二阶中心矩来估计总体的方差,但是在实际应用中人们总是采用样本方差作为总体方差的的估计。
  5. 最大优点:简单实用,与总体分布形势没有关系。只要知道总体随机变量一些矩存在,就可以做相应的矩估计。
  6. 几个常见分布的矩估计
    (1)二项分布 B(N,p),NB(N,p),NB(N,p),N已知
    p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^​=NX​
    (2)均匀分布 U(a,b)U(a,b)U(a,b)
    b^,a^=X‾±3(n−1)nS\hat{b}, \hat{a} = \overline{X} \pm \sqrt{\frac{3(n-1)}{n}} S b^,a^=X±n3(n−1)​​S
    (3)泊松分布 P(λ)P(\lambda)P(λ)
    λ^=X‾\hat{\lambda}=\overline{X} λ^=X
    (4)参数为 λ\lambdaλ 的指数总体
    λ^=1X‾\hat{\lambda}=\frac{1}{\overline{X}} λ^=X1​
    (5)正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
    μ^=X‾,σ^2=n−1nS2\hat{\mu}=\overline{X}, \hat{\sigma}^2=\frac{n-1}{n} S^2 μ^​=X,σ^2=nn−1​S2
    σ^=n−1nS\hat{\sigma}=\sqrt{\frac{n-1}{n}} S σ^=nn−1​​S

1.2 极大似然估计:L(θ)=f(x,θ)L(\theta) = f(x, \theta)L(θ)=f(x,θ)

  1. 定义:所有情况中,“看起来最像”的那个估计。求参数 θ\thetaθ 使已知条件发生的可能性最大。
  2. 重要结论
    (1)对离散总体,似然函数是样本联合分布律
    (2)对连续总体,它是样本联合密度函数
  3. 如何理解:总体参数 θ\thetaθ 的极大似然估计就是使得似然函数在 Θ\ThetaΘ 参数空间中达到极大。
    ∀θ∈Θ,L(θ^)=maxL(θ)\forall \theta \in \Theta, L(\hat{\theta}) = maxL(\theta) ∀θ∈Θ,L(θ^)=maxL(θ)
  4. 求解方式
    (1)建立极大似然方程组,求对数,导数等于0
    (2)用定义
  5. 几个常见分布的似然函数
    (1)二项分布 B(N,p),NB(N,p),NB(N,p),N已知
    L(θ)=[∏(Nxk)]p∑xk(1−p)nN−∑xkL(\theta) = [\prod{\dbinom{N}{x_k}}] p^{\sum x_k} (1-p)^{nN - \sum x_k} L(θ)=[∏(xk​N​)]p∑xk​(1−p)nN−∑xk​
    ∂∂θln[L(θ)]=x‾p−N−x‾1−p=0\frac{\partial}{\partial \theta} ln[L(\theta)] = \frac{\overline x}{p} - \frac{N - \overline{x}}{1-p} = 0 ∂θ∂​ln[L(θ)]=px​−1−pN−x​=0
    (2)正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
    L(θ)=(2πσ2)−n2exp{−12σ2∑k=1n(xk−μ)2}L(\theta) = (2\pi \sigma^2)^{-\frac{n}{2}}exp\{-\frac{1}{2\sigma^2} \sum_{k=1}^n(x_k-\mu)^2\} L(θ)=(2πσ2)−2n​exp{−2σ21​k=1∑n​(xk​−μ)2}
    {1σ2(x‾−μ)=0−n2σ2+12(σ2)2∑k=1n(xk−μ)2=0\begin{cases} \frac{1}{\sigma^2}(\overline{x}-\mu) = 0 \\ -\frac{n}{2\sigma^2}+\frac{1}{2(\sigma^2)^2} \sum_{k=1}^n(x_k-\mu)^2 =0 \end{cases} {σ21​(x−μ)=0−2σ2n​+2(σ2)21​∑k=1n​(xk​−μ)2=0​
    (3)均匀分布 U(a,b)U(a,b)U(a,b)
    L(θ)=1,θ<x(1),...,x(n)<θ+1L(\theta) = 1, \theta < x_{(1)}, ... , x_{(n)} < \theta + 1 L(θ)=1,θ<x(1)​,...,x(n)​<θ+1
  6. 几个常见分布的极大似然估计
    (1)二项分布 B(N,p),NB(N,p),NB(N,p),N已知
    p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^​=NX​
    (2)均匀分布 U(a,b)U(a,b)U(a,b)
    a^,b^=X(1),X(n)\hat{a}, \hat{b} = X_{(1)}, X_{(n)} a^,b^=X(1)​,X(n)​
    (3)泊松分布 P(λ)P(\lambda)P(λ)
    λ^=X‾\hat{\lambda}=\overline{X} λ^=X
    (4)参数为 λ\lambdaλ 的指数总体
    λ^=1X‾\hat{\lambda}=\frac{1}{\overline{X}} λ^=X1​
    (5)正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
    μ^=X‾,σ^2=n−1nS2\hat{\mu}=\overline{X}, \hat{\sigma}^2=\frac{n-1}{n} S^2 μ^​=X,σ^2=nn−1​S2
    σ^=n−1nS\hat{\sigma}=\sqrt{\frac{n-1}{n}} S σ^=nn−1​​S

1.3 比较

  • 矩估计不需要知道总体分布,只要求总体的矩存在
  • 极大似然估计必须要知道总体来自哪一种分布类型,有更多数学上的良好性质

二、估计的优良标准

1.1 无偏性:Eϕ(X1,...,Xn)=g(θ)E\phi(X_1,...,X_n)=g(\theta)Eϕ(X1​,...,Xn​)=g(θ)

  1. 定义:估计量的数学期望要等于参数
  2. 利用充分统计量构造无偏估计

1.2 有效性

  1. 定义:估计量的方差要比较小(主要限制在无偏估计的范围内)
  2. 如何衡量估计的偏差
    MSE(φ)=E[φ(X1,...,X2)−−g(θ)]2MSE(\varphi)=E[\varphi(X_1,...,X_2)--g(\theta)]^2 MSE(φ)=E[φ(X1​,...,X2​)−−g(θ)]2
  3. 限制在UE中的最优估计:一致最小方差无偏估计(UMVUE)
  4. 一般情况下如何寻找UMVUE
    如果TTT是充分、完备的统计量,φ(T)\varphi(T)φ(T)是g(θ)g(\theta)g(θ)的一个无偏估计,则ϕ(t)\phi(t)ϕ(t)就是g(θ)g(\theta)g(θ)的UMVUE
  5. 关于一些常见分布的参数的UMVUE
    (1)二项分布 B(N,p),NB(N,p),NB(N,p),N已知
    p^=X‾N\hat{p}=\frac{\overline{X}}{N} p^​=NX​
    (2)泊松分布 P(λ)P(\lambda)P(λ)
    λ^=X‾\hat{\lambda}=\overline{X} λ^=X
    (3)参数为 λ\lambdaλ 的指数总体
    λ^=n−1nX‾\hat{\lambda}=\frac{n-1}{n\overline{X}} λ^=nXn−1​
    (4)正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
    μ^=X‾,σ^2=S2\hat{\mu}=\overline{X}, \hat{\sigma}^2=S^2 μ^​=X,σ^2=S2

1.3 相合性:φn\varphi_nφn​依概率收敛到g(θ)g(\theta)g(θ)

  1. 定义:当样本容量趋于无限多时,估计量应该收敛到参数
  2. 公式
    P{∣φn−g(θ)∣>ε}→0P\{|\varphi_n-g(\theta)|>\varepsilon\}\to0 P{∣φn​−g(θ)∣>ε}→0
  3. 强相合估计
    P{φn→g(θ)}=1P\{\varphi_n\to g(\theta)\}\ = 1 P{φn​→g(θ)} =1
  4. 渐进正态估计
    n12[φn−g(θ)]σ→N(0,1)\frac{n^{\frac{1}{2}}[\varphi_n-g(\theta)]}{\sigma} \to N(0,1) σn21​[φn​−g(θ)]​→N(0,1)

三、区间估计

1.1 置信区间

  1. 定义:给定一个常数0<α<10<\alpha<10<α<1,对于总体未知参数g(θ)g(\theta)g(θ),如果存在两个统计量φ1、φ2\varphi_1、\varphi_2φ1​、φ2​满足:则称(φ1,φ2)(\varphi_1,\varphi_2)(φ1​,φ2​)是g(θ)g(\theta)g(θ)的置信度1−α1-\alpha1−α的置信区间。
  2. 相关概念:置信下限、置信上限、置信区间、置信度、置信水平等

1.2 求解思路

  1. 找一个枢轴变量Z(X,θ)Z(X,\theta)Z(X,θ)
  2. 对于给定的置信度1−α1-\alpha1−α,求出两个常数a、ba、ba、b
  3. 变换不等式,成为的等价的形式。因此区间(φ1,φ2)(\varphi_1,\varphi_2)(φ1​,φ2​)就是g(θ)g(\theta)g(θ)的一个置信度为1−α1-\alpha1−α的区间估计
    a<Z(X,θ)<b→φ1(X)<g(θ)<φ2(X)a<Z(X,\theta)<b \to \varphi_1(X) < g(\theta) < \varphi_2(X) a<Z(X,θ)<b→φ1​(X)<g(θ)<φ2​(X)

1.3 常见的区间估计

  1. **总体属性比例的置信区间(ps,p,1−αp_s,p,1-\alphaps​,p,1−α)(最短区间
    X−npnp(1−p)=Xn−pp(1−p)n→N(0,1)\frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} \to N(0,1) np(1−p)​X−np​=np(1−p)​​nX​−p​→N(0,1)
    (ps−uα/2ps(1−ps)n,ps+uα/2ps(1−ps)n)(p_s-u_{\alpha/2} \sqrt{\frac{p_s(1-p_s)}{n}}, p_s+u_{\alpha/2} \sqrt{\frac{p_s(1-p_s)}{n}}) (ps​−uα/2​nps​(1−ps​)​​,ps​+uα/2​nps​(1−ps​)​​)
  2. **指数总体参数的置信区间(λ,1−α\lambda, 1-\alphaλ,1−α)(不一定是最短区间
    2λ∑i=1nXi→Γ(2n2,12)=χ2(2n)2\lambda \sum_{i=1}^n X_i \to \Gamma(\frac{2n}{2},\frac{1}{2})=\chi^2(2n) 2λi=1∑n​Xi​→Γ(22n​,21​)=χ2(2n)
    (χ1−α/22(2n)2nX‾,χα/22(2n)2nX‾)( \frac{\chi_{1-\alpha/2}^2(2n)}{2n\overline{X}}, \frac{\chi_{\alpha/2}^2(2n)}{2n\overline{X}}) (2nXχ1−α/22​(2n)​,2nXχα/22​(2n)​)
  3. **正态总体均值的置信区间(X‾,1−α\overline{X}, 1-\alphaX,1−α)(最短区间
    (1)总体方差已知(σ2=σ02,N(μ,σ02n)\sigma^2=\sigma_0^2, N(\mu, \frac{\sigma_0^2}{n})σ2=σ02​,N(μ,nσ02​​))
    P{∣n(X‾−μ)σ0∣≤uα/2}=1−αP\{|\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0}|\le u_{\alpha/2}\} = 1-\alpha P{∣σ0​n​(X−μ)​∣≤uα/2​}=1−α
    (X‾−uα/2σ0n,X‾+uα/2σ0n)(\overline{X}-u_{\alpha/2}\frac{\sigma_0}{\sqrt{n}}, \overline{X}+u_{\alpha/2}\frac{\sigma_0}{\sqrt{n}}) (X−uα/2​n​σ0​​,X+uα/2​n​σ0​​)
    (2)总体方差未知
    n(X‾−μ)S→t(n−1)\frac{\sqrt{n}(\overline{X}-\mu)}{S} \to t(n-1) Sn​(X−μ)​→t(n−1)
    (X‾−tα/2(n−1)Sn,X‾+tα/2(n−1)Sn)(\overline{X}-t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}, \overline{X}+t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}) (X−tα/2​(n−1)n​S​,X+tα/2​(n−1)n​S​)
  4. 正态总体方差的置信区间(σ2,1−α\sigma^2, 1-\alphaσ2,1−α)
    (n−1)S2σ2→χ2(n−1)\frac{(n-1)S^2}{\sigma^2} \to \chi^2(n-1) σ2(n−1)S2​→χ2(n−1)
    ((n−1)S2χα/22(n−1),(n−1)S2χ1−α/22(n−1))(\frac{(n-1)S^2}{\chi_{\alpha/2}^{2}(n-1)}, \frac{(n-1)S^2}{\chi_{1 - \alpha/2}^{2}(n-1)}) (χα/22​(n−1)(n−1)S2​,χ1−α/22​(n−1)(n−1)S2​)
  5. 两个正态总体均值差的置信区间(μ1−μ2,N(μ1,σ12)→n1,N(μ2,σ22)→n2\mu_1 - \mu_2, N(\mu_1, \sigma_1^2) \to n_1, N(\mu_2, \sigma_2^2) \to n_2μ1​−μ2​,N(μ1​,σ12​)→n1​,N(μ2​,σ22​)→n2​)
    (X‾−Y‾)−(μ1−μ2)Sw1n1+1n2→t(n1+n2−2)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\to t(n_1+n_2-2) Sw​n1​1​+n2​1​​(X−Y)−(μ1​−μ2​)​→t(n1​+n2​−2)
    Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2​=n1​+n2​−2(n1​−1)S12​+(n2​−1)S22​​
    (X‾−Y‾−tα/2(n1+n2−2)Sw1n1+1n2,X‾−Y‾+tα/2(n1+n2−2)Sw1n1+1n2)(\overline{X}-\overline{Y} - t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \overline{X}-\overline{Y} + t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}) (X−Y−tα/2​(n1​+n2​−2)Sw​n1​1​+n2​1​​,X−Y+tα/2​(n1​+n2​−2)Sw​n1​1​+n2​1​​)
  6. 两个正态总体方差比的置信区间(σ12/σ22,1−α\sigma_1^2/\sigma_2^2, 1-\alphaσ12​/σ22​,1−α)
    S12/S22σ12/σ22→F(n1−1,n2−1)\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \to F(n_1-1, n_2-1) σ12​/σ22​S12​/S22​​→F(n1​−1,n2​−1)
    (S12/S22Fα/2(n1−1,n2−1),S12/S22F1−α/2(n1−1,n2−1))(\frac{S_1^2/S_2^2}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_1^2/S_2^2}{F_{1 - \alpha/2}(n_1-1,n_2-1)}) (Fα/2​(n1​−1,n2​−1)S12​/S22​​,F1−α/2​(n1​−1,n2​−1)S12​/S22​​)

1.4 其他(置信水平的理解,样本容量对区间长度的影响)

  1. 置信水平的理解:如果采用某种方法构造出一个置信水平 0.95 的区间(这个区间的两个端点是统计量的函数),当我们代入 100 次统计量的数据从而得到 100 个区间时,平均有 95 个区间要包含总体参数。
  2. 样本容量对区间长度的影响:以 95% 的区间估计为例
    4倍的样本容量,抽样误差才可能缩减一半
    (1)总体比例
    2×1.96ps(1−ps)n2 \times 1.96\sqrt{\frac{p_s(1-p_s)}{n}} 2×1.96nps​(1−ps​)​​
    (2)方差未知正态总体
    2×t0.025(n−1)sn2 \times t_{0.025}(n-1)\frac{s}{\sqrt{n}} 2×t0.025​(n−1)n​s​
    (3)方差已知正态总体
    2×1.96σ0n2 \times 1.96 \frac{\sigma_0}{\sqrt{n}} 2×1.96n​σ0​​

四、常考题型及解题思路

  1. 求参数的矩估计量
  2. 求参数的最大似然估计量
  3. 频率估计概率的原理求某参数的估计值
  4. 求参数,使估计量满足无偏性
  5. 求估计量的方差,判断哪个估计量更有效
  6. 求置信区间

PDF版本下载

东北大学应用数理统计第二章知识点总结——参数估计相关推荐

  1. 2021-08-08概率论与数理统计-第二章

    文章目录 概率论与数理统计-第二章 概率论与数理统计-第二章

  2. java第二章复习_JAVA第二章知识点

    JAVA第二章知识点 本章知识梳理 2.1 关键字 2.2 标识符 2.3 变 量 2.4运算符 2.5 程序流程控制 2.6 方法 2.1 关键字 关键字(keyword)的定义和特点 定义:被ja ...

  3. java第二章_JAVA第二章知识点

    JAVA第二章知识点 本章知识梳理 2.1 关键字 2.2 标识符 2.3 变 量 2.4运算符 2.5 程序流程控制 2.6 方法 2.1 关键字 关键字(keyword)的定义和特点 定义:被ja ...

  4. 计算机应用基础第一章第二章知识点,全国2013年自考《计算机应用基础》教材大纲第二章...

    第二章 计算机操作系统 (一)课程内容 第 1 节 操作系统基本知识 第 2 节 Windows2000 基本内容 第 3 节 Windows 安装和操作 第 4 节 Windows 的应用程序 第 ...

  5. 2020-08-07 光纤通信第二章知识点整理

    目录 2.1 半导体激光器 2 2.1.1 激光原理的基础知识 2 2.1.2 激光激射条件 3 2.1.3 结构理论 4 2.1.4 典型分类 6 2.1.5 模式概念 7 2.1.6 基本性质 8 ...

  6. 死锁 操作系统第二章知识点归纳总结

    系列文章 第一章 操作系统概述 第二章 进程管理之进程描述与控制 第二章 进程管理之进程调度 第二章 进程管理之进程同步 第二章 进程管理 死锁 一组相互竞争系统资源或进行通信的进程间的永久阻塞 2. ...

  7. 进程调度 操作系统第二章知识点归纳总结

    系列文章 第一章 操作系统概述 第二章 进程的描述与控制 第二章 进程管理 -调度 2.7 调度的类型 长程调度:决定哪个程序能进入系统成为进程,是创建进程的部分,用时最长 中程调度:决定哪个进程能进 ...

  8. 进程的描述与控制 操作系统第二章知识点归纳总结

    系列文章 第一章 操作系统概述 第二章 进程调度 第二章 进程的描述与控制 2.1 什么是进程 程序代码+相关数据+程序控制块PCB 当处理器开始执行一个程序的代码时,称这个执行的实体为进程 2.1. ...

  9. 数值分析(第五版) 第二章知识点总结

    仅供大致参考,有许多定义存在不严谨的地方:不同学校的考察重点自然是不同的 第二章 插值法 拉格朗日插值 Pn(x)=Ln(x)=∑i=0nf(xi)li(x)P_{n}(x)=L_{n}(x)=\su ...

最新文章

  1. JS经典面试题03-引用类型连续赋值a.x = a = { n: 2 }
  2. 【TensorFlow】tf.nn.softmax_cross_entropy_with_logits中的“logits”到底是个什么意思?
  3. linux版本查看命令多少位,查看linux系统版本命令32位还是64位
  4. 【CodeForces - 1027C】Minimum Value Rectangle (数学,公式化简,思维,卡常卡memset)
  5. VS2013编译64位boost流程及若干问题
  6. python现有两个磁盘文件a和b_有两个磁盘文件a和b,各存放一行字母,今要求把这两个文件中的信息合并...
  7. api 另一窗体 之上_12 个设计 API 的安全建议,不要等出事儿了“捶胸顿足”
  8. Java中List判空问题白话详解
  9. 我不是领导,如何让别人听我的话?
  10. unity打开excel表格_Unity3D读取之(二)——读取Excel文件内容
  11. 【ArcGIS教程03】基础知识(建议收藏)
  12. 【信号与系统实验】实验七 音频信号的采集和传输
  13. CentOS 7 安装教程、硬盘分区、LVM、网络配置、软件源配
  14. 如何看懂常用原理图符号、如何阅读原理图
  15. m3u8流媒体下载 swift
  16. 微信小程序实现自动语音功能:小程序语音提醒演示
  17. 案例分享:如何通过数据分析进行活动效果评估
  18. html调用 另存为,:将html另存为文本
  19. 9--《Method and apparatus for providing an e-bussiness audit trail in a distribu》
  20. http 状态码以及http请求、响应

热门文章

  1. 数学实验3:插值与拟合
  2. 前端性能优化,我们可以做哪些?
  3. 管理者一定要分清绝对优势和比较优势:我做的比你好,就应该我做吗?
  4. PTA 2 时钟类-1(用默认的构造方法)分数 10
  5. 对日软件外包开发浅谈
  6. 战棋游戏中的简单策略方法:基于群表示论的思想
  7. html热点区域的素材,htmllabel
  8. KRPano动态热点专用素材图50多个,加动态热点使用方法
  9. NLP必不可少的中文数据资源
  10. SQliteDatabase相关操作的工具类