大体上,统计学分为两个学派,一个是经典学派(又称频率学派),用的是总体信息和样本信息来处理参数的问题。另一个是贝叶斯学派,除了用的是同经典学派一样的总体信息和样本信息之外,还有先验信息。那么什么是先验信息呢?比如我们要了解全国人的平均身高,那么总体就是全国人的平均身高,样本就是从每个省里抽1万个人出来的平均身高,那么什么是先验信息呢?今年是2020年,我们可以考察之前的数据,比如2000年的全国人的平均身高,那么我们就能用2000年的全国人的平均身高作为一个参考,这个信息就叫做先验信息
贝叶斯估计的操作步骤
样本:
X1,⋯Xn\boldsymbol{X}_1,\cdots \boldsymbol{X}_{\boldsymbol{n}} X1​,⋯Xn​
的密度为:
f(x)\boldsymbol{f}\left( \boldsymbol{x} \right) f(x)
其是独立同分布,从同一个总体中抽出来的,并且总的的未知参数为θ{\theta }θ,什么是未知参数呢?全国平均人的身高这个东西就叫做总体参数,此时我们并不知道这个参数,所以称其为未知参数θ{\theta }θ
并且将先验的分布记为:π(θ)\boldsymbol{\pi }\left( \boldsymbol{\theta } \right) π(θ)
注意,我们的任务是要通过样本信息和先验信息来求得其后验信息、后验分布。
记:
h(θ∣x)=∏i=1nf(xi,θ)π(θ)\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{f}\left( \boldsymbol{x}_{\boldsymbol{i}},\boldsymbol{\theta } \right)}\boldsymbol{\pi }\left( \boldsymbol{\theta } \right) h(θ∣x)=i=1∏n​f(xi​,θ)π(θ)
上面的公式是求样本和参数的联合分布
再记:
m(x)=∫h(θ∣x)dx\boldsymbol{m}\left( \boldsymbol{x} \right) =\int{\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right)}\boldsymbol{dx} m(x)=∫h(θ∣x)dx
其被积区域就是θ{\theta }θ的范围
那么后验密度π(θ∣x)\boldsymbol{\pi }\left( \boldsymbol{\theta }|\boldsymbol{x} \right)π(θ∣x)就为:
π(θ∣x)=h(θ∣x)m(x)\boldsymbol{\pi }\left( \boldsymbol{\theta }|\boldsymbol{x} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{\theta }|\boldsymbol{x} \right)}{\boldsymbol{m}\left( \boldsymbol{x} \right)} π(θ∣x)=m(x)h(θ∣x)​
其目的是求参数θ{\theta }θ在样本信息条件下的后验分布,进而在该θ{\theta }θ后验分布的基础上求θ{\theta }θ得各种后验估计。
实际上贝叶斯估计就是在求出这个后验分布密度之后,根据这个密度函数求出他的期望。

下面举个例子:
例、设总体X服从二项分布,即X~B(N,p),且N已知,p为未知参数,p的先验分布为0到1的均匀分布,即U(0,1),现有n个样本:X1,⋯,Xn\boldsymbol{X}_1,\cdots ,\boldsymbol{X}_{\boldsymbol{n}}X1​,⋯,Xn​,求p的贝叶斯估计。
解:
步骤一:找出其密度,因为是二项分布,所以其密度为:p(X=x)=CNxpx(1−p)N−x\boldsymbol{p}\left( \boldsymbol{X}=\boldsymbol{x} \right) =\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}}\boldsymbol{p}^{\boldsymbol{x}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{N}-\boldsymbol{x}} p(X=x)=CNx​px(1−p)N−x
步骤二:求联合分布h,得h(X,θ)=∏i=1nCNxipxi(1−p)N−xi×1\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}_{\boldsymbol{i}}}\boldsymbol{p}^{\boldsymbol{x}_{\boldsymbol{i}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{N}-\boldsymbol{x}_{\boldsymbol{i}}}}\,\,\times 1 h(X,θ)=i=1∏n​CNxi​​pxi​(1−p)N−xi​×1
(因为是0到1的均匀分布,所以先验分布为1)
步骤三:求后验密度
π(θ,X)=h(X,θ)∫h(X,θ)dθ\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)}{\int{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) \boldsymbol{d\theta }}} π(θ,X)=∫h(X,θ)dθh(X,θ)​
这里的θ{\theta }θ其实就是p,在h(X,θ)\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)h(X,θ)中CNxi\boldsymbol{C}_{\boldsymbol{N}}^{\boldsymbol{x}_{\boldsymbol{i}}}CNxi​​是没有p的,所以分子分母可以约掉,得:
π(θ,X)=h(X,θ)∫h(X,θ)dθ=p∑Xi(1−p)nN−∑Xi∫01p∑Xi(1−p)nN−∑Xidp\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right)}{\int{\boldsymbol{h}\left( \boldsymbol{X},\boldsymbol{\theta } \right) \boldsymbol{d\theta }}}=\frac{\boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}{\int_0^1{\boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}\boldsymbol{dp}} π(θ,X)=∫h(X,θ)dθh(X,θ)​=∫01​p∑Xi​(1−p)nN−∑Xi​dpp∑Xi​(1−p)nN−∑Xi​​
其中,分母可以凑成伽马函数:
∫01p1+∑Xi−1(1−p)nN−∑Xi+1−1dp\int_0^1{\boldsymbol{p}^{1+\sum{\boldsymbol{X}_{\boldsymbol{i}}-1}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1-1}}}\boldsymbol{dp} ∫01​p1+∑Xi​−1(1−p)nN−∑Xi​+1−1dp

=Γ(1+∑Xi)Γ(nN−∑Xi+1)Γ(nN+2)\frac{\boldsymbol{\varGamma }\left( 1+\sum{\boldsymbol{X}_{\boldsymbol{i}}} \right) \boldsymbol{\varGamma }\left( \boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1} \right)}{\boldsymbol{\varGamma }\left( \boldsymbol{nN}+2 \right)} Γ(nN+2)Γ(1+∑Xi​)Γ(nN−∑Xi​+1)​
将其带入π(θ,X)\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right)π(θ,X)得:
π(θ,X)=Γ(nN+2)p∑Xi(1−p)nN−∑XiΓ(1+∑Xi)Γ(nN−∑Xi+1)\boldsymbol{\pi }\left( \boldsymbol{\theta },\boldsymbol{X} \right) =\frac{\boldsymbol{\varGamma }\left( \boldsymbol{nN}+2 \right) \boldsymbol{p}^{\sum{\boldsymbol{X}_{\boldsymbol{i}}}}\left( 1-\boldsymbol{p} \right) ^{\boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}}}}{\boldsymbol{\varGamma }\left( 1+\sum{\boldsymbol{X}_{\boldsymbol{i}}} \right) \boldsymbol{\varGamma }\left( \boldsymbol{nN}-\sum{\boldsymbol{X}_{\boldsymbol{i}}+1} \right)} π(θ,X)=Γ(1+∑Xi​)Γ(nN−∑Xi​+1)Γ(nN+2)p∑Xi​(1−p)nN−∑Xi​​
步骤四:求得了后验密度,再求其期望,就得到了贝叶斯估计
故p的贝叶斯估计为:p^=1+∑XinN+2\boldsymbol{\hat{p}}=\frac{1+\sum{\boldsymbol{X}_{\boldsymbol{i}}}}{\boldsymbol{nN}+2} p^​=nN+21+∑Xi​​

贝叶斯估计的理解及例子相关推荐

  1. 【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子

    [数据收集]名义变量.序级变量.区间变量.比率变量的理解及例子 名义变量(Nominal Variable) 分类及举例 序级变量(Ordinal Variable) 分类和举例 区间变量(Inter ...

  2. Java里main的写法_main方法的深入理解和例子

    大家好,又是一个令人振奋的周三啊,今天说一下main方法,大家应该对它很熟悉了,在Java中,main()方法是Java应用程序的入口方法,也就是说,程序在运行的时候,第一个执行的方法就是main() ...

  3. 遗传算法的理解及例子解释

    什么是遗传算法? 遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法 遗传算法的基本原理 遗传算法将"优胜劣汰,适者生存"的生物进化原理引入优化参 ...

  4. Labview移位寄存器理解(例子说明)

    引言 Labview的while循环里面有移位寄存器,看了很多例子才搞懂,把自己的理解简单记录一下. 还是用例子来说明比较好,下面文字摘自博客[1] 如下图,上面循环对移位寄存器进行过初始化,下面的循 ...

  5. CTR深度学习模型之 DIN(Deep Interest Network) 的理解与例子

    在电商领域,每个用户都有丰富的历史行为数据,这些数据具有如下特点: 多样性(Diversity):用户可能对多种商品感兴趣,例如手机.衣服. 局部激活(Local Activation):用户是否点击 ...

  6. Verilog中三态门(高阻态)的理解与例子

    以前只知道电路的输出有高阻态,但是对高阻态的理解不够,对高阻态的用法也不清楚,直到用Verilog实现单端口SRAM时,才有了一个进一步的认识,记录如下: Verilog实现单端口SRAM的内容见:V ...

  7. linux反汇编时乱码,Linux反汇编代码理解 标准例子 很好

    ~~~~~C语言代码example.c int triangle( int width, int height) { int arr{0,1,2,3,4}; int area; area = widt ...

  8. 通俗理解LDA主题模型

    0 前言 印象中,最开始听说"LDA"这个名词,是缘于rickjin在2013年3月写的一个LDA科普系列,叫LDA数学八卦,我当时一直想看来着,记得还打印过一次,但不知是因为这篇 ...

  9. LDA通俗理解LDA主题模型

    转自:http://blog.csdn.net/v_july_v/article/details/41209515#t13 通俗理解LDA主题模型 0 前言 印象中,最开始听说"LDA&qu ...

最新文章

  1. 如何一小时杀入天池OCR比赛前排?
  2. nginx0.8 + php-5.3.4 + memcached
  3. JSTL1.1函数标签库(functions)如fn:length
  4. 用python从0开始创建一个区块链,从代码深入理解区块链
  5. 【例子】外键约束的创建及例子
  6. PHP代码审计基础手册
  7. python 类属性排序_Python实现多属性排序的方法
  8. 去除Android开发文档中的URL,加速你的Android开发文档
  9. 简单的OPC与C#通讯,别想复杂了
  10. 远程连接Oracle 数据库连接报错ORA-12638身份检索失败
  11. 信息学奥赛一本通(1023:Hello,World!的大小)
  12. mysql 存储引擎_MySQL存储引擎
  13. 程序显示文本框_vb程序语言题库
  14. linux 文件大小 自动变化 写,Linux下自动清理超过指定大小文件的方法
  15. 关于python中矩阵相乘需要注意的事情
  16. 用python写个脚本把QQ空间多年动态删了
  17. 游戏开发物理引擎PhysX研究系列:通过Unity中的物理系统学习Physx指引贴
  18. 【LeetCode102. 二叉树的层序遍历】——层序遍历
  19. React 生命周期总结(新旧对比)
  20. 访问者模式-好人打贱人

热门文章

  1. 城市流浪宠物疫情监控系统
  2. 数据库|SQLite数据库
  3. 数独游戏开发——游戏主面板显示
  4. Mysql妙用CONVERT函数类型转换
  5. ffmpeg rtmp 封装发送函数_基于FFmpeg进行RTMP推流(一)
  6. windows如何利用计划任务自动关机?
  7. Redhat6.5出现不识别CPU
  8. 【AI创新者】TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择
  9. Ubuntu更换清华TUNA软件源
  10. 实战:如何降低云开发服务器成本?