Dirichlet Process

Dirichlet过程是一个常用于非参数模型的随机过程,对于随机过程的性质可以类比于Gauss过程。它是一个定义在分布上的分布,也就是说每一个Dirichlet过程的样本都是一个分布。从Dirichlet过程中抽样的分布是离散的,但是不能用有限个参数表示这样的过程,因为在每个点(无穷维)都可以定义采样点,因此这是一个非参数的模型。

​ 我们考虑下面这样一个hierarchical的模型:

一个Dirichlet distribution是定义在K维的单纯形上面的分布:

我们说具有以下密度函数形式的称为Dirichlet 分布:
p(y1,…,yk)=Γ(∑k=1Kαk)∏k=1KΓαk∏k=1Kykαk−1p(y_1,\dots,y_k) = \frac{\Gamma(\sum_{k=1}^K\alpha_k)}{\prod_{k=1}^{K}\Gamma\alpha_k}\prod_{k=1}^{K} y_k^{\alpha_k-1} p(y1​,…,yk​)=∏k=1K​Γαk​Γ(∑k=1K​αk​)​k=1∏K​ykαk​−1​

Dirichlet 分布的性质

1.可加性:

若有:
(π1,…,πk)∼Dirichlet(α1,…,αk)则(π1+π2,π3,…,πk)∼Dirichlet(α1+α2,…,αk)(\pi_1, \dots, \pi_k) \sim Dirichlet(\alpha_1, \dots, \alpha_k)\\ 则(\pi_1+\pi_2, \pi_3,\dots,\pi_k) \sim Dirichlet(\alpha_1+\alpha_2,\dots, \alpha_k) (π1​,…,πk​)∼Dirichlet(α1​,…,αk​)则(π1​+π2​,π3​,…,πk​)∼Dirichlet(α1​+α2​,…,αk​)
2.累乘性质:
若有(π1,…,πk)∼Dirichlet(α1,…,αk)(τ1,τ2)∼Dirichlet(α1β1,α1β2)其中β1+β2=1则(π1τ1,π1τ2,π2,…,πk)∼Dirichlet(α1β1,α1β2,…,αk)若有(\pi_1, \dots, \pi_k) \sim Dirichlet(\alpha_1, \dots, \alpha_k)\\ (\tau_1, \tau_2)\sim Dirichlet(\alpha_1\beta_1, \alpha_1\beta_2)\\ 其中\beta_1+\beta_2 = 1\\ 则(\pi_1\tau_1, \pi_1\tau_2, \pi_2,\dots,\pi_k)\sim Dirichlet(\alpha_1\beta_1, \alpha_1\beta_2,\dots,\alpha_k) 若有(π1​,…,πk​)∼Dirichlet(α1​,…,αk​)(τ1​,τ2​)∼Dirichlet(α1​β1​,α1​β2​)其中β1​+β2​=1则(π1​τ1​,π1​τ2​,π2​,…,πk​)∼Dirichlet(α1​β1​,α1​β2​,…,αk​)
那么Dirichlet Process可以看成无穷维度的Dirchlet分布:

Dirichlet process

狄利克雷过程是定义在分布(概率测度)上的分布,对于任意base distribution H的有限划分,有
(F(A1),…,F(Ar))∼D(αH(A1),…,αH(Ar))(F(A_1),\dots,F(A_r))\sim \mathcal{D}(\alpha H(A_1),\dots,\alpha H(A_r)) (F(A1​),…,F(Ar​))∼D(αH(A1​),…,αH(Ar​))
其中D\mathcal{D}D是Dirichlet 分布。

E(F(Ai))=αH(Ai)αH(Ai)+α∑i≠jH(Aj)=H(Ai)Var(F(Ai))=α2H(Ai)∑i≠jH(Aj)[αH(Aj)+α∑i≠jH(Aj)]2(α+1)=H(Ai)(1−H(Ai))α+1E(F(A_i))=\frac{\alpha H(A_i)}{\alpha H(A_i) + \alpha \sum_{i \neq j} H(A_j)} = H(A_i)\\ Var(F(A_i))=\frac{\alpha^2 H(A_i) \sum_{i \neq j} H(A_j)}{[\alpha H(A_j) + \alpha \sum_{i \neq j} H(A_j)]^2 (\alpha +1)}=\frac{ H(A_i) (1-H(A_i))}{\alpha +1} E(F(Ai​))=αH(Ai​)+α∑i=j​H(Aj​)αH(Ai​)​=H(Ai​)Var(F(Ai​))=[αH(Aj​)+α∑i=j​H(Aj​)]2(α+1)α2H(Ai​)∑i=j​H(Aj​)​=α+1H(Ai​)(1−H(Ai​))​
注意到Dirichlet是离散的分布,分布函数是一个阶梯函数。

Dirichlet 后验

假设我们从Dirichlet过程F中采样出来了θ1,...θn\theta_1, ...\theta_nθ1​,...θn​,根据bayes公式我们可以算得后验分布:
(F(A1),…,F(Ar)∣θ1,…,θn)∼D(αH(A1)+n1,…,αH(Ar)+nr)(G∣θ1,…,θn)∼DP(a+n,αH+∑i=1nδiα+n)=DP(α+n,αα+nH+nα+n∑i=1nδin)(F(A_1),\dots,F(A_r)|\theta_1, \dots,\theta_n)\sim \mathcal{D}(\alpha H(A_1)+n_1,\dots,\alpha H(A_r)+n_r)\\ (G|\theta_1, \dots,\theta_n)\sim DP(a+n,\frac{\alpha H + \sum_{i=1}^n \delta_i}{\alpha +n})=DP(\alpha+n,\frac{\alpha }{\alpha+n} H +\frac{n}{\alpha+n}\frac{\sum_{i=1}^n \delta_i}{n}) (F(A1​),…,F(Ar​)∣θ1​,…,θn​)∼D(αH(A1​)+n1​,…,αH(Ar​)+nr​)(G∣θ1​,…,θn​)∼DP(a+n,α+nαH+∑i=1n​δi​​)=DP(α+n,α+nα​H+α+nn​n∑i=1n​δi​​)
注意到后验分布的基分布是关于原来先验的基分布H和经验分布∑i=1nδθi/n\sum_{i=1}^n\delta_{\theta_i}/n∑i=1n​δθi​​/n的加权分布

生成Dirichlet Process

Blackwell-MacQueen Urn Scheme

生成过程:

每一个Θ\mathbb{\Theta}Θ中的值都对应一个独立的颜色,从θ∼G\theta \sim Gθ∼G取球的颜色,我们有一个缸来装球。最开始缸里没有球,我们从分布H中取颜色,用这个颜色涂一个球,放入缸中。在接下来的步骤中(n+1步),我们要么以概率αα+n\frac{\alpha}{\alpha+n}α+nα​选个新的颜色,用这个颜色涂一个球放进缸里,要么以概率nα+n\frac{n}{\alpha+n}α+nn​从缸里取一个球,用这个球的颜色涂一个新的球,再把两个球一起放进去。

Stick-breaking 生成

考虑一根长度为1的棍子,我们在β1\beta_1β1​点处掰开,该段的概率π1=β1\pi_1=\beta_1π1​=β1​等于刚刚掰掉那段的长度,以此类推。具体的参考下面的slides:


参考网址:

1.Dirichlet Process tutorial(pdf)

2.Dirichlet Processes: Tutorial and Practical Course

3.Bayesian Nonparametrics

4.Introduction to the Dirichlet Distribution and Related Processes

Dirichlet Process(狄利克雷过程)相关推荐

  1. 狄利克雷分布公式_Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)...

    Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程) Dirichlet Distribution(狄利克雷分布)与Dirichlet Pr ...

  2. 【算法】狄利克雷过程 (Dirichlet过程)

    本小节是层次狄利克雷过程的笔记. 狄利克雷混合模型DPMM是一种可以自动确定聚类类别数量的聚类方法. 狄利克雷过程DP是"分布的分布",由2个参数和确定,即.其中是分布参数,值越大 ...

  3. Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)

    Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程) 请看,我师兄的写的文章http://www.datalearner.com/blog/ ...

  4. 狄利克雷过程(dirichlet process )和分布

    狄利克雷过程(dirichlet process )是目前变参数学习(non parameter)非常流行的一个理论,很多的工作都是基于这个理论来进行的,如HDP(hierarchical diric ...

  5. 狄利克雷过程(dirichlet process )的五种理解

    狄利克雷过程(dirichlet process )是目前变参数学习(non parameter)非常流行的一个理论,很多的工作都是基于这个理论来进行的,如HDP(hierarchical diric ...

  6. 狄利克雷过程(Dirichlet Process)

    0. 引入 现观察得到两个样本 θ1,θ2\theta_1,\theta_2,来推测它们可能来自的分布: 假设来自于连续型概率密度函数, θ1,θ2∼H(θ)\theta_1,\theta_2\sim ...

  7. 【转帖】Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)原文https://www.datalearner.com/blog/10514

    beta分布的R语言实例 首先,我们可以画一个beta分布的概率密度函数. set.seed(1)x<-seq(0,1,length.out=10000)plot(0,0,main='proba ...

  8. 层次狄利克雷过程HDP(Hierarchical Dirichlet Processes)

    HDP本质是一个聚类算法,自动决定聚类的个数. HDP-HMM也是一个聚类算法,自动决定HMM的隐状态的个数,以每个隐状态作为一个聚类. LDA是主题模型,可以被用作聚类算法. HDP也是个主题模型. ...

  9. Dirichlet Process Dirichlet Distribution

    狄利克雷过程(dirichlet process )是目前变参数学习(non parameter)非常流行的一个理论,很多的工作都是基于这个理论来进行的,如HDP(hierarchical diric ...

最新文章

  1. LeetCode简单题之字符串中的单词数
  2. P1287 盒子与球(python3实现)
  3. 蓝桥杯基础练习字母图形
  4. 有一列数列,1,11,21,1211,111221,.........,
  5. spring学习--基于注解 注入属性
  6. 【OpenCV学习笔记】【编程实例】二(图像的旋转和翻转)
  7. 吴锦华/明鑫: 用户态文件系统(FUSE)框架分析和实战
  8. 快播之父卷土重来 发布升级版快播,首个区块链视频Bliface
  9. sumatrapdf反向搜索功能设置
  10. 【Python数据分析-8】:Numpy常用操作-arange函数、linspace函数与运算
  11. Mysql UDF Bug “ERROR 1125 (HY000): Function ‘xxx‘ already exists“
  12. 数字人民币的基础:共识与信任
  13. 基于JS实现购物车图片局部放大预览效果
  14. 基金收益率计算1:资管业务、资管产品和基金
  15. 一种营销新玩法微信分销系统
  16. 天圆地方· 围棋界的盲棋天才 -- 鲍云
  17. 【CSS】元素的伪类
  18. spring.jpa.hibernate.naming.physical-strategy
  19. 什么是Tick 数据?
  20. python实现调用百度API批量翻译单词

热门文章

  1. Python办公自动化EXCEL操作
  2. 金仓数据库KingbaseES监控工具—kmonitor问题及解决方法
  3. OEA ORM中的分页支持
  4. 万物皆可NFT,元宇宙中的NFT到底是什么?
  5. 【转载】CFC 心得
  6. 神州数码:防火墙上配置NAT
  7. Could not autowire field错误总结
  8. 数字逻辑-头歌实训作业-计数器设计与应用-24小时计时器(Logisim)
  9. php codeigniter 语言,利用 PHP 语言, CodeIgniter 框架, MySQL 数据库搭建简单的 Forum...
  10. python--谷歌恐龙快跑小项目