d表示文章,z表示主题,w表示单词
这里意思是,狄利克雷先验分布 产生 一组 多项式分布集合
也就是说 狄利克雷分布 产生 主题分布 (也就是doc-topic分布)(超参数 α \alpha α情况下 )

贝叶斯思想中:先验概率+参数估计=后验概率

beta分布:

beta分布中 beta分布研究的是 “一个长度为k的乱序序列(序列中每个数符合均匀分布)中,第k个大的数满足什么分布”的问题。(链接中对应部分的含糊自我概括版),
也就是说,对于序列中每个数,beta可以给出这个数的一个分布
也就是说,对序列中的每个数,只要知道这个数在集合中的排序大小,beta分布给出这个数的概率分布,概率分布可以给出这个数最有可能存在的区间范围。
其实beta分布也就是,这个数,这个序列的先验知识

狄利克雷:

狄利克雷是beta分布的高维版本,可以得到多项式的先验分布
我们这样假设,一组多项式分布,里面每个分布都不相同,需要得到这些决定他们不同的参数,(多项式的参数应该是p1,p2,p3…pn这种?)
然后狄利克雷分布就会产生这些多项式分布的参数的先验(先验:凭经验判断的可能的概率分布),换句话说,狄利克雷分布在没有其它条件的情况下,产生多项式参数的概率分布(一个复杂式子),在这个概率分布下随便丢一次骰子,得到多项式参数(p1:0.5,p2:0.3),也就找到了对应的多项式分布(情感:0.5,经济:0.3),然后从对应的多项式分布中丢一次骰子,得到具体的topic类别(情感)。

参考链接csdn_狄利克雷…
关于狄利克雷一些详细的推导datalearner

补充:
LDA生成过程 :来源:csdn_通俗理解lda(巨长)
另一个链接的生成方式:一个意思。通俗理解lda july

我也不知道对不对,有问题麻烦指出!!感恩!

【后续补充】
lda的其它说法:
不知道怎么得出来的:(和迪利克雷采样有关)
“ α \alpha α代表文档-主题密度,而 β \beta β代表主题-词密度,其中, α \alpha α值越高就代表文档由更多主题组成,而 α \alpha α值越低,文档包含的主题就会更少。另一方面, β \beta β越高就表示主题由语料库中的大量单词组成,而 β \beta β值越低则说明主题由越少的单词组成。”

参考:知乎-

【LDA】LDA主题模型笔记—主要是狄利克雷相关推荐

  1. LDA文本主题模型的学习笔记

    引言 我们经常会听到LDA文本主题模型,经常用于文本分类.LDA由Blei, David M..Ng, Andrew Y..Jordan于2003年提出,用来推测文档的主题分布.它可以将文档集中每篇文 ...

  2. 主题模型TopicModel:隐含狄利克雷分布LDA

    http://blog.csdn.net/pipisorry/article/details/42649657 主题模型LDA简介 隐含狄利克雷分布简称LDA(Latent Dirichlet all ...

  3. lda主题模型困惑度_机器学习-LDA主题模型笔记

    LDA常见的应用方向: 信息提取和搜索(语义分析):文档分类/聚类.文章摘要.社区挖掘:基于内容的图像聚类.目标识别(以及其他计算机视觉应用):生物信息数据的应用; 对于朴素贝叶斯模型来说,可以胜任许 ...

  4. lda plda主题模型

    主题模型LDA 转自http://blog.csdn.net/v_JULY_v/article/details/41209515?locationNum=1&fps=1 通俗理解LDA主题模型 ...

  5. lda php,主题模型︱几款新主题模型——SentenceLDA、CopulaLDA、TWE简析与实现

    [导读]百度最近开源了一个新的关于主题模型的项目.文档主题推断工具.语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA).Senten ...

  6. LDA等主题模型实战(一)

    文章目录 前言 正文 评估方式 LDA模型 LDA之gibbs采样算法 LDA之EM算法 Biterm Topic Model Topic Modeling with Minimal Domain K ...

  7. python安装lda_python 安装 lda topic主题模型

    python 安装 lda 出现错误 C:\Users\ch>pip install lda Collecting lda Downloading lda-1.0.5.tar.gz (303kB ...

  8. 利用LDA和主题模型发现9种冠状病毒研究趋势

    作者|Adrian Raudaschl 编译|VK 来源|Towards Data Science 尽管目前正在蔓延的冠状病毒疫情已经很可怕,但观察世界各地的学术界和研究界是多么迅速地开始了解这种病毒 ...

  9. 狄利克雷分布主题模型LDA

    狄利克雷分布主题模型LDA 文章目录 狄利克雷分布主题模型LDA 1.整体把握LDA 2.前提知识 2.1 gamma函数 2.2 四个分布 2.2.1 二项分布 2.2.2 多项分布 2.2.3 B ...

最新文章

  1. 在 Django 的 View 中利用 function decorator 可实现一定程度的代码重用
  2. 青少年编程竞赛交流群周报(第039周)
  3. 正则表达式获取TABLE里的内容
  4. 数据结构 栈的应用
  5. 字符转char android,android – 如何在kotlin语言中将char转换为ascii值
  6. React Router 黑笔记?
  7. 列表框QListWidget 类
  8. Python之方法调用
  9. 使用PYTHON统计项目代码行数
  10. 第41讲:Scrapy框架的介绍
  11. 在linux上,为什么不用配置环境变量还能运行java程序呢?
  12. 基于JAVA+SpringMVC+Mybatis+MYSQL的医院预约挂号系统
  13. 成长中不可或缺的是信仰(转载)
  14. DAP -Link 仿真下载 STM32 教程
  15. [流行偶像]分析王菲唱腔的精辟文字(转载)
  16. mac中clion无法运行
  17. Zerg虫族的传说[官方资料]
  18. 前端ui组件(1):日程排班—11个优秀JavaScript 日历插件
  19. Python中亲和度分析时defaultdict的一种典型算法
  20. 【转载】矩阵求导、几种重要的矩阵及常用的矩阵求导公式

热门文章

  1. 社区奖品之小猪猪音箱
  2. docker run和docker start的区别
  3. Acwing第37场周赛题解
  4. 判定两棵树是否是同构树(C语言)
  5. VCU解决方案及核心L9788复杂驱动功能安全审计启动
  6. Merkle Tree (重要)
  7. ContentResolver.query详解
  8. 计算机f5键有什么作用,电脑键盘按F5的作用是什么
  9. 多媒体系统之MediaCodec基本原理及使用(四)
  10. 下载怎么办,试试Aria2