《LDA漫游指南》——2.5 狄利克雷分布(Dirichlet Distribution)

简介:

本节书摘来异步社区《LDA漫游指南》一书中的第2章,第2.5节,作者: 马晨,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.5 狄利克雷分布(Dirichlet Distribution)

Dirichlet分布是Beta分布在多项情况下的推广,也是多项分布的共轭先验分布(共轭先验分布将在2.6节进行介绍)。Dirichlet分布的概率密度函数如下:

511e201523f273ac47439f638731612b0055a522

二项分布和多项分布很相似,Beta分布和Dirichlet 分布很相似,至于“Beta分布是二项式分布的共轭先验概率分布,而Dirichlet分布是多项式分布的共轭先验概率分布”这点会在下文中进行说明。

另一个重要的公式是

05d8db1639dc418c9ae2c86ec6bb773f60bbeca9

为了简便表达,公式中引入了希腊字母∆代表B函数的多项版本 。这个公式的结构和证明相似于上文中“β函数和gamma函数的关系——见式(2.6)”,这个证明留给读者来完成。从此,公式中凡是出现积分中连乘时,就要像巴甫洛夫试验中“流着口水的狗”一样警觉,建立起“可以换成gamma函数”的条件反射。

相关文章
|
2天前
|
数据可视化
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
|
1天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
|
2天前
Stata中的治疗效果:RA:回归调整、 IPW:逆概率加权、 IPWRA、 AIPW
Stata中的治疗效果:RA:回归调整、 IPW:逆概率加权、 IPWRA、 AIPW
|
2天前
|
数据可视化
R语言建模收入不平等:分布函数拟合及洛伦兹曲线(Lorenz curve)
R语言建模收入不平等:分布函数拟合及洛伦兹曲线(Lorenz curve)
|
2月前
|
人工智能 atlas
Google Earth Engine(GEE)RADD - RAdar for Detecting Deforestation-基于Sentinel-1的10米空间尺度的湿润热带森林扰动预警数据集
Google Earth Engine(GEE)RADD - RAdar for Detecting Deforestation-基于Sentinel-1的10米空间尺度的湿润热带森林扰动预警数据集
22 0
|
10天前
|
算法 数据可视化 数据挖掘
基于K-means Clustering聚类算法对电商商户进行级别划分(含Octave仿真)
基于K-means Clustering聚类算法对电商商户进行级别划分(含Octave仿真)
35 0
|
10月前
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
|
机器学习/深度学习 传感器 算法
基于最小均值 (LMF) 和最小均方 (LMS) 算法进行系统识别附matlab代码
基于最小均值 (LMF) 和最小均方 (LMS) 算法进行系统识别附matlab代码
|
存储 机器学习/深度学习 搜索推荐
Lec2 协同过滤_基于邻域| 学习笔记
快速学习 Lec2 协同过滤_基于邻域。
57 0
|
人工智能 数据格式
跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图
跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图
200 0
跟着Nature学作图 | 配对哑铃图+分组拟合曲线+分类变量热图