在我的文本建模文集里面介绍过Unigram Model 模型,这种模型其实非常的简单,这是因为简单所以我才最先看,毕竟好容易理解嘛!(毕竟之前完全没有接触过,导师交代后才慢慢看论文看的...............本来想打滑稽脸的,但是简书没这个功能 手动流汗流汗中。。。。。。),但是这个模型太过理想化,和我们人类写文章的思路差距有点大了,所以需要找更贴切的模型咯!
这里打算和大家分享一下PLSA 主题模型,这应该算是入门级的算法模型了,也算是比较经典的模型之一了。
以上PLSA模型的文档生成过程就可以用图形化的表示为