作用:对文档抽取主题概率分布
思想:
人类生成文章的过程如下:
比如假设事先给定了这几个主题:Arts、Budgets、Children、Education,然后通过学习训练,获取每个主题Topic对应的词语。然后以一定的概率选取上述某个主题,再以一定的概率选取那个主题下的某个单词,不断的重复这两步,最终生成一篇文章。LDA就是要干这事:根据给定的一篇文档,反推其主题分布。
主题模型LDA
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 本文主要用于理解主题模型LDA(Latent Dirichlet Allocation)其背后的数学原理及其推导过...
- 主题模型 只是看结论没那么复杂,但是理论依据相对麻烦。如图,LDA的粗略示意图,即如何根据X从隐变量推出Z的分布。...
- 课前问答 问:在22.6代码中往LDA中喂数据的时候,为什么要计算TF/ IDF?答:一会解释,不算也可以 主要内...
- 08 主题模型 - LDA 九、LDA参数学习-Gibbs采样 对于一个n维的概率分布π(x1,x2,...,xn...
- 今天青石的票圈出镜率最高的,莫过于张艺谋的新片终于定档了。 一张满溢着水墨风的海报一次次的出现在票圈里,也就是老谋...