13
6
3
5762
9
1
学习目标 1. 文本聚类概念 Explain the concept of text clustering and why it is usef...
一 概率主题模型 1.1 混合语言模型 如何摆脱背景词(数据中频率高)——常见词不应用分布解释 背景主题模型:生成常用词汇 使用另个分布:需决定...
文本挖掘第二弹 本周目标 正式上车 一 组合关系发现和熵(单词关联挖掘) 1.1熵函数 一个词相随出现的概率定义: 熵函数:表示预测有多困难(0...