该模型假设一篇文章是由多个分布所产生的。此处,模型简化为由一个主题分布和一个背景词分布。 接下来需要求出模型的各个分布的参数,课程在这里假设其他...
发现K个主题 计算每个文档包含哪些主题 此处引入了单词集,用来计算各主题的词分布。 通过调整模型的参数,使得生成数据的条件概率最大。 可以用最大...
文本表示有很多种,不同的种类对应着不同的应用场景和算法。 基于单词的表示方法有如下几个好处 通用性和鲁棒性:可以应用于多种自然语言 不需要太多人...
1. 近似算法 t 时刻最有可能的状态,这个公式取值最大的 i 2. 维比特算法 t 时刻状态为 i 的最大概率(在该模型下,观测序列为O,且t...
1.1 监督学习方法 已知S个长度相同的观测序列和对应的状态序列,可以通过极大似然估计法。频率算概率:转移概率,观测概率,初始状态概率 1.2 ...
1.1 直接计算法 由于已知马尔可夫模型参数和观察序列,所以有 模型产生某一状态序列的概率 模型产生某一状态序列时得到某一观测序列的概率 上面两...
1. 马尔可夫模型 特征: 有限历史假设该随机变量的概率,只取决于前面一个随机变量 时间不变性时间变化不影响各随机变量的概率 但是n-gram模...
所谓搭配,感性理解可以认为搭配就是自然语言中经常联合一起使用的词。比如我们小学英语经常被的词组等,这章讨论的问题便是如何通过一些技术手段找到常用...
在香农的信息论里面,把信息本身看成是一个随机变量,因此要量化信息,自然就是同随机变量的概率以量化。 关于熵的数理运算完全可用概率来理解,依然讲究...