上一篇的文章让我们大概了解了隐马尔可夫的基本结构和基本意义,这篇文章我们主要从数学推导的角度去深刻理解隐马尔可夫是如何工作的。
由以上的分析可知,X1和Z2、X2都是不独立的。
这里和RNN的原理差不多,也都是用来处理有联系的数据。
这里就是类似朴素贝叶斯做广告判断词向量里面的一个假设:每个词之间都是独立的(现实肯定不是)。
这里的假设意思是:当计算过程中确定一个值得时候,比如Zn已知,那么就人为此时的Xn只与Zn相关,与之前的都是独立的。为了计算方便,减少计算量(后面有例子)。
这里的推导有点难理解,下面解释其过程: