1、 什么样的问题需要 HMM 模型
- 基于序列的,比如时间序列,或者状态序列。
- 有两类数据,一类序列数据是可以观测到的,即观测序列;而另一类数据是不能观察到的,即隐藏状态序列,简称状态序列。
2、HMM 模型两个假设
- 齐次马尔科夫链假设
- 观测独立性假设
一个 HMM 模型,可以由隐藏状态初始概率分布 Π , 状态转移概率矩阵 A 和观测状态概率矩阵 B 决定。Π , A 决定状态序列,B 决定观测序列
3、HMM 模型的三个基本问题
- 评估观察序列概率。即给定模型 λ=(A,B,Π) 和观测序列 O={o1,o2,...oT},计算在模型λ下观测序列 O 出现的概率 P(O|λ);前后向算法
- 模型参数学习问题。即给定观测序列O={o1,o2,...oT},估计模型λ=(A,B,Π)的参数,使该模型下观测序列的条件概率P(O|λ)最大;鲍姆-韦尔奇算法原理使用的就是EM算法的原理
- 预测问题。即给定模型 λ=(A,B,Π) 和观测序列 O={o1,o2,...oT},求给定观测序列条件下,最可能出现的对应的状态序列;维比特算法
4、最大熵马尔科夫模型
在序列标注问题中,隐状态不仅和单个观测状态相关,还和观测序列的长度、上下文等信息相关。最大熵马尔科夫模型在建模时,去除了隐马尔可夫模型中观测状态相互独立的假设,考虑了整个观测序列,因此获得更强的表达能力。最大熵马尔科夫模型会产生标注偏置问题,条件随机场在最大熵马尔科夫模型的基础上,进行了全局归一化。
参考链接
本文非原创,学习笔记。如有侵权,留言及时删除