隐马尔科夫模型(HMM)

隐形马尔可夫模型,英文是 Hidden Markov Models,所以以下就简称 HMM。
既是马尔可夫模型,就一定存在马尔可夫链,该马尔可夫链服从马尔可夫性质:即无记忆性。也就是说,这一时刻的状态,受且只受前一时刻的影响,而不受更往前时刻的状态的影响。
其实隐马尔科夫模型就是一个三元的元组,隐含状态转移概率矩阵 A,观测状态转移概率矩阵 B,初始状态概率矩阵π。
这里说说大概怎么用这个模型。
假设我有几个句子:

要买\o 一个\o 70平\m 房子\o 价格\o 6000元\j 每平\o
想\o 买个\o 大小\o 80\m 房子\o 价格\o 5000元\j 每平\o
一个\o 100平\m 房子\o 每平\o 9000\j
有没有\o 60平\m 房子\o 两个人\o 住\o 够\o
大小\o 100平\m 房子\o 价格\o 80万\j

那么这些句子连在一起我们就可以看做是一个链,在这个链中,每个词就是一个可观测序列,每个词对应的标签就是它的隐藏状态。例如:要买\o,那么要买就是可观测的,\o就是它的隐藏状态。
对于这个链的三个状态分别如下:

  • 初始状态 π:表示隐含状态在初始时刻t=1的[概率]矩阵,(例如t=1时,P(S1)=p1、P(S2)=P2、P(S3)=p3,则初始状态概率矩阵 π=[ p1 p2 p3 ]。
    那么该链隐藏状态的初始概率为,
    \o: 22/30
    \m: 5/30
    \j: 4/30
    分别就是每个隐状态出现的次数和所有隐状态次数作比较。

  • 隐含状态转移概率矩阵 A:描述了HMM模型中各个状态之间的转移概率。其中Aij = P( Sj | Si ),1≤i,j≤N.表示在 t 时刻、状态为 Si 的条件下,在 t+1 时刻状态是 Sj 的概率。
    p(sj|si) = #(si,sj)/(si)

sj/si \o \m \j
\o 13/22 5/22 4/22
\m 1 0 0
\j 1 0 0

这个矩阵就是指每个隐藏状态和它前一刻的状态的转移概率。

  • 观测状态转移概率矩阵 B(混淆矩阵):令N代表隐含状态数目,M代表可观测状态数目,则:Bij = P( Oi | Sj ), 1≤i≤M,1≤j≤N.表示在 t 时刻、隐含状态是 Sj 条件下,观察状态为 Oi 的概率。
    p(oi|sj) = #(oi,sj)/#(sj)
sj/oi 要买 一个 70平 房子 价格 每平 6000元 买个 大小 80 5000元 100平 9000 有没有 60平 两个人 80万
\o 1/22 2/22 0 5/22 3/22 3/22 0 1/22 1/22 2/22 0 0 0 0 1/22 0 1/22 1/22 1/22 0
\m 0 0 1/5 0 0 0 0 0 0 0 1/5 0 2/5 0 0 1/5 0 0 0 0
\j 0 0 0 0 0 0 1/3 0 0 0 0 1/3 0 1/3 0 0 0 0 0 0

一般的,可以用λ=(A,B,π)三元组来简洁的表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态之间的概率关系。


一般HMM模型对应着三个问题,我们来看看百度怎么说的这三个问题:

  • 评估问题:
    给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样有效计算某一观测序列的概率,进而可对该HMM做出相关评估。例如,已有一些模型参数各异的HMM,给定观测序列O=O1O2O3…Ot,我们想知道哪个HMM模型最可能生成该观测序列。通常我们利用forward算法或者Backward算法分别计算每个HMM产生给定观测序列O的概率,然后从中选出最优的HMM模型。
    对于上面咱们自己建的那个模型,这个问题就是给定一句话,并给出这句话中每个词对应的标签,根据模型,计算每个标签的概率。

  • 解码问题:
    给定观测序列 O=O1O2O3…Ot 和模型参数λ=(A,B,π),怎样寻找某种意义上最优的隐状态序列。在这类问题中,我们感兴趣的是马尔科夫模型中隐含状态,这些状态不能直接观测但却更具有价值,通常利用Viterbi算法来寻找。
    对于上面已经建好的模型,给定三个词,那么,根据模型,计算产生这三个词分别对应了什么标签。

  • 学习问题:
    即HMM的模型参数λ=(A,B,π)未知,如何调整这些参数以使观测序列O=O1O2O3…Ot的概率尽可能的大。通常使用Baum-Welch算法以及Reversed Viterbi算法解决。
    假设我只有一句话和这句话有哪些标签,那么我们如何建立一个模型,使我们知道的句子的概率尽可能的大。


这里大概讲两种算法:

向前算法

假设我拿上面的一句话来做向前算法:
一个\o 100平\m 房子\o 每平\o 9000\j

  • 那么在t=1时刻,该时刻标签为\o,如果该时刻的词是一个,那么概率就是
    P(一个,\o)=P(\o的初始概率) x P(一个 | \o)=22/30 x 2/22
  • 在t=2时刻该词为100平,那么\m概率
    P(t=1 一个,t=2 100平,t=2 \m) = [P(t=1 一个,t=1 \o) x P(t=2 \m | t=1 \o) +P(t=1 一个,t=1 \m) x P(t=2 \m | t=1 \m) + P(t=1 一个,t=1 \j) x P(t=2 \m | t=1 \j)] x P(t=2 100平 | t=2 \m)
  • 在t=3时刻该词为房子,那么\o的概率
    P(t=1 一个,t=2 100平,t=3 房子,t=3 \o)
    ...这里就不推了,太多了,不过计算方式如上。

维特比求解

也是我们假设我们有一句话:
一个 100平 房子 每平 9000
在这里我们只知道这个序列的可观测状态,想要获得每一个词的隐含状态。那么,

  • t=1时刻
    P(\o)=P(一个|\o) x P(\o|初始概率)=2/22 x 22/30
    P(\m)=P(一个|\m) x P(\m|初始概率)=0 x 5/30
    P(\j)=P(一个|\j) x P(\j|初始概率)=0 x 4/30
    那么一个这个词最有可能的便签就是\o
  • t=2时刻
    P(t=1 \o,t=2 \o) = P(t=1 \o) x P(\o -> \o) x P(100平|\o)=(2/22 x 22/30) x 13/22 x 0
    P(t=1 \o,t=2 \m) = P(t=1 \o) x P(\o -> \m) x P(100平|\m)
    P(t=1 \o,t=2 \j) ...
    P(t=1 \m,t=2 \o) ...
    P(t=1 \m,t=2 \m) ...
    P(t=1 \m,t=2 \j) ...
    P(t=1 \j,t=2 \o) ...
    P(t=1 \j,t=2 \m) ...
    P(t=1 \j,t=2 \j) ...
  • t=3时刻计算方式如上,他们的状态都只和上一时刻t-1有关。

最后我们可以获得每一时刻最大概率的隐藏状态就是每一时刻观测状态对应的隐藏状态。
这个算法大概就是通过已知的可以观察到的序列,和一些已知的状态转换之间的概率情况,通过综合状态之间的转移概率和前一个状态的情况计算出概率最大的状态转换路径,从而推断出隐含状态的序列的情况。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,254评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,875评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,682评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,896评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,015评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,152评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,208评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,962评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,388评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,700评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,867评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,551评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,186评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,901评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,689评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,757评论 2 351

推荐阅读更多精彩内容

  • 本系列第三篇,承接前面的《浅谈机器学习基础》和《浅谈深度学习基础》。 自然语言处理绪论 什么是自然语言处理? 自然...
    我偏笑_NSNirvana阅读 17,553评论 2 68
  • 隐马尔可夫模型(Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表...
    vlnk2012阅读 6,640评论 3 47
  • 日子过得有点昏昏浩浩,都忘记今天是周六了。可能是昨天回家有点早就误以为昨天是周六了,所以刚刚与老朋友通话时还在提醒...
    灿烂阳光1阅读 184评论 0 4
  • 1. 准备工作 1.1软硬件环境 CPU:64位 OS:Windows 10 1.2 Python3.5 选用Py...
    朱亚超阅读 1,001评论 0 2
  • 我躺在床上,玩着ipad。 等会儿去吃饭,我这么想着。 看了看表,还早,那算了吧,继续 在笑话八卦的页面里切换,用...
    忧郁的鱿鱼阅读 200评论 0 1