统计学习方法——修炼学习笔记19:马尔可夫链蒙特卡罗法

蒙特卡罗法也称统计模拟方法,是通过从概率模型的随机抽样进行近似数值计算的方法。
马尔可夫链蒙特卡罗法是以马尔可夫链为概率模型的蒙特卡罗法。

马尔可夫链蒙特卡罗法构建一个马尔可夫链,使其平稳分布就是要进行抽样的分布,首先基于该马尔可夫链进行随机游走,产生样本的序列,之后使用该平稳分布的样本进行近似数值计算。

Metropolis-Hastings算法是最基本的马尔可夫链蒙特卡罗法。
吉布斯抽样是更简单、使用更广泛的马尔可夫链蒙特卡罗法。

马尔可夫链蒙特卡罗法被应用于概率分布的估计、定积分的近似计算、最优化问题的近似求解等问题,特别是被应用于统计学习中概率模型的学习与推理,是重要的统计学习计算方法。

一、蒙特卡罗法

1、随机抽样

蒙特卡罗法要解决的问题是:

假设概率分布的定义已知,通过抽样获得概率分布的随机样本,并通过得到的随机样本对概率分布的特征进行分析。
比如:
从样本得到经验分布,从而估计总体分布。
或者从样本计算出样本均值,从而估计总体期望。
所以蒙特卡罗法的核心是随机抽样。

蒙特卡罗法
  • 直接抽样法
  • 接收-拒绝抽样法
  • 重要性抽样法

接收-拒绝抽样法,重要性抽样法适合于概率密度函数复杂(如密度函数含有多个变量,各变量相互不独立,密度函数形式复杂),不能直接抽样的情况。

接收-拒绝抽样法
image.png
image.png

接收-拒绝法优点:容易实现,缺点是效率可能不高。
如果p(x)的涵盖体积占cq(x)的涵盖体积的比例很低,就会导致拒绝的比例很高,抽样效率很低。
注意:p(x)与cq(x)很接近,两者涵盖体积的差异也可能很大。

2、数学期望估计

一般的蒙特卡罗法也可用于数学期望估计。


image.png

3、积分计算

一般的蒙特卡罗法也可用于定积分的近似计算,称为蒙特卡罗积分

image.png

二、马尔可夫链

1、基本定义

image.png

2、离散状态马尔可夫链

(1)转移概率矩阵和状态分布
转移概率矩阵
image.png
状态分布
image.png

有限离散状态的马尔可夫链可以由有向图表示
结点表示状态,边表示状态之间的转移,边上的数组表示转移概率。
从一个初始状态出发,根据有向边上定义的概率在状态之间随机跳转(或随机转移),就可以产生状态的序列。
马尔可夫链实际上是刻画随时间在状态之间转移的模型,假设未来的转移状态只有依赖于现在的状态,而与过去的状态无关。

image.png

2、平稳分布

image.png

直观上,如果马尔可夫链的平稳分布存在,那么以该平稳分布作为初始分布,面向未来进行随机状态转移,之后任何一个时刻的状态分布都是该平稳分布

image.png

3、连续状态马尔可夫链

image.png

4、马尔可夫链性质

(1)不可约
image.png

直观上,一个不可约的马尔可夫链,从任意状态出发,当经过充分长时间后,可以到达任意状态

(2)非周期
image.png

直观上,一个非周期性的马尔可夫链,不存在一个状态,从这一个状态出发,再返回到这个状态时所经历的时间长呈一定的周期性

(3)正常返
image.png

直观上,一个正常返的马尔可夫链,其中任意一个状态,从其他任意一个状态出发,当时间趋于无穷时,首次转移到这个状态的概率不为0。

(4)遍历定理
image.png

遍历定理的直观解释:
满足相应条件的马尔可夫链,当时间趋于无穷时,马尔可夫链的状态分布趋近于平稳分布,随机变量的函数的样本均值以概率1收敛于该函数的数学期望。
样本均值可以认为是时间均值,二数学期望是空间均值。遍历定理实际表述了遍历性的含义:当时间趋于无穷时,时间均值等于空间均值。
遍历定理的三个条件:不可约,非周期,正常返,保证了当时间趋于无穷时达到任意一个状态的概率不为0。

遍历均值
image.png
(5)可逆马尔可夫链
image.png

直观上,如果有可逆的马尔可夫链,那么以该马尔可夫链的平稳分布作为初始分布,进行随机状态转移,无论是面向未来还是面向过去,任何一个时刻的状态分布都是该平稳分布。

细致平衡方程
image.png

三、马尔可夫链蒙特卡罗法

1、基本想法

马尔可夫链蒙特卡罗法更合适于随机变量是多元的、密度函数是非标准形式的、随机变量各分量不独立等情况。


image.png
马尔可夫链蒙特卡罗法的基本想法:
image.png
构建具体的马尔可夫链:
  • 连续变量的时候,需要定义转移核函数。
  • 离散变量的时候,需要定义转移矩阵。

一个方法是定义特殊的转移核函数或者转移矩阵,构建可逆马尔可夫链,这样可以保证遍历定理成立。
常用的马尔可夫链蒙特卡罗法有Metropolis-Hastings算法,吉布斯抽样。

由于这个马尔可夫链满足遍历定理,随机游走的起始点并不影响得到的结果,即从不同的起始点出发,都会收敛到同一平稳分布。

马尔可夫链蒙特卡罗法的收敛性的判断通常是经验性的。
比如在马尔可夫链上进行随机游走,检验遍历均值是否收敛。具体地,每隔一段时间取一次样本,得到多个样本以后,计算遍历均值。
再比如,在马尔可夫链上并行进行多个随机游走,比较各个随机游走的遍历均值是否接近一致。

马尔科夫链蒙特卡罗法中得到的样本序列,相邻的样本是相关的,而不是独立的。
因此,在需要独立样本时,可以在该样本序列中再次进行随机抽样。
比如,每隔一段时间取一次样本,将主要得到的子样本集合作为独立样本集合。

马尔可夫链蒙特卡罗法比接受-拒绝法更容易实现,因为只需要定义马尔可夫链,而不需要定义建议分布。
一般来说马尔可夫链蒙特卡罗法比接受-拒绝法效率更高,没有大量被拒绝的样本,虽然燃烧期的样本也要抛弃。

2、基本步骤

可以将马尔可夫链蒙特卡罗法概括为以下三步。


image.png

3、马尔可夫链蒙特卡罗法与统计学习

image.png

贝叶斯学习中经常需要进行三种积分运算:

  • 归范化
  • 边缘化
  • 数学期望
image.png

马尔可夫链蒙特卡罗法为这些计算提供了一个通用的有效解决方案。

四、Metropolis-Hastings算法

1、基本原理

(1)马尔可夫链
image.png
定理
image.png
(2)建议分部

两种常用形式:


image.png
(3)满条件分部
image.png

2、Metropolis-Hastings算法

image.png

3、单分量Metropolis-Hastings算法

在Metropolis-Hastings算法中,通常需要对多元变量分布进行抽样,有时对多元变量分布的抽样是困难的。
可以对多元变量的每一变量的条件分布依次分别进行抽样,从而实现对整个多元变量的一次抽样,这就是单分量Metropolis-Hastings算法。


image.png
image.png

五、吉布斯抽样

吉布斯抽样是马尔可夫链蒙特卡罗法的常用算法。可认为是Metropolis-Hastings算法的特殊情况,但是更容易实现,因而被广泛使用。

1、基本原理

吉布斯抽样用于多元变量联合分布的抽样和估计。
基本做法:从联合概率分布定义满条件概率分布,依次对满条件概率分布进行抽样,得到样本的序列。
可以证明这样的抽样过程是在一个马尔可夫链上的随机游走,每一个样本对应着马尔可夫链的状态,平稳分布就是目标的联合分布。
整体成为一个马尔可夫链蒙特卡罗法,燃烧期之后的样本就是联合分布的随机样本。

image.png

吉布斯抽样是单分量Metropolis-Hastings算法的特殊情况。
image.png

2、吉布斯抽样算法

image.png
单分量Metropolis-Hastings算法
  • 抽样会在样本点之间移动,但其间可能在某一些样本点上停留(由于抽样被拒绝)
  • 适合于满条件概率分布不容易抽样的情况,使用容易抽样的条件分布作建议分布。
吉布斯抽样算法
  • 抽样会在样本点之间持续移动
  • 适合于满条件概率分布容易抽样的情况。

3、抽样计算

吉布斯抽样中需要对满条件概率分布进行重复多次抽样。可以利用概率分布的性质提供抽样的效率。
以贝叶斯学习为例介绍这个技巧


image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354

推荐阅读更多精彩内容

  • 蒙特卡罗法(Monte Carlo Method)也称为统计模拟方法,是通过概率模型的随机抽样进行近似数值计算的方...
    单调不减阅读 2,321评论 0 2
  • 今天四叔生日,照例一大家子的人给他过生日,我本来是不想参加这种场合的,大姐说我现在应该去,是代表我们家。人不能只做...
    杨淑心阅读 140评论 0 2
  • 入秋了,又是一年中收获的季节,成熟的玉米像个胖娃娃,趴在玉米秆上晒太阳。圆滚滚的黄豆在豆荚里睡大觉,还有那纤细的水...
    王梓萱1阅读 194评论 0 1
  • 你爱我,我爱你,就是爱情,就是爱吗? 但似乎每次都是我聆听你说的,我总是默默无语,又或者是你听我说,但最后...
    Lara88阅读 538评论 0 2