为什么要引入采样原理?
因为精确推断随着随机变量数目的增长在时间复杂度上呈现指数级的增长趋势。为了降低计算复杂度,我们采用近似推断技术。本章,我们采用 马尔科夫链蒙特卡洛采样算法(MCMC).
强调下,MCMC本质上是种近似推断技术。
一、随机采样
随机采样,又称为:蒙特卡洛采样。
那么,如何通过给定概率分布p(x)计算出生成样本呢?
主要的方法分别是:线性同余伪随机数法,结合均匀分布将值域固定在[0,1],或通过高斯分布使结果符合正态分布。
二、随机过程和马尔科夫链
什么是随机采样?
从单一随机变量X延伸到随机变量的时间序列下x1,x2,x3...xt,即:随机过程。对于随机过程的求解,采用马尔科夫性,即:当前时间t的状态仅与t-1时刻状态有关,用数学公式表示:
满足上式的随机过程称为马尔科夫过程,也称为:马尔科夫链。
在马尔科夫链下,如何表示t时刻的状态i到t+1时刻的状态j的状态转移呢?
用状态矩阵p,表示如下:
那么,t时刻马尔科夫链的概率分布计算公式如下:
含义:初始概率分布π0,经过t次状态矩阵p的变换,得到新的概率分布πt。使随机变量具备了时序性。
马尔科夫链的性质:任意给定的p和π0,在经过t迭代后都收敛于稳定的状态。用公式表示,即:
π是马尔科夫链的平稳分布。