登录注册写文章

蒙特卡洛积分与重要性采样

蒙特卡洛积分与重要性采样

重要性采样在强化学习有着重要作用,它是蒙特卡洛积分的一种采样策略.

目录

概率论基础
蒙特卡洛积分
重要性采样
参考

概率论基础

本文先补充两条基础的概率论公式,方便大家更好地看懂全文
假设某一连续型随机变量 $X$ 的样本空间为 $D$ ,其概率密度分布函数为 $p(x)$ ,则其数学期望为: $E(X) = \int_D xp(x)dx$
若另一连续随机变量Y满足Y = f(X),则Y的数学期望为: $E(Y) = \int_D f(x)p(x)dx$

蒙特卡洛积分

现在假如我们要计算一个定积分: $A = \int^b_a f(x)dx$
我们可以使用牛顿-莱布尼茨通过求原函数来算这个积分(F(x)是f(x)的原函数): $A = \int^b_a f(x)dx = F(b) - F(a)$
如果我们无法求得原函数,那么我们就需要通过蒙特卡洛积分法:

首先我们可以在积分区间 $[a,b]$ 上进行均匀采样得到: ${X_1,\cdots,X_N}$ ,样本对应的函数值为: ${f(X_1),\cdots,f(X_N)}$
然后我们可以求和得到: $F(N) \approx \frac{b-a}{N} \sum^N_{i=1}f(X_i)$

这个方法和黎曼积分非常相似,可以借用黎曼积分的图直观理解: $\frac{b-a}{N}$ 即为我们在曲线中近似的每一个矩形的宽,而 $f(X_i)$ 则为每一个矩形的高,所以我们用这个方法算出的 $F(N)$ 就可以作为A的近似值
这时读者可能有疑问,上面这个方法是不是只能针对均匀分布的数据?如果我在区间上按照概率密度函数 $p(x)$ 进行采样,那结论还成立吗?让我们来推导一下:

首先按照概率密度函数 $p(x)$ 在区间 $[a,b]$ 上进行采样得到数据 ${X_1,\cdots,X_N}$
再构造新的 $F_N$ 函数: $F_N =\frac{1}{N} \sum^N_{i=1} \frac{f(X_i)}{p(X_i)}$

$F_N$ 的数学期望:
到这里我们发现其实前面推导 $p(x)$ 为均匀分布其实是一种特殊情况:
若 $p(x)$ 是 $[a,b]$ 上的均匀分布,则它的表达式为:
则 $F_N(x)$ 的表达式为:
和我们在均匀分布下的结果一致.

重要性采样(Importance Sampling)

定义

通过对蒙特卡洛积分的讲解,我们知道我们可以通过按照函数的分布进行采样求和来近似这个函数.但是现实中往往我们不知道某个函数的分布或者已知某个函数的分布但我们很难按照这个分布采样,那这个时候该怎么办?这时候就要引入我们的重要性采样了.
我们知道 $f(x)$ 在概率分布 $p(x)$ 的期望为: $E[Y] = \int_x f(x)p(x)dx$
因为我们无法直接对分布 $p(x)$ 进行采样,所以我们引入另一个容易采样的分布 $q(x)$ :
$E[Y] = \int_x f(x)p(x)dx = \int_x q(x) \frac{p(x)}{q(x)}f(x)dx$
当我们在新的分布 $q(x)$ 上进行采样的时候就可以估计 $f(x)$ 的期望: $E[Y] = \frac{1}{N} \sum^N_{i=1} \frac{p(x_i)}{q(x_i)}f(x_i)$
我们可以看作是函数 $\frac{p(x_i)}{q(x_i)}f(x_i)$ 在分布 $q(x)$ 上的期望.这里 $\frac{p(x_i)}{q(x_i)}$ 就是重要性权重

作用

我们知道重要性采样就是引入一个新的分布来更好的估计,这解决了原本分布难采样的问题.举个例子.
假设我们要估计一个工厂里面产品的质量,假设每个工厂里面有两条生产线A和B,比例为2比1,通常来说A生产线的质量会比B生产线要好,这个时候我们要估计整个工厂的产品的质量,但是由于生产线的限制,我们不能按照原来AB生产线2比1的比例采样(无法按照原分布采样),我们只能按照AB生产线1比2(新的分布)的比例采样,如果我们直接采样加和平均得到的估计值就是有问题的(采样B生产线的比例比真实的要多,所以得到的结果也比真实产品质量要差),这时候在采样的时候就需要加权,也就是我们的重要性权重,加权的比例是 $\frac{1}{2}$ : $\frac{2}{1}$ = $1:4$ ,这样采样加权平均之后的结果就准确了.
重要性采样还有一个别的作用,就是我们有时候还可以改进原来的分布:
我们可以看到如果我们直接从分布 $p(x)$ 采样,而实际这些样本对应的 $f(x)$ 都很小,采样有限的情况下很有可能都无法得到 $f(x)$ 值比较大的样本,这样估计的期望值不准确;而如果我们找到一个分布 $q(x)$ ,使得它能在 $f(x) * p(x)$ 较大的地方采集到样本,则能更好地逼近我们的期望,而因为有重要性权重来控制新分布的比重,所以结果也不会偏差.
所以选择一个好的新的分布 $q(x)$ 不仅能帮助你更好地采样估计,还能帮助你更好地估计准确.

参考

https://blog.csdn.net/Dark_Scope/article/details/70992266

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

随机模拟-Monte Carlo积分及采样（详述直接采样、接受-拒绝采样、重要性采样）
转载请注明出处 http://www.jianshu.com/p/3d30070932a8作者：@贰拾贰画生 1....
贰拾贰画生阅读 25,760评论 7赞 21
蒙特卡洛理解与python实现2
蒙特卡洛定义模拟是指把某一现实的或抽象的系统的某种特征或部分状态，用另一系统（称为模拟模型）来代替或模拟。为...
_龙雀阅读 6,117评论 0赞 0

神经网络语言建模系列之三：重要性采样
重要性采样（Important Sampling, IS）属于蒙特卡洛（Monte Carlo）方法，被Bengi...
施孙甲由阅读 11,605评论 24赞 82
家长会谈合作
久违的晴天，家长会。家长大会开好到教室时，离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。放学铃声...
飘雪儿5阅读 12,240评论 16赞 22
2019－11－28 周四阴
今天感恩节哎，感谢一直在我身边的亲朋好友。感恩相遇！感恩不离不弃。中午开了第一次的党会，身份的转变要...
余生动听阅读 13,613评论 0赞 11

友情链接更多精彩内容

赞1赞

赞赏

手机看全文