使用鞅(Martingale)的早停方法解决赌徒破产问题

题干

非对称随机游走过程的一个实现

对于一个(不对称的)随机游走过程S_n=\sum_{i=0}^n X_i,其中X_1,\cdots,X_n为离散的独立同分布随机变量,服从以下变化:

X_i=\left\{\begin{array} \\ 1 & \text{with probability $p$} \\ -1 & \text{with probability $q:=1-p$} \end{array}\right.,\qquad p\neq q,\;\;p+q=1

假设过程初始在零点,即S_0=0;假设两个边界\alpha<0<\beta,若过程在某一时刻\tau接触到任意一条边界则停止,请问过程停止于边界\alpha的概率p_a:=\mathbb{P}(X_\tau=\alpha)是多少。

注意: 区分随机过程的上升概率p以及停止于边界的概率p_a,p_\beta


题解

针对赌徒破产问题有许多种不同的求解方法,这里我们将介绍其中一种使用鞅(Martingale)的方法。对于题干所述的随机过程S_n,很明显由于限定p\neq qS_n自身并不是一个鞅。对于此类非对称随机游走过程而言,我们发现M_n:=\left(\frac{q}{p}\right)^{S_n}是一个期望为1的鞅,具体证明过程如下:

\begin{aligned} \mathbb{E}[M_{n+1}|\mathcal{F}_n] &= \mathbb{E}\left[ \left( \frac{q}{p} \right)^{S_{n+1}} |\mathcal{F}_n \right] \\ \\ &= \mathbb{E}\left[ \left( \frac{q}{p} \right)^{S_{n}}\left( \frac{q}{p} \right)^{X_{n+1}} |\mathcal{F}_n \right] \\ \\ &= \left( \frac{q}{p} \right)^{S_{n}}\mathbb{E}\left[ \left( \frac{q}{p} \right)^{X_{n+1}} |\mathcal{F}_n \right],&\text{在可测集$\mathcal{F}_n$的信息下,$S_n$为已知量} \\ \\ &= \left( \frac{q}{p} \right)^{S_{n}} \left[ p\left( \frac{q}{p} \right)^{+1}+q\left( \frac{q}{p} \right)^{-1} \right] \\ \\ &= \left( \frac{q}{p} \right)^{S_{n}}\underset{=1}{\left[ q+p \right]} \\ \\ &= \left( \frac{q}{p} \right)^{S_{n}} =: M_n&\hfill\square \end{aligned}

同样可知M_0=\left(\frac{q}{p}\right)^0=1,即M_n为一个期望为1的鞅。根据可选停时定理(Optional Stopping Theorem),一个早停(Early Stopped)的鞅依然具有同样的期望。我们设\tauS_n接触到\alpha\beta的步数,则有:

\begin{aligned} \mathbb{E}[M_\tau] = p_\alpha M_\tau|_{S_n=\alpha} + p_\beta M_\tau|_{S_n=\beta} &\overset{!}{=} 1 \\ \\ p_\alpha \left( \frac{q}{p} \right)^\alpha + (1-p_\alpha)\left( \frac{q}{p} \right)^\beta &= 1 \\ \\ p_\alpha\left( \left( \frac{q}{p} \right)^a - \left( \frac{q}{p} \right)^\beta \right) &= 1 - \left( \frac{q}{p} \right)^\beta \\ \\ p_a &= \frac{1 - \left( \frac{q}{p} \right)^\beta}{\left( \frac{q}{p} \right)^a - \left( \frac{q}{p} \right)^\beta}&\hfill\square \end{aligned}\tag{1.1}

同理可根据p_\alpha+p_\beta=1得出p_\beta

注意: 该结论只用于非对称随机游走,即p\neq q的情况。对于对称随机游走(p=q),我们发现公式1.1的结果是未定义的(分母为零)。针对这种情况,直接使用S_n为鞅的性质,并同样应用可选时停定理即可得p_\alpha=\frac{\beta}{\beta-\alpha}


参考

如有错误欢迎指出,感谢。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容