一般来说,一个随机变量是一个从概率空间到测度空间的可测函数,而一个随机过程是一系列的从相同的概率空间到相同的态空间的可测函数,通常用所有的正实数来做指标。随机过程在金融、运筹、物理等领域有着广泛的应用,也有很多著名的随机过程,例如马尔可夫链、布朗运动、泊松过程。今天我想先来谈一谈泊松过程[wikipedia]。
首先给定一列服从指数分布[wikipedia]E[λ]的独立变量X1,X2,...,取值范围为非负实轴。定义Tn=X1+...+Xn,则Tn关于n非递减,且服从Erlang分布[wikipedia]。对任意的t≥0,定义Nt为最大的n使得Tn≤t(没有的话定义为0),即对于任意的非负t,存在唯一的n使得Tn≤t<T_(n+1),则Nt便定义为n。由于Xi、Tn都是随机变量,则Nt也是一个随机变量,它的取值范围为所有的非负正整数。
注意到,若Nt≥N,因为Nt为最大的整数使得Tn≤t,则必有小一点的N满足T_N≤t;而若T_N≤t,因为Nt为最大的整数使得Tn≤t,则必有Nt≥N。也就是说,事件Nt≥N与事件T_N≤t是完全相同的,而我们是知道T_N是服从Erlang分布的,由T_N分布的表达式,我们可以算出Nt是服从Poi(tλ)(λ为前面指数分布的参数),即参数为tλ的泊松分布[wikipedia]。至此我们才知道为什么这样的随机过程叫做“泊松过程”。
当然,你有可能会有疑问,为什么一开始设定独立变量Xi要服从指数分布呢?一是因为指数分布本身有着很广泛的应用,很重要,另外一个更关键的原因就是它具有memoryless[wikipedia]的性质,就是满足下式
即X>t+s在X>t中的权重,与X>s在原来的全部X>0中的权重是相同的,也就是说,如果我们将起点0向右移,不管移到哪里,右侧仍然是一个指数分布(当然需要正规化一下,因为右侧的积分不能达到全概率1)。另外,满足memoryless的非负随机变量经证明,只有指数分布。这个性质在随机过程中有着非常重要的意义,随机过程可以看做是随着时间t变化得到的结果,而且大部分情况下都要依赖于已经发生的结果,但是如果随机过程也有这样类似的性质,即不管从哪个时间开始考虑,得到的结果整体类型都差不多,那会极大地降低研究的难度。所以我想这是取X服从指数分布的一个可能性吧。
泊松过程还有一个重要的性质,就是它是一个下鞅(submartingale)。一个随机过程成为鞅[wikipedia],是指第一它满足每个时间态Nt都是可积的,而泊松过程中的Nt服从泊松分布,自然满足;第二就是E[Nt|Ns]=Ns,s<t,即Nt关于Ns的条件期望就是Ns。关于条件期望,上次稍微聊了一些,有兴趣的朋友可以稍作参考[数学基础-条件期望,简书]。关于这第二条定义,也可以理解为Nt向前面的时间s“投影”,得到的结果就是时刻s时的Ns。而下鞅就是将第二条改为E[Nt|Ns]≥Ns。
通过指数分布的memoryless性质,可以得到泊松过程有类似的结果,即Nt-Ns与N_(t-s)有相同的分布,且与Ns独立。则我们可以得到E[Nt|Ns]=E[Nt-Ns+Ns|Ns]=E[Nt-Ns|Ns]+E[Ns|Ns]=E[Nt-Ns]+Ns=E[N_{t-s}]+Ns=(t-s)λ+Ns≥Ns,即它满足下鞅条件。同时我们也可以由等式看出,{Nt-tλ}满足鞅的条件。