2.6.2 连续随机变量函数的分布(Distribution of Functions of Random Variables)

参考:概率论与数理统计教程(第二版) 茆诗松

个人觉得“连续随机变量函数的分布”这个表述有点绕,远不如英语的“Distribution of Functions of Random Variables”,所以加了个英文的标题

几个定理的证明的练习和笔记
先总结下思路脉络:

当g(x)为严格单调时
  • 定理2.6.1是重点,后面的定理2.6.2~定理2.6.4都是基于定理2.6.1推导

  • 定理2.6.1给出了y=g(x)严格单调时,随机变量Y=g(X)的通用PDF公式
  • 定理2.6.2给出了初始随机变量为正态分布,Functions of (正态分布随机变量)的Function为一次线性函数时的分布
  • 定理2.6.3给出了初始随机变量为正态分布,Functions of (正态分布随机变量)的Function为对数函数时的分布,并引出了对数正态分布
  • 定理2.6.4给出了初始随机变量为伽马分布,Functions of (正态分布随机变量)的Function为kX时的分布,并引出了其应用——任一伽马分布转化为卡方分布

  • 定理2.6.5给出了特定条件下F_{X}(X)服从(0,1)上的均匀分布U(0,1)这么一个结论,并推演出了各种分布随机数的获取方法——随机模拟法(蒙特卡罗法)

当g(x)为其他形式时
  • 给出了g(X)的通用求法思路,结合例题思考


下面进入正题



当g(x)为严格单调时


定理2.6.1

X是连续随机变量,其密度函数为p_{X}(x)Y=g(X)是另一个随机变量。
y=g(x)严格单调,其反函数h(y)有连续导函数,则Y=g(X)密度函数
p_{Y}(y)=\left\{\begin{matrix} p_{X}[h(y)]|{h}'(y)|,a<y<b \\ 0,\quad \quad \quad \quad \quad \quad \quad others \end{matrix}\right.
其中a=min\left\{g(-\infty,g(\infty))\right \},b=max\left\{g(-\infty,g(\infty))\right \}

证明:

g(x)是严格单调增函数,这时它的反函数h(y)也严格单调增函数。
{h}'(y)>0。记a=g(-\infty),b=g(\infty),这意味着y=g(x)仅在区间(a,b)取值,于是y的CDF F_{Y}(y)

  • y<a
    F_{Y}(y)=P(Y\leqslant y)=0
  • y>b
    F_{Y}(y)=P(Y\leqslant y)=1
  • a\leqslant y\leqslant b
    F_{Y}(y)=P(Y\leqslant y)=P(g(X)\leqslant y)
    \qquad \qquad \qquad \quad \quad =P(X\leqslant h(y))=\int_{-\infty}^{h(y)}p_{X}(x)dx
    由此得Y的PDF为
    p_{Y}(y)=\left\{\begin{matrix} p_{X}[h(y)]|{h}'(y)|,a<y<b \\ 0,\quad \quad \quad \quad \quad \quad \quad others \end{matrix}\right.
    同理可证当g(x)是严格单调减函数时,结论也成立。但要注意{h}'(y)<0,故要加绝对值符号,这时a=g(\infty),b=g(-\infty),综上所述,定理得证。

定理2.6.2

设随机变量X服从正态分布N(\mu,\sigma ^2),则当a\neq 0时,有Y=aX+b \sim N(a\mu+b,a^2\sigma ^2)

证明:

a>0时,Y=aX+b是严格增函数,仍在(-\infty,\infty)上取值,其反函数h(y)X=(Y-b)/a{h}'(y)=\frac{1}{a}定理2.6.1可得y的PDF
\quad p_{Y}(y)
=p_{X}[h(y)]|{h}'(y)|
=p_{X}(\frac{y-b}{a})\frac{1}{a}
=\frac{1}{\sqrt{2\pi}\sigma}exp\left \{ -\frac{1}{2\sigma^ 2}(\frac{y-b}{a}-\mu)^2\right \}\frac{1}{a}
=\frac{1}{\sqrt{2\pi}(a\sigma)}exp\left\{ -\frac{(y-a\mu-b)^2}{2a^2\sigma ^2}\right\}
这就是正态分布N(a\mu+b,a^2\sigma^2)的PDF。

a<0时,Y=aX+b是严格减函数,仍在(-\infty,\infty)上取值,其反函数h(y)X=(Y-b)/a,由定理2.6.1可得y的PDF
\quad p_{Y}(y)
=\frac{1}{\sqrt{2\pi}|a|\sigma}exp\left\{ -\frac{(y-a\mu-b)^2}{2 a^{2}\sigma^{2}} \right\}
这是正态分布N(a\mu+b,a^2\sigma^2)的PDF。
Q.E.D.


定理2.6.3(对数正态分布)

设随机变量X\sim N(\mu,\sigma^2),则Y=e^{X}的概率密度函数为
p_{Y}(y)=\left \{\begin{matrix} \frac{1}{\sqrt{2\pi}y\sigma}exp \left \{-\frac{(lny-\mu)^2}{2\sigma^2}\right \}, y>0 \\ 0 \qquad \qquad\qquad \qquad \quad, y\leqslant 0 \end{matrix} \right.

证明:

y=e^{x}是严格增函数,它仅在(0,\infty)上取值,其反函数h(y)x=\ln y,由定理2.6.1可得

  • y \leqslant 0时,F_{Y}(y)=0,从而p_{Y}(y)=0.
  • y>0时,Y的PDF为
    \quad p_{Y}(y)
    =p_{X}[h(y)]|{h}'(y)|
    =p_{X}(\ln y)|{\ln}'y|
    =\frac{1}{\sqrt{2\pi}\sigma}exp\left \{ -\frac{(\ln y-\mu)^2}{2\sigma^2}\right \}\frac{1}{y}
    =\frac{1}{\sqrt{2\pi}y\sigma }exp\left \{ -\frac{(\ln y-\mu)^2}{2\sigma^2}\right \}

对数正态分布

这个分布被称为“对数正态分布”,记为LN(\mu,\sigma^2),其中\mu称为对数均值,\sigma^2称为对数方差。对数正态分布LN(\mu,\sigma^2)是一个偏态分布,也是一个常用分布,实际中有不少随机变量服从对数正态分布,譬如

  • 绝缘材料的寿命服从对数正态分布
  • 设备故障的维修时间服从对数正态分布
  • 家中仅有两个小孩的年龄差服从对数正态分布
对数正态分布

定理2.6.4

设随机变量X \sim Ga(\alpha,\lambda),则当k>0时,有Y=kX\sim Ga(\alpha,\lambda/k)

证明:

x>0时,Ga(\alpha,\lambda)PDF:
p(x)=\frac{(\lambda)^{\alpha}}{\Gamma (\alpha)}x^{\alpha-1}exp\left \{-\lambda x \right \}

因为k>0,所以y=kx是严格增函数,它仍在(0,\infty)上取值,其反函数为x=y/k,由定理2.6.1可得

  • y<0时,p_{Y}(y)=0
  • y\geqslant 0时,
    \quad p_{Y}(y)=
    =p_{X}[h(y)]|{h}'(y)|
    =p_{X}(\frac{y}{k})\frac{1}{k}
    =\frac{\lambda^{\alpha}}{k\Gamma (\alpha)}(\frac{y}{k})^{\alpha-1}exp\left \{-\lambda \frac{y}{k} \right \}
    =\frac{(\lambda/k)^{\alpha}}{\Gamma (\alpha)}y^{\alpha-1}exp\left \{-\lambda \frac{y}{k} \right \}
    此即Ga(\alpha,\lambda/k)的PDF
    Q.E.D.

用途:

将任一伽马分布转化为\chi ^2分布,如
X \sim Ga(\alpha,\lambda),则2\lambda X\sim Ga(\alpha,\lambda/2\lambda)=Ga(\alpha,1/2)=\chi^2(2\alpha)


定理2.6.5

若随机变量的分布函数F_{X}(x)为严格单调递增的连续函数,其反函数F_{X}^{-1}(y)存在,则Y=F_{X}(X)服从(0,1)上的均匀分布U(0,1)

证明:

下求Y=F_{X}(X)的分布函数。由于分布函数F_{X}(X)仅在[0,1]区间上取值,故

  • y<0时,因为\{F_{X}(X)\leqslant y\}是不可能事件,所以
    F_{Y}(y)=P(Y\leqslant y)=P(F_{X}(X)\leqslant y)=0
  • 0\leqslant y \leqslant 1时,有
    F_{Y}(y)=P(Y\leqslant y)=P(F_{X}(X)\leqslant y)
    \qquad \qquad \qquad \qquad =P(X\leqslant F_{X}^{-1}(y))=F_{X}(F_{X}^{-1}(y))=y
  • y\geqslant 1时,因为\{F_{X}(X)\leqslant y\}是必然事件,所以
    F_{Y}(y)=P(Y\leqslant y)=P(F_{X}(X)\leqslant y)=1

综上所述,Y=F_{X}(X)的分布函数为
F_{Y}(y)=\left\{ \begin{matrix} 0,y<0 \qquad\\ y,0\leqslant y <1\\ 1,y\geqslant 1 \qquad\\ \end{matrix} \right.
这正是(0,1)上均匀分布的CDF,所以Y\sim U(0,1)

意义:

任一个随机变量X都可以通过其分布函数F(X)与均匀分布随机变量U发生关系。譬如

  • X服从指数分布Exp(\lambda)
    其分布函数为F(x)=1-e^{-\lambda x}
    x换为X后,有
    U=1-e^{-\lambda X} \quadX=\frac{1}{\lambda}\ln \frac{1}{1-U}
    后一式表明:由均匀分布U(0,1)的随机数(伪观察值)u_{i}可得指数分布Exp(\lambda)的随机数x_{i}=\frac{1}{\lambda}\ln \frac{1}{1-u_{i}},i=1,2,…,n,…
    而均匀分布随机数在任一个统计软件都可产生,从而指数分布(继而其他分布)随机数也可以获得。而各种分布随机数的获得是进行随机模拟法(又称蒙特卡罗法)的基础


当g(x)为其他形式时

可直接由Y的分布函数F_{Y}(y)=P(g(X)\leqslant y)出发,按函数g(x)的特点做个案处理

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。