2.1-2.2 离散型随机变量

第二章 随机变量及其分布

2.1 随机变量的基本概念

概率研究的传统方法

  1. \Omega中的样本点与试验有关,类型多样,不便于进行抽样的研究
  2. 很多非等可能的问题的概率如何计算没有很好地解答

新的思路:

  • 引入函数的概念对随机试验进行更为抽象的描述
  • 通过某种从样本空间到实数集的映射,将对随机试验及其概率的研究转化为对随机数值及其取值概率的问题
  • 将微积分等现代数学工具引入到概率的研究中来

解决问题的思路:将样本空间\Omega数字化(抽象化)

例:随机抽取一件产品,考察其是否合格,则
\Omega=\{\text{合格},\text{不合格}\}

X(\omega)=\left\{\begin{array}{ll}{0,} & {\omega=\text{合格}} \\ {1,} & {\omega=\text{不合格}}\end{array}\right.

\Omega \stackrel{X}{\longrightarrow} \Omega^{\prime}=\{0,1\}
相对而言,新的集合\Omega‘更便于使用数学的方法进行讨论。


定义:设\{\Omega,\mathscr{F},P\}为概率空间,若对任意\omega\in\Omega均存在唯一实数X(\omega)与之对应,且对任意x\in\mathbb{R}\{X \leq x\} \triangleq\{\omega | X(\omega) \leq x\} ​是一随机事件,即
\{X \leq x\}\in\mathscr{F}
则称X=X(\omega)​随机变量(random variable,简写为r.v.)

随机变量X(\omega)​是定义在样本空间\Omega上的函数。
随机变量是\Omega \longrightarrow \mathbb{R}​的(可测)映射。所谓“可测”,也即\{X \leq x\}​必须是事件!
实变函数论中,对可测的概念(可测集合、可测映射)给出了严格的定义,与概率论中使用的可测概念是完全一致的
随机变量的引入,使得原来我们必须在样本空间\Omega上讨论的概率问题,可以转而在实数集上进行研究。在新的抽象层次上研究概率问题,不仅有利于发现不同问题之间的关联,也为引入各种数学工具提供了便利。

对于任意实数,\{X\leq x\}都是事件,故可定义函数
F(x)=P\{X\leq x\}
F(x)称为随机变量X分布函数(Cumulative Distribution Function, 简称CDF


例:在实弹射击训练中,对同一目标连续打三发子弹,击中目标记为1,否则记为0,则样本空间
\Omega=\{000,001,010,100,011,101,110,111\}
定义随机变量
X=\text{命中的次数},

\Omega \stackrel{X}{\longrightarrow} \Omega^{\prime}=\{0,1,2,3\}
则事件
\begin{aligned}\{X=0\} &=\{000\} \\\{X=2\} &=\{011,101,110\} \\\{X \leq 2\} &=\{000,001,010,100,011,101,110\} \\ &=\{X \leq 3\}-\{X=3\} \\ &=\Omega-\{111\} \end{aligned}


现实中,很多试验的结果本身就是随机变量,例如:

  1. 某地区的日平均气温X,日平均气温Y
  2. 电子产品的寿命X
  3. 某城市的日耗电量X
  4. 一战士连续对目标射击n次,击中目标次数X
  5. 从一大批产品中随机抽取n件进行测试,其测得的次品数N

很多问题的实际背景不同,但数学本质完全一样。 利用随机变量将样本空间转变为抽象形式,能够更方便地发现不同问题的相似性。


随机变量可分为离散型非离散型随机变量,其中后者又可以分为连续型随机变量奇异型随机变量,我们主要研究其中的离散型、连续型及其混合型的随机变量。

2.2 离散型随机变量及其分布律

若 r.v X 可取至多可列个值,则称X离散型随机变量

至多可列 也即有限或可列

例:

  1. 对同一目标连续射击n 次,击中目标次数 X .
  2. 用同一支枪对目标进行射击,直到击中目标为止,射击次数 X .
  3. 114查号台一天接到的呼叫次数 X .
  4. 从一批产品中随机抽取 n件进行测试, 其测得的次品数 N.

离散型r.v.的分布律

X 为离散型 r.v,设X 所有可能的取值为
x_1,x_2,...,x_k,...

P\left\{X=x_{k}\right\}=p_{k} \quad(k=1,2, \cdots)
则称上式为离散型 r.v X 的分布律(Probability Distribution Law,缩写PDL


x_1<x_2<x_3<...<x_k<...

F(x)=P\left\{X\leq x_{k}\right\}=\sum\limits_{i=1}^kp_{i} \quad(k=1,2, \cdots)
一般称为r.v.X累积分布函数(Cumulative Distribution Function,缩写CDF


例:在实弹射击训练中,对同一目标连续打三发子弹,设每一发的命中率为p,记X 为击中目标次数,求 X 的分布律.

解:样本空间
\Omega=\{000,001,010,100,011,101,110,111\}
r.v X 的取值为0,1,2,3,其分布律
\begin{array}{l}{P\{X=0\}=(1-p)^{3}} \\ {P\{X=1\}=3 p(1-p)^{2}} \\ {P\{X=2\}=3 p^{2}(1-p)} \\ {P\{X=3\}=p^{3}}\end{array}
分布律的特点:所有样本点对应的概率总和为1,上例中
P\{X=0\}+P\{X=1\}+P\{X=2\}+P\{X=3\}=[(1-p)+p]^3=1

分布律时,必须注意所有的样本点必须都遍历一次!


分布律的基本性质

  1. p_{k} \geq 0, k=1,2, \cdots
  2. \sum_{k=1}^{\infty} p_{k}=1

以上两点是分布律的本质特征,也即:

  • 离散型 r.v. 的分布律必满足以上两条性质
  • 满足以上两条性质的数列\{p_k\}必是某离散型r.v的分布律

直观解释:

  1. 将球扔向位于x_k处的“盒子”的概率为p_k
将球扔向特定位置的盒子的概率
  1. 将总质量为1的“物质”散布在至多可列个点x_k
总质量1的散布

分布律的几种表示法

  • 解析法
    P\left\{X=x_{k}\right\}=p_{k} \quad(k=1,2, \cdots)
  • 列表法
列表法表示分布律
  • 矩阵法
    \left( \begin{array}{ccccc}{x_{1}} & {x_{2}} & {\cdots} & {x_{k}} & {\cdots} \\ {p_{1}} & {p_{2}} & {\cdots} & {p_{k}} & {\cdots}\end{array}\right)
  • 图示法
图示法表示分布律

几种重要的离散型随机变量

两点分布

定义:如果 r.v X 的分布律为
P\left\{X=c_{1}\right\}=p, P\left\{X=c_{2}\right\}=1-p \quad(0<p<1)
则称 r.v X 服从两点分布,特别当c_1=1,c_2=0时称 r.v X 服从(0-1)两点分布

产生两点分布的实际背景:试验只产生两个结果.

例如:

  1. 一门课程的考试是“及格”还是“不及格”
  2. 刚出生的新生儿是“男”还是“女”
  3. 产品检验的结果是“合格”还是“不合格”
  4. 射击结果是“击中目标”还是“没有击中目标”

注:如果r.v. X的分布律为
P\{X=c\}=1,
则称r.v. X服从退化分布(或单点分布),或者说X“几乎处处”等于c,记为
X \stackrel{\mathrm{a.e}}{=} c \quad\text{或}\quad X=c(\mathrm{a} . \mathrm{e})


Bernoulii试验与二项分布

Bernoulii试验:只产生两个结果A,\bar{A}的试验

n重Bernoulli试验Bernoulli概型:将Bernoulli试验<u>独立重复</u>进行 n

  • 要求每次试验相互独立(无关),从而对应结果的概率不变

例:某战士用步枪对目标进行射击,记
A=\{\text{击中目标}\},\quad \bar{A}=\{\text{未击中目标}\}
对每次射击的观察是Bernoulli试验,连续观察n次射击结果则为n重Bernoulli试验

例:从一批产品中随机抽取一个产品进行检验,记
A=\{\text{合格}\},\quad \bar{A}=\{\text{不合格}\}
检验一个产品是Bernoulli试验

问:独立抽检 n 件产品是否是n 重Bernoulli试验?

分析:产品抽一个少一个,所以每次抽检后概率
P(A)=P\{\text{合格}\}
都在变化,故不能认为是n 重Bernoulli试验

如果产品数量比较大,可近似看作 n 重Bernoulli试验.

n 重Bernoulli试验中,令
P(A)=p, P(\overline{A})=1-p

A_i=\{\text{第}i\text{次试验结果}\},i=1,2,...,n
对任意1 \leq i_{1}<i_{2}<\dots<i_{k} \leq n,有
P\left(A_{i 1} A_{i 2} \cdots A_{i_{k}}\right)=P\left(A_{i_{1}}\right) P\left(A_{i_{2}}\right) \cdots P\left(A_{i k}\right)

X=\{n\text{重Bernoulli试验中事件}A\text{发生的次数}\}
X 是一个离散型 r.v.

X的分布律是什么?

分析:X的可能取值为0,1,2,...,n,对任意k\leq n\{X=k\}表示n次独立试验中A恰好发生了k次(\bar{A}恰好发生了n-k次),也即
\{X=k\}=\bigcup_{1 \leq i_{1}<\cdots<i_{k} \leq n} A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}
以上取并的事件两两不相容,结合独立性的假设,可知
\begin{aligned} P\{X=k\}&=P\left\{\bigcup_{1 \leq i_{1}<\cdots<i_{k} \leq n} A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}\right\}\\ &=\sum_{1 \leq i_{1}<\cdots<i_{k} \leq n} P\left\{A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}\right\}\\ &=\sum_{1 \leq i_{1}<\cdots<i_{k} \leq n} \overbrace{p \cdots p}^{k} \overbrace{(1-p) \cdots(1-p)}^{n-k}\\ &=C_{n}^{k} p^{k}(1-p)^{n-k} \end{aligned}
q=1-p,从而X 的分布律为
P\{X=k\}=C_{n}^{k} p^{k} q^{n-k} \quad(k=0,1,2, \cdots, n)
不难验证

  1. P\{X=k\}>0 \quad(k=0,1,2, \cdots, n)
  2. \sum_{k=0}^{n} P\{X=k\}=\sum_{k=0}^{n} C_{n}^{k} p^{k} q^{n-k}=(p+q)^{n}=1

定义:若 r.v X 的分布律为
P\{X=k\}=C_{n}^{k} p^{k} q^{n-k} \quad(k=0,1,2, \cdots, n)
则称 X 服从参数为( n, p)二项分布,记为X \sim B(n, p)

特别当n=1时,B(1,p)就是(0-1)两点分布,即
P\{X=k\}=p^{k} q^{1-k} \quad(k=0,1)
实际背景:二项分布产生于 n 重Bernoulli试验

例:一大批电子元件有10%已损坏,若从这批元件中随机选取20只来组成一个线路,问这线路能正常工作的概率是多少?

解:因为元件的数量很大,所以取20只元件可看作是有放回抽样,记 X 表示20只元件中好品的数量,则
X \sim B(20,0.9)
于是
\begin{aligned} P\{\text{线路正常}\}&=P\{X=20\} \\ &=C_{20}^{20} \times 0.9^{20} \times 0.1^{20-20} \\ &=0.9^{20} \approx 0.1216 \end{aligned}


Poisson流与Poisson分布

Poisson流:随着时间的推移,在时间轴上源源不断出现的具有某种特性的随机粒子(事件)流.

  • 粒子出现的次数与时间起点无关,只与时间长短有关
  • 任何两个不重叠的时间段内,粒子出现的次数是相互独立的
  • 在非常短的时间内,几乎不可能出现两个以上粒子

典型的Poisson流:

  1. 随机服务系统
  • 电话交换台在某时间段内接到的呼叫数
  • 公共汽车站在某时间段内来到的乘客数
  • 营业员在某时间段内接待的顾客数
  • 114查号台在某时间段内接到的查号电话数
  • 医院在一天内收到的急诊病人数
  • 大型超市停车场,汽车的到达数
  1. 稀疏现象
  • 电子设备在某时间内受到的干扰冲击次数
  • 雷达在跟踪目标时接收到的电磁干扰信号脉冲流
  • 巡航导弹飞过拦截区域的中弹数量
  • 人的一生中患癌症等严重疾病的次数
  • 某地区在一天发生的交通事故数
  • 一本书一页中的印刷错误数
  • 119报警台在某时间段内接到的火警电话数
  • 快递公司在一天内遗失的快件数
  1. 物理学中的现象
  • 放射性分裂落到某区域的质点数
  • 热电子的发射数
  • 显微镜下落在某区域中的微生物数

X_t表示时间区间(0,t]内出现的质点个数,如果X_t满足:

  1. 平稳性:在任意时间段(t_0,t_0+t]内,出现k个质点的概率P\{X_t=k\}仅与t有关
  2. 独立增量性:在任意两个不重叠的时间段(a_1,a_2](b_1,b_2]内,各质点出现的个数是相互独立的,即随机变量X_{a_2}-X_{a_1}X_{b_2}-X_{b_1}是相互独立的
  3. 普通性:在很短的时间(0,t]内,几乎不可能出现两个以上的质点,且有
    P\{X_t=1\}=\lambda t+\circ(t),\quad P\{X_t=2\}=\circ(t),
    其中\lambda为常数。
    则称X_t是参数为\lambdaPoisson流

\lambda>0已知,若 r.vX 的分布律为
P\{X=k\}=\frac{\lambda^{k}}{k !} e^{-\lambda}, k=0,1,2, \cdots
称称X 服从参数为\lambdaPoisson分布,记为X \sim P(\lambda)

Poisson分布可用来描述稀疏事件发生的频数

  • 所谓稀疏事件,是指在单次试验中发生的概率很小,而试验的次数又很大

可以验证,Poisson分布满足分布律的基本性质

  1. P\{X=k\}>0, k=0,1,2, \cdots
  2. \sum_{k=0}^{\infty} P\{X=k\}=\sum_{k=0}^{\infty} \frac{\lambda^{k}}{k !} e^{-\lambda}=e^{\lambda} \cdot e^{-\lambda}=1

Poisson分布与Poisson流的关系:在Poisson流中,记时间间隔(0,t]中出现的质点数为X

Poisson流

X \sim P(\lambda t),也即
P\{X=k\}=\frac{\lambda t^{k}}{k !} e^{-\lambda t}, k=0,1,2, \cdots
其中参数\lambda称为Poisson强度.

Poisson强度可以直观地理解为单位时间内出现的质点个数的平均数


Poisson(小数)定理(Poisson law of small numbers):设\lambda>0为常数,n 为正整数,\lim _{n \rightarrow \infty} n p_{n}=\lambda,则对任一非负整数k,有
\lim _{n \rightarrow \infty} C_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} e^{-\lambda}}{k !}
证:记n p_{n}=\lambda_{n}, p_{n}=\lambda_{n} / n,则
\begin{aligned} C_{n}^{k}& p_{n}^{k}\left(1-p_{n}\right)^{n-k}= C_{n}^{k}\left(\frac{\lambda_{n}}{n}\right)^{k}\left(1-\frac{\lambda_{n}}{n}\right)^{n-k} \\ &=\frac{\lambda_{n}^{k}}{k !}\left[1 \cdot\left(1-\frac{1}{n}\right) \cdot\left(1-\frac{2}{n}\right) \cdots\left(1-\frac{k-1}{n}\right)\right]\left(1-\frac{\lambda_{n}}{n}\right)^{n}\left(1-\frac{\lambda_{n}}{n}\right)^{-k} \end{aligned}
因为
\begin{aligned} \lim\limits_{n\to\infty}&\underbrace{1\cdot\left(1-\frac1n\right)\cdot\left(1-\frac2n\right)\ldots\left(1-\frac{k-1}n\right)}_{k\text{个}}\\ &=1\cdot\underbrace{\lim\limits_{n\to\infty}\left(1-\frac1n\right)\cdot\lim\limits_{n\to\infty}\left(1-\frac2n\right)\ldots\lim\limits_{n\to\infty}\left(1-\frac{k-1}n\right)}_{k\text{个}}\\ &=\underbrace{1\cdot1\cdot1\ldots1}_{k\text{个}}=1 \end{aligned}
\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^n =\lim\limits_{n\to\infty}\left[\left(1-\frac{\lambda_n}n\right)^{\frac{n}{\lambda_n}}\right]^{\lambda_n} =\left[\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^{\frac{n}{\lambda_n}}\right]^{\lim\limits_{n\to\infty}\lambda_n}=e^{\lambda}
\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^{-k} =\left[\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)\right]^{-k}=1

\lim _{n \rightarrow \infty} C_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} e^{-\lambda}}{k !}

二项分布与Poisson分布的累积分布函数与分布律对比

例:若一年中某类保险者里面每个人死亡的概率等于0.005,现有10000个人参加这类人寿保险, 试求在未来一年中在这些保险者里面:⑴ 有40个人死亡的概率; ⑵死亡人数不超过70个的概率.

解:记 X 为未来一年中在这些人中死亡的人数,则
X \sim B(10000,0.005)
(1)
P\{X=40\}=C_{10000}^{40} \times 0.005^{40} \times 0.995^{9960}
因为n=10000, p=0.005, \lambda=n p=50,所以
P\{X=40\} \approx \frac{50^{40}}{40 !} e^{-50}=0.0214
(2)
P\{X \leq 70\}=\sum_{k=0}^{70} C_{10000}^{k} \times 0.005^{k} \times 0.995^{10000-k} \approx 0.997
注:当 n 很大时,直接计算二项分布的和比较难,因此在实际中往往采用如下的方法进行计算

  1. 用计算机编程计算
  2. 利用第五章的极限定理,作近似计算

Poisson分布由法国数学家Siméon-Denis Poisson在1838年发表,最初是作为二项分布的近似被引入
Poisson分布是构造随机现象的“基本粒子”之一,其应用范围不亚于正态分布

Poisson分布的分布律
Poisson分布的累积分布函数

课后思考题:习题二:1,2,5,6,7,8,10

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容