第二章 随机变量及其分布
2.1 随机变量的基本概念
概率研究的传统方法
- 中的样本点与试验有关,类型多样,不便于进行抽样的研究
- 很多非等可能的问题的概率如何计算没有很好地解答
新的思路:
- 引入函数的概念对随机试验进行更为抽象的描述
- 通过某种从样本空间到实数集的映射,将对随机试验及其概率的研究转化为对随机数值及其取值概率的问题
- 将微积分等现代数学工具引入到概率的研究中来
解决问题的思路:将样本空间数字化(抽象化)
例:随机抽取一件产品,考察其是否合格,则
令
则
相对而言,新的集合更便于使用数学的方法进行讨论。
定义:设为概率空间,若对任意均存在唯一实数与之对应,且对任意,是一随机事件,即
则称为随机变量
(random variable
,简写为r.v.
)
随机变量是定义在样本空间上的函数。
随机变量是的(可测)映射。所谓“可测”,也即必须是事件!
在实变函数论中,对可测的概念(可测集合、可测映射)给出了严格的定义,与概率论中使用的可测概念是完全一致的
随机变量的引入,使得原来我们必须在样本空间上讨论的概率问题,可以转而在实数集上进行研究。在新的抽象层次上研究概率问题,不仅有利于发现不同问题之间的关联,也为引入各种数学工具提供了便利。
对于任意实数,都是事件,故可定义函数
称为随机变量的分布函数
(Cumulative Distribution Function, 简称CDF
)
例:在实弹射击训练中,对同一目标连续打三发子弹,击中目标记为,否则记为,则样本空间
定义随机变量
则
则事件
现实中,很多试验的结果本身就是随机变量,例如:
- 某地区的日平均气温,日平均气温
- 电子产品的寿命
- 某城市的日耗电量
- 一战士连续对目标射击次,击中目标次数
- 从一大批产品中随机抽取件进行测试,其测得的次品数
很多问题的实际背景不同,但数学本质完全一样。 利用随机变量将样本空间转变为抽象形式,能够更方便地发现不同问题的相似性。
随机变量可分为离散型
和非离散型随机变量
,其中后者又可以分为连续型随机变量
和奇异型随机变量
,我们主要研究其中的离散型、连续型及其混合型的随机变量。
2.2 离散型随机变量及其分布律
若 r.v 可取至多可列个值,则称 为离散型随机变量
。
至多可列 也即有限或可列
例:
- 对同一目标连续射击 次,击中目标次数 .
- 用同一支枪对目标进行射击,直到击中目标为止,射击次数 .
- 114查号台一天接到的呼叫次数 .
- 从一批产品中随机抽取 件进行测试, 其测得的次品数 .
离散型r.v.的分布律
设 为离散型 r.v,设 所有可能的取值为
且
则称上式为离散型 r.v X 的分布律
(Probability Distribution Law,缩写PDL
)
设
则
一般称为r.v.的累积分布函数
(Cumulative Distribution Function,缩写CDF
)
例:在实弹射击训练中,对同一目标连续打三发子弹,设每一发的命中率为,记 为击中目标次数,求 的分布律.
解:样本空间
r.v 的取值为,其分布律
分布律的特点:所有样本点对应的概率总和为,上例中
分布律时,必须注意所有的样本点必须都遍历一次!
分布律的基本性质
以上两点是分布律的本质特征,也即:
- 离散型 r.v. 的分布律必满足以上两条性质
- 满足以上两条性质的数列必是某离散型r.v的分布律
直观解释:
- 将球扔向位于处的“盒子”的概率为
- 将总质量为1的“物质”散布在至多可列个点上
分布律的几种表示法
-
解析法:
- 列表法
-
矩阵法
- 图示法
几种重要的离散型随机变量
两点分布
定义:如果 r.v 的分布律为
则称 r.v 服从两点分布,特别当时称 r.v 服从(0-1)两点分布
产生两点分布的实际背景:试验只产生两个结果.
例如:
- 一门课程的考试是“及格”还是“不及格”
- 刚出生的新生儿是“男”还是“女”
- 产品检验的结果是“合格”还是“不合格”
- 射击结果是“击中目标”还是“没有击中目标”
注:如果r.v. 的分布律为
则称r.v. 服从退化分布
(或单点分布
),或者说“几乎处处”等于,记为
Bernoulii试验与二项分布
Bernoulii试验
:只产生两个结果的试验
n重Bernoulli试验
或Bernoulli概型
:将Bernoulli试验<u>独立重复</u>进行 次
- 要求每次试验相互独立(无关),从而对应结果的概率不变
例:某战士用步枪对目标进行射击,记
对每次射击的观察是Bernoulli试验,连续观察次射击结果则为重Bernoulli试验
例:从一批产品中随机抽取一个产品进行检验,记
检验一个产品是Bernoulli试验
问:独立抽检 件产品是否是 重Bernoulli试验?
分析:产品抽一个少一个,所以每次抽检后概率
都在变化,故不能认为是 重Bernoulli试验
如果产品数量比较大,可近似看作 重Bernoulli试验.
在 重Bernoulli试验中,令
记
对任意,有
令
则 是一个离散型 r.v.
的分布律是什么?
分析:的可能取值为,对任意,表示次独立试验中恰好发生了次(恰好发生了次),也即
以上取并的事件两两不相容,结合独立性的假设,可知
记,从而 的分布律为
不难验证
定义:若 r.v 的分布律为
则称 服从参数为的二项分布
,记为
特别当时,就是两点分布,即
实际背景:二项分布产生于 重Bernoulli试验
例:一大批电子元件有10%已损坏,若从这批元件中随机选取20只来组成一个线路,问这线路能正常工作的概率是多少?
解:因为元件的数量很大,所以取20只元件可看作是有放回抽样,记 表示20只元件中好品的数量,则
于是
Poisson流与Poisson分布
Poisson流
:随着时间的推移,在时间轴上源源不断出现的具有某种特性的随机粒子(事件)流.
- 粒子出现的次数与时间起点无关,只与时间长短有关
- 任何两个不重叠的时间段内,粒子出现的次数是相互独立的
- 在非常短的时间内,几乎不可能出现两个以上粒子
典型的Poisson流:
随机服务系统
- 电话交换台在某时间段内接到的呼叫数
- 公共汽车站在某时间段内来到的乘客数
- 营业员在某时间段内接待的顾客数
- 114查号台在某时间段内接到的查号电话数
- 医院在一天内收到的急诊病人数
- 大型超市停车场,汽车的到达数
稀疏现象
- 电子设备在某时间内受到的干扰冲击次数
- 雷达在跟踪目标时接收到的电磁干扰信号脉冲流
- 巡航导弹飞过拦截区域的中弹数量
- 人的一生中患癌症等严重疾病的次数
- 某地区在一天发生的交通事故数
- 一本书一页中的印刷错误数
- 119报警台在某时间段内接到的火警电话数
- 快递公司在一天内遗失的快件数
物理学中的现象
- 放射性分裂落到某区域的质点数
- 热电子的发射数
- 显微镜下落在某区域中的微生物数
设表示时间区间内出现的质点个数,如果满足:
-
平稳性
:在任意时间段内,出现个质点的概率仅与有关 -
独立增量性
:在任意两个不重叠的时间段,内,各质点出现的个数是相互独立的,即随机变量和是相互独立的 -
普通性
:在很短的时间内,几乎不可能出现两个以上的质点,且有
其中为常数。
则称是参数为的Poisson流
设 已知,若 r.v 的分布律为
称称 服从参数为的Poisson分布
,记为
Poisson分布可用来描述稀疏事件发生的频数
- 所谓稀疏事件,是指在单次试验中发生的概率很小,而试验的次数又很大
可以验证,Poisson分布满足分布律的基本性质
Poisson分布与Poisson流的关系:在Poisson流中,记时间间隔中出现的质点数为
则,也即
其中参数称为Poisson强度
.
Poisson强度可以直观地理解为单位时间内出现的质点个数的平均数
Poisson(小数)定理
(Poisson law of small numbers):设为常数, 为正整数,,则对任一非负整数,有
证:记,则
因为
故
例:若一年中某类保险者里面每个人死亡的概率等于0.005,现有10000个人参加这类人寿保险, 试求在未来一年中在这些保险者里面:⑴ 有40个人死亡的概率; ⑵死亡人数不超过70个的概率.
解:记 为未来一年中在这些人中死亡的人数,则
(1)
因为,所以
(2)
注:当 很大时,直接计算二项分布的和比较难,因此在实际中往往采用如下的方法进行计算
- 用计算机编程计算
- 利用第五章的极限定理,作近似计算
Poisson分布由法国数学家Siméon-Denis Poisson在1838年发表,最初是作为二项分布的近似被引入
Poisson分布是构造随机现象的“基本粒子”之一,其应用范围不亚于正态分布
课后思考题:习题二:1,2,5,6,7,8,10