概率论与数理统计pdf txt mobi读书笔记
形式计算使人相信结果是对的,但不能提供直观上的启发性。数学可以达到精确量化,实在验证,但是提出新假设新观点还是要靠直觉,随机事件与概率、离散型随机变量及其分布、连续型随机变量及其分布、随机变量的数学特征、随机变量序列的极限、现代概率论基础简介、数理统计的基本概念、参数估计、假设检验、回归分析与方差分析。
作者:同济大学数学系
下载地址:
http://www.txtepub.com/1203.html
阅读感悟
第一节
随机变量及其分布
一、随机变量的定义
在随机试验中有很多试验结果本身就是用数量表示,例如,
(1)抛掷一枚均匀的骰子,出现的点数 X 的取值;
(2)每年每辆参保的车辆会发生理赔的次数 N ,每次理赔的金额 Y ,这里 N 和 Y 的取值;
(3)测量的随机误差 ε 的取值。
在随机试验中还有很多试验结果本身不是用数量表示,这时可以根据需要设置变量,例如,
(1)抛掷一枚均匀的硬币,观察其朝上的面,则样本空间 Ω ={正面朝上,反面朝上}.这时,可按如下方式设置一个变量 X :
在这里, X 的取值对应如下随机事件:
{ X =1}={正面朝上},{ X =0}={反面朝上} 。
(2)抛掷三枚均匀的硬币,观察其朝上的面,则样本空间 Ω ={ HHH , HHT , HTH , THH , HTT , THT , TTH , TTT },其中 H 表示正面朝上, T 表示反面朝上.这时,若一个变量 X 表示“三次抛掷中反面朝上的次数”,则 X 的取值与样本点之间有如下的对应关系:
在这里, X 的取值对应如下随机事件:
{ X =0}={反面朝上0次}={ HHH },{ X =1}={反面朝上1次}={ HHT , HTH , THH },{ X =2}={反面朝上2次}={ HTT , THT , TTH },{ X =3}={反面朝上3次}={ TTT }。
下面,我们给出随机变量的一般定义。
定义1 在随机试验 E 中, Ω 是相应的样本空间,如果对 Ω 中的每一个样本点 ω ,有唯一一个实数 X ( ω )与它对应,那么就把这个定义域为 Ω 的单值实值函数 X=X ( ω )称为 (一维)随机变量 。
随机变量一般用大写字母 X , Y 等来表示,随机变量的取值一般用小写字母 x , y 等来表示.如果一个随机变量仅可能取有限或可列个值,则称其为离散型随机变量.如果一个随机变量的取值充满了数轴上的一个区间(或某几个区间的并),则称其为非离散型随机变量.连续型随机变量就是非离散型随机变量中最常见的一类随机变量。
随机变量的定义可直观解释为:随机变量 X 是样本点的函数,这个函数的自变量是样本点,可以是数,也可以不是数,定义域是样本空间,而因变量必须是实数.这个函数可以让不同的样本点对应不同的实数,也可以让多个样本点对应于一个实数。
随机变量的引入是概率论发展走向成熟的一个标志,它弥补了随机试验下的随机事件种类繁多、不易一一总结它们发生的可能性大小的规律的缺陷,因为如果知道随机变量的分布,随机试验下任一随机事件的概率也随之可以得到;另外引入随机变量后,可以使用数学中的微积分工具讨论随机变量的分布。
二、随机变量的分布函数
随机变量 X 是样本点 ω 的一个实值函数,为了掌握 X 的统计规律性,我们需要知道 X 取值于某个区间的概率.由于
{ a < X ≤ b }={ X ≤ b }-{ X ≤ a },
{ X > c }= Ω -{ X ≤ c }。
因此,对于任意实数 x ,只需知道{ X ≤ x }的概率就足够了,我们用 F ( x )表示这个概率值,显然这个概率值与 x 有关,不同的 x ,此概率值也不一样,下面给出分布函数的定义。
定义2 设 X 是一个随机变量,对于任意实数 x ,称函数
F ( x )= P ( X ≤ x ),-∞< x <+∞
为随机变量 X 的 分布函数 。
对任意的两个实数-∞< a < b <+∞,有
P ( a < X ≤ b )= F ( b )- F ( a )。
因此,只要已知 X 的分布函数,就可以知道 X 落在任一区间( a , b ]内的概率,所以说,分布函数可以完整地描述一个随机变量的统计规律性。
从这个定义可以看出:
(1)分布函数是定义在(-∞,+∞)上,取值在[0,1]上的一个函数;
(2)任一随机变量 X 都有且仅有一个分布函数,有了分布函数,就可计算与随机变量 X 相关事件的概率问题。
例1 设一盒子中装有10个球,其中5个球上标有数字1,3个球上标有数字2,2个球上标有数字3.从中任取一球,记随机变量 X 表示为“取得的球上标有的数字”,求 X 的分布函数 F ( x )。
解 根据题意可知,随机变量 X 可取1,2,3,由古典概型的计算公式,可知对应的概率值分别为0.5,0.3,0.2。
分布函数的定义为 F ( x )= P ( X ≤ x ),因此
当 x <1时,概率 P ( X ≤ x )=0;
当1≤ x <2时,概率 P ( X ≤ x )= P ( X =1)=0.5;
当2≤ x <3时,概率 P ( X ≤ x )= P ( X =1)+ P ( X =2)=0.5+0.3=0.8;
当 x ≥3时,随机事件{ X ≤ x }为必然事件,因此 P ( X ≤ x )=1,即
P ( X ≤ x )= P ( X =1)+ P ( X =2)+ P ( X =3)=0.5+0.3+0.2=1。
整理可得 X 的分布函数为
F ( x )的图形如图2.1所示,它是一条阶梯形的曲线,在 X 的三个可能取值1,2,3处有右连续的跳跃点,其每次跳跃的高度正好是 X 在该取值点的概率。
图2.1 F ( x )的图形
从例1中的分布函数及其图形中可以看到分布函数具有右连续、单调不减等性质,具体来说,任一分布函数 F ( x )有如下性质:
(1)对于任意实数 x ,有0≤ F ( x )≤1,
(2) F ( x )单调不减,即当 x 1 < x 2 时,有 F ( x 1 )≤ F ( x 2 );
(3) F ( x )是 x 的右连续函数,即
证明略。
三、离散型随机变量及其分布律
设 E 是随机试验, Ω 是相应的样本空间, X 是 Ω 上的随机变量,若 X 的值域(记为 Ω X )为有限集或可列集,此时称 X 为(一维) 离散型随机变量 。
定义3 若一维离散型随机变量 X 的取值为 x 1 , x 2 ,…, x n ,…,称相应的概率
P ( X=x i )= p i , i =1,2,…
为离散型随机变量 X 的 分布律 (或分布列、概率函数)。
一维离散型随机变量的分布律也可用下表来表示。
且满足(1)非负性 p i ≥0, i =1,2,…;(2)规范性
这两条性质也是判别某一数列是否能成为分布律的充要条件。
例2 设随机变量 X 的分布律如下。
X-102
概率0.20.40.4
求(1) P ( X ≤-0.7);(2) X 的分布函数 F ( x )。
解 (1) P ( X ≤-0.7)= P ( X =-1)=0.2。
(2) X 的分布函数 F ( x )求解过程同例1,可得
从这个例子中可知,已知一个离散型随机变量的分布律,就可以求得其分布函数;反之,若已知一个离散型随机变量的分布函数,也可以通过如下过程求得其分布律:
P ( X =-1)= P ( X ≤-1)= F (-1)=0.2,
P ( X =0)= P (-1< X ≤0)= F (0)- F (-1)=0.6-0.2=0.4,
P ( X =2)= P (0< X ≤2)= F (2)- F (0)=1-0.6=0.4。
因此可得 X 的分布律如下。
从上面的分析中可以发现,分布函数和分布律对离散型随机变量的取值规律描述是等价的,比较而言,分布律更直观、方便。
四、连续型随机变量及其密度函数
连续型随机变量的取值充满了数轴上的一个区间(或某几个区间的并),在这个区间里有无穷不可列个实数,因此当我们描述连续型随机变量时,用来描述离散型随机变量的分布律就没法再使用了,而要改用概率密度函数来表示。
密度函数
定义4 设 E 是随机试验, Ω 是相应的样本空间, X 是 Ω 上的随机变量, F ( x )是 X 的分布函数,若存在非负函数 f ( x )使得
则称 X 为(一维) 连续型随机变量 , f ( x )称为 X 的 (概率)密度函数 ,满足:(1)非负性 f ( x )≥0,-∞< x <+∞;(2)规范性
概率密度函数 f ( x )与分布函数 F ( x )之间的关系如图2.2所示, F ( x )= P ( X ≤ x )恰好是 f ( x )在区间(-∞, x ]上的积分,也即是图中阴影部分的面积。
图2.2 f ( x )与 F ( x )的几何关系
连续型随机变量具有下列性质:
(1)分布函数 F ( x )是连续函数,在 f ( x )的连续点处, F ′( x )= f ( x );
(2)对任意一个常数 c ,-∞< c <+∞, P ( X=c )=0,所以,在事件{ a ≤ X ≤ b } 中剔除 X=a 或剔除 X=b ,都不影响概率的大小,即
P ( a ≤ X ≤ b )= P ( a < X ≤ b )= P ( a ≤ X < b )= P ( a < X < b )。
需注意的是,这个性质对离散型随机变量是不成立的,恰恰相反,离散型随机变量计算的就是“点点概率”。
此外,这一性质还能帮助我们判断一个非离散型随机变量是否是连续型随机变量.如果一个非离散型随机变量不存在离散的点,它的概率不为0,则该随机变量为连续型随机变量。
(3)对任意的两个常数 a , b ,
例3 设连续型随机变量 X 的密度函数为
求(1) P (| X |<0.5);(2) X 的分布函数 F ( x )。
解 (1)
(2)
显然,不难求出 F ( x )的导数即为 x 的密度函数. F ( x )的图形如图2.3所示,它是一条连续的曲线,同时它也满足 F ( x )的所有性质。
图2.3 F ( x )的图形
习题2-1
1. 试确定常数 c ,使得下列函数成为某个随机变量 X 的分布律:
(1) P ( X=k )= ck , k =1,…, n ;
(2)
2. 试确定常数 c ,使
成为某个随机变量 X 的分布律,并求:
(1) P ( X ≥2);
(2)
(3) X 的分布函数 F ( x )。
3. 一口袋中有5个球,在这5个球上分别标有数字1,2,3,4和5.从这袋中不放回任取3个球,设各个球被取到的可能性相同,求取得的球上标明的最大数字 X 的分布律与分布函数。
4. 已知随机变量 X 的分布律如下.试求一元二次方程3 t 2 +2 Xt +( X +1)=0有实数根的概率。
5. 设随机变量 X 的分布函数为
求 X 的密度函数,并计算 P ( X ≤1)和 P ( X >2)。
6. 已知连续型随机变量 X 的分布函数为
(1) a , b 取何值时 F ( x )为连续函数?
(2)求
(3)求 X 的密度函数。
7. 设随机变量 X 的密度函数为
求(1)常数 c 的值;(2)
(3) X 的分布函数 F ( x )。
8. 设随机变量 X 的密度函数为
求(1)常数 a 的值;(2) P (-1< X ≤2)。
9. 已知随机变量 X 的密度函数为
求(1) P (0< X <1);(2) X 的分布函数。
10. 设某种晶体管的寿命(单位:小时)是一个随机变量 X ,它的密度函数为
(1)试求该种晶体管不能工作150小时的概率;
(2)一台仪器中装有4只此种晶体管,试求该仪器工作150小时后至少有一只失效的概率(假定这四只晶体管是否失效是互不影响的)。