1.1基本概念
随机变量:在同一组条件下,每一次实验都会出现不同的结果,并且所有的结果都能列举出来,即X1,X2……Xn。具有概率P(X1),P(X2)……P(Xn),其中P(Xi) = P(X=Xi),称为概率函数(probability function),则X称为P(X)的随机变量,反之称为概率函数
可以说,随机变量是用随机事件描述随机现象的数量关系的推广,且随机变量在概率论和数据统计研究中的应用普遍。
离散型随机变量: 如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。例如:在一批产品中取到次品的个数、单位时间内某交换机台收到呼机次数。
连续随机变量: 如果随机变量X的所有取值无法逐个列举出来,而是取数轴上某一区间内的任何一点,则称X为连续随即变量。例如:一批电子元件的寿命,实际工作中遇到的测量误差。
古典概率:如果某一随机试验的结果有限,而且各个结果出现的随机性相等,则某一事件A发生的概率为该事件所包含的基本事件个数m与向本空间中所包含的基本事件个数n的比值。
条件概率 条件概率是一种带有附件条件的概率。是指若事件A与事件B是相依事件,即事件A的概率随事件B是否发生而变化,同样事件B的概率与随事件A是否发生而变化,则在实践A已发生的条件下,事件B出现的概率成为事件B的条件概率。
期望值 期望值是指一个人对某目标能够实现的概率估计,期望值也称做期望概率。在离散型随机变量X的一切可能完备值的完备组中,各可能值x与其对应的概率p的乘积之和称为随机变量X的期望值,记作E(X)
大数定律 大数定律分为强大数定律和弱大数定律。大数定律通常指强大数定律,它是描述相当多次数重复试验的结果的定律。根据这个定律,样本数量越多,则其算数平均值就有越高的概率接近期望值。
2.1离散变量的概率分布
二项分布 二项分布是由伯努利提出的概念,指的是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。
二项分布有以下特点:
a.包含n个相同的实验
b.每次实验只有两个可能的结果
c出现“成功”的概率p对每一次实验是相同的,“失败”的概率q也是如此,并且p+q=1
d.实验是相互独立的。
e.试验成功或失败可以计数
泊松分布 泊松分布是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。
泊松分布与二项分布的关系:当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。常当n≧20,p≦0.05时,就可以用泊松公式近似得计算。
3.1 连续性随机变量的概率分布
均匀分布 均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。
正态分布 正态分布(Normal distribution),也称“常态分布”,正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
指数分布 指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。