基本概念
随机变量
1.连续性随机变量
如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点的随机变量
2.离散型随机变量
设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量
古典概率
古典概率通常又叫事前概率,是指当随机事件中各种可能发生的结果及其出现的次数都可以由演绎或外推法得知,而无需经过任何统计试验即可计算各种可能发生结果的概率。
条件概率
条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B),读作“在B的条件下A的概率”。
期望值
在概率论和统计学中,期望值(或数学期望、或均值,亦简称期望,物理学中称为期待值)是指在一个离散性随机变量试验中每次可能结果的概率乘以其结果的总和
离散变量概率分布
二项分布
在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。二项分布是显著性差异的二项实验的基础
伯努利分布
伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。均值EX = p , 方差DX = p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况
泊松分布
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。
若随机变量X取0和一切正整数值,在n次独立试验中出现的次数x恰为k次的概率P(X=k)=(k=0,1,...,n),式中λ是一个大于0的参数,此概率分布称为泊松分布。它的期望值为E(x)=λ,方差为D(x) = λ。当n很大,且在一次试验中出现的概率P很小时,泊松分布近似二项分布
连续变量概率分布
均匀分布
在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)
正态分布
正态分布又名高斯分布,是一个非常常见的连续概率分布。正态分布在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。
若随机变量X服从一个位置参数为、尺度参数为的正态分布,记为:
则其概率密度函数为
正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度
标准正态分布是位置参数 = 0,尺度参数 = 1的正太分布
指数分布
在概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。
概率密度函数:
其中λ > 0是分布的一个参数,常被称为率参数。即每单位时间发生该事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X 呈指数分布,则可以写作:X ~ Exponential(λ)
伽马分布
概率密度函数:
偏态分布
偏态分布指频数分布的高峰位于一侧,尾部向另一侧延伸的分布。它分为正偏态和负偏态。偏态分布的资料有时取对数后可以转化为正态分布,反映偏态分布的集中趋势往往用中位数。
贝塔分布
在概率论中,贝塔分布,也称B分布,是指一组定义在(0,1)区间的连续概率分布,有两个参数 , >0 。
概率密度函数:
威布尔分布
威布尔分布是可靠性分析和寿命检验的理论基础
概率密度函数:
卡方分布
卡方分布是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽马分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。
数学定义:
概率密度函数: