离散数据:由单个数值组成。
连续数据:包含一个数据范围,这个范围内的任何一个数值都有可能发生。其数据常常用测量方法得到,而不是用计数方法得到。
概率密度函数:描述连续随机变量的概率分布
- 通过概率密度函数可以求出一个数据范围内的某个连续变量的概率,它向我们指出该概率分布的形状。
- 通过计算一个数值范围内的概率密度函数下方的面积,可得出该数值范围的概率。也就是说,为了求出P(a<X<b),必须计算a和b之间的概率密度函数下方的面积
- 概率密度函数下方的总面积必须等于1
正态分布:正态分布具有钟形曲线,曲线对称,中央部位的概率密度最大。越是偏离均值,概率密度减小。均值和中位数均位于中央,具有最大该路密度,正态分布通过参数μ和σ2进行定义。μ指出曲线的中央位置,σ指出分散性。
- 如果一个连续随机变量X符合均值为μ、标准差为σ的正态分布,则通常写作:
- X~N(μ,σ2)
- 求正态概率时,首先要确定所需要的概率范围,然后求出这个范围的限值的标准分,算式如下,其中Z~N(0,1)
- 通过在概率表中查找标准分可求出正态概率,概率表给出的是等于或者小于这个数值的概率。[图片上传中...