期望值(Expectation )
如果是在概率空间中的一个随机变量,那么它的期望值
定义为
注意分布函数并不是每一个随机变量都有期望值的,因为有的时候这个积分不存在,
表达式为
其中为概率密度函数。
如果是离散的随机变量,输出值为
,和输出值相应的概率为
(概率和为1),若级数
绝对收敛,那么期望值
是一个无限数列的和
如果是连续的随机变量,存在一个相应的概率密度函数
,若积分
绝对收敛,连续期望值
为
性质:
(1)线性运算规则
推广到一般情况
(2)乘积的期望
,该式成立的前提是
与
不相关(或独立)
方差(Variance)
定义
总体方差 定义为
为变量,
为总体均值,
总体例数
样本方差
实际统计计算时,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式
为样本均值,
为样本例数。
离散型方差
,其中
连续性方差
性质:
(1)若为常数,则
(2)若为随机变量,
为常数,则
(3)若和
为两个随机变量,则
其中协方差。
如果和
不相关,则
(4)
协方差(Covariance)
定义
两个随机变量的协方差被定义为
方差是协方差的特例,即当时,
性质:
(1)线性组合的协方差
两个随机变量特例:
(2)独立随机变量的协方差
若与
为独立的随机变量,则
相关系数(Correlation coefficient)
定义
相关系数可以通过方差和协方差来定义。两个随机变量和
的相关系数定义为:
性质:
(1)有界性
相关系数的取值范围为[-1,1],其可以看成是无量纲的协方差。
(2)统计意义
值越接近1,说明两个变量正相关性(线性)越强,越接近-1,说明负相关性越强,当为0时表示两个变量没有相关性。