方差(Variance)是描述一组数据离散程度的一个度量,数据越是离散的,方差越大,反之越小。方差一定是正数。方差经常用或Var(X)表示(注意用Var()表示的话,X需要大写,表一个数据总体):
与总体的期望值类似,在实际研究中,我们不单要知道原始数据的方差,还需要知道原始数据经过某种线性变换后的方差。因此,我们需要知道下面几个变换的结果是什么:
1.
2.
3.
其中,k和c为任意实数。
与数据线性变换后的期望值的几个证明类似,下面的证明尽量使用“加权平均”的式子进行证明,避免使用求和符号(Sigma notation),以区别于许多教科书直接用进行证明,方便初学者理解。
关于第一个方差变换,因为每个数据都变成原来的k倍,那么期望值(均值)也变成原来的k倍,因为:
于是
关于第二个方差变换,我们先要了解,数据总体增加常数c之后,期望值出现怎样的变化。根据上一篇文章,有:
于是当所有数值都增加c后,方差有:
结合上面两个结论,并结合数据线性变换后的期望值:
第三个方差有:
综上可得:
1.
2.
3.