2. 平均值,标准差,期望: 标准差

1. 方差和标准差:数据的离散情况

方差是各个数据对均值的偏离程度,但是根据(均值的性质1.1),各项减均值差的和是0,为了避免这个问题,把所有的差都做一个平方就可以了。对于一个变量X,它的方差VAR(X)是

VAR(X)=\frac{\sum{(x-\bar{x})^2}}{n} (2.1)

而标准差就是方差的正平方根:

std(x) = \sqrt{VAR(X)}

对于上篇里的这组数据2,4,5,8,2,3,5,6,8,2,可以求出:

VAR(X) = \frac{(2-4.5)^2+(4-4.5)^2+(5-4.5)^2+...(2-4.5)^2}{10}=4.85

分子部分就是上面说的,通过求差的平方和避免所有差的和总是0。那么除以n又是为什么呢?比如我们考虑把上面的这10个数据复制粘贴一下,现在变成2,4,5,8,2,3,5,6,8,2,2,4,5,8,2,3,5,6,8,2了。那么分子部分会变成原来的2倍对吧?不过不用担心,因为项数n也变成了原来的2倍,所以方差最后还是4.85。

所以方差相当于是消减掉项数对于方差可能的影响。而方差的分子部分:\sum{(x-\bar{x})^2},一般也叫做sum of squares,也就是平方的和。这个sum of squares在方差分析的时候还会提到。

2. 方差的几个性质

还是用3,5,7这三个数据作为例子。当所有的项都加上一个常数,比如说2的时候:

VAR(X+c)=\frac{(3+2-(5+2))^2+(5+2-(5+2))^2+(7+2-(5+2))^2}{3}=\frac{(2)^2+(0)^2+(2)^2}{3}=2.667

因为

VAR(X)=\frac{\sum{(x-\bar{x})^2}}{n}=\frac{\sum{(x+c-(\bar{x}+c))^2}}{n}

每一个项都加上c的时候平均值也要加上c (由1.2),于是方差还是原来的方差

VAR(X+c)=VAR(X) (2.2)

考虑另外一种情况,当所有的项都乘以同一个常数c的时候,新的方差:

VAR(cX)=\frac{\sum{(cx-\bar{cx})^2}}{n}=\frac{\sum{(cx-c\bar{x})^2}}{n}=\frac{\sum{(x-\bar{x})^2 \times c^2}}{n}=c^2 \times VAR(X) (2.3)

对标准差来说std(cX)=c \times std(X)

注:本篇主要来源于《数理统计初级教程》

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。