均值、标准差和标准误

学习统计过程中,一些概念经常搞不清。本文以一个简明的例子,具体解释一下标准差和标准误。

假如将2020年全国高考考生的数学成绩为总体。

第一次,从中随机抽取400考生的数学成绩,这就可以构成一个样本1,记为X1=\left\{ 98,76,...,103\right\}

此时,该样本均值为\bar{X1 } =99

标准差S1=5.60

均值反应该样本的集中程度,方差反应该样本离均值的离散程度。

第二次,继续随机抽取了400考生,重新构成了一个样本2,记为X2=\left\{ 101,55,...,99\right\}

样本均值\bar{X2 } =97

标准差S2=7.13

m次抽取之后,共获得了m个样本均值,这些个统计量重新构成一个数据整体,记为XM = \left\{ X1,X2,...,Xm \right\}

因为抽样本身具有随机性,所以每次抽样得到的均值可能也是不同的,是一个在变动的值,即M具有随机波动性,想要了解这组数据的概率分布,同样可以计算 标准差

这个标准差的定义与前文相同,但其本身含义 是反应抽样过程中随机误差的大小,所以也叫标准误(standard error, Std.E 或 SE),或者均值的标准误

当然了,其他的统计量也可以进行标准误计算,比如SM = \left\{ S1,S2,...,Sm \right\} ,可以被叫做“标准差的标准误”。

标准误越小,反应抽样误差越小,用该样本统计量来估计或推断响应总体参数的可靠性就越高。


还看到有人对其区别进行了总结,直接搬过来,原文链接:https://zhidao.baidu.com/question/590726342400477245.html

标准差和标准误都是变异指标,但它们之间有区别,也有联系.区别:

①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;

②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等.标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等.

③它们与样本含量的关系不同:当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 .联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同.

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容