学习统计过程中,一些概念经常搞不清。本文以一个简明的例子,具体解释一下标准差和标准误。
假如将2020年全国高考考生的数学成绩为总体。
第一次,从中随机抽取400考生的数学成绩,这就可以构成一个样本1,记为
此时,该样本均值为
标准差
均值反应该样本的集中程度,方差反应该样本离均值的离散程度。
第二次,继续随机抽取了400考生,重新构成了一个样本2,记为
样本均值
标准差
m次抽取之后,共获得了m个样本均值,这些个统计量重新构成一个数据整体,记为
因为抽样本身具有随机性,所以每次抽样得到的均值可能也是不同的,是一个在变动的值,即具有随机波动性,想要了解这组数据的概率分布,同样可以计算 标准差
这个标准差的定义与前文相同,但其本身含义 是反应抽样过程中随机误差的大小,所以也叫标准误(standard error, Std.E 或 SE),或者均值的标准误。
当然了,其他的统计量也可以进行标准误计算,比如,可以被叫做“标准差的标准误”。
标准误越小,反应抽样误差越小,用该样本统计量来估计或推断响应总体参数的可靠性就越高。
还看到有人对其区别进行了总结,直接搬过来,原文链接:https://zhidao.baidu.com/question/590726342400477245.html
标准差和标准误都是变异指标,但它们之间有区别,也有联系.区别:
①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;
②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等.标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等.
③它们与样本含量的关系不同:当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 .联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同.