最近有一个考试,遇到标准差的问题,难倒了很多人,今天正好有时间,来整理下关于标准差的一些知识。
举个例子
首先为了更好的理解,还是举例说明:
设定一个假设,老师希望的结果是,尽量让每个人都能考上大学,不希望有人落榜。以此为评价依据,请问以下图片中,哪一组数据更好呢?
看到示例图片之后的直观感受是什么?
从直观感受上来说,肯定是1班的成绩更集中,2班的成绩差异很大。
举例的原因是,看起来非常直观。
而我们在实际工作中进行统计时,数据会非常多,很难通过直观的方式来感受到。
基于以上的期望,我们如何基于以上的假设,统计出老师的希望,哪个班更符合呢?
这个时候我们需要引入一个新的概念“方差”。
方差
方差的概念,网上都可以百度到。总而言之,一句话。方差是看一组数据的分布偏离程度。
方差计算公式
对于公式,咱们是拿来主义,在此处暂时不用深究公式是如何推导的。
只需要记住有这么一个公式即可,它的作用是算一组数据的偏离程度,或者叫离散程度。
如果还是不理解,你可以在脑海中想象,两组数据的最大值和最小值的差异值,差异大的就是偏离程度高,反之则偏离程度低。虽然方差不是这样算的,但是按这个思路思考,可以帮助理解。
将你要统计的数据,带入到公式,即可得到方差。
既然有了方差表示偏离程度,为何还要使用标准差?
方差虽然可以表示数据的偏离程度,但其计算结果,不太容易被人理解。
咱们还是举例来说明:
根据我们上面提到的计算公式,方差的结果越大,代表偏离的程度越大,2班的结果比1班大,说明1班的成绩比2班更向平均值集中。
一个新的问题,不但要看到谁的偏离大,还要看其偏离的值和统计的值比较,有多少偏差。
于是这就引入了咱们今天的主角,“标准差”
标准差
标准差是在方差的基础上,计算平方根。标准差可以表示出来方差所能体现出来的偏离程度,同时又能体现出来偏离的值大多集中在什么范围。
方差计算公式
继续上面的例子:
标准差例子的解读
某个学校有两个班级,其中1班和2班的平均成绩都是420分。
1班的标准差是42,2班的标准差是263(此处的标准差保留了整数位)。
标准差,三个字当中的“差”,指的是统计的样本数据中,与平均值的差。
如果你的成绩在420 - 42 = 378 或 420 + 42 = 462之间,那么你的成绩在该组的一个比较集中的范围内。如果是医院体检的健康指标,则代表你在正常范围内。
两组样本数据,标准差越大,代表离散程度越高。
如果两个班级的平均值不变,其中一组的标准差随时间变化越来越小,则代表,离散程度越来低,越趋于向平均值集中。