2.差异性-方差和标准偏差定量分析数据

1. 计算公式

$x_{i}$ ---> 数据集合中的某个值

$\mu$ ---> 均值

n ---> 总体数量

离均差: 每个数值与数据集均值之间的差，可能存在负数。常用于衡量数值之间的差异性。

公式：离均差 = $x_{i} - \mu$

平均绝对偏差：离均差的绝对值的平均值。离均差中存在负数的情况，防止相加导致的数据对消，所以采用离均差的绝对值的方式。

公式： $\frac{\sum_{i}^n \vert x_{i} -\mu \vert }{n}$

平方偏差：离均差的平方

公式： $(x_{i} - \mu )^2$

平方和：平方偏差的数值和

公式： $\sum_{i}^n (x_{i} - \mu )^2$

标准偏差：平方和的均值

公式： $\sigma =\sqrt{\frac{\sum_{i}^n (x_{i} - \mu )^2 }{n} }$

标准偏差的意义：大约68%的数据与平均值的偏差不超过一个 $\sigma$ （即一个偏差）。大于95%的数据与平均值的偏差不超过 2 $\sigma$ （即2个偏差）。下图所示：

通常抽样中总会低估了总体中差异性的数量。因为大部分数据居于中间位置。特别是正态分布中。为了纠正这一现象，我们采用 n -1 的方式，使s的值稍大一些，趋向于 $\sigma$ 。即：

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。