2.差异性-方差和标准偏差定量分析数据

1. 计算公式

x_{i}   --->  数据集合中的某个值

\mu    ---> 均值

 n    ---> 总体数量

离均差: 每个数值与数据集均值之间的差,可能存在负数。常用于衡量数值之间的差异性。

               公式: 离均差 = x_{i} -  \mu

平均绝对偏差:离均差的绝对值的平均值。离均差中存在负数的情况,防止相加导致的数据对消,所以采用离均差的绝对值的方式。

               公式:\frac{\sum_{i}^n \vert x_{i} -\mu  \vert }{n}

平方偏差:离均差的平方

               公式:(x_{i} - \mu )^2

平方和:平方偏差的数值和

              公式:\sum_{i}^n (x_{i} - \mu )^2

标准偏差:平方和的均值

              公式:\sigma =\sqrt{\frac{\sum_{i}^n (x_{i} - \mu )^2 }{n} }

2. 标准偏差的重要性

    标准偏差的意义:大约68%的数据与平均值的偏差不超过一个 \sigma (即一个偏差) 。大于95%的数据与平均值的偏差不超过  2\sigma  (即2个偏差)。下图所示:



3. 贝塞尔校正

        通常抽样中总会低估了总体中差异性的数量。因为大部分数据居于中间位置。特别是正态分布中。为了纠正这一现象,我们采用 n -1 的方式,使s的值稍大一些,趋向于 \sigma 。即:


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容