一、数据的集中趋势
1. 平均数
一组数字的总和 / 数字总个数。
2. 中位数
一组数字进行排序,中间位置的数;记其总个数为N,若N为奇数,则第(N+1)/2为中位数;若N为偶数,则第(N/2)和(N/2+1)个数的平均数为中位数。
3. 众数
一组数字中出现频次最高的数字;若频次最高的有多个数字,则均为众数。
4. 极差
一组数字中最大数和最小数的差值。
5. 中程数
一组数字中最大数和最小数的平均数。
6. 分位数
将给定的一组数字从小到大排序,其N分位数为将这组数据N等分位置处的数字;若对应的位置不是整数,则根据该非整数位置前、后整数位置数字等比例推算分位数。
例如:求某组数字的N分位数,将改组数字从小到大排序,记其数字总个数为M;若M/N是小数,ceil(M/N)位置处的数字为a,floor(M/N)位置处的数字为b,则其1/N分位数为 = a + (M/N - ceil(M/N)) * (b - a)。
7. 算数平均数
针对无差别的一组数据,每个数字对于平均数的贡献占比相同;计算方法:所有数字求和 / 数字总个数。
8. 加权平均数
针对有差别的一组数据,每个数字对于平均数的贡献占比不同;计算方法:。
9. 几何平均数
n个数字连乘积的n次方根。
二、数据的离中趋势
1. 方差
一组数字中,各数字与该组数字平均数差值平方和的算术平均数;计算方法:。
2. 标准差
方差的算术平方根。
3. 平均差
一组数字中,各数字与该组数字平均数差值绝对值的算术平均数;计算方法:。
4. 四分位差
上四分位数(3/4位置处)与下四分位数(1/4位置处)的差。
5. 异众比率
总体中非众数次数与总体全部次数的比值。
三、相对离散程度
1. 离散系数
又称变异系数,为标准差与平均值之比;离散系数越大,表明样本的离散程度越大。
四、分布的形状
1. 偏态系数
又称偏差系数,反应数据分布非对称情况;以众数、中位数与均值之差对标准差之比来衡量数据分布的偏斜程度;偏态系数大于0为右偏(正偏),偏态系数小于0为左偏(负偏)。
(后补)
2. 峰态系数
反应频数分布曲线顶端尖峭或扁平程度。
(后补)