一、集中趋势
1、众数,样本中出现次数(频数)最多的数值。
2、中位数,一组样本数据按升序或降序排列后,如果样本容量为奇数,取中间位置的数值;如果为偶数,则取中间两个数据的平均值。
3、平均数
算术平均数:,n个数据相加后除以n,它较中位数、众数更少受到随机因素影响, 缺点是它更容易受到极端值影响。
几何平均数:,n个数据相乘后开n次方,适用于指数增长 (恒定的比例增长) 和变化的增长值。
调和平均数:,n个数据的倒数取算术平均,再取倒数,调和平均数可以用在相同距离但速度不同时,平均速度的计算。
二、离散程度
1、异众比率,总体中非众数次数与总体全部次数之比。
2、四分位差,上四分位数和下四分位数的差值,反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。
3、描述统计中的方差,,随机变量的离散程度,将各个误差将之平方相加之后再除以总数,开根号之后就是均方差(标准差)。
4、概率分布中的方差,随机变量X的均值就是数学期望E,即
6、离散系数(变异系数),标准差与平均值
之比。
三、分布形状
1、偏态系数,用来度量分布是否对称,,当SK>0,数据为正(右)偏态,当SK<0,数据为负(左)偏态,当SK=0,数据完全对称。
2、峰态系数,用来度量数据在中心聚集程度,在正态分布情况下,峰度系数值是3(但是SPSS中将正态分布峰度值定为0,是因为已经减去3,这样比较起来方便)。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。