文/伢赞
集中量数
数据的集中趋势就是指数据分布中大量的数据朝某个方向集中的程度,集中量数是指用于描述集中程度的统计量包括算术平均数,中数和众数。
主要探讨4个问题,是什么,怎么算,有何特点及何时用。
(一)算术平均数
数据总和除以数据个数,简称为平均数,均数或均值。平均数一般与标准差方差相结合使用。总体平均数用u表示,样本平均数统计量用x表示。
它的特点是加则加,乘则乘,离差之和永为零。
我们在进行集中数据或离散数据的优点分析时,要考虑到所有的数据统计量是否都用上了?一是所有的数据都用到了,那么它的优点就是严密、灵敏,可以进一步的用代数运算,以及较少受抽样变动的影响,比较稳定。二是没有用到所有的数据,那么它的优点就是不易受极端数据的影响,能够出现在模糊计算时。而它们的缺点则是相反的。
计算平均数的原则包括:同质性原则,也就是这一类数据来自同类群体或同一指标。二是平均数与个体数值相加结合的原则,三是平均数与标准差方差相结合的原则。
(二)中数
中数是指按顺序排列在一起的一组数据中居于中间位置的数,用MD表示,这组数据中,有一半的数据比它大,有一半的数据比它小,也就是说它位于百分等级为50%。
中数主要用到中间的数据,没有用到所有的原始数据,可以用画图法找到中位数。
它的算法一,数列总个数为奇数时第(N+1)÷2个数就是中数。二,数列总个数为偶数时,可取位于中间两个数的平均数作为中数。三,分布中有相等重复的数时。可分为以下几种情况:A、当重复数值没有位于数列中间时求中位数的方法与无重复数据相同,B、当重复数目位于数列中间时可以用画图法。
(三)众数
次数分布中出现次数最多的那个变量值,用M0表示。在某些分布中众数可能不止一个。
不受极端值影响,能在数据不同质的情况下使用。
(四)平均数,中数,众数三者关系
正态分布中:M0=Md=M
正偏态分布(右偏态):M0<Md<M
负偏态分布(左偏态):M<Md<M0
以上就是今天的学习内容。