
中位数与平均数的不同
(2025.7.25.)
小学课程数学四则运算就认识学会了求取平均值。但多数人几十年后中老年了也未必知道什么是中位数。其实一点儿也不复杂,被人家忽悠了。
平均数是指在一组数据中所有数据之和再除以这组数据的个数,所得结果即为这组数据的平均数。它是反映数据集中趋势的一项指标。
平均数易受极端值影响:若数据中存在极大或极小值,平均数可能偏离实际集中趋势。
中位数是将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数;如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.
中位数显示抗干扰性:与平均数不同,中位数不受极端值影响。
例如在收入分析中,少数高收入者会拉高平均数,但中位数能更真实反映多数人的收入水平。
例如,采集5个数据1、2、3、4、100,平均数为22,而中位数为3。
中位数与平均数的核心区别在于计算方式和对极端值的敏感度。平均数反映数据总和均衡值但易受极端值影响。中位数代表数据中间位置且更稳定。
当平均数>中位数时,实际数据偏于高位;平均数<中位数时,实际数据则偏于低位。如:2019年中国居民人均可支配收入平均数30733元、中位数26523元。平均数偏于虚高,中位数更接近真实。
选择平均数的时机:需要计算总量时(如GDP核算)和数据分布对称且无极端值时。
选择使用中位数的时机:存在显著异常值时(如收入分析)和关注中等水平时(如房价评估)。
显然,收入的平均值容易偏高,让人情绪敏感负面,就是大家戏称的拖后腿、被平均。住房面积的平均值则让人易于接受,因为比较接近实际感觉。
在社会学范围可以较多显示中位数,因为直接涉及到个性化的实际和感受。非社会学范围乐于显示平均数,因为它有总量把控意义。
让我想到几十年前的纯计划经济时代,均贫富是社会革命的口号和目标。极端数值是全民大敌。人们的工资袋里差距一般就在一、二十元钱。那时的人均收入平均数是真实反映,那时的人均收入中位数则意义不大。
两则真实故事。那时中央核心领导层的王**爱喝酒,就将国宴招待会开启的茅台酒甁里剩酒集中起来,个人掏钱购买回家。后来被列为罪状之一。国家领导人到人大会堂开会,服务员泡茶是要收取几角钱茶叶费的。某位女副总理有些舍不得,就说自己不爱喝茶。
听起来是不是很吃惊,足见社会之清洁。相对公平的社会没人去关注什么平均数和中位数。
研究问题是采用平均数还是中位数,有时是取决于你的学术探讨的目的性。
应该数据决定观点,观点决定立场。而不应该立场决定观点,观点决定数据。谁都不傻。