(一)令人困惑的平均值
我们先放松一下,来简单回忆一下初中的数学知识——算术平均数、中位数、众数。它们都属于平均值,但中位数和众数还可以反映某一组数据的集中趋势。
算术平均数:一般而言,我们常用算术平均数作为平均值的一个指标,即把所有数值相加,然后用总数除以相加的数值个数。
中位数:指将所有的数值从高到低排列然后找到位于最中间的数值。
众数:指计算不同数值出现的次数然后找出出现频率最高的数值。
众数和中位数更符合实际感受,算术平均数更容易受到极端值的影响。于是在日常统计中,为了使某一类数据看起来更高或更低,常用算术平均数作为统计指标。
如:统计某地产公司工资的工资水平增幅时,利用算术平均数,能得出工资普遍上涨的假象,还能掩盖个人收入天壤之别的现实。(可能只是高管的工资翻倍,其他人工资原地踏步)
(二)把一个结论改头换面包装成另一个结论
简言之,就是用不相关的数据证明结论,用无辜的数据为倾向的结论作伪证。
例如,某减肥产品,宣称100名试验志愿者中,只有6名有副作用,所以,94%的人在服用该减肥产品后,会有效果。
逻辑错误在于,没有副作用不等于有减肥效果。商家明显在玩文字游戏。数据是真实的,但是与结论无关。
这里有两种策略可以帮你找出这类欺骗性伎俩:
不看持论者提供的数据,自己思考需要什么样的数据,然后比较所需的数据和所给的数据。如果两者不吻合,你就发现了一个数据上的欺骗。
不看持论者给出的结论,自己思考根据数据可以得出什么结论,然后拿你的结论和作者的结论相比较。
(三)省略数据也是欺骗
有意省略隐瞒一些数据也是常见的现象。例如常见的洗涤剂广告:“去污效果增强10%”,这个增强是与上一代产品对比,还是与纯水对比?貌似广告中都没有说。
目前北京、广州、深圳都在执行禁摩禁电的政策。以深圳为例,理由是致死事故中驾驶电动车的占比超过30%,但是官方并未提供数据,近三成的事故中,事故责任主要是机动车违规驾驶而导致了惨剧。
还有先前对比中美办公大楼的帖子:“美国田纳西州拉菲特市市政厅,怎么看也像个内地的大型汽车加油站”,事实上,作者并没有说明,该市人口为4474人(2010年最新统计),接近华北地区一个行政村的规模。
还需要留意一些令人心动的数字或百分比,例如“跳伞运动其实比其他活动,比如驾驶汽车要安全的多,一个月内洛杉矶有176人死于车祸,而死于跳伞事故的却只有3人”,可是我们都知道参加跳伞活动的人比起驾车的人简直是微不足道,此时如果用百分数,是不是就会得出不同的结论呢?
当你面对数字的时候,如果只有百分比,想一想绝对数字,是不是结论可能就不成立了呢?同时还要注意作者有没有缺失相对比较的数据。
有意隐瞒一些数据,确实能够增强证据的说服力和可行程度,但是却是误导性的。
总结完上述可能存在的数据作假问题,这儿还有一些贴心建议供大家参考:
尽量找出数据来源的背景信息;
确认平均值的类型;
注意对方用无辜的数据为自己的观点洗地;
判断并寻找缺失的信息。
参考书《学会提问》