「用数据来说话」也可以忽悠人

有时即使数据是真的,不合理地解读也会歪曲其实际含义

在文章论证中,有一类证据常常看起来非常动人,因为它们往往让证据显得非常具有科学性和精确性,似乎就已经代表了真正的“事实”,这就是用数字或图表形式来表示的统计类数据然而,这些数据却能够,而且经常会对我们说谎。

中心原则

不是只要带图有数字的内容就能代表真相,我们应该仔细核查信息的来源,努力辨别出错误的数据推理方式。

思考结构

关键问题:统计数据有没有欺骗我们?

统计数据看起来就像是很权威的“事实”,但是这种“事实”是非常容易被人操纵的。

思考节奏:评估数据是否合理
  1. 尽量找出如何获得数据的相关信息,越多越好,多问一下:作者是怎么知道这些数据的?
  2. 对描述的平均值的类型感到好奇,思考一下:如果知道相关事件数据的全距(最小数值和最大数值之间的差距)及数值分布(每个数值出现的频率),是不是就可以有另外一种视角的理解?
  3. 要特别小心作者是不是在使用数据拿一件事的结论来证明另一件事。
  4. 先不去看作者使用的数据,把所需的数据证据和实际提供的数据做一下比较。
  5. 先从数据中得出自己的结论,如果这个结论和作者的结论不一致,那么要仔细揣摩其中哪些地方可能已经出错
  6. 仔细判断是否有缺失的信息,对于误导性的数字和百分比以及缺失的比较要特别小心。
一些常见的数据撒谎方式
  • 数据来历不明或者带有偏见
    统计数据往往要求将发生在某地的某些事件界定并准确识别出来,这常常是一项非常艰巨的任务,因此统计数据往往都是基于事实而作出的一些估计。不知来历的统计数据最常见的一个用处就是用大量的数字给我们加深印象,或者让我们肃然起敬。为了辨别他们,我们要尽量找到足够多的关于这些数据是如何采集的信息。并且记住一点,在对这样的数据作出反应之前,先问一声他们是怎么得来的。
  • 不同类型的平均值模糊地表达出来
    在统计学上,至少有三种不同的常用方法来测定平均值:
    平均数:把所有数值相加,然后用总数除以相加的数值个数
    中位数:将所有数值从高到低排列,然后找到位于最中间的数值
    众数:计算不同数值出现的次数,然后找出出现频率最高的数据
    有一个虚构的例子,可以让我们对这些平均数的区别,有一个非常直观的认知:

假设有一家工厂,里面有5个股东,25个经理,70个工头,200个高级技工,250个普通技工,300个实习生。其中:
股东年收入1000万
经理年收入50万
工头年收入10万
高级技工年收入8万
普通技工年收入4万
实习生年收入2万

对上述人群的收入,平均数是11.94万,中位数是4万,众数是2万,虽然这些结果都可以用“平均数”来描述,但却相差好几倍。假设某个地方政府需要上报该工厂的收入情况,那么上报“平均数”就显得非常和谐,而上报“众数”就会很不和谐了。

  • 把一个结论改头换面包装成另一个结论

一家汽车销售公司宣称其所推出的某款新型汽车是一个巨大的成功,因为每100个购买该款汽车的人里,只有5个人向代理商投诉这款车的性能不够好。“95%的买主都对这款车感到满意,”推销员说,“证明这是款非常好的车。”

5%的人没有投诉,并不能推导出95%的人满意这个结论。

  • 故意省略一些关键数据
    一些很常见的例子就是在百分比绝对数值这两个重要因素之间,故意忽略掉一个因素不提。
  • 使用不同的表达方式来刻意改变效果

想象一个65岁的女性刚患了中风,正在和她的医生一起商量治疗的方法。医生引用了三种治疗方案的相关统计数据:
1)治疗方案X可以减少33%的未来再次患中风的可能
2)治疗方案Y可以将绝对风险从9%降低到6%
3)采用治疗方案Z,有94%的女性在十年内不会再患第二次中风,而没有接受方案Z的病人里只有91%的人十年内没有再患中风

让我们猜猜这位女性会选择哪种方案呢?可能很多人猜会选择方案X。而事实上,所有这些选择都指向了同样的治疗效果!它们只是以不同的语言方式来表达风险而已。假设当前的治疗手段可以将中风的100例中的9例减少到6例:

  1. 方案X(33%)是相对危险度的降低率,从9减少到6,那么风险就减少了1/3,或者说33%。
  2. 从9%到6%,绝对风险只变化了3%,也就是方案Y的意思。
  3. 病情好转的人数从91人变化到94人,仅仅只是提高了3%,即方案Z的意思。

可以看到,以相对方式而不是绝对方式来表达风险减低值,可以让疗效显得比实际情况好的多。

写在最后

我们不仅要在读文章的时候小心识别这些数据的论证方式,当我们自己在写文章的时候,也要小心来使用数据证据。我们应该尽量避免欺骗手法,但同时应该以一种明白易懂的方式,来呈现出那些常常是复杂万分的数据。可能我们要从论证中专门拿出时间和精力来解释这些数据是怎么得到的,数据的含义是什么,以及数据存在的局限性,这样的做法才是一个具有批判性思维的写作者的做法。

  参考:
* 《学会提问》(https://book.douban.com/subject/20428922/)
* 《什么是基于真实数据的欺骗》(http://www.woshipm.com/operate/227073.html)
* 《「数据会说谎」的真实例子有哪些?》(https://www.zhihu.com/question/19578400)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354