认知训练020:那些欺骗我们的数据

在我们接触到的很多有关数据证明的推理中,数据的正确得当与否,往往需要我们的去认知和判别。

今天,我们就来讨论一下在有关数据的推理论证形式。

我们常说,有理有据,这里的ju可不可以理解为“数据”呢,不得而知,但是数据在推论中占有重要的地位却是不可置疑的事实。

但是,我们往往对数据缺乏相关的认知和不知怎么去判别一个数据是否得到和详实。

不信,你先看下面的图:

公众号:aaronwog22

公众号:aaronwong22


两种不同的提供数据的方式有可能会产生欺骗性

是不是发现这两张图都是表示的同一个意思,甚至表示的内容都一模一样。 但是为什么,它们看起来那么地不同呢? 是的,我相信认真观察的童鞋早已注意到一个细微的但却严重影响到人们认知的地方。 那就是,它们垂直轴一栏的起点数据和等差数据不一样。 两张图表达同一个东西,但是却给人天差地别的印象。这种现象在生活中很常见,这都是别有用心的人专门设计出来达成目的的一种手段,我们只要细心一点,多观察(看起点数据和等差数据),就能很容易避免。

但是,往往,我们还是会遇到一些比这更难判断的情况。

比如,

最近一个新闻标题:40%的大学生饱受抑郁症的折磨!

如果在你情绪正好低落的时候,看到这样的数据,那你可能会怀疑自己患上了抑郁症,进而根据自己的这个判断,不断回想以之相关的种种症状。最终,在这种“科学数据"的帮助下,你确信自己得了抑郁症,于是变得更加抑郁。如此恶性循环,失去了生活中很多美好的时光。

所以,拥有正确的认识和判断不仅对于我们做选择题有用,还对我们的生活产生了更多无法估量的影响。

那么,当我们面对上例这种数据时,我们应该怎样去判断和分析呢?

我们不妨来看看独立思考大师尼尔布朗的建议:

任何统计数据都要求将发生在某地的某些事件界定并准确识别出来,这常常是一项非常艰巨的任务。因此,要找出欺骗性的数据,第一个策略就是尽量找到足够多的关于这些数据是如何采集的信息。

并且,我们应该有以下认识:

统计数据往往只能是基于事实做出的一些估计。

不知来历的统计数据最常见的一个用处就是用大量的数字给别人加深印象或让别人肃然起敬。

记住,

在对数据做出反应之前,我们先要问一声它们是怎么得来的。

在统计数据中有一种数据我们往往会产生误解:

平均值

在我们大部分人眼里,平均等于平均数。

但是,今天我要告诉你的是,这种认知是错误的。

比如,下面的例子:

快速致富的一个方法就是做一名职业足球运动员,2010年国家足球联盟球星的平均收入是180万美元。

这里的“平均”其实有3种方法去测定。

就是用我们也同时熟知的平均数,中位数和众数的方法。而用这三种方法测量出来的平均值和它们所代表的含义是非常巨大的。

所以, 当你见到平均值的时候,一定要记得问一下:“是平均数、中位数还是众数,选择的平均值不同会不会产生什么影响?”

同时,了解全距(最大值和最小值的差值)和每个数值出现的频率也很重要。 因为,

了解全距和数值分布的一个总体好处就是这样做会提醒你大多数人或事并不正好符合平均值,与平均值差异极大的结果也在意料之中。

比如我们上面提到的职业足球运动员收入,如果不了解全距和各个球员工资的数值分布,那么我们极容易会被那个所谓的“平均”所误导,从而做出不符合我们预期的决定。

有时候,数据也可能被论述者有目的地进行省略

比如下面这个广告:

美杜莎发胶,现在效果要好50%。

看到这个广告,作为批判性思考的我们应该问这样一个问题,:

比什么要好50%?是其他没效果的发胶?还是美杜莎以前的发胶产品?(有什么相关的信息缺失了?)

尝试着问出以上类似的问题,能够帮助我们发现那些省略的信息。

同时,要记住:

当你遇到听起来让人心动的数字或者百分比,一定要当心!

了解了数据本身的问题,我们来看一下人们解释数据的问题

有些数据确实能证明一件事,而持论者往往宣称这些数据证明了另一件性质完全不同的事,这时候他们往往在欺骗我们。

那怎么找出这种欺骗呢?

一个策略是对持论者提供的数据视而不见,然后问自己:“什么样的统计数据作为证据在证明他的结论方面会有帮助?”然后,将“所需”的数据和所给的数据进行比较。如果两者之间难以吻合,你可以就发现了一个数据上的欺骗。
另一个策略是,不急于去看作者的结论而是先非常细心地检查作者的数据,然后问自己:“从这些数据我们可以得出什么合适的结论?”然后拿你的结论和作者的结论相比较。

除了数据解释上的欺骗,在数据表达方式上我们也应该要注意。

例如,用相对方式而不是绝对方式进行表述,这些不同形式可以极大影响到我们对于实际的风险降低数值的认识。

最后,根据《如何提问》这本书,对本章的总结:

评估数据的一些线索:

尽量找出如何获得数据的相关信息,越多越好。
要对描述的平均值的类型感到好奇,分析一下知道事件的全距和数值分布是不是会对数据多了一个有用的视角。
数据使用者拿一件事的结论来证明另一件事时你要特别当心。
先不去看作者或演说者使用的数据,把所需的数据证据和实际提供的数据做比较。
从数据中得出你自己的结论。如果这结论和作者或演说者的结论不一致,那么很可能其中有什么地方出错了。
判断有什么信息缺失了。对于误导性的数字和百分比以及缺失的比较,你要特别当心。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容