第21章 直觉判断与公式运算,孰优孰劣?
这一章中,作者全篇都在讲述的一个观点是:用公式来判断或者用公式来预测会比那些领域里的专家做出的判断和预测更加准确。
为什么专家的预测不准确,作者推测有两个原因:
1. 这些专家试图变得聪明,总想跳出思维的框框,在预测时会考虑将不同特征进行复杂的结合。复杂化对稀奇古怪的事情是有影响的,但十有八九会降低其正确性,将这些特征简单地整合在一起反而会更好。
2. 专家判断不可取的另一个原因,是人们对复杂信息的最终判断很难达成一致。如果有人要求这些专家对同一信息进行两次评估,他们通常会给出不同的答案。案例:一个经验丰富的放射科医师在两个不同的场合看到同一张片子,这两次检查结果在“正常”与“异常”之间会有20%的偏差。
这两个原因看起来都很人性化对吧,人往往会考虑到更多的原因的影响,不像机器,你选几个因素它就是几个因素,第二个,人会在不同的环境下被影响,选出前后可能会矛盾的选择。
用公式来做出决策的方法我们姑且叫它“运算法”,在很多领域的从业者会对使用运算法反感,他们认为运算法是机械化,武断,甚至有点迂腐,冥顽不灵的。但是其实这些都很好理解,比如“深蓝”打败围棋大师的时候,我们总是站在我们这边的,我始终同情的是我们自己。谁会去为一个冷冰冰的机器加油喝彩呢?
人对运算法也是存在偏见的,比如一个医生如果做出了错误的判断,你可能不那么反感,但是如果是机器做出了错误的判断,那么人可能就会感到更加悲痛。这个很容易理解,比如前时间的华大基因的事件,因为基金检测的误差,导致没有检测出畸形儿,这直接让家属把华大基因告上了法庭,这个也是这几年首例,但是基因检测确实医生推荐家属去做的,最后医生的判断和基因并没有矛盾,两个都判断错了,但是受苦的确实机器。说起来很搞笑吧?
最后一个是作者为以色列士兵做的一个推荐他日后从事的兵种的系统,刚刚开始认为的面试官的做出的判断效果奇差,作者最后列出了大概六个标准,让面试官根据这六个因素给士兵打分,最后由这六个标准来做出判断给士兵推荐他日后从事的兵种。最后这个系统是“有效”的。比起以前的认为面试做判断”无效“的努力可以说是有了很大的进步。
但6项指标整合起来作出的预测比之前的整体评估要准确得多。我们已经从“徒劳”进步到了“有效”。
示例—人工判断和公式运算
“不管何时,只要公式能替代人工判断,我们至少应该考虑一下(运算法)。”
“他认为自己的判断既缜密又微妙,但实际上把一些分数简单地整合在一起也许会更胜一筹。”
“我们应该事先考虑清楚自己有多重视这些候选者以往的表现,否则,对他们的第一印象会对我们产生过多的影响。”
参考书:
《临床与统计的预测:理论分析与事实回顾》(Clinical vs. Statistical Prediction:A Theoretical Analysis and a Review of the Evidence)保罗·米尔(Paul Meehl)
《一份清单宣言》(A Checklist Manifesto)阿图尔·甘德(Atul Gawande)