当我们评价一类葡萄酒的品质,和预测它的价格时,往往会认为:如果没有几十年的从业经历,和品尝过成千上万不同品类、品质的酒时,你连资格都不具备。
葡萄酒品鉴就是这样一个复杂,和崇尚权威的领域。只有具备足够多的品尝经验,才能形成更精准的直觉。而葡萄酒大师级人物的品鉴方法,也正是传统的“痛饮”,以及“回味”。
但这种状况,却被葡萄酒行业的一个外来者给彻底颠覆了。这个无名小卒虽然很喜欢喝葡萄酒,但却远远算不上品鉴专家,也并不在葡萄酒相关行业工作,而是一位普林斯顿的经济学家。他的工作常年与数字为伍,或者简单地说,他的工作是用统计学方法提取出隐藏在大型数据集合中的相互关联的信息。
比如,这位普林斯顿的经济学家曾考察同卵双胞胎的工资,来估计上一年学对一个人的收入带来的影响。又比如他曾考察限速差异,来估计美国各州对于统计寿命的重视情况。这一次,他花了25年时间,只为搞清楚葡萄酒的品质究竟与哪些因素有关,以及相关程度到底有多少,直至变成一个精准的数学公式。
这位普林斯顿的经济学家名叫阿森费尔特,他联想到价格肯定与品质相关,因此他分析了以往不同年份、不同拍卖价格,这些酒的相关特征各是什么。
阿森费尔特发现:较少的收获期降水量和较高的平均夏季气温,这两者才会带来品质最佳的葡萄酒。又经过一段时间的统计与计算,阿森费尔特大胆地提出了一个判断葡萄酒品质的数学公式。
即,葡萄酒品质=12.145+0.00117*冬季降水量+0.0614*生长季平均气温-0.00386*收获期降水量
阿森费尔特的这种做法遭到了传统葡萄酒评论家的猛烈攻击,最有影响力的葡萄酒评论家罗伯特·帕克更是评价道:他是个彻头彻尾的骗子。帕克进一步说:“阿森费尔特就像一个从不看电影,仅仅根据演员和导演判断电影好坏的影评人一样。”
阿森费尔特和罗伯特·帕克的交锋在1989年和1990年达到了顶峰。阿森费尔特先是公开批评帕克对于1986年波尔多葡萄酒“非常好,简直称得上出类拔萃”的评价是个错误,因为根据统计数据,那一年的生长季平均气温低于平均水平,而收获期降水量高于平均水平,因此那一年的酒绝对很平庸。紧接着,阿森费尔特在当年葡萄酒仅存放3个月,还没被评论家品尝时,就断定那一年的酒会成为这个世纪的葡萄酒之选,售价绝不会低于过去35年酿造的任何一款葡萄酒。
事实证明,阿森费尔特是对的,1989年的葡萄酒之后被公认为“世纪年份酒”。但事情还没完,阿森费尔特紧接着又在1990年大胆宣称,这一年的酒会比1989年的葡萄酒表现得更好。事实再一次得到了验证,阿森费尔特又对了。
传统专家大跌眼镜,虽然他们从未公开承认阿森费尔特的预测能力,但他们却在慢慢地改变先前的看法,纷纷对天气给予了巨大重视。阿森费尔特对于这种改变幽默地说道:“现在和过去不同了,品酒师不会再犯可怕的错误了。坦白地说,我是在自掘坟墓,我再没有像之前那么高的附加值了。”
这个故事来源于《魔鬼统计学》,作者伊恩·艾瑞斯用了大量的真实案例把我们带入了统计学的世界,引导我们思考直觉、经验体系是否可以取代数据分析体系,它们二者究竟孰对孰错。在葡萄酒品质预测这个案例中,我们看到代表数据分析的阿森费尔特战胜了代表直觉与经验的葡萄酒大师罗伯特·帕克,似乎数据分析占了上风。但是,不得不说,阿森费尔特并不是每一次都对,也并不是每一次都和正确答案相差无几(有时稍有差距);而罗伯特·帕克也并不是没有一点作用,几十年的经验毕竟沉淀了某些珍贵的特质,让他比别人更具直觉。
那么,面对生活中大大小小的预测与决策,我们究竟应该如何应对呢?你需要了解如下几个问题。
一、认知缺陷和偏差影响我们的预测能力
科学实验已经证实,我们人类的大脑存在某些认知缺陷和偏差,即使是最聪明、最优秀,有着足够多经验的专家,有些时候也不能幸免,而这往往会影响到我们的准确预测能力。
这些认知缺陷和偏差就包括“可得性偏差”和“否认证据”。
“可得性偏差”指的是,我们的判断总是会基于那些难忘、生动的记忆,而不是可靠或可信的证据,这直接导致我们会对某些看似特殊的事件赋予过高的权重。比如,很多人认为游乐场坐飞车是个危险的行为,毕竟一方面我们看到在高速转圈的过程中瞬间充满恐惧的人群,顿时感觉到如果被甩出去将会是多么可怕。另外,我们也会对一些报道过坐飞车出事的事件记忆犹新,这进一步加深了我们对其危险性的判断。但是,其实根据统计结果显示,在游乐场坐飞车比在干道上骑自行车的危险性还要小,可是我们从来就不认为骑自行车危险。
“否认证据”指的是,一旦我们形成了对于某事的错误观念,我们就会坚持这种观念,即使新出现的证据显示与我们的原有观念不符,我们还是会选择忽视它,只关注支持我们原有观念的证据。这样的事情也屡见不鲜,从拒绝改变诊断的医生到拒绝放弃其理论的科学家都是如此。正如普朗克所评价的那样:一个新的科学真理不是通过说服它的对手,使他们恍然大悟,而是因为它的对手最终死了,通晓它的新一代成长起来了。
除了这两个认知缺陷和偏差,我们有时还会犯过度自信的问题。就像瑞典的一项调查显示,有90%的司机都认为他们的驾驶技术在平均水平之上。
二、数据分析预测的优势
伽利略曾说:唯有数学才能揭示科学的真实面貌,因为数学似乎是上帝的语言。”对于生活中我们的预测与决策,数学也占据着重要的地位。
数据分析预测相比于人类缺陷的优势在于,它会在预测时更好、更客观的分配每个因素的权重,而且在此过程中不带任何情绪,不会犯任何人类认知缺陷方面的错误和过度自信的问题。不仅如此,它还能告诉你它预测的质量,不会像传统专家那样对任何没有把握的预测都充满自信。
数据分析预测经常使用的方法是统计学中的回归方程,当然随着技术的发展,后来也出现了一种“神经网络”的预测方式。有趣的是,它所使用的是模拟人脑的学习过程来进行预测。它们二者究竟谁强谁弱现在还不好说,但是肯定的是,它们都不是源于人类简单的经验和直觉,而是数字、数学。
还有一点,数据分析预测还会用到一种方法叫做“随机化测试”,简单的说,它是把几组不同的方案分配给一群测试人员,根据得到的反馈来进行进一步的决策。这样做的目的很简单,就是避免犯专家高估自己直觉能力的错误,而是用随机化测试来检验我们的直觉,可以说这是一种非常客观的方式。
三、数据分析预测的不足
数据分析预测做不了什么事情呢?《魔鬼统计学》的作者认为是“假设”。也就是说,数据预测分析并不会知道是“什么导致什么”,而人类需要用我们的大脑和直觉猜测哪些变量应该或者不应该包含在统计分析中。之后,再由回归来检验是否存在因果效应,以及这些因果影响的大小。
还有一点需要指出,查理芒格在一次题目为“论学院派经济学”的演讲中讲到,由于经济学涉及的系统太过复杂,经济学家往往会过度强调某些可以量化的因素,而低估那些无法被测量的因素的重要性,这就导致我们的回归公式中并不会包含那些无法测量但重要的因素。因此,准确性一定会大打折扣。
四、结语
数据分析预测并不是直觉的替代物,更准确地说,它们应该成为一种相互的补充。正如《魔鬼统计学》结束语所说:我们应该做的是,将直觉、经验、统计学结合起来,以生成更好的选项。