▍概述
本书作者纳特西尔弗(Nate Silver)曾经在棒球预测和选举预测两大领域都取得了成功。在棒球预测中,他建立的PECOTA系统(PECOTA:“投手经验比对与优化测试算法”的首字母缩写)在2003年~2008年领先于其他预测系统;在选举预测中,他建立的538网站(取自选举人票的总票数538张)在2008年的美国总统竞选中,命中了总共50个州中的49个州。
在《信号与噪声》中,西尔弗对“预测”进行了全面的审视,书中对房市、选举、棒球、天气、地震、经济、传染病、NBA、国际象棋、扑克牌、股票、气候,甚至恐怖袭击等诸多方面的预测进行了分析,并提出了一套完整的预测框架。
虽然涉猎众广,且“预测”在一般意义上被认为是一个技术性的词汇,本书却并不是本“手把手”的操作书,而是一部方法论。
在绝大部分篇幅里,我们找不到任何的“鱼”:具体的预测技巧。相反,作者在一遍又一遍(上述13个领域构成了本书的13章)地教授“渔”:预测的目标怎么定,预测的质量有多高,影响的因素在哪里,改进的方法有什么。
▍一、前提假设
既然是方法论,当然会有一个前提假设。
本书假设的前提有三点:
1、世界上存在着客观真理;
2、人类无法直接认识客观真理;
3、人类可以通过对自己观念的修正来不断地接近客观真理。
▍二、前七章概述
当然作者不是一开门就抛出这套理论,不然马上就会遭到异议。因为作者所提出的和我们——至少最近二三十年的几代——所接受的系统性的科学教育中隐含的本质是相悖的。我们接受的科学主义的核心是:通过科学可以认识世界——换个说法,即客观真理。
为了让读者能循序渐接受,全书的前七章实际上都在铺垫。
简要罗列前七章主要领域的预测分析:
(注:理论指理论根基,模型指数据模型,数据指数据质量,预测指预测效果;另外差、中、好是我总结的,不代表作者观点)
1、房市:理论差、模型差、数据差、人为影响大,预测差;
2、选举:理论中、模型中、数据中、人为影响大,预测差;
3、棒球:理论好、模型中、数据好、人为影响小,预测好;
4、天气:理论好、模型中、数据好、人为影响小,预测好;
5、地震:理论差、模型差、数据差、人为影响大、预测差;
6、经济:理论差、模型差、数据差、人为影响大、预测差;
7、传染病:理论差、模型差、数据中、人为影响大、预测差。
实际上,“房市”和“经济”是同一类。
我们看到,预测基本是由“人”、“理论”、“数据”三者相互作用而产生的(下文我将它们称为“预测三要素”,当然此处也不代表作者观点)。好的预测需要“天时地利人和”:好的理论、好的模型、好的数据和减少人为影响同时作用。若一个元素不好,甚至每个元素都不好,预测的结果也不会好。
▍三、预测三要素:人
之前不是说过作者的538网站在选举预测中大获成功吗?为什么选举预测总体上还是很差呢?
因为那只是个例。选举期间,真正面对广大受众的,在新闻、访谈、社论中出镜、执笔的专家们所做的预测,准确率是极低的。作者以广受欢迎的政治节目“麦克劳夫伦讨论小组”为例:小组成员的平均预测准确率是49%~52%,和掷硬币猜人头的概率相当。
“麦克劳夫伦讨论小组”中的成员可谓名副其实的“圈内人士”:他们来自《芝加哥论坛报》、《福克斯新闻》、《新闻周刊》,民调的数据也很容易获取,为什么他们的预测效果仍然不好呢?作者给出的答案是:立场。
保守派不会预测自由派当选,自由派也一样。更重要的是,有时预测者并不在意预测的结果,他们更在意过程——是否吸引了足够多的受众。于是他们的选择是:坚持观点,和加大嗓门坚持观点。
也就是说,预测者们专注于观点本身——无论对错——带来的影响力,而不关心结果如何。在现实中能被我们轻易识别出的,也正是那些站定派别后就不再换边的人。
但选举总会有结果,与此相比那些需要更长时间才能检验结果的领域,比如地震和经济预测上,在谋求影响力的推动下,不断产生“青蛙预测地震”或“橄榄球超级碗大赛冠军预测经济走势”这样的论调就不足为奇了。
回头再看,作者的538网站之所以能取得成功,仅仅因为西尔弗盯住民调作为主要指标——竞选级别越高,越接近最终大选,民调的结果就越稳定——而摒弃了人在其中的影响。
与此类似,棒球和天气之所以能取得成功,很大一部分原因也在于预测者们摒弃了个人的好恶,专注于从数据中挖掘证据。
▍四、预测三要素:理论
但是,如果过于强调数据的作用,就会掉入“数据决定论”的陷阱。事实上,作者认为,在人、理论、数据这三者中,数据的重要性反而是最低的,一个正确的理论远胜于千万数据。
例如棒球。棒球运动中,几乎所有运动员的表现都能被量化,但正因为数据庞杂,如何选择合适的数据成了预测的关键。最好的理论需要的并不仅仅是棒球场上量化的数据:本垒打数、保送数——反映了球员现在的能力;也需要结合棒球场外无法量化的数据:态度、自信心——反映了球员未来的潜力。
再如天气。最开始的天气预测实际上是纯数据的:统计“历史上的今天”降水的平均概率。很显然我们都知道不能仅靠过去去预测未来:现在天气预测先将大气层划分为一块块的“网格”,并建立模型预测它们之间相互作用时对天气的变化和影响,精度取决于“网格”的密度。随着科学发展,和对气流、温度变化的持续研究——还有越来越强大的超级计算机的帮助,我们已经能够把大气的“网格”划分得越来越小。
而对于地震、传染病,正因为目前我们对它们的成因或传播方式的研究还有诸多盲点,所以目前的模型都有各自的局限,预测效果也不好。
▍五、预测三要素:数据
虽然数据的顺位不如理论和人,但也是很重要的——经由理论建立的模型需要投入大量的数据才能运算。
但是数据也有自身的问题:太多了。在如今的信息社会,每天都会产出大量的数据,其中真实数据的产出速度远不如虚假、重复数据的产出速度——比如作为一个直观的案例,可以打开微博和朋友圈看看大多数信息的质量——有用的信号太少,噪声太多。
这也是影响经济预测重要因素:美国政府每年公布的数据有4.5万个,而私人数据提供者甚至能追踪400万个不同的统计,其中真正能起到指标意义的数据,只有绝少的一部分。
▍六、预测的偏见
预测需要一个好的理论,但好理论或坏理论都只有人才能建立。
模型结合了理论和数据,但对模型效果的检验需要更多的数据和——人的参与。
此外一些数据本身就是“偏见”的产物:比如棒球运动员的“自信心”,需要人——球探——依靠主观经验去量化。
我们能看到,在预测中“人”的影响无处不在,而人又是带有偏见的,所以大部分的预测难免会被偏见所影响。
▍七、预测的框架——贝叶斯定理
前七章毕,我们眼前有两个问题:
1、人、理论和数据都有各自的局限,如何组织它们?
2、预测难免带有人的偏见,有没有带着人的偏见也能作出好预测的方法?
对此,作者提出了一套预测的框架——贝叶斯定理。
在这里只简要介绍下如何应用贝叶斯定理:
1、承认人在预测前就带有某种偏见。
(举个例子,比如我发现前方蹲着一只生物,我想预测下它到底是什么,此时我有一个初始偏见:遇见一只未知生物时会先下意识地以为它是狗。)
2、将这种偏见表示为概率的形式。
(称作“先验概率”,此时我对我的偏见进行主观量化,我认为该生物是狗的概率为60%)。
3、当更多事件发生时,分别计算出先验条件存在和不存在时相关事件发生的概率。
(我听到了一声“汪”。假如它是狗,那么它发出“汪”的概率是99%——考虑到有些狗可能喜欢说外语,比如“喵”;若非狗,它“汪”的概率是0.5%——考虑到可能有某些大概会说外语的猫,和真能说外语的八哥)。
4、将先验概率用相关事件下的不同概率调整后,计算得到后验概率,这就是你对事件的预测
(最终得到的“后验概率”中,我预测蹲着的生物是狗的可能性变成了99.69%)。
5、此时的“后验概率”就变成了你的“先验概率”。
(也可以被看作是这件事对你的影响程度,比如我再往前走,遇到了另一只蹲着的生物,此时我的初始偏见就变成了:它是狗的可能性是99.69%)
可以看到,应用贝叶斯定理时,即便带有初始偏见,只要经过足够多的事件,不断地检验和修正后,我们的偏见是可以被纠正到很低的水平的——也就是,无限地接近客观真理。
再看看贝叶斯定理下的预测三要素:人既是提供偏见——先验概率的,又是做出客观预测——后验概率的;一个好的理论能保证这一过程的顺利进行;数据——大量持续的数据——是使贝叶斯定理不断应用,后验概率逐渐接近客观真理的保障。
▍八、九至十三章
最后几章主要是应用贝叶斯定理时需要注意的问题,归根结底还是人、理论和数据。
对于人的偏见问题、立场问题,作者几乎在每一章都苦口婆心地唠叨了一遍。例如股票市场中,为什么股票经纪人有没有预测到熊市都会坚持买入?因为他们的考核周期只有90天,而股市在90天内崩盘的可能性只有4%,无论熊市还是牛市,坚持买入对他们最有利。
对于理论,假如现有的模型失败了该怎么办?作者建议启用备用模型——一个合理的基准预测,比如选举预测中,备用的模型是选还在台上的那个。
对于数据,重要的是筛选出信号——有用的那个。我们都知道GDP在公布之后还会被不断被修正,可是你知道修正的范围有多大吗?1965~2009年美国政府修正过的季度GDP中,误差幅度为±4.3%——最初估计为超常增长的,实际上也有可能在衰退。原因在于GDP估值并没有一个公认准确的概率市场——类似于股市对股票的估值,虽然这也是不确切的——实际上大部分数据都如此,因此对于数据需要在应用中注意不断修正。
书中于此相关的论述颇多,就不加赘述了。
▍九、竞争的水位——预测得准还不够
需要特别指出的是,在现实世界里,并不是掌握了贝叶斯定理,做几个准确的预测就能挣钱。例如在扑克牌领域,即便你的预测能达到95%的准确度,依然有可能输,因为顶尖玩家预测的准确度是99%。
在竞争性强的领域,特别是零和博弈的条件下,预测能力最差的玩家最终都会被淘汰。当那些准确度达到85%的玩家都因为亏损而离场后,准确度为86%的玩家就开始亏钱了,顺此而上,最终只有最顶尖的玩家才能生存。
如西尔弗所说:“竞争为人们设定了‘水位’,而个人的利润只是‘冰山一角’,漂浮在水面的仅仅是一小部分竞争优势,而隐蔽在水面下支持它的,是一个由汗水铸成的巨大堡垒。”
▍十、作者的终极理想
作者的终极理想是,如果人人都用贝叶斯定理,那么世界大同将不是梦。
从表面上看这是合理的,因为不管大家一开始的想法有多大的差距,在严格遵循贝叶斯定理的框架时,经过对各自观念的长期、持续的修正后,最终都将收敛于一点。
但这里其实有一个问题,“不断修正”时需要大家都取相同或接近的概率,而在现实中并没有提供这一概率的公认市场。而让人们从各自的主观出发去估计这一概率——显然大家的估计都是不同的——难免会导致后验概率的不断震荡,最终自由派和保守派是很难收敛到一个点上去的。