△
传染病预测中通常使用外推法。
外推法只有一个假设:假设未来是现在趋势持续发展的结果。用统计学修正后会发现,外推法对指数增长的效果极差。
当预测涉及人类行为时(比如预测某种病毒善于在某一类人群中传播),预测本身就会改变人的行为方式(大家突然间就开始注意个人卫生了),而方式又会作用于预测(实际调查发现病毒在目标人群中的传播并不广泛)。这类作用可以分为自我实现预测和自我否定预测两类。
△
芬兰科学家汉娜 库克将构建统计或预测模型比作绘制地图。
绘图需要足够多的细节才能真实地展现基本景观,但过于复杂的模型又会将噪声拟合进来,以至无法成功地复制内在结构,使预测失败。
但过于简单也不行。流行病学界,医生所用的SIR模型就相当地简单(始于1927年)。它只能对极少数病情有效。
简单化是构建模型应有的追求,但应该是抓住核心本质后的简单化。哈佛大学的马克 利普斯奇说:“根据3个数据点作预测是很愚蠢的。”这三个点是1918、1957和1968年。
△
模型都会遗漏一些细节,这些细节是否关系重大,取决于我们试图解决的问题究竟是什么,还要看我们想要得到的答案有多精确。
模型也是帮助我们理解某一领域复杂性的工具,而不是用来取代整个领域的。
△人与机器
在传染病预测中,表面上还是模型的问题,但深层下依然是理论的问题。不能对现实进行合理的简化,不能抓住问题的重点,其实都是理论构建不到位的缘故。虽然是不同的领域,但存在的问题却总是相似的:如果没有在理论上做好足够的准备,贸然地认为单凭数据就能解决问题的,最后总要面对失败的苦果。
△前七章总结
表面上是“越依赖数据的领域,如果数据质量越差,那么预测效果越差”。而实际原因则根源于人。出于人的动机,为了符合自己的理论,宁愿使用差的数据,就会导致预测结果变差。
对比下前三章,同样的近似的情况下,因为克服了人的错误,预测效果马上就变好了。而第四至第七章虽然是不同领域,讲的其实是同一个问题:因为人的动机问题,最后导致的不但是整体预测效果的低下,也阻碍了理论和技术的进步。
但正如“经济人”总是存在的一样,人的动机问题也是客观存在的。那么是否有办法能解决这一问题,提高预测的精度呢?作者的答案是贝叶斯定理。
承认我们天生带有偏见,并保证说即使带着偏见,我们依然能够进步,听起来就很振奋人心。下一章开始,作者会介绍如何在带有个人偏见的前提下,通过应用贝叶斯定理,来帮助我们克服自身的偏见,让预测结果能更接近客观真实。