面对新冠病毒疫情这一突发事件,你是不是很紧张?当然,对生命的拷问没有人敢轻视。悲观者可能举出世卫组织提供的模型计算结果,说可能会让这颗星球的三分之二的人口感染上。听上去就像是“危言耸听”。也有人说,哥廷根(著名的数学圣地)的数学家给出的模型说四月底将迎来“拐点”,且对已经发生的数据有相当不错的拟合。他们说的模型到底是什么意思?普通百姓如何判断?我今天就来谈谈模型思维的适度运用。
什么是模型思维?其实说起来也不神秘,你横穿马路就会不自觉地用到模型思维。“愤青”也是典型的模型思维。你之所以敢横穿马路,你实际在运用“线性思维”。你根据车速做出估计时,就在使用线性方程。愤青(运气不好,你的领导也会)运用的刻板印象也是一种模型。而下面我要说的模型思维是有意识地主动构建的准数学模型,模型往往是我们世界观的产物,好的数学素养不仅有助对疫情趋势的判断,甚至是对你世界观(思维操作系统)“版本”的一次升级。
模型常常像俄罗斯套娃,有表层的粗模型,也有内层更本质的精细模型。你放心坐着民航那样的“大铁嘎哒”飘于接近无感的空气中,就是因为有纳维-斯托克斯方程建立的流体力学模型。它的简化套娃有“卑努力方程”和欧拉方程等。你不必理解这些,知道复杂模型总有“简化版”即可。
我们回到一种新冠病毒的传播模型SEIR,模型的微分方程是不是很唬人?你只要相信科学家由此导出的“传播强度”指标R0即可。过程我就不推导了。
R0有何意义?科学家总会用一些“指数”(数学素养好的人可以理解为一种泛函)。类似“洗车指数”之类,R0=1时,扩散不再增长,小于1则收敛,大于1越多扩散越快。
理解模型要理解他的“要素”。这里的四个字母就代表了SEIR的要素,简化一点的模型是SIR。没有考虑潜伏期,能看懂上图要素间关系的朋友会有更深入的理解。我今天只把最最,最最粗糙的“套娃”讲给诸位,他是连“约束和抑制项”都没有的模型,也可以叫马尔萨斯增长模型,其朴素思想就是传播速度与已经患病的人成正比(y'=ky),这是不是大家脑子里的常识?加入各种抑制因子、自衰因子…,就有些类似著名的罗杰斯蒂克方程了。
而这个方程y'=ky的解就是用y=ce^x指数方程。市长大人如果对指数增长有任何常识,就不会犯如此大错了。
当然,如果想自己动手算算,可以用Matlab 软件算一下罗杰斯蒂克方程。用已经公布的历史数据拟合出参数后,对当天数据做一次预测。y'=ky太粗糙了,根本就没有拐点,只有一点点启迪作用。罗杰斯蒂克方程解的典型曲线形状就是“S”曲线。更接近SIR和SEIR传染病模型(精确套娃)。算出的数据似乎略低于实际,但已经接近了。所以粗糙模型也比普通人的“线性思维”准确。
要用模型求出拐点,那是专家的事。在大数据年代,模型往往是一种公开的公共知识,而要算准“拐点”就难了,专家们是用“数据算数据”,模型即便对过去一段数据拟合得非常好,也不见得能算准拐点,因为模型参数可能被“过拟合了”。就像你对某某的刻板印象,他就是“怎样怎样的人…”。模型甚至有可能出现“混沌”,那预测就会失效。
回归也是一个给予我们信心的模型,我这里所谓的“回归”是说,这世界上很多“突发(偶发)”的事件总会恢复平静。这类蝙蝠为宿主的病毒乔迁到人类,也类似哥伦布登陆北美。这里不是它们的家园。但是人类再这么贪婪,没有节制,那新冠病毒就真要建立“冠立坚共和国”了。间隔没几年,就因为我们的“吃相”不好,两度引起全球恐慌,我们是不是要找回尊严?提高那些吃货的犯罪成本。要“和谐掉”的是他们,而不是真相。诚实是令人尊重的前提。
作为非专业的普通群众,我们对专业人员选择的模型可以有要素级别的判定,比如SEIR的理论精细程度就高于SIR模型,因为后者少考虑了一个潜伏期。专家可以用历史数据适当训练模型,适当就是要保持一定的泛化能力,一面“过拟合”(就是你日常的所谓刻板印象)。AI建立的模型如今已经越来月准,但你需要知道对传播概率、修复概率等还受管理体制、气候等因素的影响。比如我们的举国体制,官员的独立决断力差,但一旦有了判断,采取措施的效率是非常高的。很快可以形成阻碍传播的社区网格,容纳这些变数的模型就太复杂了。新冠病毒据说对温度的偏爱是较低的气温,那么印度就可能比我们有利。总之,模型的相对正确性非常依赖它的基本假设。而其中有相当多的假设是“理想化的”,切不可忙信。
建立国家级别的AI传染病模型库看来很有必要,成本不会比研制预警机还高。但对未来病毒的战役可能是“核战”级别的。从传播模型就不难知道,措施早一点,损失的减少也许是指数级别的。升级认知吧,从今天的1.0开始。