13 双参数扫描
在前面的章节中,我们介绍了传染病的SIR模型,特别是Kermack-McKendrick模型。我们扩展了模型,包括疫苗接种和洗手运动的影响,并使用扩展的模型来最优地分配有限的预算,即最小化感染的数量。但是我们假设模型的参数,接触率和恢复率是已知的。在本章中,我们将探讨模型在改变这些参数时的行为,使用分析来更好地理解这些关系,并提出一种使用数据估计参数的方法。
13.1 扫描beta
回想一下,β是接触率,它既包括人与人之间的互动频率,也包括导致新感染的互动比例。如果N是人口的大小,s是易感人群的分数,SN是易感人群的数量,βsN是易感人群与其他人之间每天接触的数量,βsiN是其他人具有传染性的那些接触者的数量。
随着β的增加,我们预计感染总人数也会增加。为了量化这种关系,我将为β取一系列值:
beta_array = linspace(0.1, 1.1, 11)
然后对每个值运行模拟并打印结果。
for beta in beta_array:
sir = make_system(beta, gamma)
run_simulation(sir, update1)
print(sir.beta, calc_total_infected(sir))
我们可以将该代码包装在一个函数中,并将结果存储在一个SweepSeries对象中:
def sweep_beta(beta_array, gamma):
sweep = SweepSeries()
for beta in beta_array:
system = make_system(beta, gamma)
run_simulation(system, update1)
sweep[system.beta] = calc_total_infected(system)
return sweep
现在我们可以像这样运行sweep_beta:
infected_sweep = sweep_beta(beta_array, gamma)
并绘制结果图:
label = 'gamma = ' + str(gamma)
plot(infected_sweep, label=label)
第一条直线使用字符串操作来组合打印直线的标签:
当+运算符应用于字符串时,它会将它们端到端地连接起来,这称为连接。
函数str将任何类型的对象转换为字符串表示形式。在本例中,gamma是一个数字,因此在尝试连接它之前,我们必须将其转换为字符串。
图13.1:感染学生的比例作为参数β的函数,gamma=0.25。
如果gamma的值为0.25,则label的值为字符串<font color=#FF0000> ‘gamma=0.25’ </font> 。
图13.1显示了结果。记住,这个数字是一个参数扫描,而不是时间序列,所以x轴是参数beta,而不是时间。
当beta较小时,接触率很低并且疫情永远不会真正爆发;受感染的学生总数几乎为零。随着beta的增加,它达到了接近0.3的临界值,在这个临界点上,受感染的学生比例迅速增加。当beta超过0.5时,超过80%的人会生病。
13.2 扫描gamma
让我们看看gamma取不同值时会是什么样子。同样,我们将使用linspace创建一个数组:
gamma_array = linspace(0.1, 0.7, 4)
并对gamma的每个值运行sweep_beta:
图13.2:对于不同的gamma值,感染学生的比例是参数beta的函数。
for gamma in gamma_array:
infected_sweep = sweep_beta(beta_array, gamma)
label = 'gamma = ' + str(gamma)
plot(infected_sweep, label=label)
图13.2显示了结果。当gamma值较低时,恢复率较低,这意味着人们感染的时间更长。在这种情况下,即使是低接触率(beta)也会导致流行病。
当gamma很高时,beta必须更高才能让疫情继续下去。
13.3 扫描框架
在上一节中,我们扫描了gamma的值范围,对于每个值,我们扫描了beta值的范围。这个过程是一个二维扫描。
如果我们想要存储结果,而不是绘制它们,我们可以使用SweepFrame,这是一种DataFrame,行扫描一个参数,列扫描另一个参数,值包含来自模拟的指标。
此函数显示其工作原理:
def sweep_parameters(beta_array, gamma_array):
frame = SweepFrame(columns=gamma_array)
for gamma in gamma_array:
frame[gamma] = sweep_beta(beta_array, gamma)
return frame
sweep_parameters将beta值的数组和gamma值的数组作为参数。
每次经过循环时,我们都会运行sweep_beta。结果是一个SweepSeries对象,每个beta值都有一个元素。循环内的赋值将SweepSeries存储为SweepFrame中的新列,对应于gamma的当前值。
最后,SweepFrame存储了每对参数——beta和gamma——感染学生的比例。
我们可以像这样运行sweep_parameters:
frame = sweep_parameters(beta_array, gamma_array)
使用SweepFrame中的结果,我们可以像这样绘制每一列:
for gamma in gamma_array:
label = 'gamma = ' + str(gamma)
plot(frame[gamma], label=label)
或者,我们可以像这样绘制每一行:
for beta in [1.1, 0.9, 0.7, 0.5, 0.3]:
label = ' = ' + str(beta)
plot(frame.row[beta], label=label)
图13.3:对于几个beta值,感染学生的比例作为参数gamma的函数。
图13.3显示了结果。此示例演示了SweepFrame的一种用法:我们可以运行一次分析,保存结果,然后生成不同的可视化效果。
可视化二维扫描结果的另一种方法是等高线图,它显示轴和等高线上的参数,即恒定值的线。在本例中,该值是受感染学生的分数。
ModSim库提供了counter函数,该函数以SweepFrame为参数:
contour(frame)
图13.4:等高线图显示了感染学生的比例与参数gamma和beta的函数关系。
图13.4显示了结果。感染率最低的是右下角,这里的接触率是最高的,恢复率也很高。当我们移动到左上角时,它们会增加,那里的接触率很高,回收率很低。
这个数字表明,beta和gamma之间可能存在一种关系,这决定了模型的结果。事实上确实存在这种关系。在下一章中,我们将通过运行模拟来探索它,然后通过分析得出它。
在继续之前,您可能需要阅读本章的chap13.ipynb,并做练习。有关下载和运行代码的说明,请参见第0.4节。
本书的中文翻译由南开大学医学院智能医学工程专业2018级、2019级的师生完成,方便后续学生学习《Python仿真建模》课程。翻译人员(排名不分前后):薛淏源、金钰、张雯、张莹睿、赵子雨、李翀、慕振墺、许靖云、李文硕、尹瀛寰、沈纪辰、迪力木拉、樊旭波、商嘉文、赵旭、连煦、杨永新、樊一诺、刘志鑫、彭子豪、马碧婷、吴晓玲、常智星、陈俊帆、高胜寒、韩志恒、刘天翔、张艺潇、刘畅。
整理校订由刘畅完成,如果您发现有翻译不当或者错误,请邮件联系changliu@nankai.edu.cn。
本书中文版不用于商业用途,供大家自由使用。
未经允许,请勿转载。