1 建模
在这本书中要讲述的是物理(真实)体系的建模(Modeling)与仿真(Simulation)。这里我所说的“建模”就如下图所示:
让我们从图的左下角开始,现实世界中我们所感兴趣的东西就是一个体系(System)。通常来说,它是复杂的,所以我们需要决定哪些细节是可以被去除掉的,删除细节这一过程我们称之为抽象(Abstraction)。
抽象的结果就是模型,它是对只包含了我们认为系统的必要的特征的描述。一个模型可以用图解或者是等式的形式展现出来,这样就可以用于数学分析(analysis)。它也可以用计算机程序的形式来实现,这就是运行“仿真”(simulation)。
分析和仿真得出的结果可能是对某一体系将要发生的变化的预测,或是对这个体系的一些行为的原因的解释,或者是一个设计从而去完成某个特定的目标。
我们可以从真实世界测量数据,再与分析/仿真得出的数据进行对比,从而验证预测是否准确或者设计是否完善。
对于任何一种体系,可能有很多种模型,每一种模型都有不同的特征以及不同程度的细节。而建模的过程就是去寻找与我们要解决的问题(预测、解释原因或者设计)最契合的那一种模型。
有些时候最好的模型是充满细节的。如果我们加入了更多的特征,模型也会变得更契合实际情况,因此我们认为这个模型更加准确。
但是通常简单的模型是更好的。如果我们只保留了必要的特征而省去其他,我们的模型会更加容易处理,给出的解释也会更清楚,更令人信服。
举个例子,假如有人问你为什么地球的轨道是椭圆的,如果你将地球和太阳看成质点进行建模(忽略掉它们的真实大小),用牛顿的万有引力定律计算出它们之间存在的引力,再用牛顿运动定律计算出它们的运动轨道,你就可以证明它就是一个椭圆。
当然,事实上,因为还存在着月球、木星及太阳系的其他天体的引力,地球轨道并非一个标准的椭圆,况且牛顿运动定律也只是一个近似的结论(它没有把相对论的影响纳入考虑)。但是把这些因素加入到这个模型里面并不会让它对地球轨道的解释变得更好,更多的细节只会分散我们对于问题的根本原因的注意力。如果我们的目标是非常精准地预测地球的具体位置,往模型里加入更多细节就是必要的了。
模型该怎么去选择取决于模型的用途。通常从一个简单的模型开始是一个好主意,并检验它能否顺利完成目标任务,即使它显得太过于简单。之后我们可以从最重要的部分开始,逐渐再给这个模型增添特征,这个过程称为迭代建模(iterative modeling)。
比较随后建立的模型的结果提供了一种内部验证(internal validation)的形式,我们可以通过这种方式发现概念上、数学上及计算机程序上的各种错误。并且,通过对模型增删特征,你可以发现哪个特征是对模型有最大的影响的,而哪一个特征是可以被忽略的。
把模型结果和现实世界的数据做对比,这种方式称为外部验证(external validation),这通常是对模型最强有力的检验。
1.1 硬币掉落的传言
关于模型是怎样使用的,下面这个例子可以告诉我们。
你可能听说过这样一个传言,从帝国大厦的顶部落下一个硬币,当硬币落在人行道上的时候速度快到可以使它嵌入到混凝土里,或者说它击中了一个人,那么它能击碎这个人的头盖骨。
我们可以通过创建并且分析一个模型,来验证一下这个传言。
一开始,我们假设空气阻力的影响是很小以至于可忽略的。但这样显然是一个糟糕的假设,但请耐心听我说。
如果空气阻力是可忽略的,那么作用在硬币上的最主要力就是重力,给硬币产生了向下的加速度。如果硬币的初速度是0,在t秒后速度将会变为at,硬币下落的高度为:
通过代数运算,我们可以解出t:
代入重力加速度的值,这里我们取a = 9.8 m/s2,帝国大厦的高度为h = 381 m,我们可以计算出总下落时间为t = 8.8 s。之后再计算v = at,得到了在重力影响下硬币撞击的速度为 86 m/s ,相当于每小时190公里的速度,这听起来就很疼。
当然,这些结果并不确切,因为这个模型是基于简化得来的。例如,我们假设了重力是恒定的,但事实上,重力大小会随着地球上的不同位置而改变,并且离地表越高重力越小。然而这些差异很小,因此忽略它们可能是这种情况下的一个好的选择。
另一方面,忽略掉空气阻力就不是那么好了。一旦当硬币下落达到大约 18 m/s 时,向上的空气阻力就会和向下的重力大小相等,因此硬币就会停止加速了。在那之后,不论硬币下落的距离有多远,它都以差不多 18 m/s 的速度撞击人行道(或者你的头),远远小于之前的简单模型所预测得出的 86 m/s 。
统计学家George Box有一句名言:“所有模型都是错的,但有一些是有用的。”他这是在说统计学的模型,但他这句名言可以用于所有类型的模型。我们的第一个模型,忽略了空气阻力,是非常不正确的,很可能就没有用处。在这一章节的notebook里,你可以看到另一个假设加速至达到最大速度为止的下落模型,这个模型也是错的,但是要好一点,并且也足够好去用来反驳那个硬币下落的传言了。
有一栏电视节目“流言终结者”更加仔细地验证过硬币下落地传言,你可以在http://modsimpy.com/myth上看到他们的结果。他们做的是基于运动的数学模型,测量空气对一枚硬币的阻力,以及一个人类头部的实体模型。
1.2 计算
有(至少)两种方法来建立数学模型:分析(analysis)和仿真(simulation)。分析通常涉及代数和其他类型的符号处理,而仿真通常涉及到计算机。
在这本书中我们将会进行一部分分析和大量的仿真工作。在这个过程中,我们会讨论两者的好处与不足。我们用于仿真的最关键的工具是Python编程语言和 Jupyter,其中 Jupyter是一个用于编写和运行程序的环境。
举一个例子,我来展示一下我是如何用Python计算上一小节中的结果的。
首先我创建了一个变量(variable)来代表加速度:
a=9.8*meter/second**2
一个变量就是对应于某个值的名称。在这个例子中,这个名称是a,这一数值是 9.8 并且跟上了单位meter/second**2 。
这一例子还阐释了Python中用来表现数学运算的符号:
Operation | Symbol |
---|---|
Addition | + |
Subtraction | - |
Multiplication | * |
Division | / |
Exponentiation | ** |
下一步,我们要计算硬币下落 381 m ,也就是帝国大厦的高度,所需要的时间:
h=381*meter
t=sqrt(2*h/a)
这两个语句创建了两个变量:h被赋值为建筑物的高度,t被赋值为以秒为单位的时间,也就是硬币掉落在地面上所需的时间。sqrt是一个计算开二次根号的函数(function)。Python会根据计算公式保留单位,所以变量t保留了正确的单位,秒。
最后,我们来计算硬币在t秒后所达到的速度:
v=a*t
这个结果就是大约 86 m/s ,同样也是保留了正确的单位。
这个例子阐释了通过Python实现的分析和计算。在下一章节,我们将会看到一个仿真的例子。
在你进入下一章节之前,你可能会想要阅读一下这一章节的notebook chap01.ipynb,同时做一做练习。有关下载和运行代码的说明,详情请见0.4节。
本书的中文翻译由南开大学医学院智能医学工程专业2018级、2019级的师生完成,方便后续学生学习《Python仿真建模》课程。翻译人员(排名不分前后):薛淏源、金钰、张雯、张莹睿、赵子雨、李翀、慕振墺、许靖云、李文硕、尹瀛寰、沈纪辰、迪力木拉、樊旭波、商嘉文、赵旭、连煦、杨永新、樊一诺、刘志鑫、彭子豪、马碧婷、吴晓玲、常智星、陈俊帆、高胜寒、韩志恒、刘天翔、张艺潇、刘畅。
整理校订由刘畅完成,如果您发现有翻译不当或者错误,请邮件联系changliu@nankai.edu.cn。
本书中文版不用于商业用途,供大家自由使用。
未经允许,请勿转载。