借我借我一双慧眼吧,让我把这纷扰看得清清楚楚明明白白真真切切。一首歌这样唱道。可惜,我们没有上帝视角,无法事无巨细观察这个和认识这个世界,大道至简,作为常人,我们就简化来看看这个世界的结构并研究其演化规则。在这个过程中,将研究对象模型化是一种非常重要的手段和方法。我们就一起来走进模型的世界。
1 模型与数学模型
1.1 丰富多彩的模型
模型并不复杂,我们小时候玩的航模、船模,听过的飞机风洞试验,在天文尺度上,把地球当成一个质点来看待,量子当成波粒二象性对象,引力、磁力作用使用场来描述,这些都属于物理模型。我们分析问题时,常常画图,先把重要的人和对象记下,然后把TA们的关系通过线连接起来。在做古典概率的学生房间分配、邮件投递、电子呆在不同的量子化能级上,常常使用小球装入盒子中的模式转换分析,这些属于心智模型。事实上,模型并不复杂,我们在工作、学习和生活中有意无意地一直在使用。本文讲的是另外一种非常重要的模式——数学模型。
1.2 数学模型及分类
数学模型,就是简化同构复杂对象系统后,形成一套易于理解的数学符号系统。能运算模型来描述对象系统演化过程。
模型主要用于对象系统(社会、生物、物理)的结构描述。还可以进行预测、预警。对于复杂对象系统,通过一个简化的模型我们可以简化分析对象,并对其发展趋势进行预测,还可以得到一定的阈值从而根据预测或实际收集数据进行预警。
数学模型展示方式一般为方程或者方程组,也可以是一些逻辑运算公式,或者是集合运算公式,或者是它们的组合应用。模型能预测对象系统的运动情况。属于应用数学中的一个重要分支。
按照不同的标准,常见数学模型有如下分类。
1.3 建模方法
建模有两种路径,一是根据先验知识进行建模,主要是根据常识或者相应理论进行建模,如微分方程、马尔可夫过程建模等。二是从数据中发现存在的知识。对于前者,判断结构是否合理、选择的因素是否恰当,尤其要估计参数,有些模型是简单的,可以得到解析解,但是对于一些复杂问题就必须用算法来计算结果估计参数了。对于后者,利用数值法来求解结果(如插值和仿真),用机器学习和统计方法来探索结构和估计参数。
无论是建模还是用算法训练模型都需要经过长期训练,必须非常熟悉业务,这是一个容易被忽略,但是又极其重要的要求。再加上有相当数学基础的专业人员,才能较好完成建模工作。
模型 ≠ 算法
是一个有限步骤内解决问题和方法集合。是求解模型的工具。
在众多的应用领域中,人口领域应用模型很多,非常具有代表性,因此,我们下面就以这个领域来介绍数学模型。由浅入深,不是很难。
2 严峻的人口问题及人口模型
2.1 当前人口面临的问题
我们能感到人口的影响,如号召大家生三胎,人口第一大国已经是印度等。按照《世界人口展望2022》中方案对中国人口的预测, 2022年7月1日中国总人口已经进入负增长[i]。印度将在明年超过中国,成为世界上人口最多的国家[ii]。据世界人口网报道,我国面临以下重大人口问题[iii]:
一,中国陷入“超低生育率”陷阱
二,“空巢”现象冲击传统家庭模式
三, 中国社会老化的包袱越来越沉重
四,中国很多地方进入严重少子化时代
五,“男女比例失调”埋下隐患
六,人口素质和劳动生产率亟待提高
七,流动人口面临市民待遇和人口融合问题
八,“户籍捆绑福利”导致社会不公
九,流动人口子女受教育被歧视
十,中国养老服务体系和社保体系滞后
面对这些严峻问题,该怎样应对,数学模型在政策建议和政策仿真中具有很重要的支持作用。
2.2 人口模型类别
人口模型属于特定应用领域的模型。一是传统人口学,把人口作为一个整体,以群体为单位进行的宏观测算;二是家庭人口学,以家庭为基本单位,除可以测算传统人口学所有的信息外,还可以测算人口的家庭结构、代际结构,作为中观模型对待。三是微观仿真方法,把人作为一个主体,以个体为单位,模拟其可能出现的社会行为,然后汇总得到人口的总体信息。其中,第二、三两种方法是20世纪80年代以来新兴的分析方法,可以更好地分析、把握人口及其经济社会行为,如可计算“4-2-1”家庭数量及比例、独生子女、二胎、三胎数量等,正日益成为政策分析的有力工具。
随着研究问题的深入,我们还希望了解人口与社会、资源、经济、环境等其他领域的强相关、互作用关系。这扩大了我们的视野,并能从更总体视角去动态、联动地看待人口问题,做到问题的综合平衡。这可以作为第四类人口问题,可以称为人口VS自然——社会系统宏观模型。
对以上四种类型模型分别做一定的介绍,尽量多举例,而且涉及不同的建模方法,如宏观、微观模型,微分方程、蒙特卡洛仿真、Markov模型等。让大家能尽量多地了解一些模型。挑选的模型都是非常经典的,看了这篇文章,对人口学和其对应的模型也就有了全面的了解。
3 宏观群体数人口模型
模型预测的内容相对少一些,主要是人口的数量和结构。
3.1 人口平衡模型
如果让你来预测t年后人口数量,相信我们都能凭借常识和给一个方程:
⋯ ①
:期末人口数 :期初人口数 B:为期内出生人口 D:期内死亡人口数。好,①式就是一个简单的人口模型,不复杂吧,一想,自己建立过许多模型的,是不是有成就感。我们继续往下走。
上式中,我们考虑的是一个封闭空间,如一个市、一个省,但是人口是迁移的,因此,把这个因素考虑进来,就得到人口平衡方程:
⋯ ②
I:期内迁入人口数。E:期内迁出人口数
人口平衡方程反映某一时期人口数量及其自然变动与机械变动影响因素相互关系的基本方程。人口平衡方式的涵义是某一时期内,总人口数的变化等于人口的自然增长与迁移增长之和。是计算人口数量的一个基础方程。看来专业的比我们业余的还是考虑要周到一些。
3.2 莱斯利(Leslie)矩阵
人口平衡模型中,对不同的人没有分类。事实上,不同年龄的人死亡率是不一样的,人类出生数量是和女性更直接相关的,而且一般认为15~49岁女性为育龄妇女,这样的人员多,出生率才高。还有,随着时间的推进,今年14(49)岁的女性,明年15(50)岁后,就有(失去)生产能力了。每一年不同年龄层的人口结构是变动的,因此考虑到这些因素,就得到了著名的莱斯利模型。这个模型最先是科学家研究海龟种群统计学的内容用于人口数量预测中,也取得了很好的效果。如果把每一年的不同年龄段人员按照性别分别统计,使用莱斯利矩阵进行测算,可以得到人口金字塔,用于表现某时间点上的年龄直方图,能反映一地区人口男女比例与年龄构成。这种表示方式显示了年龄和性别资料,为一种可直接且清晰知晓人口组成的图表,可以提供下列资讯:人力资源、人口老化程度、扶养比、生育年龄人口、未来的出生率和死亡率、未来人口总数等。是各类涉及人口之发展或规划的基础。
3.3 微分方程人口模型
3.3.1 马尔萨斯模型
3.3.2 阻滞增长模型
3.3.3 微分方程模型改进
【以下详细内容可以参看连接】 https://mp.weixin.qq.com/s/uSHnXmzq4RQdzi54V5butg
4 中观家庭人口模型
5 微观个人仿真模型
微观仿真模型是人口模型中非常重要的一种新方法,这种方法得到的结果非常精细,还很灵活,可以方便地道许多感兴趣的指标。受到越来越多人的重视。同时,我们在计量经济模型、运输模型、排队论模型中都大量使用仿真方法,在算法上,如MCMC方法中也都需要进行Monte Carlo (蒙特卡洛)仿真。因此,对这个方法进行一个比较详细介绍。笔者也是花了很长时间才悟明白这个方法的一些道理,今天和盘托出,所以,读下去,划算的很。
需要对人口数量进行预测。可以想到出生率和死亡率,知道当前人口数量,利用等比数列通项公式可以预测n年后人口数量。可是,人口的增长主要是人群中育龄妇女(15~49)数量决定的,每一年不同年龄层的人口结构是变动的,这时就需要莱斯利矩阵来测算。
人口调查的属性很多,包括性别、收入、职业、年龄、居住地点等社会和生物属性,不利用起来太可惜。想预测n年后以上属性的数据已经利用这些数据来预测学校的数量、分布,铁路规划等,就需要利用蒙特卡洛仿真来得到这些结果了。
5.1 Monte Carlo 仿真
蒙特卡洛是摩洛哥著名的赌城,以他的名字命名的方法我们通过一个简单的方法说明。
在图 2 内含圆形的正方形 中,正方形边长为4,圆的半径为1。Monte Carlo 仿真就是在这个区域中投点,你可以投飞镖,也可以让计算机模拟投点,只是有要求投的点等可能地出现在方形的任何地方内!根据这个方法,仿真有两个使用方式。
第一种方式:如果投的点足够多(图中蓝色点),我们计算圆内的点 nc,还有总的投的点数量nT,圆的面积可以估计为 Sc = (nc /nT)Ss = 16(nc /nT) ,Ss为方形面积。当然,圆的面积可以由公式 S = πR2 计算,但是当图中圆是没有公式可以计算的异形图像时,用这个方法就可以得到面积了。
第二种方式:如果只投入了一个点(图中橙色点),而它恰巧在圆中,那我们可以知道它这次在圆中的概率为:p = Sc / Ss = π12/42 ≈ 19.63%。由于投点只能在整个方形中,所以,其概率为1. 方形分为两个部分,一个是圆形,一个是方形除去圆后剩余部分。我们可以把投点在方形中的位置与一个随机数X之间建立起一一对应的关系。0<X≤1 。
我们在后面进行Monte Carlo 仿真的时候,用的就是第二种方式。
5.2 人口调查表的变形
我国人口调查表有18个项目,真实的下表包括全国14亿人,经过简单的描述性统计方法,可以得到性别比、迁移情况、出生率、死亡率、民族结构、总和生育率等多个指标,是非常精细的.
上表是2022年的统计数据,要是能预测出2027年5年后的一张相同的表,那就可以得到许多指标了。这个大胆的想法有戏,经过对表 3 一张模拟的原始人口调查表 进行小小的修改,为保护隐私,同时,将相同年龄、相同性别的人假定其生死、迁移等概率都是一样的,于是,去掉个人标识信息,隐藏姓名和身份证号,统一从0号开始从新编辑,得到 表 4 修改后的人口调查表 就可以仿真至2027年。
微观模拟模型对家庭人口个体特征分类比较精细,作为预测起点的样本人口规模与抽样比必须足够大!这样才能具有较好的代表性。我国人口的1%样本是1400多万。
按微观模拟方法对数百万成千万个体一个一个地分别就其生育、死亡、婚姻、迁移、离家等各种人口事件做精细的仿真模拟,将用去大量的算力,好在现在算法的优化和硬件的降价解决了这个问题
对表 4 修改后的人口调查表 实现1%等距抽样,抽取编号为0,100,200,300,…的成员,得到一个新的2021年普查数据的1400万条记录的新表
5.3 仿真进行的原理
以“死亡”这个属性进行仿真示例。应用的方法为 5.1 节中Monte Carlo仿真的第二种方式,即从一次仿真结果中推断其属于那个类别。表 5 生命表部分内容 为生命表中截取的部分数据。
选择第 0 号(原始普查表编号)人员,18岁
用一个服从 U(0,1) 均匀分布的随机数进行仿真
使用程序给出一个随机数 X,18岁的青年死亡概率 p(18)=0.000981
如果 X ≤ p(18) ,则认为此人在下一年中会死去(与真实的人无关)
如果 X > p(18) ,则认为此人在下一年中任然活着。
再选择第100号(原始普查表编号)人员,?岁
重复以上过程直到结束。
1400多万人,在个人18个属性中,属性值可以改变的那几个属性(如生育等)逐年仿真, 可以得到5年后的一张填满了单元格的抽样表。
在仿真出5年后的含1400多万人的抽样表中获得详细信息。可以通过简单的统计得到需要的一些指标。这些指标是抽样的1400万人的结果,如果需要还原到14亿人的结果,给一个区间估计,可以通过t 分布来实现。
如果还有额外需求,如跨省的人员流动情况等,可以增加一些方法,如转移矩阵来实现等。
6 人口VS自然——社会系统宏观模型
6.1 CGE模型
6.1.1 CGE模型基本介绍
CGE 模型(Computable General Equilibrium),全称可计算的一般均衡模型,起源于西方经济学中的瓦尔拉斯一般均衡理论,是由抽象的瓦尔拉斯一般均衡理论衍变而成的关于实际经济的数学模型。CGE 模型通常是对一个经济体进行数学上的模拟,从而反映这个经济体是如何通过对商品和要素的数量和价格的调整,实现瓦尔拉斯一般均衡理论所描述的供需平衡。
一般均衡理论是经济学理论的核心,被认为是经济学的主要成就之一。它的思想来源是亚当·斯密著名的“看不见的手”的论断:在一个分散决策的经济中,追求个人最优的行为会在价格调节下实现社会最优的资源配置,或者追求个人最优的行为人的决策通过价格机制达到相互间的均衡。瓦尔拉斯在 1874年发表的《纯粹经济学要义》中正式把这样的一般均衡思想用一组方程式表达出来。然而,他所表达的结论是定性的。此后许多经济学家试图用能表示现实经济的具体方程来代替抽象的函数。最为成功的是列昂惕夫的投入产出模型,反映了部门间的关联以及产品价格与要素价格间的联系,对后来 CGE 模型的发展产生了极大的影响。
一般均衡理论把整个经济系统作为分析对象。它着眼于经济系统内的所有市场、所有价格,以及各种商品和要素的供需关系,要求所有的市场都结清。在一般均衡模型中,还存在着一些外生给定的变量。外生变量变化引起的经济系统的任何一部分的结构变化都会波及整个系统,导致商品和要素价格、数量的普遍变动,使得经济系统从一个均衡状态向另一个均衡状态过渡。对抽象的一般均衡模型给出具体的数字设定,从而判断外生变量变化会导致内生变量如何变化的模型,就是所谓的 CGE 模型。
CGE 模型是多部门模型家族中的一个分支。它是投入产出模型和线性规划模型的结合与完善。CGE 模型通过引入经济主体的优化行为,刻画了生产之间的替代关系和需求之间的转换关系,用非线性函数取代了传统的投入产出模型中的许多线性函数。并且引入了通过价格激励发挥作用的市场机制和政策工具,从而将生产、需求、国际贸易和价格有机地结合在一起,以刻画在混合经济条件下,不同产业、不同消费者对由一定政策冲击所引致的相对价格变动的反应。
6.1.2 人口CGE模型
通过连接人口变动模型,拓展居民账户和添加省际调入调出账户将多个地区有机联系构建得到人口CGE模型。
人口CGE通过将CGE模型与研究劳动力或者人口的动态演化规律的模型相连接而建立的。如可以进行三方面的拓展:
首先,拓展居民账户。居民账户分为:农村居民,农民工居民,城市低收入居民,城市中收入居民,城市高收入居民五组(可调整)。各类居民的人参与生产,参与收入分配和再分配等。
其次,引入污染排放因素。通过在居民的消费效用函数中增加污染排放因素,分析人口变动对节能减排的影响。
第三,连接人口动态模型。将CGE与人口动态模型联系起来,分析人口政策变动对经济的影响。
6.1.3 方程具有的模块
通常,CGE模型主要包括三组方程,分别表示供给、需求和均衡关系,形成相应的三个模块,根据研究问题的不同,可以引入更多的主体和研究对象,有更多的模块。这也正体现了CGE模型处理问题的灵活性。
6.1.4 模型原理
6.1.5 模型的用处
在国外,CGE模型广泛应用于贸易政策、财政政策和收入分配、环境政策、经济改革、技术,国际商品价格、汇率和利率、工资调整和工会行为、区域发展、粮食政策等领域。
近年来,全球气候变暖、臭氧层破坏、大气污染、水土流失、生物多样性减少等环境问题日益突出,在这种背景下,旨在于减少污染、改善环境的各种国际合作与协定就应运而生,各国都在寻求一种既能保持经济增长的同时,又能有效削减污染排放的经济控制政策。环境 CGE 模型就是在这种背景下逐渐成为研究的热点。
近年来的研究更多地将CGE模型应用于各种政策效应的分析之中。当然也包括人口政策。
6.2 系统动力学模型
7 模型的应用及局限
7.1 模型主要作用
7.2 人口模型的主要作用
7.3 模型的局限
7.4 解决问题的关键
https://mp.weixin.qq.com/s/uSHnXmzq4RQdzi54V5butg
以上为详细介绍链接
[[i]] https://new.qq.com/rain/a/20220714A09RYR00