今天开始读斯科特·佩奇的《模型思维》一书,斯科特·佩奇是风靡全球的“模型思维课”主讲人,有超过100万各行各业的人反复学习并从中受益。(原本坚果读书第七期是想读奶茶的《我的不完美》,这本书已经反复读过好几遍了,每次都有新的感受。但这期未选择是因为目前工作中遇到了建模的卡点,觉得自己需要查漏补缺下,最终定了这本书)。
一打开度娘,搜索模型思维,会弹出无数夸赞模型思维如何如何厉害的推文。如:“思维模型化,变成擅长解决问题的人”、“模型思维,一种更高级的思考方式”。不过细读下来,的确会感受到模型的魅力和感叹它的厉害之处。
很多人都知道投资者查理·芒格喜欢谈论“思维模型”,他说:“要想获得普世智慧,80~90个重要的模型就能完成90%的工作。”我们每天都会遇到许多的问题,为了对这个世界建立更清晰的认知,我们就需要建立这样的模型思维。通过建立模型,可以帮助我们更好地整理信息,制定更好的策略。简单来说,就是帮助我们透过现象看本质。我们能更深层次去看问题背后的逻辑,而不是仅仅停留在问题的表面,这也和深度思维(深度思考)有关。
我们生活在大数据的时代,各种信息流铺天盖地而来,哪些是正确的?哪些又是无用的?我们处理信息的同时也是在筛选对我们有价值的信息,并组合成一定的认知结构,最终形成我们自己的认知体系,这就是模型的搭建过程。
金字塔的最底层是数据。数据代表各种事件和现象,比如出门看见下雨,这就是一个数据。数据本身没有组织和结构,也没有意义。数据只能告诉你发生了什么,并不能让你理解为什么会发生。数据的上一层是信息。信息是结构化的数据。看见下雨只是数据,但如果有人统计哈尔滨市在2019年11月份这一个月总共下了多少雨,这就不是简单的数据了,而是信息。信息就可以用来做分析和解读。信息再往上一层是知识。知识能把信息组织起来,告诉我们事件之间的逻辑联系。有云导致下雨,因为下雨所以天气变得凉快,这都是知识。成语典故和思维套路都是知识。模型,则可以说是一种高级知识,能解释和预测。认知金字塔的最上一层,是智慧。智慧是识别和选择相关知识的能力。
2020-03-08 《为什么需要多模型》
我们思考时为什么不能局限于一个模型,而要用多个模型呢?多模型方法背后的原理基于古老的思想——“管中窥豹夺需多管齐下”。作者提到,这个古老思想可以追溯至亚里士多德,集合了许多人的智慧,呈现视角和观点的多样性。
通过本书的学习,我们可以自己去构建自己的格栅模型。来自多个学科,涉及各种现象,例如政治、经济、生物、管理、心理等等,收入不平等原因、权利分配、传染病的传播、社会动荡,以及城市和互联网的结构。
不同的模型用途是不同的。一些模型是用来帮助预测和解释的,一些模型是用来指导行动、推动设计或促进沟通的,还有一些是才找了有待我们去探索的虚拟世界。
所有模型都有三个共同特征。1、都要简化,玻璃不必要的细节;2、都是形式化,要给出精确的定义;3、所有模型都是错误的。(模型都是在特定条件下才成立,所以我们要考虑多个模型,综合使用,从而克服单个模型因严格而导致的狭隘性)
2020-03-09 《做一个多模型思考者》
作者提到,我们生活在一个信息和数据及其丰富的时代,技术条件还极大地缩短了时间和空间的距离。所以在分析时,我们不能只满足于双重模型、三重模型甚至四重模型,而是多模型思考者。而成为多模型思考者,需要掌握多种模型。
构建模型的3种方法。1、具身法。重要部分要么剥离要么整合一起考虑。生态沼泽模型、交通系统模型、气候模型等;2、类比法。对现实进行类比与抽象。传染病传播、犯罪行为传播。3、另类现实法。分析计算演练场。
2020-03-10 《模型的7大用途-推理》
推理:识别条件并推理判断逻辑含义
解释:为经验现象提供解释
设计:选择制度、政策和规则的特征
沟通:将知识与理解联系起来
行动:指导政策选择和战略行动
预测:对未来和未知现象进行数值和分类预测
探索:分析探索可能性和假说
2020-03-11 《模型的7大用途-解释/设计》
在模型中,我们可以在给定的假设下证明定理。相反的谚语存在,相反的定理却不会出现。两个定理,如果对何为最优行动有不同看法,必定会做出不同的预测。
模型确实可以解释任何东西。然而基于模型的解释必须包括正式的假设和明确的因果链条,而这些假设和因果链条都要面对数据。
2020-03-12 《模型的7大用途-交流/行动》
模型有效地改变了我们的交流。将抽象的东西形式化、模型化,不用担心会造成误解。
模型还能指导人的行动。政府、企业和非盈利组织都要使用模型来指导行动。重要的行动中,决策者还要使用多个复杂的模型,模型与数据紧密相关。
个人也可以使用模型去做某个重要的决策。购买房屋、更换工作、回到学校深造、买车还是租车等。
可以说,模型改变了工作和生活
2020-03-13 《模型的7大用途-预测/探索》
模型长期用来预测。天气预报、流感、情报局,都在用模型进行预测,尤其现在数据可得性提高和精细度改进,利用模型进行预测变得特别常见。
2009年6月1日,法国航空公司AF477航班失事事件,一年多也没有找到飞机的残骸,最终不得不求助于模型。法国国家统计分析局将概率模型应用于大海洋流,识别出了一个坠机最有可能沉没的矩形区域。根据模型给出的预测,搜索队在一个星期之内就找到了飞机残骸。
最后我们还会用模型来探索直觉。这个概念会比较抽象。我们这个世界未来会发生什么变化?我们目前提出的问题能帮助我们什么?我们探索未来又能改变未来什么?模型都可以帮助我们去思考。
当我们在时间中应用一个模型时,也能以多种方式使用它。同一个模型既可以用来解释、预测,也可以用来指导行动。将一个模型用于多种用途,正式本书中将会反复出现的一个主题。
2020-03-14 《孔多塞陪审团定理和多样性预测定理》
孔多塞陪审团定理是从一个解释多数规则长处的模型中推导出来的。在这个模型中,陪审员要做出要么有罪、要么无罪的二元决策。
总数为奇数的一组人(模型)将未知的世界状态分为真或假。每个人(模型)正确分类的概率为P>1/2,并且任何一个人(模型)分类正确的概率在统计上都独立于任何其他人(模型)分类的正确性。
孔多塞陪审团定理:多数投票正确的概率比任何人(模型)都更高;当人数(模型数)变得足够大时,多数投票的准确率将接近100%。
而多样性预测定理则适用于给出数值预测或估值的模型,它量化了模型的准确性和多样性对所有模型平均准确性的贡献。
多样性预测定理:多模型误差=平均模型误差-模型预测的多样性。
比如说,一个模型预测它将获得两项奥斯卡奖,另一个模型这预测它将获得8项。这两个模型预测的平均值,也就是多模型预测的结果等于5。如果最后这部电影获得了4项奥斯卡奖,那么第一个模型的误差等于4,第二个模型的误差等于16,而多模型误差则等于1,模型预测的多样性等于9。
2020-03-15 《分类模型/适当的模型粒度》
分类模型为孔多塞陪审团定理提供了微观基础。分类模型将世界划分为不相交的。
分类模型:存在一组世界的对象或状态,每个对象或状态都由一组属性定义,每个属性都有一个值。根据对象的属性,分类模型M将对象或状态划分为一个邮箱的类别集,然后给每个类别赋值。
分类模型在经济学家对失业率、经济增长率和通货膨胀率上被广泛应用。
适当的模型粒度
创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测。构建的类别越大,分类误差就越大。
模型误差分解定理:偏差-方差权衡,模型误差=分类误差+估值误差
2020-03-16 《一对多》
为减少学习成本,我们会灵活使用一些模型,将一个模型复制到其他可推广的事物分析中。比如使用流行病学模型解释玉米良种的扩散、Facebook的风行、犯罪行为的传播和流行明星的“吸粉”。信号传递模型应用于广告、婚姻、孔雀羽毛和保险费的分析。利用进化适应的崎岖景观模型解释为什么人类不需要金鱼那样的喷气孔等等。
一对多,“更高的幂”概念。
2020-03-17 《多模型思维》
孔多塞陪审团定理和多样性预测定理为多对一的方法奠定了逻辑基础。分类模型说明了模型多样性的局限性,也阐述了模型在预测、行动和设计等方面的能力。
装袋法和多模型
模型中包含的参数越多,就越能够很好地拟合数据,同时也越有可能过度拟合。好的拟合不一定意味着好的模型。为了避免过度拟合,可以采取自举聚合法或装袋法来构建模型。为了引导数据,我们从原始数据中随机抽取若干数据点,创建多个规模相同的数据集。然后将模型拟合到每个数据集上,生成多个模型。可以得到“意大利面图”。装袋法运用了多样性预测定理背后的逻辑——平均值比模型本身更加准确。
2020-03-18 《对人建模的挑战》
人天生就是多样性,易受影响,还会出错,带有自己主观意识的生物。我们本身就具有思考和行动的能力。对于这样复杂的生物去进行建模是一个巨大的挑战。如果每一个人都一样,那建模工作会轻松很多。
挑战一:人们的偏好、行动能力不同,形成的社交网络、利他主义倾向以及分配给不同行动的认知资源也有所不同。
挑战二:人们所犯的错误能否相互抵消,取决于具体情境。人们对最近发生的事件往往更加重视,并且更容易回忆起故事性的情节而不是统计数字。这类共同偏差不会被消除。
挑战三:如何准确评估人们的目标和目的,这个与他们所渴望得到的东西有关。
挑战四:人的主体性。我们有采取行动的能力,改变行为的能力以及学习的能力。人类可能是一种“习惯生物”,行动可能会超出我们的控制范围。
2020-03-19 《理性行为者模型》
理性行为者模型假设人们在给定收益或效用函数的情况下做出最优选择。
理性行为者模型:行为者个体的偏好由一组可能的行为上定义的数学形式的效用函数来表示。行为个体选择函数值最大化的行动。在博弈中,这种选择可能需要相信其他博弈参与者的行为。
消费者理性行为者模型 假设:行为者个体的效用来自总消费C和住房支出的H,效用最大化的行为者个体会将自己收入的⅓用于住房。
使用效用函数能使模型成为可分析的、可检验且易于处理的。
2020-03-20 《损失厌恶和双曲贴现》
理性行为者模型受到心理学家、经济学家和神经科学家的挑战。他们指出,这种模型与人类的行为方式不符。人在决策时会受到各种各样的偏差影响,会表现出损失厌恶。
损失厌恶是指面对收益时,人们表现为风险厌恶。面对损失时,人们却表现为风险偏好。
双曲贴现意味着,人们对近期的贴现更强。大量证据表明,大多数人都不会以固定的贴现率去贴现未来,他们会受即时性偏差影响:他们对近期的贴现率远远高于更远的未来。
2020-03-21 《模型产生了什么样的结果》
微观-宏观循环揭示了一个关键问题:模型中的行为主体应该有多聪明?人们有能力推断出他们行为的所有后果吗?这个循环还暗示了本书中要讨论的一个更大的问题:模型会产生什么样的结果?它是否会达成均衡?
一般来说,市场规则都会遵循固定规则(能达到有效或近乎有效的结果的规则),这样会产生符合大部分利益的结果。但是当我们的模型只能产生效率低效甚至糟糕的宏观结果时,就会产生张力,埃尔法鲁模型就是这种情况。
这也就引出了一个大问题:模型产生了什么样的结果?我们有四种选择:均衡、周期、随机性或复杂性。结果的类别将会界定我们对于人们应该学会实现均衡的论点的重视程度。产生周期或均衡的模型则可以创造一个稳定的环境,因此我们有理由期望人们可以学习,没有人会持续采取次次优行动。
2020-03-22 《第5章 正态分布》
本章开始研究各种模型。作为建模者,我们要对两个问题感兴趣:为什么要这样看待分布?为什么分布很重要?
分布以数学的方式刻画变量的变差和多样性,将变量表示为在数值上或类别上定义的概率分布。正正态分布的形状是我们熟悉的钟形曲线形状。大多数物种的高度和重量都满足正态分布,我们可以通过中心极限定理来解释正态分布的普遍性。只要把随机变量加总或求其平均值,就可以期望获得正态分布。
分布为事件或价值分配概率。我们可以利用正态分布的规律给各种范围的结果分配概率。
2020-03-23 《逻辑:中心极限定理》
非常多的现象都表现为正态分布:动植物的体型大小,学生考试成绩、便利店销售额等等。中心极限定理表明为什么对随机变量求和或取均值会产生正态分布。
中心极限定理:只要各随机变量是相互独立的,每个随机变量的方差都是有限的,且没有任何一小部分随机变量贡献了大部分变差,那N≥20个随机变量的和就近似一个正态分布。
中心极限定理一个非常重要的特征是,随机变量本身不一定是正态分布的。
第一个应用将揭示:为什么罕见结果在规模小的群体中更常见。均值的标准差公式表明,大的总体的标准差要比小的总体的标准差低得多。由此可以推断,在小的群体中应该还会观察到更多的好事和更多的坏事。比如,最安全的居住地是小城镇,但最不安全的居住地也是小城镇。
2020-03-24 《六西格玛方法》
正态分布规律的最后一个应用是六西格玛方法,通过六西格玛为质量控制提供有效信息。其涉及缩减标准差的大小从而降低生产出不合格产品的可能性。在六西格玛方法中应用中心极限定理很微妙,几乎没有人注意到。
对数正态分布:乘法冲击
如果随机变量是不可相加而是以某种方式相互作用的,或者如果他们不是相互独立的,那么产生的分布就不一定是正态分布。事实上,一般情况下都不会是。比如,独立随机变量之间的乘积就不是正态分布,而是对数分布。对数正态分布缺乏对称性。一个对数正态分布的尾部长度取决于随机变量相乘的方差。如果他们的方差很小,尾巴就会很短,如果方差很大,尾巴就可能会很长。呈现对数正态分布的情况也很多,比如英国农场大小,地球上的矿物质浓度,从受到感染到症状出现的时间等等。
小结
正态分布具有很强的规律性,作为一个预测规则,我们当然更倾向于规律性,而不是发生很大事件的可能性。因此如果了解了生成各种各样分布的逻辑,我们将会获益匪浅。我们可能更希望随机冲击相加,而不是相乘,以减少发生很大事件的可能性。
2020-03-25 《幂律分布》
幂律分布就是通常所称的长尾分布或重尾分布。在把这种分布绘制在图上时,会产生对应大事件的延水平轴运行的长尾。例如城市人口分布、物种灭绝、万维网上的链接数量以及企业规模等,所有这些都有很长的尾巴,视频下载量、书籍销量、学术论文引用数量、战争中的伤亡人数、洪水和地震的分布也是如此。
2020-03-26 《幂律分布的逻辑》
第一个模型是优先连接模型。优先连接模型刻画了马太效应:更多导致更多。
优先连接模型:一连串物体一个接一个地到达。第一个到达者创建一个实体。后续每次有人到达时都应用以下规则:在概率P(较小)的情况下,新到达者创造一个新的实体;在概率1-P的情况下,新到达者加入现有的某个实体。加入某个特定实体的概率等于该实体的大小除以到目前为止所有到达者的数量。
优先连接模型有助于解释为什么网络连接、城市规模、企业规模、图书销量和学术引用数量的分布都是幂律分布。
第二个模型是自组织临界模型。在系统中建立相互依赖关系的过程产生幂律分布,直到系统达到临界状态为止。比如沙堆模型和森林火灾模型。
2020-03-27 《长尾分布的含义——公平、灾难、波动性》
森林火灾模型:“森林”最初只是一个空的N乘以N网格,每个周期在网格上随机选择一个格点。如果该格点为空,那么就以概率G在那里种上一棵树。如果该格点上已经有树,那么闪电会以概率(1-G)击中该格点。如果该格点有一棵树,那么树会着火,火势会蔓延到所有连接到该格点的有树的格点。
在沙堆模型和森林火灾模型中,宏观层面的变量,也就是沙堆的高度或森林的密度,都具有一个临界值。
长尾分布对公平、灾难和波动性有着巨大的影响。正态分布是关于均值对称,而长尾分布可能会增加波动性,因为更大实体中的随机波动会产生更大的影响。
公平:我们在优先连接模型中看到的马太效应,正反馈创造了少数大赢家。实验研究表明,社会效应会创造更大的赢家。尾巴变长了,社会影响增加了不平等。
灾难:长尾分布还包括灾难性事件-地震、火灾、金融崩溃和交通拥堵。尽管模型不能预测地震,但能解释地震的分布为什么会满足幂律,我们至少能知道会发生什么。而森林火灾模型确实可以指导行动了。
企业规模的分布应该会影响市场波动性。
在长尾分布中,大事件发生的概率必须加以考虑。长尾分布是由反馈和相互依赖性而产生的。我们需要高度注意这个结果。大事件发生的可能性使计划变得非常困难。比如地震等自然灾害。
2020-03-28 《线性模型》
模型通常假定变量之间存在某种特定的函数关系。这种关系可以是线性的,也可以是非线性的,或者可以包括阈值效应。在这些模型中,线性模型是最简单且应用最广泛的。
在线性关系中,由于第二个变量的变化而导致的第一个变量的变化量不依赖于第二个变量的值。
线性模型:在线性模型中,自变量X的变化,会导致因变量Y的线性变化,用如下方程表示:Y=MX+B,其中,M等于直线的斜率,B等于截距,即当自变量等于0时的因变量值。
线性回归模型的目标是找到能够最小化到各数据点的直线。线性回归可以解释犯罪、洗衣机销量,甚至可以解释葡萄酒价格的变化。
在社会环境和生物环境中,我们不能期待会有完美的线性拟合。结果通常取决于多个变量。但是根据定义,单变量回归只能包含一个变量。由于这些被省略的变量,预测值可能会偏离实际值。回归线越靠近数据,模型解释的数据越多,R²就越大。
符号、显著性和大小:线性回归可以告诉我们关于自变量系数的如下内容。符号-自变量与因变量之间的正相关或负相关。显著性(P值):系数上非零符号的概率。大小-对自变量系数的最佳估计。