[Thinking Electrons : Modeling People]
本周的课程分为了两大块部分Tinking electrons:modeling people & categorical and linear models
Part 1
1.为什么要给人类建模?
因为我们很多模型都会涉及到人或者一群人,比如政府、公司、机构等等,我们要为这些对象建立模型,就必须对其中的主题,也就是人,进行建模。可是人是一个复杂的动物,因为我们可以思考,我们有意图、动机、目标,有我们各自想要做的事情,有信念体系,最重要的是,我们其实都不同。所以,正因为是如此的困难,所以精确化是一件不容易的事情,建立基础框架貌似是一个不错的选择,
2.三个基础框架
①理性行为者模型(rational actor model),假定人们的所有的行为是寻求最优的行为。(当然不现实)不过,这是个不错的基准,我们从这个入手,假设人们的行为是有目的地,并且会优化自己的目标。
②行为模型(behavioral model),我们需要收集真实地人们做决策和采取行动的数据,然后建立起描述人们真实行为的模型。当然,不能太复杂,会包含一、二个完美理性假设下没有的因素。比如,人们可能有的倾向和偏见。(也就是人们在很多情况下并不一定会选择理性的最优解,而是会选择更适合自己偏见和倾向的最优解)
③规则模型(rule based model),我们不会去深入挖掘人们的心理,而是直接假设人们会遵循某些规则,然后研究这些规则作用下的结果。
3.讨论一下
现在,我们先看看理性行为者模型的原理,在理性行为者模型中,我们假设存在一个目标函数,它是一个被试图最大化的数学函数。
譬如,如果这代表一个人,这可能会最大化他的幸福值或是个人价值,如果这代表一家公司,可能是最大化 公司的利润或市场份额,又或者是你在竞选一个政府职位,这就是会最大化你的选票数。
你所做的假设是:人们是寻求最优解的:给定目标,你会做最优的事,你会做出让你感到最开心的选择,你会做出让你获得更多选票的政治决策,你会生产那些最能让你赚钱的产品。
让我们更具体一点,假设你在思考,一个人应该选择工作几个小时?
你要做的,是写下一个函数——效用函数(utility function),效用取决于消费和闲暇,这个函数可以这样写: 消费的平方根乘以闲暇的平方根,为什么是这个样子呢?
我们知道,平方根函数的初始斜率比较大,之后就变得比较平缓,这就意味着:刚开始消费的效用很高,之后就越来越低,休息也是一样:第一个小时非常愉快,但一周过后,你恐怕已经迫不及待要返回工作了。所以休息的效用也是下降的,它们都具有所谓的“收益递减”(diminishing returns)特点。
因此,这个函数是说,消费是好的,但时间长了就不那么好了;休息也是好的,但时间长了也没那么好了。这就是你的函数,而你现在要做的,是根据消费和休息的成本,来决定工作和休息的时长,也即最大化效用函数。
你可能不会真的这么做,比如坐在家里写下什么函数,然后去解什么方程,但经济学家们假定你就是这么做的。或者说,这是近似于你所做的。
理性行为者模型受到了很多质疑,特别是与一些基本数据不符,因此,经济学中发生了一场长达百年之久的 称之为"行为主义革命"(behavioral revolution)的运动。
心理学中也在发生类似的事情,它假定人们的行为是非理性的,如果观察人们的行为举止,你会发现他们不是理性的,而且这种非理性是系统化的。
最近 神经科学的发展提供了支持这种学说的证据,你可以亲眼观察大脑结构,观察人们在特定条件下如何思考,你可以观察到:实际上 ,人们会按照“理性行为者模型” 所认为的非理性方式进行思考!
这样 我们就有了两个基准:
一方面我们假定人们是理性的;
另一方面又假定人们按照人的方式去做事,而这种所谓“人”的方式可就复杂多了。
而第三个办法也来自于社会科学,还有计算机科学以及一些心理学,它假定人们遵循一些规则,它更像是谢林模型(Schelling Model)。
我们并没有一个描述人们行为的精确模型,我们仅需要假定人们会搬离一个社区—— 如果邻里街坊们与他们不是同类人,这是一个很简单的规则,如果这个规则,与人们的行为很接近的话,那这个模型也许够用!
我们现在有了三个基本框架:
·人们会最优化;
·人们会按『人』的方式做事;
·人们遵循规则
在给定条件下,这三个模型对于人们行为所做出的预测会有所不同,而当我们把这三个框架结合在一起时,会得到各种迥异的结论,在某些情况下,我们的假设无足轻重,看看什么情况下这些假设很关键。
Part 2 人们到底理性与否
1.理性行为者模型(rational actors model):这一模式假定是人们是理性的。我们会做出最优化的选择。
但是这个模型受到了很多批评,而且越来越多,因为,人们对它产生的一些结果不满意。不过,我也会证明这真的是一个很有用的 思考“人"的一种方法,特别是构建模型的时候 。
我们都是从“有偏见的点”------------------------→理性人的点
(我们始终在学习让自己走向更好的点,也就是理性人的点)
∴ 理性人是我们的基准,我们可以有一个锚定了。
所以,之前我的一些观点,比如,经济学的一个最基本的假设是——理性人,可是理性人这个假设一直让我觉得,这就是个错误,因为没有一个人始终保持理性,而且经济学弄了这么久,也没有让这个世界变得有多么好,穷人还是很穷,所以不信任由此产生。
但是在model thinking中,基于人的建模,其中也是假定人事理性人的模型(rational actor model),当然,再加上一些人的主观偏见之后的弱化的理性人的行为模型(behavioral models)。
通过rational 和 behavioral 模型的对比,我可以更好的理解了,理性人(完全)的存在,并不是我们每个人都可以做到,只是给我们有一个标的,一个锚定,我们基于它,我们不完全理性人会不断地通过学习而自然而然的接近它。
Part 3 总结三大类模型
第一种模型,认为认识具有理性的,人们有明确的“目标函数”,并且会针对他们的目标采取最优策略。
第二种模型,我们假定所有行为都是理性的,但是会带有偏差,作何说这是减弱版的理性模型。也就是说行为的理性程度是略低的。
第三种模型,它认为我们可以进一步简化模型,只需要假设人们遵循某种规则,这些规则可以是固定不变的,也可以是改变的。
2.我们写下的是什么规则,它真的重要么?——一个人的行为是遵循既定规则、最优策略或是遵循行为模型,真的重要么?
我们可以发现,其实最优化行为和有些偏差的行为并不会有大的区别,那么基于规则的行为了,在“零智能交易者”(zero intelligence)的简单规则模型中研究过。
得出的结论也是:我们发现市场和机构的影响如此之大,结果使得在一个相当宽的范围内,行为本身并不是很重要。所以,在市场中,我们并不非常关心如何模拟行为。
3.在game中,我们学到了一个简单的道理是:理性行为真的是一个很好的基准。
如果我们比较这三者:理性、理性行为、偏差,然后简单的规则。我们看到结果会有多大的差别, 如果结果差别很小,那么我们说,结果似乎不因行为改变。如果差别很大,那么你可以做的事情,就是去想,上三者中哪个最有道理了?
Part 4 线性模型
一、分类模型
1.举例,几十年前,如果你是华尔街投资人,对于Amazon公司,你觉得它是否有投资价值?
a,有投资价值,因为他是info公司,所以有投资价值(信息公司则不然)
b,没有投资价值,因为他不过是delivery,所以没有投资价值(因为现在已经有了很多运输公司UPS,EPX,而且这个行业的利润非常薄)
2.你看,不同的分类,造成了对不同公司的分类,从而也导致了你是否会投资成功,所以,怎么进行分类是关键!
我们可以把a和b看成两个盒子,其实盒子就是我们对社会的认知和框架,所以选择哪个盒子(a或b或其他)反映出你怎样对事物分类的,也将会影响你对这些事物的思考,还会影响你所做出的决定。
3.Lump to live——为了生活,必须把东西捏成团。其隐喻就是,为了理解世界,我们创造了这些团块、盒子、各种分类,我们看到一辆车,我们不会说那是几几年的什么款式的车(除非你是专业人士),而是会说那是一辆卡车、跑车等。我不会把事物分得一清二楚,我只会将事物分门别类 这些都是为了便捷 它们帮助我们理解世界 再想想我们建立模型的原因。原因之一就是用模型帮助我们 做出决定、制定策略、进行设计 所以把东西混在一起 有助于我们更快作出决定 我们将事物分类 说这一件我喜欢 这一件我不喜欢 这一件有风险 这一件没风险
4.我们会用方差来表示物体的差值,因为平方之后不仅让数值变成了正数好比较,而且会让数据之间细微的差异显得明显很多,这也方便我们观察。
步骤:
①我们会先算整体的mean(平均值)
②然后通过每个值与平均值的比较,得出结果,然后平方,最终得到方差。
③然后我们加起来得到总的方差和,英文诗total variations(总方差)
R squared-R平方:表示通过那个简单的分类,解释的方差的百分比。(即为方差/总方差的百分数)
0-------------R--------------1(R 距离0和1的值,取决于数据的准确性)
!!!专家与非专家之间的一个区别就是:专家倾向于more boxes,也就是更多的分类,也就是在某个领域,分得越来越细,也就是越来越接近分子成面,就是我们可能是看到森林,而他已经看到了数目,这就是专家和普通之间的区别。
!!!记住,correlation≠causation(相关性≠因果关系)
eg:就像一般有很好的马术场的学校其学校的排名就会高很多,但是你不能说学校排名高是因为拥有好的马术场,我们是只能说统计数据显示有相关性,而不能推导出因果性,这点要注意。
我们还可以这么想,这个世界有一个总的total variations,我们的创造各种不同的盒子,目的就是为了让R的值接近100%,这样我们就能够更好的理解这个世界,对世界的理解和预测可以更包容和准确。
more 方差(R)→分类越好 ⇋ more boxes →more 方差(R)
互逆过程。
5.intercept 截距
coefficient 系数
R²→告知模型与真实世界的匹配程度
sign(斜率)→告知其对结果影响上是正还是负
magnitude(量级)→让我们知道系数大的影响才大。
Part 5 The big coefficient vs The new reality
一、首先,正如大家所知道的,世界大部分的情况都为非线性的,但是我们依然可以把对线性模型的理解运用到非线性的model中。
1.拟合,look like a line models 、或者分成不同的部分拟合、或者引入一些非线性的关系(如对数、指数)
二、the big coefficient 大系数
Big data does not obviate the uses of models。
1.correlation is not causation
2.数据只存在于一个小区间内,同时还会有(multiple peaks)多峰值
三、The big coefficient vs The new reality
1.我们沉浸其中的大系数,我们过度关注我们现有的数据对我们的影响,但是The new reality则可以从根本上改变我们的生活。
eg:就像大数据一样,在《今日简史》中作者提出的观点一样,日后数据会指导我们的生活,因为我们每一次的行为都会产生一个新的数据,而这些数据会比我们自己还了解我们自己,这样日后我们做出行为的时候,我们到底是根据我们自己的想法,还是听从数据的指挥呢?大部分时候,这确实是一个问题,而且还不小。
但是我们要考虑到,其实数据指导的我们都是从过去或者说现有的层面来指导我们的,可是我们处在这个变化多端的世界,我们的思想会随着时间、经历而改变,而且并不以一定就是又过去决定的,顿悟虽然是又过去的积累构成的,可是当下瞬间的升级是超越系数的,是超越层级的,所以这一些都说明,现实世界的重要性,当然也不否认数据的重要性,这就是我们思维之间的game了。
eg:对于改善交通:
大系数思维可能是增加高容量的车道,让一个车道容纳更多的汽车。
但是新思维则是,为什么不休一个地铁了?或者完全是创造一个新的系统?
Part 6 总结
虽然世界不全是线性的,但是用线性来做参考大部分时候不算太糟糕。!
模型思考的重要性,不言而喻,当然也不是万能。