一、一杯水为何存在?
你每天都会喝水,但你有没有想过,「一杯水」为什么会存在?
或者换句话说,这杯水为什么可以以一个「个体」的形式存在?
要知道,一杯水是由数不清的水分子构成的,并没有谁给这些水分子贴上标签——「它们都属于这杯水」。而且,它的边界似乎也并不清楚——在水面附近,水分子不断的飞出、飞回,好像根本没有边界一样。
空气、灰尘,也都是这样,从最底层的粒子来看,好像都可以「取消」这个几个概念,而只用分子、微粒代替一样。
那我们为何要将它看作一个单独的个体呢?而不是看作一个个水分子呢?
因为单个水分子的有些行为,在宏观的尺度几乎没有影响。
水分子越多,单个的水分子就越来越不重要,而它们整体的行为则开始占了主导。空气也是这样,数量越多,单个分子就越来越不重要。正因如此,我们才可以讨论「空气」。
但正是由于数量越多,单个部分就越不重要的特性,我们可以把它们看作一个整体。
注意这里就有了一个断层——底层的行为,与宏观行为之间的断层。水分子和气体分子的运动,都是高度随机的。而一杯水则非常平静,又容易预测,是一个非常大的差异。
所以说,在尺度的增长过程中,有的性质保留了下来,有的性质则渐渐消失了。
造成这一切的,不是什么高深的物理定律,而是简单的统计学规律:「大数定律」。
举一个简单的例子:你投1000次硬币,那正面/反面的比例会非常接近1:1,如果投10次,差别则可能非常大;这其实就体现了大数定律的思想:对独立的随机变量反复抽样,最终抽样的频率会接近于概率。
一杯水中的情形与投硬币非常相似,每个水分子都有很多随机行为,比如随机的热运动,它们是相互独立的;也有非随机的行为,比如接近时产生斥力从而发生碰撞,这些运动则会有互相之间的影响。
根据大数定律,随着数量的增加,随机热运动产生的影响会渐渐消失;而非独立的行为,比如分子之间的作用力导致的行为,则会占据主导地位。而后者的行为,则会在更大的宏观尺度上产生影响。
正是由于上述的原因,我们才可以说这里有「一杯水」。
但大数定律并不能解释所有的涌现行为,比如屏幕。
屏幕如何显示图像?
此时此刻,你正在看这句话、这篇文章。但有一个问题:你是如何看到屏幕上的字的?
要知道,如果你在更小的尺度观察,它们都是一个个的像素点。而尺度一大,它们就变成了字。这与一杯水、一团气完全不一样:尺度增大了之后,我们能获得更多的信息了。我们不能像处理水分子那样,把像素完全平均,因为这样我们就会损失掉绝大多数的信息。
差别究竟在哪里呢?在于关联。
像素之间是可以有关联的,这个关联并不是来自于显示器的结构,而是来自于我们的理解。
一个单独的像素,我们可能会理解成一个点,也可能理解成一个噪点、坏点。两个像素连在一起,就更有可能是一条线,当然也有可能是随机的噪点。但一百个像素连成一条呢?我们就会非常确定——那就是一条线。各种直线、曲线组合在一起,就会让我们获得更多的信息,比如产生可以阅读的文字。
在这个过程中,大数定律并不起作用。因为像素点之间不会互相平均掉,反而会相互加强——几百个像素连成的线,它「是一条线」的可信度就远远高于几个像素连成的线。之所以如此,都是因为在我们的理解中,像素之间是有关联的,而这些关联又是可以互相加强的,从而在大尺度上涌现出了更多的意义。
注:有的了解信息论的人,可能会觉得上面说的不对,这种尺度扩张的过程是会损失很多信息的。但如果将像素点引入随机性,那么「一条线」的概率就远远低于「随机点」的概率,对应的,在这个系综(或者叫等价集合)中,这一条线所包含的信息就远远高于随机的点。这里的关键是承认随机性。
关联,可以超越大数定律,产生更为复杂的行为。
商店与银行的故事:负反馈与正反馈
下面我们可以讨论一些更为复杂的问题了,比如社交网络、鸟群、计算。要讨论这些系统,我们还要引入一个概念,就是「反馈」。
反馈非常好理解,你跟朋友说话,你朋友的行为就是反馈,这个行为甚至不需要针对你自己,因为即便是作用于其他对象,也可以看作是对「系统」的反馈。
举个例子,现在有100个人要去,两个商店,A和B。他们有两种策略:
1. 每个人随机的去AB商店之一,概率是1:1;
2. 每个人都尽量选择去人少的商店。
第一个策略的结果很容易猜到,那就是AB两个商店的人数会非常相近,这是大数定律的结果,前面提到过。
第二个策略虽然不一样,但结果还是一样的,AB商店的人数也会非常相近。我们可以这样理解,如果某一时刻A商店人多,而B商店人少,那么后来的人都会尽量选择去B,进而AB之间的差异就被填平了。最终,两个商店的人数会非常接近。这就是一个负反馈的过程。
结果虽然相同,但原理大不一样。后者对于外界的扰动是有适应性的:假设突然给A商店加入30个人,由于人们都愿意去人少的店,很快两个店的人数就会再次平衡。而策略1则不能适应。
这就是反馈的力量——反馈可以让系统具有适应性。
注:而从更抽象的角度看,反馈可以看作一种计算以及信息的传播,正是由于信息可以在系统中广泛传播,又可以得到计算,整个系统才会被连成一体,才会有所反应。
但是,负反馈得到的结果是非常容易预测的,那就是「平衡」。但生命以及社会中,有很多不平衡的结构,它们是无法用负反馈得到解释的。比如人体的结构,比如社会的结构,都无法单独用负反馈来解释。
我们需要引入正反馈。
一个著名的「正反馈」的例子,就是社交网络。比如在微博上,粉丝数很多的「大V」曝光率也很大,新加入的用户就更容易看到这些「大V」,相应的,关注他们的概率也更大。
这就会导致「超级大V」的产生。有的微博头部用户甚至有几千万的粉丝数。如果每个人都完全平等、随机的关注别人,那也会产生粉丝数很多的「大V」,但结构会完全不一样,「超级大V」会比现在少得多,大部分用户的粉丝数都处在适中的范围内。
为了解释这个现象,网络科学家Barabasi提出了「优先连接模型」,引入了「用户更容易关注粉丝数更多用户」的正反馈机制。非常好的模拟了很多社交网络。顺便多说一句,在很多复杂系统中,我们都可以看到幂律的行为,这些行为或多或少都与正反馈有关。
正反馈的机制不仅仅可以模拟一些特定的结构,它还可以与负反馈结合,形成「智能」的系统。
Conway提出的「生命游戏」就是这样的一个系统。它是一个运行在棋盘格上的模型,每个格子可以是黑色的(生),也可以是白色的(死),它的规则是这样的:
1. 如果一个黑色格子周围的邻居少于两个,那它就会因孤单而死(正反馈);
2. 如果一个黑色格子周围的邻居大于三个,那它就会因拥挤而亡(负反馈);
3. 如果一个白色格子周围恰好有三个黑色格子,那这里就会出生一个黑色格子(正反馈);
4. 其余情况则不变。
可以看到,它是正反馈与负反馈的结合,但它的行为却极为复杂:
事实上,它的行为不是「一般的复杂」,Conway的生命游戏系统是「图灵完备」的。这意味着,我们可以在「生命游戏」中构造出一台通用计算机!从而可以运行任何算法,这如果按照Wolfram的标准,它就已经达到了「复杂性的极限」了。
图灵完备、计算等概念这里不多叙述,我们还是看「反馈」。为什么既要正反馈,又要负反馈呢?
因为纯粹的正反馈会导致系统崩溃,比如说,如果气体膨胀的时候气压还会增加,那这个系统就会急速膨胀,最终不受控制。
而纯粹的负反馈又会非常无趣,因为最终会达致一个平衡态。
只有正反馈与负反馈的结合,才最可以涌现出复杂性。
大数定律的用处
我在一开始提到了大数定律,讲到了它对于「一杯水的存在」的意义。而后面说到了一些更有意思的内容:反馈、生命游戏、图灵完备……
有的人现在可能会觉得,大数定律太过于平常,在复杂系统中毫无意义。是这样的吗?答案是否定的,这里我想举一个例子来说明:
北美洲有一种蝴蝶,叫做「美洲帝王蝶」,每年气候寒冷的时候,它们就会从加拿大的东南部,迁徙到墨西哥中部的米乔坎州,路途上千公里,而最终却能聚集在这么小、这么确定的地方。
它们靠什么来导航呢?
已有的研究表明,它们会使用地磁场、地面的信息来导航。但这些研究都没有解释一个现象,那就是它们的路线非常直。
对于飞行的群体,比如鸟群、蝴蝶群等,科学家早已提出了很多模型,比如基于多主体(Agent-based model)的模型,可以很好的模拟鸟群的飞行。然而它们都没有告诉我们:这些群体到底是如何保持方向的?
墨西哥学者Carlos M. Hernandez-Suarez最近提出了一个理论,用简单的模型解释了群体导航的原理:
想象一个随机行走的过程,如果只有一个粒子,那它的路径就是非常随机的。
而如果有两个粒子,它们的行为则变成这样:
1. 首先按照一定概率 theta 去走向另一个粒子;
2. 还有 1-theta 的概率做随机行走。
但越从众,导航就越精确吗?可不见得。前面说到了反馈的思想,这里的这个行为就是正反馈,这意味着如果有偶然的偏航,正反馈会加大这种偏航的行为。所以单纯的正反馈是不行的,越从众,群体的行为可能就越无法预料。
这时需要什么呢?需要有一部分个体保持随机的行走(每次随机的修改一点自己的方向),不受其他个体影响。这时群体就既能聚集成团,又能保持方向。
作者对这个结果的解释似乎还停在动力学(dynamic)的层面,但我们其实可以从大数定律的角度去理解:虽然每个个体方向的变化都是随机的,但根据大数定律,它们整体会有一个「记忆」,也就是它们的平均方向。这个记忆会非常稳定,而其他「从众」的个体,则可以从这个记忆中得知正确的方向。换句话说,从众概率 theta 如果在一个合适的位置,那这个群体中就会有一部分个体,通过随机行走来储存正确的方向,实现长程的导航。
涌现还有很多尚未解决的问题,比如层级如何出现?又如何分辨层级?一个系统中是否存在一个「特殊的尺度」?在这个尺度上,系统展现出明确、复杂的因果关系。在这个尺度下,行为混沌而难以理解,在这个尺度上,则是整体的行为,对于理解规律帮助不大。这些都是现在尚未完全解决的问题,后面会写一些文章慢慢讨论,欢迎关注。
参考文献
[1] Miller, John H, and Scott E Page. Complex Adaptive Systems: An Introduction to Computational Models of Social Life. Vol. 17. Princeton university press, 2009.
[2] Barabási, Albert-László, and Réka Albert. "Emergence of scaling in random networks." science 286.5439 (1999): 509-512.
[3] Hernandez-Suarez, Carlos M. "Aggregation is the key to succeed in random walks." Mathematical biosciences 279 (2016): 33-37.