幂律分布

好,我们先来看一组现象,一组常见却又特别奇怪的现象——

在抖音和快手上,有的短视频能够吸引几百万个点击量,但是其他绝大多数短视频却无人问津。这是为什么?

在微博上,大V拥有几千万的粉丝,但是普通人的关注度却寥寥无几。这又是为什么?

还有,在中文里,我们经常使用的汉字也就两三千个,但实际上呢,中文汉字的总量是9万多个,换句话说,字典里的绝大多数字,你都不会用到。这又是为什么?

还有,统计学上有一个发现,它讲的是,城市的人口数量排名跟它的人口规模成反比。最大的城市的人口规模,是第二大的城市的两倍,是第三大的城市的三倍,是第四大的城市的四倍,以此类推。用这个方法来估算城市的人口,跟人口普查的数据常常能达到惊人的相似。

你看,这些现象都有一个共同的特征,就是它的数据波动非常地大,少数点的数值特别高,大多数的点数值都很低,最大和最小的点之间,可能相差好几个数量级。统计学上,把这种情况叫做“幂律分布”。

幂律分布的形状,是一个不断下降的曲线,从最高的峰值开始极速下降,后面拖了一个长长的尾巴。自然界中的很多现象都遵循正态分布。比如,人们的身高、体重、智商,这些统计量都有一个平均值。大家在这个平均值的周围小范围地波动。你高一点,我矮一点,差距不是特别地大。

但是,还有一类现象,就像我们刚才讲的点击量、关注度、语言,还有城市人口,甚至包括人脉、财富、声望,这些都遵循的是幂律分布。

世界是不公平的

幂律分布和正态分布,给我们展示了两个非常不同的世界。

以收入为例,在正态分布的社会里,中等收入阶层占绝大多数,低收入和高收入阶层只占极少数。这种分布,被认为是非常理想的社会结构,对聪明勤奋的人有激励,让弱者的落差感没那么大。但是真实世界的趋势,是越来越像幂律分布。

第一个为幂律分布命名的是经济学家帕累托。他发现,在19世纪的意大利,极少数的富人赚走了绝大部分的钱,大部分家庭的收入都很低。他的这一发现被后人称为“帕累托法则”,也叫“二八定律”,也就是20%的人获得了80%的收入。

在美国经济危机期间,幂律分布被赋予了新的意义。占领华尔街的运动让人们关注到一个惊人的事实,在美国,1%的高收入人群,拿走了15%的收入,而且这个贫富差距还在继续扩大。

用《新约·马太福音》里的话就是:“凡有的,还要加倍给他叫他多余;没有的,连他所有的也要夺过来。”

用现在的话来说,就是“穷者越穷、富者越富”。

皮凯蒂在《21世纪新资本论》里也证实了这一观点。他指出贫富两极分化的根本原因,是资本回报率总是大于劳动回报率。所以,资本会倾向于流动到已经聚集的资本上,而不是为劳动增值。因而,有钱的人,会越来越有钱,没钱的人几乎没有办法通过劳动来追赶上。

在电影《西虹市首富》里面,主角王多鱼得到了一笔意外之财,要求在短时间之内必须花掉。他使尽了浑身解数去花钱,没想到,财富像雪球一样越滚越大,挡都挡不住。这背后的原理,就是幂律分布。

产生机制:优先连接

你可能会问,既然这么不公平,那么,幂律分布背后的机制是什么呀?“穷者越穷、富者越富”的现象是怎么形成的?穷人还有没有机会打个翻身仗呢?

这就涉及到我们今天的硬核知识了。幂律分布之所以产生,是网络中的相互影响和正反馈的结果。

你看,身高、体重、智商,这些现象,人和人之间是互不影响、彼此独立的。它们不是网络现象,所以,它们服从的是正态分布。

但是,财富、人脉、声望,还有人口和点击量,它们都是网络现象。一个人有多少钱、有多少人脉、有多少关注度,是在跟别人的互动中形成的。你必须把这些现象放到网络之中,才能理解它为什么是这样。

符合幂律分布的网络,又被称为“无标度网络”。无标度网络的特点,是节点的中心度相差悬殊,无法用均值或方差等指标来反映度分布的聚合或者离散程度,所以,我们把它叫做“无标度”。

真实世界的网络,大部分都是无标度网络,都遵循的是幂律分布。从只有20多年历史的万维网,到经历了40亿年漫长进化过程的蛋白质互动网络;从由分子构成的网络,到由城市构成的网络。幂律分布,铁律,让人惊叹!

那么,网络为什么会呈现幂律分布呢?

这跟网络的生长机制有关。物理学家巴拉巴西(Barabási Albert-László)认为,网络生长的方式不是随机发生的,而是优先连接。当新的节点加入网络,或者网络中有新的连接产生时,连接度高的节点会比连接度低的节点更有可能得到新连接,这就是所谓的优先连接。

在社交网络中,一个人的朋友越多,就越有可能认识新朋友。

在互联网上,一个短视频的点击量越高,就越容易被更多的人看到。

在学术界,一篇论文被引用的数量越多,就越有可能被其他的论文引用。

正是在优先连接这一机制的作用下,网络才出现了幂律分布的结果。幂律分布的出现,预示着一个系统从无序到有序的过程,从随机网络发展到无标度网络的过程。幂律分布的结果,是少数的节点能够施加影响,重新组织整个系统。

以航空网为例,伦敦、芝加哥、法兰克福、阿姆斯特丹的机场都非常地大,有通往全国各地、全世界各地的航班,它们是全球航线网络中的超级节点。但是与此同时,还有大量的小机场,他们是地方性的,只维持了几条航线。航空公司通过小机场覆盖尽可能多的乘客,又通过大机场这样的超级节点,最大程度地减少了转机的次数。所以,航空网的效率,来自于他们主动运用了幂律分布。

城头变幻大王旗

经济学家弗里德曼有一个预言,他说啊,世界是平的。因为全球化、因为互联网,世界在机会分布上变得更公平了。

但实际上呢,幂律分布告诉我们,公平不是世界的真相,而且,这个不公平在互联网时代被放得更大。咱们就看互联网行业,不管是哪条赛道,早期都是千军万马、百舸争流,但是最后,能活下来的只有一个或几个巨头。这些巨头利用已有的用户基础和资本体量,不断地攻城掠地,进一步加强知名度,改变用户习惯,提高用户粘性,巩固行业地位。

但是,巨头永远是巨头,这只是一厢情愿的看法。

当孙正义在投资一家叫做阿里巴巴的小公司时候,他可能没有预计到马云不仅会登上福布斯全球亿万富豪榜,更不会预计到还会排在他前面。而且,跟马云一起登上富豪榜的成功人士中,一半以上都是白手起家。

前几年我们还在焦虑BAT的垄断地位,可能会压制创新创业的发展,然而今天简称TMD的今日头条、美团和滴滴等新一代互联网企业,已经站在新的风口浪尖上。

换句话说,幂律分布没有那么令人绝望。我们如果只是静态地观察的网络,它表现出来的是两极分化和寡头垄断,但如果我们从动态的角度看,你会发现新的超级节点总在不断涌现。社会结构的变化、世代的更替、颠覆性技术的出现,都为新的超级节点的出现创造了机会。正所谓城头变幻大王旗,各领风骚三五年。

今日得到

总结一下这一讲的内容。今天我们讲了网络的一个普遍特征,那就是幂律分布。我们生活中各式各样的现象,从点击量、关注度、语言、城市人口,还有人脉、财富、声望,都遵循的是幂律分布。

幂律分布产生的原因是优先连接。新加入到网络中的节点,更倾向与超级节点产生连接。静态地看,你会看到不公平,但是,动态地看,你会看到新的机会仍然在不断涌现。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 《网络素养》中的原文: 当你开始分析小世界⽹络,并列出每个节点的连接数量时,你会发现⼤部分节点的连接数都⽐较少,只...
    MeamMr阅读 4,992评论 3 5
  • 01 问题的引入: 在看《跃迁》这本书时,第二章讲到幂律时,提到: 幂律分布的第一个特征,就是高度的不平均。 幂律...
    闪闪发光的Lucky阅读 16,399评论 2 13
  • 一、幂律分布与正态分布 相信不少朋友应该知道“幂律分布”与“正态分布”的概念。首先,幂律分布与“二八法则”的概率类...
    悦读思考阅读 1,698评论 0 4
  • 很喜欢深夜一个人走在街上的感觉,街灯拉长了我的身影,几颗寥寥的星星,那一刻我觉得整个世界都是我的。 我天性不宜交际...
    3720_9bed阅读 267评论 0 0
  • 依稀记得第一次接触灵性成长类书籍是在读初中的时候。英语老师组织大家订阅一些刊物书籍,无意间被一本《遇见未知的自己》...
    海韵梦都阅读 457评论 0 2