任何一场博弈游戏都有纳什均衡;然而,真的能够达到吗?
1950年,数学家John Nash(电影《一个美丽的头脑》主人公的原型)写了一篇两页的论文,改变了经济学的理论。他的关键而又非常简单的想法是,任何一个博弈游戏都存在一个最优策略集合,在这个集合中,每个参与者都有自己选择的策略,但是,没有哪个参与者可以通过单方面转向集合外的策略来赢得更多的胜利,这就是“纳什均衡”。
“纳什均衡”的概念为理解博弈行为(包括经济学,心理学,进化生物学和其他领域)提供了一个统一的框架;Nash因此在1994年获得了诺贝尔经济学奖。芝加哥大学诺贝尔经济学家Roger Myerson对此评价道:“其对经济理论的影响与生物科学中DNA双螺旋的发现相当。”
当参与博弈的各方已经处在“纳什均衡”时,当然没有人愿意破坏这种平衡。然而,参与者如何才能达到“纳什均衡”呢?与皮球会在引力的作用下滚下山谷不一样,似乎没有明显的力量引导博弈的参与者走向“纳什均衡”。
“纳什均衡”一直是微观经济学家的焦点。他们使用这些均衡的概念,他们分析他们,好像人们会处于均衡状态;但对于“人们为什么要达到纳什均衡”并没有令人满意的解释。
如果人们只进行一次博弈游戏,期望他们找到均衡往往是不合理的。尤其当博弈的参与者只知道他自己对不同结果的喜好,而不知道其他人的想法;而这正是现实生活中典型的情况。如果人们可以反复进行相同的博弈游戏,他们也许可以从早期的尝试中并迅速转向均衡;然而,试图找到这种有效的到达“纳什均衡”的努力总是鲜见效果。“经济学家已经提出了很多如何快速收敛到纳什均衡的机制;但是,对于每一个这样的机制,都可以找到简单例子,在这些例子上是不起作用的”。
现在,就职于以色列理工学院的数学家Rubinstein和Yakov Babichenko解释了其中的原因。去年9月,他们在一篇论文中证明:任何在某一个博弈游戏中可以快速收敛到纳什均衡的策略,无论多么符合常识,多么有创造力,多么聪明,都不可能适用于每一个博弈游戏。“这是一个非常消极的结果。”
经济学家经常使用纳什均衡分析来证明经济改革的正确性;但新的结果表明,经济学家不能假定人们将达到纳什均衡,除非他们能够证明有关情况的特殊性。“如果你想弄清楚你的游戏是否能轻易找到一个平衡点,那么你就需要证明它。”
多人博弈
在一些简单的游戏中,很容易发现纳什均衡。例如,如果我更喜欢中国菜,而你更喜欢意大利菜,但我们最强烈的选择是一起吃饭,两个明显的平衡是我们两个去中餐馆或者我们俩去意大利餐馆。即使我们开始只知道自己的喜好,而且不能事先交流彼此的想法,在我们彻底了解彼此的喜好之前,也不需要花费太多次的尝试就能找到一个或另一个平衡。
但想象一下这样的情形:晚餐计划涉及100人,每个人对于“谁和谁吃饭”都有自己特定的偏好,但都不知道其他人的偏好。Nash在1950年证明,即使是像这样的庞大而复杂的博弈游戏,也总是有一个均衡的。但是,直到2015年在车祸中去世,Nash一直没能没有提供如何计算这种均衡的方法。
通过深入研究纳什的证据,Rubinstein和Babichenko能够证明,对于一般的情况来说,没有任何方法可以保证让参与者找到纳什均衡(即使只是寻找近似的纳什均衡也没法保证),除非他们互相告诉对方各自的偏好。随着博弈中参与者数量的增长,所有这种通信所需的时间很快变得不可能。例如,在上述的100人就餐的博弈游戏中,有2的100次方种可能的选择,因此每个参与者必须分享2^100条偏好;相比之下,大爆炸以来只有2^59秒。
这种沟通瓶颈意味着通过一轮又一轮尝试的策略都不能有效地在一些复杂的博弈游戏(例如一个有复杂偏好的100人就餐博弈)中引导参与者找到纳什均衡。毕竟,在每一轮中,参与者只会学到一些关于彼此的新信息:对于某一个特定的安排他们有多么满意。因此,在他们了解所有人的价值观之前大概要2100轮左右(到那个时候,大概中餐馆和意大利餐馆都倒闭了)。“如果这要比宇宙的年龄还长,那当然是完全没有用的。”
一件很自然,很显而易见的事:参与者有时需要了解彼此价值观才能找到纳什均衡。然而,新的论文表明,即使参与者只是希望寻找到一个近似的纳什均衡,这限制也是存在的;即使在现实世界中,找到一个近似的纳什均衡已经是非常让人满意了。
Babichenko和Rubinstein的结果并不意味着所有的(甚至也不是大部分的)博游戏都会受到这个限制,“只有一些游戏会”。经济学家用来模拟真实世界的许多博弈游戏都有额外的结构,可以大大减少了每个参与者必须传达的信息量。例如,如果我们有100个人每天都选择两条路线中的一条,那么你可能并不在乎每个参与者走哪条路,你只关心哪条路上有多少人。这意味着参与者的偏好集合将具有高度的对称性,您可以用一些精心挑选的句子而不是所有的2^100句来完整地表达。
经济学家可以运用这样的论证来证明为什么纳什均衡可以在特定的博弈中实现。但新的结果意味着这种理由必须在个案基础上作出;没有普适的论据覆盖所有的博弈游戏。
更重要的是,尽管许多随文明进化而来的博弈游戏可能适合这样的简化;但互联网(约会网站到网上股票交易)正在催生各种新型多参与者的博弈游戏。“在这一点上,人类的进化并没有让我们走向容易找到均衡的博弈游戏;我们设计新的博弈,如果我们理所当然的认为这些博弈会达到平衡,我们往往会出错。”
经济学家们敏锐地意识到,在现实生活中,人们往往不会在纳什均衡的状态下进行博弈游戏;但经济学中没有任何理论可以讲清楚经济学究竟有多精确。“理论计算科学的结果,比如Babichenko和Rubinstein的理论计算结果,可以为解决这个问题提供灵感。”
但是这两个领域有着截然不同的思维方式,这可能会阻碍跨学科交流:经济学家倾向于寻找简单的模型来捕捉复杂交互体系的本质;而理论计算科学家往往更有兴趣了解模型越来越复杂的情况。“我希望我的经济学同事们能够对计算机科学正在做的事情有更多的认同,更多的兴趣。”
值得信赖的顾问
新的工作在纳什均衡与另一个更一般的均衡概念之间划分出了一个明显的分界线。在Nash的论文发表24年后的1974年,另一位诺贝尔经济学家Robert Aumann提出的“相关均衡”的概念。Aumann认为,假设博弈游戏的每个参与者都可以从一个可信中介(或“相关设备”)得到应该采取什么策略的建议,如果没有参与者有动机偏离收到的建议,而且他认为其他参与者也会遵循“可信中介”的建议,则中间人给各参与者的建议的集合形成“相关均衡”。
这乍听起来有点神秘,但事实上,我们总是使用相关的均衡。例如,每当我们让硬币决定出去用中餐还是意大利餐;或者还是让交通灯指示十字路口中哪一个先通过。
在这两个例子中,每个参与者确切地知道“调解员”给另一个参与者的建议,调解员的建议基本上可以帮助参与者实现纳什均衡。但是,当参与者不确切地知道“调解员”其他人的建议时,只知道不同的建议是如何相互关联的,Aumann表明,参与者可能在这种情况下达到“相关均衡”。“相关均衡”的集合不仅包含“纳什均衡”的组合,也包括根本不是“纳什均衡”的策略选择,但有时会导致比任何纳什均衡更积极的社会结果。例如,在一些合作会产生更高总收益的博弈中,比起自私自利的行为,调停者有时可以通过隐瞒给其他参与者的建议来让参与者合作。“这个发现是一丝蓝天。”
即使一个中介可以给出许多不同的建议,但是,一组由线性方程组和不等式组成的博弈相关均衡集在数学上也比“纳什均衡”的集合更易处理。“另一种思考的方式,数学更美好。”
尽管Myerson(就职于芝加哥大学的以为诺贝尔经济学获奖者)曾经把Nash的博弈论视为“20世纪杰出的知识进步之一”,但他认为“相关均衡”或许是“比纳什均衡”更贴切现实情况为自然的概念。“如果在其他行星上有智慧的生命,那么大多数人会在纳什均衡之前先达到相关的平衡。”
在轮回制的博弈游戏中,参与者可以选择许多最自然的方式来寻找适应其的策略,这最终都可能趋于“相关均衡”。举个例子:“遗憾最小化”的方法。在一个轮回制的博弈游戏中,如果参与者因为在上一轮没有使用某种策略而感到遗憾,就会在这一轮中增加使用该策略的概率。遗憾最小化是一种与现实生活有着相似之处的方法,“关注过去的成效,偶尔还有一些尝试”。
研究证明,许多“遗憾最小化”的方法都迅速收敛到“相关平衡”:在进行了大概100轮之后,回顾整个过程,就像有个中间人一直给参与者劝告。随着博弈游戏的继续,参与者不一定会一直保持在同一个“相关均衡”状态。例如经过1000轮后,他们可能已经漂移到一个新的平衡点。现在他们这场1000论的博弈游戏看起来好像是被一个不同于以前的中介所指导。“这个过程让人联想到现实生活中发生的事情,因为社会规范应该逐渐演变。”
在纳什均衡难以达到的复杂博弈中,相关均衡是替代解决方案“自然的优先竞争者”。人类在相关均衡之前就提出纳什均衡的观点可能只是历史的一个偶然事件。人们总是认为先前演变出来的想法是更基本的想法;但在这种情况下,谁来说什么是更基本的想法呢?
然而,快速收敛并不代表任何一轮的比赛都是以相关均衡的方式进行的。这意味着,“遗憾最小化”方法并不总是理性参与者在任何一轮的理想选择。这就留下了一个问题:理性的参与者会做什么?对于这个问题,至今没有明确的答案。