博弈论告诉你,为什么合作可以共赢

20世纪30年代著名的棒球运动员利奥-杜罗切尔(Leo Durocher)曾说,“好人最后总是输给蠢人”。这句话可能适用于棒球比赛,但在一般的现实生活中却并非如此。在这篇文章中,我们用“博弈论”的数学思想来研究“囚徒困境”,它阐明了人们经常难以合作的原因。博弈论表明,善良且值得信赖的人具有战略优势,因为他们可以“改变游戏规则”来避免囚徒困境,并让所有人获得更好的结果,也包括他自己。从博弈论的角度出发,真的是“好人好报”。

没有谁是一座孤岛,在大海里独踞。——约翰·多恩,十七世纪英国诗人

当人们谈到“游戏”时,人们往往说的是娱乐或体育活动,如跳棋、大富翁、足球、篮球等。游戏的本质是博弈。在数学中,“博弈论”从更广泛的意义上研究游戏。

什么是博弈

什么是“博弈”?一般来说,要满足两个条件:(1)有一个以上的人在做决定(2)人们的决定相互影响。

我们在生活中所做的一切,都是博弈论意义上的博弈。不论何时何地、不论我们做什么,生活中的大小事几乎都有博弈的存在。不信吗?想一下你在上学的时候,你早上醒来时,你起床的速度对父母的影响,父母喊你起床的时间对你的影响——这就是一场博弈!包括接下来一天里发生的事情,从教室到操场,你做出的每个选择都会影响别人和自己。这就是一场场博弈!如果你了解了博弈论的相关知识,你就可以在这些场合下找到更好的应对方式——不仅仅是为了“赢”什么,而是为了改进人际关系、拥有快乐生活

博弈论常用来研究人们在战略情况下的行为方式,在经济学、政治学、商业战略、法律、创业和军事等方面均有应用。就像物理学描述行星如何围绕着太阳旋转一样,博弈论试图描述人们如何在博弈中作出选择。在博弈论中,数学是一个非常重要的工具,可用来分析各方动机、预测结果。有时候,博弈论做出的预测可能会非常出人意料,就像下面这个例子。

🌰:和朋友聚餐

有8个人决定去一家汉堡店吃午饭,他们选择平分价钱(AA)。菜单上有两个菜品:(1)价格为4块钱的普通小汉堡和(2)价格为8块钱的豪华大汉堡。不过,这8个人都觉得普通小汉堡值5块钱,而豪华大汉堡值6块钱。需要注意的是,在这里,普通汉堡的价值高于它的价格(5>4),而豪华汉堡的价值低于它的价格(6<8)。这种情况下,豪华大汉堡显然不划算——你要为你觉得只值6块钱的东西付8块钱。但博弈论预测,当大家一起吃饭时,所有8个人都会点豪华大汉堡。为什么呢?

为了理解这个看起来出人意料的结果,让我们从数学的角度来思考。设 D 为选择豪华汉堡的人数,R 为选择普通汉堡的人数,DR均为正整数,显然D+R=8。豪华汉堡8块钱,普通汉堡4块钱,那么总共花的钱就是8D+4R。那么,可以写成

\text{T}=32+4D

由于8个人决定平分花费,每个人要付总价格的\frac{1}{8}。那么,每个人要付的钱是

\text{I}=4+\frac{D}{2}

当任何一个人选择豪华汉堡时,他们获得的价值收益从5块上升到6块,增加了1块。但是,根据上面的公式可以发现,这个人只要多付5毛钱就行,因为多花的4块钱平分到了8个人身上。因此,每个人都愿意选择多花“小钱”(5毛)得“大收益”(1块),尽管这样大家都为6块钱的汉堡花了8块钱。

那么,要是有人还是选择普通汉堡呢?虽然总共花的钱从64块降到了60块,但是在平分的情况下,每个人花了7.5元。选择普通汉堡的人要为5块的普通汉堡付出7.5元,比付8块得6块的豪华汉堡还要差

看起来很奇怪,是吧?实际上,这是博弈论中最著名、研究最深入的一种战略情况——囚徒困境的一个例子。

囚徒困境

普林斯顿大学的数学家、博弈论奠基学者阿尔伯特-塔克(Albert Tucker)早在1950年提出了囚徒困境的故事,以描述博弈论中一个意想不到的场景——有时只做对自己最有利的事会使所有人的情况更差

有这样一个场景。警方因故逮捕了两名罪犯,我们称他们为P1和P2,根据法律最高可以判处5年的刑期。不过,警方认为这两人可能还犯下更严重的罪行——武装抢劫,这一罪行最高可判20年。于是,审讯人员将两名罪犯带到不同的审讯室,并告诉每个罪犯:“现在是你们将功赎罪的机会,你们在监狱里待多久取决于谁承认武装抢劫。如果你们只有一个人认罪,认罪的人可以立即释放,另一个人会待上20年;如果你们都不认罪,你们会待上5年;如果你们都认罪,你们都会待上10年。”那么,我们会预估两名犯人做出怎样的行为呢?

图1 - 在囚徒困境中,第一名囚犯的坐牢时间。这张“收益代价表”展示了不同情况下第一名囚犯可能坐牢的时间。可以注意到,不论另一名囚犯作出什么选择,这名囚犯都有充分的动机来选择承认(就像红色箭头所示)。

图1显示了不同情况下P1将在监狱中度过的时间。请注意,无论P2怎么做,P1最好自己坦白。(如果P2认罪,认罪可以让P1在监狱中度过10年而不是20年)。如果P2不认罪,认罪可以让P1获得自由,而不是在监狱中度过5年。无论是哪种情况,P1都有坦白的个人动机)。当然,这个逻辑也适用于P2。因此,博弈论预测,两个犯人都会招供,并且都会在监狱里呆上10年--这是一个 "双输的结果",因为如果他们都保持沉默,他们可能只用在监狱里呆5年。

真实生活中的囚徒困境

你或许从没有被审讯过,但实际上,从博弈论的视角来看,生活中的许多情况也跟囚徒困境非常相似。为了向大家解释清楚这一点,让我们细化对“囚徒困境”的定义。

首先,我们需要知晓博弈论中的另一个重要概念——占优策略(dominant strategy)。占优策略是说,不论其他人作出什么行为,当前个体都能获得自身的最高收益的一个可选择的行为。如果一场博弈符合囚徒困境的情形,那么(1)每个参与人都有自己的占优策略,且(2)当所有参与人都不选择占优策略时反而获得最好结果。

这种囚徒困境的定义并不限制博弈的参与人数(经典理论一般认为只有两个人,但是现在可以扩展到任意多数人)。比如,在上面的“吃汉堡”例子中,总共有8名参与人,所有人的占优策略都是“豪华大汉堡”(对应囚徒困境中的“认罪”),结果所有人都得到了更差的结果(对应囚徒困境中“大家都多坐几年牢”)。

除此以外,让我们再看两个囚徒困境的现实例子。

第一个例子:每周末的时候,一群人出去野餐。假定他们只从自身利益出发,占优策略则是不扔垃圾(因为收拾垃圾很费事)。但是,如果大家都这么选择,公园就会变成垃圾场。在这种情况下,不扔垃圾是所有人的占优策略,但是最终会导致所有人得到更差的结果。

第二个例子:当班里有一个喜欢霸凌他人的小孩,ta会欺负班里所有人。当ta欺负别人的时候,你会挺身而出吗?只从每个人自己的自身利益角度来说,很可能不会——因为这样会让ta转而欺负你。但是,如果没有人这么做,那么霸凌就会一直持续。在这个情境下,每个小孩的占优策略都是不要阻止霸凌者的,最终导致大家都得到更差的结果。(如果你遇到校园霸凌,请及时寻求权威人士的帮助!)

如何摆脱囚徒困境

己所不欲,勿施于人。在囚徒困境中,每个人都选择做对自己最有利的事情得到的结果比每个人做出个人牺牲来帮助别人的结果要差。因此,摆脱囚徒困境的一个方法是改变每个参与者的动机,使他们愿意帮助他人

例如,在扔垃圾的例子中,社区组织可以张贴海报宣传并促使野餐的人“当一名好领居,扔掉你的垃圾”。通过宣传、推广“好领居”的所作所为,人们在看到宣传海报的时候,为了让自己成为“好领居”、避免被认为是“坏邻居”,从而清理制造的垃圾。只要这些新的动机足以说服每个人去打扫,那么公园会变得更干净、大家也会获得比以前更好的结果。

早在十七世纪,醉酒的英国水手们往往会面临严厉的惩罚——他们会被绑在船上的桅杆上,被下令由另一名船员用“九尾猫”的鞭子抽打。为了避免这种情形,水手们就私下达成协议,用挠后背表示轻抽对方来代替鞭子。只要大家都同意这个协议,那么每个人在受罚的时候都只要轻轻地抽就行。这种“你帮我我就帮你”的情形是一种相互的承诺,它也可以帮助参与者摆脱囚徒困境

回到最初的囚徒困境的场景,两名嫌疑人可以提前达成一个简单协议:你不承认,我也不承认;但你承认了我也会承认。假设第二个人做出了这样的承诺,第一个人选择相信。那么,第一个人的结果要么是10年(都承认)要么是5年(都不承认),这种情况下他会选择不承认,从而获得更好的收益。看起来囚徒困境破了(图2)!

图2 - 囚犯间的承诺使得参与方“摆脱”囚徒困境。 这张图展示了,当一个参与者先行动,另一个参与者后行动且能遵守私下的承诺时,囚徒困境的决策树。其中,红色部分为先行动人、黑色为后行动人的选择。每个“囚犯”在每个“决策点”做出的选择用粗箭头表示,没有选择的行为则用细线表示。圈出的内容“两人都不承认并都服刑5年”是这种情况下可预测的结果。

但是等下——要是第一个人不相信第二个人,认为第二个人可能背信弃义,怎么办?这种情况下,他还是会选择承认,所以结果还是10年。两个人还是困在囚徒困境中了。

那么,问题来了:你怎样确保别人相信你的承诺?最简单有效的方法——做一个诚实可敬的人。如果别人知道你一诺千金且看中名望,他们更可能相信你说的。这样,你能更好地运用承诺的作用,摆脱生活中的囚徒困境,让自己和周围的人生活得更舒服。

更多信息

原文:McAdams D (2017) Game Theory and Cooperation: How Putting Others First Can Help Everyone. Front. Young Minds. 5:66. doi: 10.3389/frym.2017.00066
作者:David McAdams
翻译:小鱼

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容