一个有趣的游戏

有一个小游戏,游戏规则:

两组分别代表两家公司。需要选出一位组长,他就是最终下决策的CEO;

游戏共有10轮,每一轮,两家公司分别选择「偷袭」或是「合作」。

如果都选择偷袭,则都不得分;如果都选择合作,则都得2分;如果一家选择偷袭,另一家选择合作,前者得3分,后者得-1分;

胜利条件:最终得分比对方高,且不低于8分;

游戏过程中双方不得沟通,但有3次谈判的机会,可以各派出一个人去谈判。

好了,你可以思考一下:如果是你玩这个游戏,在这10轮之中,你会采用什么样的策略?

学过博弈论的朋友,应该一眼就能看出来,这是一个「囚徒困境」的升级版。

什么是囚徒困境?

假设有两个犯了案的囚徒,被警方单独审问,警方开出的条件是:

指认对方。那么对方将判刑5年;

沉默。那么对方将无罪释放;

但如果自己沉默的同时,对方指认自己,那么对方将无罪释放,而自己将判刑10年,作为包庇的惩罚。

可以看到,对两位囚徒而言,最好的做法是都沉默,这样双方都能无罪释放。但是,如果遭到对方的背叛,自己就将面临10年刑罚;反过来,如果选择指认,运气好的话可以无罪释放,运气差的话,也不过是5年而已。

所以,尽管存在最好的情况(都沉默),但两位囚徒最终一定会选择互相指认对方,从而都判刑5年。

这里,囚徒们作出的决策,就是鼎鼎大名的纳什均衡。

它阐述了这一点:在信息没有充分沟通的情况下,双方都从自己角度出发,选择自己的优势策略(在实例中,就是「指认对方」),反而会得到一个「不好」的结果。

这是一个很违反直觉,但在生活中普遍存在的现象。

最常见的例子,就是广告战。

市场上,企业面临着「打广告」和「不打广告」两种策略。最好的策略,当然是大家都不打广告,好好做产品。这样,可以节省大量的广告开支。但是,如果自己不打广告,别人打了,自己就会蒙受损失;同样,别人不打广告,自己打,就能获利。

所以,最终的情况,一定会演变成「所有企业都在打广告」。效果得不到提升,还白白投入了大量开支。

回到囚徒困境。这里面的关键是什么呢?是猜疑链的存在。

第一,囚徒与囚徒之间难以沟通,「我们一起选择沉默吧,这样大家都可以无罪释放」这个想法,无法传递给对方。

第二,即使双方建立共识,也无法保证对方是否会背叛自己。毕竟,对于对方来说,选择「背叛」,风险永远是比「合作」更低的。

这是一个关乎人性和信任互利的决策。

回到最开始的游戏。

这个游戏跟囚徒困境有什么差异呢?很显然,是两点:

第一,这个游戏有十轮。也就是说,「无法沟通」这一点被打破了。双方完全可以在前几轮的较量中,用自己的决策来传递信息,进而影响对方的决策。

第二,这个游戏有下限条件。这非常符合实际:如果一个市场里,所有企业都在互相攻讦,忽视了对市场的占领,最后的结果就是两败俱伤。

如果没有下限,显然,最好的策略就是十轮都选择「偷袭」,这样自己一定不会输。只要对方选择了一次「合作」,自己就赢了。

但是存在下限,就给合作和信任留下了空间。

显然,一味「偷袭」,是绝对到不了8分的 —— 除非对方连续3次犯晕,选择「合作」。在这里,「活下去」就变成比「打败对手」更重要的事情。

如何确保自己能拿到8分?

先互相攻击,再合作,还是先合作,再对决?

是追求双赢,大家都拿8分,还是伺机给对面致命一击?

如果自己处于劣势,是委曲求全,还是两败俱伤?

如何利用好3轮沟通的机会?

是麻痹对面,还是释放善意、寻求共同发展?

这些,都是需要严肃讨论的问题。

不妨可以想想,如果是你,你会作出什么样的选择?你会如何说服其他人,支持你的决策?

讲一下我们玩的进度吧。

一开始,我们打算释放善意,未料对方以偷袭回敬,于是开局落后。几轮后,对方发现这样永远拿不到8分,于是开始试探着想要合作。几轮下来,我们反而扳回了优势。

后来,利用沟通机会,在我和对面组长的促成下,双方签订了协议,约定共同合作。

到了最后一轮,组里分化成了两派。一派表示,对方一定会选择偷袭,所以这一轮我们撕毁协议,也选择偷袭,这样大家都不得分;但另外一派坚决认为,既然已经签订了协议,就要遵守协议精神,反正就算我们落败,也拿到了8分,已经有了最基本的保障。

最后的结果是什么呢?其实也不重要了。整个游戏的过程,揣摩,分析,决策,说服,谈判,才是最有意思的。

为什么讲这个故事呢?是因为,前几天看到一个网站,叫做 The Evolution of Trust,用互动游戏的形式,探讨了这个问题。

它构造的博弈是一样的:

每一轮,你可以选择欺骗或是合作。选择前者,你没有损失;选择后者,你损失1枚金币,对方得到3枚金币。

如果双方都选择合作,则各自净获得2枚金币;都选择欺骗,则没有损失也没有获利;一人选择欺骗,另一人选择合作,前者获得3枚金币,后者损失1枚金币。

你会如何作出决定呢?

在这里,我们把作出决定的方式,叫做「策略」。

例如,有人可能会想「不管对方怎么做,我每一轮都要欺骗」;也有人可能会觉得「我坚信合作互惠是对的,我每一轮都要选择合作」。这就是两种策略:前者永远欺骗,后者永远合作。

如果把不同的策略放到一起混战,在经历足够长的时间之后,什么样的策略会取得优胜?

这个网站假定了这么几种策略:

1)狐狸:无论对方选什么,永远选择欺骗;

2)兔子:无论对方选什么,永远选择合作;

3)猫:第一轮选择合作,后面每一轮,都模仿对方上一轮的选择;

4)猎人:选择合作,直到对方出现第一次欺骗,从此以后,每一轮都选择欺骗;

5)侦探:前四次按照合作、欺骗、合作、合作的顺序。如果这四次里面,对方出现了一次欺骗,从第五次起,就按照猫的策略操作;如果对方一次欺骗都没有(大概率是兔子),就按狐狸的策略操作;简而言之,就是欺软怕硬。

它的规则是这样的:

假定有100个人玩这个游戏,把这5种策略,随机分配给100个人,每人使用一种策略;

所有人的初始状态是0枚金币;

游戏从1号开始。任意两个人之间,都玩10局游戏(1-2,1-3,1-4……1-100,2-3,2-4……2-100,以此类推),记下最终每个人的金币数量。

所有人都玩过一遍之后,找出金币最少的5个人(超过5个则随机挑出5个),把他们剔除出游戏,剩下95个人;

找出金币最多的5个人(超过5个则随机挑出5个),复制他们的策略,新增5个人,补足100个;

重复步骤3-5。

好了,如果上面的叙述比较模糊,可以多看几遍。

在这样的规则下,猜一猜,哪种策略最终存活下来的人数最多?

狐狸,兔子,猫,猎人,还是侦探?

作出自己的猜测后,再往下看。

想好了吗?我要公布答案了。

答案蛮有意思。

如果任意两个人之间,游戏局数较少(比如2局、5局),最终获胜的将会是狐狸。

但如果游戏局数较多(10局、20局),最终将会是猫统治全世界。

为什么呢?

原因很简单。狐狸是一个低风险低收益的策略,它可以保证不败,但难以保证获利。而对于猫来说,如果局数较多,就给合作互惠留下了更大的空间 —— 只要多遇到几次愿意合作的人,双方就都能「凭空」得到更多的金币。

具体的模拟过程,可以点击「阅读原文」,体验一下。

后面还给出了一些其他推论,比如「游戏过程中出现意外,怎么办」「是否把对方的欺骗当成意外来宽恕」等等,也很有意思。

实际上,这个游戏和结论,是美国政治学家阿克塞尔罗德,在其著作《合作的进化》中提出的。

他组织了一场竞赛,邀请一批科学家,设计了14个程序。每个程序使用一种策略,与其他程序各进行200次对局,循环5次。最终,一共进行了12万次对局。

最终获胜的策略是什么呢?就是猫。更广为人知的名字是「Tit for tat」,以牙还牙。

根据竞赛结果,大多数程序的得分在200-600之间,而以牙还牙的平均得分是504。也就是说,这个策略的结果,十分接近「永远合作」了。

这可以给我们许多启示。

《合作的进化》提到过一个案例:一战期间,英德双方对峙,但在最前线的一些战区,却出现了双方军人和平相待,擅自「休战」的行为。

书里写道:

每到天黑之后,军需官带着食品上来了,食品摆开后由从前线下来的小组取走。我想敌人大概也是这么做的。这样的事悄悄地做了几天之后,这些取食品的小组变得不在乎了,在回去的路上还有说有笑的。

到了圣诞节,引起司令部不满的友善行为更加扩大了。在之后的几个月,不时有人用叫喊或信号来安排直接休战。一个目击者这样写道:

在一个防区中早上8点到9点被认为是神圣不可侵犯的「个人时间」。一些插上旗作为标志的地方,被认为是双方狙击手不能打扰的范围。

这种现象之所以发生,是因为双方都知道这几点:

如果双方都开火,结果就是两败俱伤;

如果双方都不开火,大家都可以活下来;

如果一方率先开火,可能会遭受对方更猛烈的报复。

在这种「基于回报的策略」影响下,甚至发生了这样的情况:

突然一阵炮火打来,但没有造成伤亡。这时双方跳下土墙,我们的士兵开始骂德国人。这时立即有一个大胆的德国人跳上土墙,大声喊道:我们很抱歉,但愿没有人受伤,这不是我们的错,这是该死的普鲁士炮兵干的。

这说明什么呢?

在特定的情况下,只要双方拥有一致共识,并且基于足够长的时间,信任和互惠甚至可以在敌人之间产生。

那么,如何才能产生信任呢?

或者说,在前述的游戏里面,要想最终存活下来,需要满足什么条件呢?

简单来说,就是「以牙还牙」 —— 这就是最基本的原则。

它包含这么四点:

1. 释放善意

竞赛结果揭示了这么一种现象:所有得到高分的策略,都有一个共性 —— 它们都是善良的。

亦即,它们总是以「合作」开始,并且永远不会首先背叛对方。

道理很简单:背叛只能保证短期获利,一旦遭遇报复,双方就将两败俱伤。而一开始释放善意,遇到同类的几率更高,与对方建立信任互惠合作关系的可能性也就更高。

另一点是,彼此友善的个体之间,能够结成一个紧密的群体,双方都从这个群体中得益。由于这个群体是稳定的,故而也是难以被入侵和破坏的。

2. 给予反馈

释放善意,并不意味着愚蠢。如果你的善意遭遇背叛,理性的方式是给予警告,而不是一味退让。

「以牙还牙」的策略优异在哪里呢?它能够用一种最简单的方式,辨别其他人中,哪些是有可能合作的,哪些是无法合作的,并且选择跟前者建立联系,跟后者进行对抗。

一方面,它能够用更高的收益瓦解「背叛者」的群体;另一方面,当它受到外来的攻击时,也能够以正面回击的姿态保护自己。

3. 坦诚相待

跟很多人的想法相反,在这场竞赛中,算计越多的程序 —— 试图诱导对方相信自己、试图欺骗对方等,得到的往往是低分。

这是因为,这样思考的人,很容易犯一个错误:对方并不愚蠢,不会任由你欺负。当你设下陷阱欺骗对方时,也许对方看不透你的行为,但它能够知道「你是危险的」,因此,它会采取保守的姿态面对你。

这就导致了,很多时候,算计过多,效果就跟「永远欺骗」一样,在尝到最开始的甜头之后,遭遇到的是闭门羹。

相反,坦诚相待,一个最大的好处,就是对方很容易理解你。在这个基础上,能够降低对方的戒备,提高稳定感,更有效地建立联系。

4. 不要冲动

现实生活中,绝大多数时候,是非零和博弈。就像前面讲过的团队拓展游戏:分数可以有高低,但双方都能保证拿到8分,也就是能够「活下去」。这未必不是一个可以接受的结果。

很多时候,与其玉石俱焚,不如退一步,为自己争取最后一线机会。

这需要的,是非常理性和冷静的心态,不受之前的挫折、失败和背叛影响。

永远记住,理性人不考虑沉没成本,不考虑过往的恩怨,只考虑边际收益。

用一个狼人杀场景来举例。

你是狼人,现在是夜晚,场上剩下一个第三方,一个猎人,你非常讨厌第三方,不想让第三方赢,那么,你应该刀谁?

刀第三方?如果这样做,第二天猎人出局,开枪带走你,结果就是流局,场上无人获胜。

理性的做法,是刀猎人。这样,猎人出局,开枪。有50%的可能性带走你,但也有50%的可能性带走第三方。

如此,你才可能有一线胜机。

当然啦,这些只是在游戏模拟下的结果,现实生活中是否也是如此?

不知道。但我希望是。

至少,这样的话,这个世界会更有希望一些。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352

推荐阅读更多精彩内容

  • 前几天,我在微信上做了一个有趣的游戏,就是向自认为关系比较好的朋友借钱,看有多少人愿意借钱给你,结果让人大失所望。...
    心若幽兰_3b4b阅读 768评论 7 5
  • 有一个有趣的游戏您愿意参加吗?“做一件事来影响一群人!” 这是易项能学习的一个任务,我反复考虑过后,我决定参加这个...
    小奚之屋阅读 674评论 2 1
  • 1. 绪言 如果你正独自开车送别人的1千万美金去某地点,酬劳是1千美金,你内心里会不会想从此人间蒸发,然后在某个无...
    诸葛_吴用阅读 4,578评论 0 5
  • 围棋机器人——AlphaGo AlphaGo其实是有两个“大脑”组成的,也就是两套完整的深度学习网络来进行配合计算...
    夜空一起砍猩猩阅读 1,759评论 0 1
  • 6:40早起去上英语课。 吃早饭,做午饭,和朋友做最近的生意小结。赚的钱不多,但有一个是一个。 11点到办公室,开...
    玉蓝田阅读 156评论 0 0