塔克在1950年提出,当时对它的的案列描述为:
两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
分析一下,从A的角度出发,他知道B的做法是两个:坦白和不坦白。若B坦白,那么他将面临的是8年(同样坦白)或10年(不坦白)的判刑;若B不坦白,那么他将面临1年(同样不坦白)的判刑或不判刑(坦白),因此对他来说坦白明显略胜一筹。若从这个角度分析,B的最佳做法也依然是坦白,那么,最后的结果就是两人由于都坦白而被判刑8年。这是这场博弈唯一可能达到的”纳什均衡“。
(推理表)
”
纳什均衡“有一个最大的特点就是:每个博弈者的均衡策略都是为了达到自己期望收益的最大值。这是一个绝对利己的选择,但是
这显然不是最优的做法,因为假设二者都不坦白那么都只是会被判刑一年。
然而,两个人在之前并没有串供,就算有,二者之间也未必有足够的信任。因为一旦他们被分开,面对审问,内心深处企图通过出卖别人而换取一个更好的结果的想法就会非常强烈。
由此可见,囚徒困境问题反应的最大的问题在于由利己心理而带来的整体的损失。
其实,囚徒困境另一个标签是”非零和博弈“,它是一种合作下的博弈,指的是博弈各方的收益与损失的总和并不是零值,区别于”零和博弈“它更多的蕴藉着各方之间共同的利益,也就是说"共赢"才是它的最高和最美好的目标。因此,走出囚徒困境的方法就是“理性利己”。
何为“理性利己”,我的解释是:以“合作共赢、予多余取、同情共理”三大原则为处事的基本方针,并能将其应用于与人合作中去的人生价值观。
“合作共赢”的意思是二者之间相互合作达到共赢;“予多于取”的意思是给对方的大于从对方那里拿到的(这个原则表面上会吃亏,但是如果把目光看着长远或者考虑到大的环境,最后自己并不吃亏,反而有很大的可能会赢得更多);“同情共理”的意思是站在对方的角度带有同理心的从彼方角度考虑问题。这三大原则是构成各方博弈间能达到集体和个人利益都最大化的基础,也就是走出囚徒困境的最好的方法。
然而,人类从来都是失败在自己的聪明上,其自以标榜的理性,一但遇到集体时就会失声,即使有着以上三大原则的指导,最后也只会被淹没在以集体为伪装下的个人的盲目的私利之下,其结果有二:一是群体盲目的共恶,一是被利用的群体的目的性的恶。相比于前者,后者往往更可怕,因为被利用的恶的目的往往是极端的利己,当在盲目的群体的支持下这足以制造一场灾难。
愿“理性利己”的思想能够被大多数人接纳,愿“囚徒困境”不再是个问题,愿人类不会失败于自己的太过聪明。
扫描关注公众号: