1.什么是囚徒困境?
百度百科:囚徒困境是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。
起源:囚徒困境时1950年由艾伯特·塔克提出的。
故事是这样的:
两个罪犯被抓住,关在不同的屋子里。
警察告诉每个人:
若一人认罪并检举对方,而对方保持沉默,检举者会获释,被检举者判刑10年;
如果双方都不说出罪行,各判刑一年;
如果双方互相检举,各判刑8年;
2. 囚徒困境的广泛应用。
值得注意的是,囚徒困境在单次和多次实验中,结果是不一样的,
在只有一次的囚徒困境中,双方更容易去不合作,
在重复的囚徒困境中,博弈被反复进行,因此每个参与者都有机会去惩罚另一个参与者前一回合的不合作行为。这时,合作可能会作为平衡的结果出现,反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从相互背叛趋向于相互忠诚。
3. 如何解决
在重复的囚徒困境中,有一个经典的比赛,
阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争,参赛的程序各不相同,有复杂的算法、最初的对抗、宽恕的能力等等。
最后拔得头筹的算法是阿纳托尔·拉波波特的”以牙还牙“。
这个策略是,在博弈的开头选择合作,然后根据你的对手前一回的策略,来选择你这一把的策略。
这个策略有几个必要条件:
A. 友善。不要在对手背叛之前先背叛。
B. 报复。成功的策略必须不是一个盲目乐观者,要始终报复
C. 宽恕。如果对手不继续背叛,那我们会选择去合作。
D. 不嫉妒。不去争取得到高于对方的分数。
看,多次囚徒困境的最优解,还是偏于利他行为,
利他就是利己,但又不能是永无底线地去利他,也要有自己的底线和锋芒存在。