囚徒困境是一个博弈论思维实验,涉及两个理性人,每个理性人都可以为了共同利益而合作,也可以为了个人奖励而背叛自己的同伴。囚徒困境模拟了许多涉及战略行为的现实情况。“囚犯困境”的标签可以适用于任何情况,即两个实体可以从合作中获得重要利益,或因未能合作而遭受痛苦,但发现协调其活动很困难或代价很高。
囚徒困境的具体描述如下:一个犯罪团伙的两名成员被捕入狱。每个囚犯都被单独监禁,无法与对方交谈或交换信息。警方承认,他们没有足够的证据将这两人以主要罪名定罪。他们计划以较轻的罪名判处两人一年监禁。同时,警察向每个囚犯提出,如果他作证指控他的同伴,他将获得自由,而同伴将因主要指控被判三年监禁。如果两名囚犯互相指证,两人都将被判处两年监禁。囚犯们有一点时间来思考这个问题,但在任何情况下,在对方做出不可逆转的决定之前,他们都不会知道对方的决定。双方都被告知,另一名囚犯也得到了同样的待遇。每个囚犯只关心自己的福利,即尽量减少自己的刑期。
这导致囚犯A和B有四种不同的可能结果:
如果A和B都保持沉默,他们将各自服刑一年。
如果A作证指控B,但B保持沉默,A将被释放,而B将服刑三年。
如果A保持沉默,但B作证指控A,A将在监狱服刑三年,B将被释放。
如果A和B互相指证对方,他们将各自服刑两年。

不管对方做出什么决定,每个囚犯都会通过背叛对方获得更高的奖励。这可以根据分析两个玩家的最佳响应得出:B要么合作,要么叛逃。如果B合作,A应该背叛,因为无罪总比服刑一年好。如果B背叛,A也应该背叛,因为服役2年比服役3年要好。因此,无论哪种方式,A都应该叛逃,因为无论B的策略如何,叛逃都是A的最佳响应。类似的推理将表明B应该背叛。
背叛总是比合作带来更好的回报,所以这对双方来说都是一种严格的主导策略。相互背叛是博弈中唯一的强纳什均衡。由于从自利的角度来看,相互合作的理想结果是非理性的,因此这种纳什均衡不是帕累托有效的,即可以在没有使任何人境况变坏的前提下,使得至少一个人变得更好。
囚徒困境在现实世界中有不少例子。毒瘾可以被描述为一个跨期的囚徒困境问题,介于瘾君子现在和未来的自我之间。在这种情况下,“背叛”意味着复吸,今天和未来都不复吸是迄今为止最好的结果。今天戒了毒,但将来又复吸,这种情况是最糟糕的结果:今天戒毒所涉及的自我牺牲被“浪费”了,因为未来的复吸意味着瘾君子又回到了他们开始的地方,必须重新开始。今天和明天复吸是一个稍微“更好”的结果,因为当瘾君子仍然成瘾时,他们还没有努力戒毒。最后一种情况是,一个人今天进行成瘾行为,而明天弃权,问题是“今天”背叛有明显的好处,但明天一个人将面临同样的囚犯困境,同样的明显好处也会出现,最终导致一连串无休止的背叛。
广告有时被视为囚徒困境的例子。当香烟广告合法时,相互竞争的香烟制造商必须决定在广告上花多少钱。公司A广告的有效性在一定程度上由公司B进行的广告决定。同样,公司B从广告中获得的利润也受到公司A进行的广告的影响。如果公司A和公司B都选择在给定的时间段内做广告,那么每个公司的广告否定了另一个公司的广告,收入保持不变,以及由于广告成本而增加的费用。两家公司都将从广告的减少中受益。然而,如果公司B选择不做广告,公司A可以从广告中受益匪浅。然而,一家公司的最佳广告量取决于另一家公司承担的广告量。由于最佳策略取决于另一家公司的选择,因此没有主导策略,这与囚犯的困境略有不同。然而,结果是相似的,因为如果两家公司的广告少于均衡状态,它们的境况会更好。
在国际关系理论中,囚徒困境经常被用来证明为什么在国家之间的合作会失败,尽管它是集体最优而个体次优的。一个经典的例子是安全困境,即一个国家安全的增加(例如增加其军事力量)导致其他国家出于对进攻行动的恐惧而担心自己的安全。因此,加强安全措施可能导致与一方或多方的紧张局势、升级或冲突,产生任何一方都不希望看到的结果。在难以区分进攻性武器和防御性武器的情况下,安全困境尤其严重,而且在任何冲突中,进攻都比防守更具优势。