囚徒困境是一个关于两名被警察抓住的罪犯的故事。我们把这两个罪犯称为张三和李四。警察有足够的行距证明张三和李四犯有携带枪支的轻罪,因此每人都要在监狱中度过一年。警察还怀疑这两名罪犯曾合伙抢劫银行,但他们缺乏有力的证据证明这两名罪犯有该严重罪行。警察分别审问了张三和李四,而且向他们提出以下的交易:
“现在我们可以关你1年。但如果你承认银行抢劫案,并供出合伙者,我们就免除你的监禁,你就可以得到自由,你的同伙将在狱中度过20年。但如果你们两人都承认罪行,我们就不需要你的供词,而且我们可以节省一些审讯成本,这样我们就采用一种折中的方式,给你们每人判8年徒刑。”
如果张三和李四两个人是银行的抢劫犯,只关心自己的刑期,你预计他们会怎么做?
这时候在两个被怀疑犯罪的罪犯之间的博弈中,每个人得到的刑期既取决于自己是坦白还是保持沉默的个人决策,又取决于另一个罪犯所作出的决策。
首先考虑张三的决策。
张三会这么推理:“我并不知道李四将会怎么做。如果他保持沉默,我最好的策略是坦白,因为我讲自由而不是在狱中待上一年。如果他坦白,我最好的策略仍然是坦白,因为我讲在狱中待8年而不是20年。因此,无论李四怎么做,我选择坦白都会更好一些。
很显然,李四也会这么考虑。在博弈论中,这种无论其他参与者采取什么策略,某一策略都是一个参与者最好的策略。那么这种策略就被称为“占优策略”。
最后张三和李四都会选择坦白。那么他们将在狱中待8年。这个结果是一个那什均衡:在其他人的策略为既定的情况下,每个罪犯都选择了可能的最优策略。但从他们的角度来看,都待8年是一个糟糕的结果。
因为如果他们都选择沉默,只会在狱中待1年。由于他们各自追求自己的利益,两个囚徒共同达到了使每个人状况变坏的结果。
也许你会说,假如他们在入狱之间就事先说好都保持沉默。那么两个人的情况就会变好。然而事实上,这两个罪犯会仅仅由于他们之间有协议就保持沉默吗?一旦他们被分别审问,利己主义就会起到主导作用,并使他们坦白。两个囚犯之间的合作是难以维持的,所以可以判断他们的合作是不理性的。