Day 56: 无处不在的囚徒困境《博弈论》

D1 打卡《博弈论》

先来讲讲博弈论中经典的个人最优选择并非团体最优选择的例子—囚徒困境。

囚徒困境

一天，警局接到报案，一位富翁被杀死在自己的别墅中，家中的财物也被洗劫一空。经过多方调查，警方最终将嫌疑人锁定在杰克和亚当身上。因为有目击者事发时看到他们两个从富翁家中仓皇逃离。

但是到了拘留所里面，两人都矢口否认自己杀过人，他们辩称自己只是路过那里，想进去偷点东西，结果进去的时候发现主人已经被人杀死了，于是他们便随便拿了点东西就走了。这样的解释不能让人信服，再说，谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。

隔离审讯的时候，警察告诉杰克：“尽管你们不承认，但是我知道人就是你们两个杀的，事情早晚会水落石出的。现在我给你一个坦白的机会，如果你坦白了，亚当拒不承认，那你就是主动自首，同时协助警方破案，你将被立即释放，亚当则要坐10年牢；如果你们都坦白了，每人坐8年牢；都不坦白的话，可能以入室盗窃罪判你们每人1年，如何选择你自己想一想吧。”同样的话，警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白，这样他们只能以入室盗窃的罪名被判刑，每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗？答案是否定的，两人都选择了招供，结果各被判了8年。

事情为什么会这样呢？杰克和亚当为什么会做出这样“不理智”的选择呢？其实这种结果正是两人的理智造成的。

当警察把坦白与否的后果告诉杰克的时候，杰克心中就会开始盘算坦白对自己有利，还是不坦白对自己有利。杰克会想，如果选择坦白，要么当即释放，要么同亚当一起坐8年牢；要是选择不坦白，虽然可能只坐1年牢，但也可能坐10年牢。虽然（1，1）对两人而言是最好的一种结局，但是由于是被分开审讯，信息不通，所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年，选择不坦白的结局是10年或者1年，在不知道对方选择的情况下，选择坦白对自己来说是一种优势策略。于是，杰克会选择坦白。同时，亚当也会这样想。最终的结局便是两个人都选择坦白，每人都要坐8年牢。

上面这个案例就是著名的“囚徒困境”模式，是博弈论中最出名的一个模式。可以看出，两人都选择了对自己最有利的选项，可是双双都得到了差的结果。

虽然这是个二者博弈的例子，但是“纳什平衡”提到了N方博弈均衡的概念。这让我联想到了些什么。

前段时间刘瑜《我的孩子正势不可挡地成长为一个普通人》引发争议，在集体教育军备竞赛中，每个家长的个人选择和大环境下其他人的选择也是一种N方博弈。家长的选择跟老师，学校，补习机构也是N方博弈。这种动态的N方博弈如同“纳什均衡”一样，必须在各自利益都稳定而不能更改的时候达到均衡稳定，不然就是无休止的N层博弈，没有赢家。

很多家长估计还来不及老鹰保护小鸡，就妥协给了学校或者是培训机构。现实就是目前的这种教育现状就是“负和博弈”。

虽然博弈论在经济学领域广泛运用，但细心留意的话，就会发现其实我们周围无处不在。了解一些博弈论的原理，帮助我们做好日常决策。

Day 56: 无处不在的囚徒困境《博弈论》

Day 56: 无处不在的囚徒困境《博弈论》

相关阅读更多精彩内容

友情链接更多精彩内容

Day 56: 无处不在的囚徒困境 《博弈论》

相关阅读更多精彩内容

友情链接更多精彩内容

Day 56: 无处不在的囚徒困境《博弈论》