你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?
每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
3x + (-2)(1-x) = (-2) * x + 1*( 1-x )——解方程得x=3/8;
同样,美女的收益,列方程-3y + 2( 1-y) = 2y+ (-1) * ( 1-y)——解得y也等于3/8。
于是,我们就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。
计算解释:
1.(1-y)(2x-(1-x)) 代表着:美女出反面时,获得的收益 = 你出正面*美女的损益 + 你出反面*美女的损益
2.y(-3x+2(1-x)) 代表着:美女出正面时,获得的收益 = 你出正面*美女的损益 + 你出反面*美女的损益
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。
如果你全部出正面,你每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;
如果你全部出反面,你每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。
如果你用完全随机 (1/2, 1/2) 策略,你的收益是 1/2 * (3/8 * 3 + 5/8 * (-2)) + 1/2 * (3/8 * (-2) + 5/8 * 1) = -1/8;
计算解释:
1.1/2 * (3/8 * 3 + 5/8 * (-2)) 代表着:当你有1/2的概率出正面的时候,你的收益为:美女出正面的概率*你的损益 + 美女出反面的概率*你的损益
2.1/2 * (3/8 * (-2) + 5/8 * 1) 代表着:当你有1/2的概率出反面的时候,你的收益为:美女出正面的概率*你的损益 + 美女出反面的概率*你的损益
实际上,不论你用什么策略,你的收益都是 -1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的。
这个例子中是没有纯战略纳什均衡的,因为只出一种策略,肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了,所以不是最佳策略);而混合纳什均衡是纯在的,事实上,Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在”,如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的,也就满足了纳什均衡的条件。