博弈论1:博弈论不是“三十六计”
计谋不值得被认真对待
诡计要想成功,不但必须严密封锁信息,还得假设对手是比较愚蠢的
诡计不可长期使用,是零和游戏,我要赢你就得输,我想得到什么你就得失去什么,属于你死我活的局面
博弈论假设人是理性的,表现为:
你得知道你想要什么,并且对你想要的东西有一个明确的排序
你的行动是在一定的规则之下,争取得到你想要的东西
你知道对手也是这么想的,而且对手也知道这些规则
平等对待对手,你既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界绕着自己转的幻觉
博弈论2:群鸦的盛宴
很多事情是这样并不是因为有人喜欢这样,这不是思想品德的问题。哪怕所有人都不喜欢这个局面,所有人却都只能维护这个局面
帕累托改进的意思是这个改进能在不伤害任何一个人利益的同时,使得至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地了,这个局面就叫“帕累托最优”
理想青年喜欢帕累托最优,但是博弈论告诉我们只有稳定的局面才能长久存在。
“压倒性策略(Dominant Strategy)”。这个策略压倒其他一切策略,不管对手怎么做,这个策略对你来说都是最好的
“被压倒性策略(Dominated Strategy)”,也就是不管别人怎么做,你这么做对你都是不好的
作为理性的人,如果博弈中有压倒性策略,你就一定要选择这个策略。任何情况下都不要选择被压倒性策略。
纳什均衡的意思就是这么一种局面,在这个策略组合里,没有任何一方愿意单方面改变自己的策略。
如果一个现象能够在社会中长期稳定地存在,它对参与的各方来说就一定是个纳什均衡。纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好,它必须得让每个参与者都不愿意单方面改变才行。
理想青年喜欢帕累托最优,理性青年寻找纳什均衡。
博弈论研究的合作可不是要搞“思想道德教育”去劝人行善,也不是让一个强权去管制人民,而是寻求能让人自愿合作的机制。
好的合作,一定得是个纳什均衡。
博弈论3:以和为贵
聚焦点就是在众多可能的纳什均衡中最显眼的那一个,人们会自动在这一点上达成合作。聚焦点的作用是协调。
聚焦点的最大价值就是它的存在本身。明天公司要开个重要会议,那几点开呢?几点都行,关键是你得先有个点,让大家协调。像每周的例会,就应该在固定时间固定地点进行。
由此说来,传统文化和社会习俗其实也是作为聚焦点起到了协调合作的作用。中国人讲老人要坐在主座,西方讲女士优先,其实这些规范具体是什么没有那么重要,重要的是得有个规范,有了规范就能省下一大堆麻烦。
聚焦点能这么有用,有一个关键的前提,那就是各方没有根本的利益冲突。我们都希望能促成这次合作,我们需要解决的只是在哪里合作
如果各方都有强烈的合作愿望,而博弈存在多个纳什均衡,我们要做的就是找到聚焦点。聚焦点可以是生活习惯,可以是历史传承,可以是传统文化,可以是先下手为强,可以是政府指导,可以是随便找到的什么借口,实在不行还可以抽签。
其实,聚焦点就是最后的临门一脚
例如:两个黑道火拼,双方都不想打了,但又不能主动求和,找个中间人,中间人随便说一些客套话,重要的不是中间人的面子,而是双方本来就不想打了。中间人就是他们的聚焦点
博弈论4:不纵容,但要宽容
“囚徒困境”形容每个人都按照对自己最优的策略行事,结果却是双输的局面。
博弈论研究的就是一群聪明人,在一定的规则之下,如何选取最有利于自己的策略
如果各方都足够理性,那么最终决定局面的不是策略,而是规则。所以,有的人研究怎么违反规则,有的人研究怎么适应规则 —— 高手研究怎么改变规则。
防止背叛,最直观的办法就是把单次博弈变成重复博弈。
重复博弈之所以有效,是因为背叛者会受到惩罚。最直接的惩罚就是下次我也背叛你,让你得不到合作的好处
博弈论认为有效的惩罚必须得满足几个条件。首先你得能发现背叛行为。然后惩罚必须得是可信的,对方知道他一定会受到惩罚。再者,惩罚的力度得足够。
在真实世界中,以牙还牙并不是最好的策略,它不够宽容。博弈论专家提出一个改进版的以牙还牙:对方背叛我一次,我继续合作;只有当对方连续背叛我两次,我再报复。研究表明,在有可能出错的博弈中,这个办法的效果比以牙还牙更好。
真实生活中别人可能犯无心的错,你可能误判。中国人有句话叫“退一步海阔天空”,强人通常不喜欢这句话,但是其实这句话很有道理 —— 宽容能避免脆弱。不过请注意,这句话的关键词是“一步”。退一步是宽容,退两步就是纵容了。
博弈论5:装好人的好处
“KMRW定理”,用四个经济学家名字的首字母命名。KMRW定理说,在不完全信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人的这样一个声誉,前期尽可能地保持合作,到最后才选择背叛。
博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一厢情愿的期待。有的好人认为他能感化别人,他觉得如果我这次跟人合作,哪怕吃了亏,下一次别人也会因为不好意思、或者为了回报我而跟我合作。博弈论专家会说这种想法非常危险。事实上,如果你身处一个比较险恶的社会环境,那你不但不应该做好人,而且应该装坏人
做真正的好人的确有个重大好处,那就是你会自我感觉很好。为了维持这个良好感觉,你宁可牺牲金钱的利益
通俗小说、电影和电视剧里一般都是好人取得最后胜利。你被这样的文化熏陶,就不自觉地想要跟好人一伙儿。好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没办法,想象的共同体是最强大的社会力量。
这种感觉有时候会如此强烈,以至于我们认为物质利益都是不值得的。这其实也是理性的!只要你知道自己心中什么最重要就行。
博弈论6:布衣竞争,权贵合谋
事实是把钻石和爱情联系在一起,和把圣诞老人送礼物和圣诞节联系在一起一样,都是商业宣传的结果。结婚戴钻戒的风俗是在19世纪才流行开来。
而就在19世纪,钻石业务出现了一次重大危机。1869年,南非发现了一个巨大的钻石矿,导致钻石的价格直线下降。商人们马上意识到这是囚徒困境,各家竞相压价的结果是大家都得死。
结果钻石商人们做成了一件博弈论意义上的壮举:大家联合起来成立了一个全球范围内的垄断集团。这就是著名的戴比尔斯公司。
钻石是一个非常奇怪的商品,它必须价格贵才有人买,“贵”就是它的价值。
虽然后来钻石的垄断被打破了,在1999年和2003年,加拿大的钻石矿就宣布和另外两家珠宝公司合作,其中一家是著名的蒂芙尼(Tiffany)。戴比尔斯的垄断被打破了。但价格被并没有下跌,反而继续上涨。因为钻石业务的玩家仍然是少数,他们知道钻石这个东西好就好在价格贵,那是绝对不能降价的。他们非常默契地形成了同盟
网上流传一句话叫“上流社会人捧人,中流社会人比人,下流社会人踩人”。这句话说得很难听,但是有几分道理。合作的利益大就不会竞争,背叛的成本低才会背叛。
博弈论7:有一种解放叫禁止
监管的本质是改变了博弈的报偿(payoff)。有了有效的监管,不合作就不但没有好处,而且还会受到惩罚,那么不合作的行为自然就会大大减少。
博弈论8:先下手为强
动态博弈的本质不是轮流出招,而是你可以改变游戏的规则
你每次行动之后,留给对方的都是一个不一样的博弈局面,都是一个新的游戏。有出手权,这是十分难得、而且可能稍纵即逝的机会
每一次行动其实都在限定对方的选择空间
有个经典的博弈局面,英文叫“chicken”,是“小鸡”的意思,意思是比比谁胆小。在一条笔直的公路上,甲乙两个人各自开一辆车相向而行,眼看就要撞在一起了。游戏规则是谁先打方向盘靠边谁就胆小,谁就是小鸡
建议是你可以当着对手的面,把自己这辆车的方向盘给卸了。你这个动作明确告诉对方自己肯定不会转方向盘,因为你的车已经没有方向盘了,你只能走直线。那么现在两辆车会不会相撞就完全取决于对方。只要对方不想死 —— 你知道他肯定不想死 —— 他就只能转方向盘,这样你就赢了
小鸡博弈是个非常常见的局面。只要你能确定对手的底线,那么先发制人,造成既成事实,就能逼迫对手就范。
把自己的底牌亮出,让对手去选择,而对手的底线你又清楚,他只有一个选择
“悬崖策略(Brinkmanship)”,意思是咱俩都站在悬崖边上,你不服,我就把你再往前推一步。我推你的过程中你也拉着我,等于要死一起死。我们脚下的土质已经疏松了,还打滑,可能再进一步咱俩都得摔下去 —— 但是接下来我们又往前走了一步。
悬崖策略是非常危险的,它很容易因为出错而变成真的灾难
基辛格说:“威慑有三个要素:实力、决心和让对手知道。”
第一,我有实力摧毁你。
第二,我有决心摧毁你。
第三,你得知道我有实力和决心摧毁你。
博弈论9:其身不正,虽令不从
威胁和承诺都是在博弈双方都没有采取实质性行动之前,一方通知另一方的声明。
所谓威胁,就是我要求你不要去做某件事 —— 我说如果你做了,我就会对你进行惩罚。
所谓承诺,就是我要求你去做某件事 —— 如果你做了,我就会给你一个奖励。
威胁和承诺在本质上是一样的,都是我事先说好,会根据你下一步的行动采取一个相应的行动。
对头脑清醒的人来说,只有可信的威胁和承诺才有意义
增加可信度的方法:
- 第一个办法是给别人惩罚你的权力。
如:商业合同,违约相当于给对方惩罚你的权力;对爱情最好的承诺是结婚。现代婚姻具有法律效力,离婚那是要分割财产的。
- 第二个办法是主动取消自己的选项。
即破釜沉舟
- 第三个办法是建立声望
孔子说“其身正,不令而行;其身不正,虽令不从。”声望最大的好处就是它允许你无需花费任何成本就能提出可信的威胁和承诺。损害声望,就是对你失信最大的惩罚。