中国古代有很多民间谚语,单看都貌似很有道理,摆在一起却又自相矛盾,比如:
兔子不吃窝边草 ——近水楼台先得月;
宁可玉碎,不能瓦全——留得青山在,不怕没柴烧;
一分耕耘、一分收获——人无横财不富、马无夜草不肥;
得饶人处且饶人——纵虎归山,后患无穷。
又比如,这两句:善有善报,恶有恶报;人善被人欺,马善被人骑。
这些俗语,之所以作为民间智慧流传下来,肯定都自有其道理。而摆在一起产生的冲突感,我以为,主要是源自于“情境的错置”。也就是说,每一条谚语都有其适用的情境,如果把适用于不同情境的谚语摆在一起,当然便不能自圆其说了。
比如,“宁可玉碎,不能瓦全”,意在强调、推崇“价值层面的持守和保全”,对某些人而言,如果失去了他们所珍视的“价值/精神操守”,则肉体的保全没有任何意义。而“留得青山在,不怕没柴烧”,则强调做事要有大局观,为了更大的目标和“逆袭”,在己方暂时处于劣势时,要先保全再以图后谋。可见,这两条谚语针对的情境和强调的重点不一样,根本不能简单类比。如果情境类似,要遵从哪一条,还得看你看重的是什么,如果看重操守,当“留青山”意味着接受侮辱,意味着对所珍视之价值的否定,则会放弃保全。所以,谚语的比对,一要看所处的具体情境,二要看价值观的偏好序列。
谚语和俗语,是老百姓在时间长河中针对形形色色的不同情境总结的一些简单法则,用于指导人们如何自处及如何与他人相处。这些相处之道,大致看,无非是劝人向善、推崇美好的品质,及教人如何使自己处于有利情势。俗语活泼、实在,不同于生硬的说教,即便是劝人向善,也总是从“好人有好报”这一偏功利性的角度出发,没好处,谁会信谁又会照着做呢?换句话说,道德榜样如果恰巧是利益上的成功榜样, 向善的号召力和效果就越好。
虽然老话劝我们做个好人,因为好人有好报,但实际生活中,我们也常常见到老实人受欺负的例子,因此,俗话也说,人善被人欺,马善被人骑。那么,究竟做好人是“有善报”呢?还是“被人欺”呢?
还真有西方人较真,用“博弈论”来研究究竟是做好人更有利,还是做坏人更合算。美国政治社会学家艾克斯罗德(R.Axelord)在1980年进行了著名的计算机仿真博弈实验[注1],在该实验中,参赛者设计不同的策略进行多轮混战,并给每轮计分,总分最高者得胜。每个策略都会在“合作”和“背叛”之间组合出牌,如果双方合作,各得3分,如果都背叛,各得1分,而如果一方合作一方背叛,则合作者得0分,背叛者得5分。因此,出“背叛”牌的回报高,诱惑大,这和真实世界的情境类似,“背叛”的坏人碰到“合作”的好人可以得5分,而碰到同样“背叛”的坏人,仍然可以得1分,也就是“人善被人欺”。如果仅仅进行一个回合,在不知道对方打“合作”牌还是“背叛”牌的情况下,出“背叛”牌成为最“理性”的选择,单次博弈就是经典的“囚徒困境”博弈。
第一次实验,参赛者共提交了14个策略,这些策略五花八门,可以任意选择“合作”和“背叛”的出牌顺序,你可以做个“好人”,大部分时间都选择“合作”,也可以做阴险的坏人,一直打“背叛”牌,或者在90%的回合里选择“合作”,然后随机在10%的回合中出“背叛”牌。艾克斯罗德在比赛中,加了一个自己的策略——随机策略,就是随机出“合作”或者“背叛”牌,作为比对的底线(如果你精心设计的策略得分还不如随机策略,那就是个差策略)。
经过了12万回合的计算机模拟博弈,实验的结果美好得让人怀疑,居然是一个简单的具有“善良、宽恕”特质的“一报还一报”策略(TFT)胜出。这个策略一开始总是善意地相信对方是好人,选择“合作”,但如果对方打了“背叛”牌,就“以其人之道还治其人之身”,下一轮也打“背叛”牌,而只要对方在接下来的回合中出了一次“合作”牌,就马上原谅对方曾经的“背叛”,改回“合作”策略。这个策略,简而言之,就是第一个回合选择“合作”,接下来就重复对手上一个回合的出牌。这是个从不主动背叛的善良策略。
还有一个有意思的现象,就是在其他策略中,得分领先的策略都是善良的,得分落后的都是恶意与人为敌的。在第二次实验中,艾克斯罗德将参赛策略增加到62个(同时也像上次一样增加了自己的随机策略),并事先公布了第一次实验的结果。有意思的是,在明明知道善良的策略有得分优势的情况下,很多人还是选择做“坏人”(可能觉得,上一次“坏人”策略输掉是因为“不够狡诈”,坏得太没技术含量)。结果,这一次仍然是TFT等善良策略胜出。
看到这个结果,想做好人又怕吃亏的读者们是不是觉得可以松一口气了呢?毕竟还是“善有善报”啊!且慢,要想“好人”在博弈中胜出,是要有条件的。
首先,就像我前面指出的,如果只有一次博弈机会,那“背叛”才是“理性”的策略(囚徒困境),多次博弈才能让好人胜出。所以,想做“好人”的人们,应对陌生人保持一定的警惕。有句话说“你不可能永远欺骗所有人”,但每次欺骗不同的人则不是难事。所以,在人来人往,外来流动人口密集的闹市,一家口味差服务差的餐馆很可能屹立不倒,因为它可以每次都接待不同的人。而在顾客群相对固定的社区型餐馆,口味差服务差则是作死的节奏了。换句话说,“信任”是通过多次博弈建立的良性互动关系。
为了解决陌生人的博弈问题(陌生人之间通常不是多次博弈),西方通过完善法治,提高陌生人“使坏”的代价,从而降低社会运行的成本,扩展合作秩序。无法处理和调整陌生人的人际关系,则社会合作规模便相当有限,就像中国古代,儒家的一套调整的是熟人之间的关系,讲究“君君、臣臣、父父、子子”,讲究“老吾老以及人之老、幼吾幼以及人之幼”,整个社会架构和人际关系都以熟人为基石,所以很难将合作规模超出宗族、同乡。在熟悉的人之间,由于人数和地域的限制,小规模的人在相对封闭的圈子内进行多次博弈,所以容易鼓励和形成善良的合作策略。一旦超出了熟人的圈子,则“背叛”策略的诱惑便增大。相信大家都看过类似的社会新闻,说某某人在外地作案被抓捕,乡亲们纷纷对记者表示,印象里,此人是个乖孩子,此例虽不能作为普遍例证,但不防作为一个小小的注脚。
另外,“好人”策略在艾克斯罗德的计算机模拟实验中胜出,还同游戏规则的设定有关,获胜或者失败主要靠计分,这是数字游戏,不是生死博弈。在实际生活中,很可能,好人面对坏人的一次“背叛”,就被干掉了,根本没有机会去“报复”他或者“原谅”他。如果在前几轮博弈中,好人纷纷因为被“背叛”而死掉,则整个社群中“坏人”就会越来越多,从而整个环境会转向鼓励“背叛”的竞争策略。赵汀阳在他的《坏世界研究:作为第一哲学的政治哲学》[注2]中指出,“杀不死”假定是艾克斯罗德仿真实验不够“仿真”的bug,“杀不死”假定让好人可以卷土重来,限制了不择手段竞争的威力,从而造成了善良策略具有博弈优势的假象[注3]。
赵汀阳提出,如果取消“杀不死”假定,把实验规则修改为,若因选择“合作”而遭到n次背叛(n次得0分),则必须退出比赛,相当于“死掉”,则可以合理想象,最终的胜出者也许还有善良策略,但也可能有恶意策略笑到最后。特别是一旦“合作者”会死掉这一考量影响到其他原本想选择“合作”策略之人时,可能会有“好人”蜕化成“坏人”的趋势出现。
因此,在真实世界中,只有完善“法治”,提高“坏人”作恶成本,让“恶有恶报”真实可见,最好是“现世报”,“好人”才不会“人善被人欺”,继续有信心做个好人。“善有善报”的报,除了作为“好人”本身这一选择便是福报之外,“合作”秩序的扩展带来的普遍福祉的提高也是实实在在的好处。
最后,还想提醒大家的是,在计算机模拟实验中,胜出的“善良”策略可不是任人欺负的“老实人”策略,面对“背叛”时,是要“以眼还眼、以牙还牙”的,正所谓,“人不犯我,我不犯人;人若犯我,我必犯人”,在此“善良”是指,善意相信别人,不主动背叛。事实上,在艾克斯罗德的第二次实验中,有一个“两怨还一报”策略,比“一报还一报”策略还要“善良”,该策略允许对手背叛两次才报复一次,却成绩殿后,因为第二次比赛中,出现了很多精心设计的足够狡诈的策略,会捕杀“很傻很天真”的人。
所以,要做有原则有脾气有能力的“好人”,而不是懦弱的“老实人”。可见,“善有善报”和“人善被人欺”这两句谚语,还是要还原到真实的复杂情境之中,才能具体情况具体分析。
顺便提一句,在艾克斯罗德第一次模拟实验中,参赛者提交的14个策略中,得分最低的是一个最复杂的策略(由一个匿名者提交),正应了那句老话“机关算尽太聪明,反误了卿卿性命”!
2014-11-16
[注1]:R. Axelord: Effective Choice in the Prisoner's Dilemma. Journal of Conflict Resolution.24:3-25.1980.
[注2]:赵汀阳在此书的开篇,讨论了“政治的发生”议题,在该议题下,探讨了古今中外政治博弈发生的初始状态理论,包括中国的荀子、西方霍布斯的“自然状态丛林”、罗尔斯的“无知之幕”,及本文涉及的艾克斯罗德仿真博弈实验。
[注3]:艾克斯罗德在举行过两轮比赛后,事实上,又进行了第三轮比赛,只是这次是将第二轮参赛的63种方案再比赛一遍。而这次,比赛的结果不是得出一个分数,而是获胜的策略会获得一个自身策略的复制,再投入下一轮比赛,也就是说,失败的策略会消失,成功的策略会繁殖延续。这就有点像赵汀阳修改的“杀得死”规则,只是,不是在每轮策略捉对厮杀的时候就被“杀死”,而是在大的比赛轮次结束后淘汰失败策略。关于艾克斯罗德的三次实验,感兴趣的读者可以参考《自私的基因》第十二章的内容。
【参考书目】
1.《自私的基因》,理查德.道金斯 著,卢允中等 译,吉林人民出版社,1998.
2.《坏世界研究:作为第一哲学的政治哲学》,赵汀阳 著,中国人民大学出版社,2009.