7
越是组织化程度高的策略思维越是需要智慧和技巧。
博弈论在说明个人理性、非理性与集体合理性、集体非理性的互相作用和辩证转化等方面,起着重要的作用。博弈论也是揭示了个人合理性如何达到集体合理性的桥梁和手段。
它在揭示有意志的个人行为何以形成了不以人的意志为称移的社会规律的发生发展机制上,与“合力论”有某种不谋之合之处,不过,博弈论与之相比,更趋细密和解释性。
经典的“囚徒困境”模型,提示出个人之间的理性行为何以可能导致集体的不合理性,个人的最优决策并不必然的会导致集体行为的最优;相反,它可能深刻的揭示出那种社会生产中“企业的有组织、有计划的生产与整个社会生产的无政府”之间的矛盾。
8
囚徒困境的描述如下:
假设有两个小偷A和B联合犯事,私入民宅被告警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑两年,而坦白者有功被减刑8年,立即释放。如果两人都是抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。博弈支付矩阵如下。
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,对B也是一样的情况,他也会选择“坦白”,结果两人都被判刑8年。
但是,如果他们都选择“抵赖”,每人只有被判刑1年。在四种选择组合中,(抵赖、抵赖)即双方都选择抵赖其实是一种最优,这就是帕累托最优,这是因为偏离这个行动选择组合的任何其它选择组合都至少会使一个人的境况变差。但是,“坦白”是任一个犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。
9
因此,不难看出,此处纳什均衡与帕累托最优存在冲突。
囚徒困境的博弈结果突破了亚当·斯密的“看不见的手”理论,即博弈论似乎证明了个人自私的行为并不一定能够,在“看不见的手”的指引下产生最佳的社会共同结果,也即人们的经济行为,其实并非是理性的,或者说个人理性并不能保证集体理性,这样一来,经济学的奠基性基础就动摇了。
当然了,经济学之所以还要谈经济建立经济理论,它也没办法,只能忽略掉这些非理性的因素,所以我们会发现,经济学其实是一种理想情境下的哲学思维,因为它的假设前提可能本身就是不明确,或者是矛盾的。
当然,不能将博弈论的见解,与“看不见的手”当成是对立的,它只是指出了“看不见的手”这种理论,奠基性的根本上的矛盾,或者说,如果只是用“看不见的手”来解释经济行为是不够的,这不是形成集体理性的充分条件。
纵观人类历史,有过大量的合作与对抗,总体上人类还是合作多于对抗,因此,经济的理性人的假设,也不能说是全错的,起码是部分合理的。
10
在人类社会历史活动中,存在着大量的长期合作的历史过程(当然少量的对抗过程),这是因为人类的社会历史活动本质上是长期、永续的,不仅在空间上并存,而且从时间角度来看,也有起承。因此,研究长期或某一长期阶段的前后相继的,或某个周期性的人类活动的交互作用是有意义的(虽然从历史长河中是一个片断)。
博弈论在这方面的贡献因此也是独特而有成效的,长期博弈的不同阶段是相互依赖,因此博弈参与者的决策不仅受到其过去经验的影响,而且还要预测未来潜在可能性的影响。
现实生活中大量的行为模式其实都是多阶段动态博弈模式,因此重复博弈很难避免,时空不同,可能是动态均衡式的发展,此一时而彼一时也。
博弈理论的数学模型,精确地刻画了斗争与同一,冲突与联合,对抗与非对抗,进攻与防御,强弱攻守的关系,这丰富和细化了马克思的矛盾学说。因此可以说,博弈理论分析增加了世人对矛盾的斗争复杂性与同一性形成机制的理解。
11
斗争何以产生同一性,这是因为重复博弈的存在。
我们知道,在现实世界上,长期关系比短期关系更加容易合作,并且具有效率更高的博弈结果,因此,往往决定性的某一次性的博弈并不存在,甚至是有失偏颇的。
比如对一个人有重大意义影响的事件节点,像高考升学考学历等这类博弈的后果并不意味着人生被决定了,人们要意识到这种博弈的非完全决定性,甚至人们的唯学历论的思维方式,会伤害一个人的能动回性,得到的沾沾自喜,没得到的垂头丧气,这只是一种短暂的胜利,而非持久的胜利,如果不能认识到自己的能力可以表现在很多方面,人就容易陷入一种心理误区,总觉得是因为这个自己才不如人,而不是因为他能力不行,才造成的失败人生。
我怀疑人类已经开始变得更蠢了,因为没有了深度思考的结果,从而陷入了别人的思想框架里,也陷入了某种被规定的模式之中,从而失去了自我的意识,和自我的能动力,这种格式化的思维真是可怕,连幸福的概念,也可能是别人给的,而不是他自己创造自己实现自己设置的。
因此,我们的人生也是重复博弈的过程。
从可重复博弈的“囚徒困境”,我们可以得出以下结论:两个小偷被警察抓住,在“一个坦白一个抵赖就减免坦白者重罚抵赖者”的博弈规则下,两个小偷的纳什均衡是(坦白、坦白)。
如果两个小偷是在一个重复的博弈中,即他们反复面临着选择的话(比如不是一锤子买卖),他们信息共享后,他们会联合起来抵赖,结果共同抵赖会导致无罪释放。
因此,重复博弈又导致了信任,从而导致了长期的关系和合作的可能。
囚徒困境说明如果双方的交易是一次性的,结果一定是诚信缺失,但是如果双方能够预期到交易次数增加,那么,受长期利益的驱动,就会相应增加交易双方诚信的可能性。
因此,信息的透明性,有助于增强人们之间的相互理解,从而将这一锤子买卖(此处这种现象很容易导致骗子的增多,骗子的本质就是一锤子买卖,从而导致诚信消失)转化为长期的利益关系。
12
因此,集体不理性可以由于重复博弈的存在而变成集体理性。社会应该营造人们的重复博弈的氛围,从而形成更好的人与人的互动关系。
作为一种社会历史观的博弈论,它为消解斯诺《两种文化》,即科学与人文的分离,所揭示的现在仍然存在两种文化的对立作出了自己的贡献,这种结合似乎是如此的必然和自然,这也正预示着马克思预言的正确性。
必然与自然,前者是说这是自然科学与社会科学发展的趋势,后者是说,这种结合是自然而非强制的,也不是牵强附会的,而是有机互相统一的。
因此,在博弈论这个新视角下,去研究社会历史规律,去揭示个人理性何以能走向集体不合理性,然后,个人在选择中何以去实现社会发展,这都是深有必要的。
若从博弈论所揭示的道理中得到启发,也许人类可以自觉地设计一种社会机制,在满足个人理性的前提下,从而达到集体合理性(反之亦然),从而实现马克思所说的那种理想社会:“每个人的自由发展是一切人的自由发展的条件”。
这似乎可以是一条通行之路。