1. 引言
这篇文章深入聊一下博弈问题,看起来会稍微有点跑题。
在现实生活中,使用现金购买商品,交易就是一手交钱一手交货,这是人类经济活动几千年来形成的一条最基本的准则,我们称之为钱货两讫。现金交易天然就是支付即结算的,而在银行转账等无现金支付业务中,支付和结算却往往是分离的。特别是在网上购物出现之后,钱货两讫这一古老的交易准则就开始逐渐受到挑战。
因为交易双方可能不在同一个物理空间,以及无现金支付场景中支付和结算的分离,无法像现金付款一样保证实时的钱货两讫,所以买卖双方总有一方要先进行选择,或是先付款,或是先发货。这种钱货分离的交易方式的核心问题就是双方的互信,天然存在一种信用缺失。如果先付款结果不发货怎么办,或者先发货但对方不付款怎么办。这种担忧是网购出现的早期我们都经历过的。所以这种情况下建立交易支付体系要解决的首要问题就是通过某种方式建立互信。
2. 互信和博弈
这里描述的买卖双方的互信问题,实际上是一个经典的博弈问题。我们可以通过博弈论(Game Theory)的数学方法分析这个模型。
我们希望用一个数值来表示在交易的不同情况时各方的损益。卖方的损益很容易用商品的成本和售价计算得出,买方的支出是实际的货币金额,购买产品的收益体现为商品的效用,即商品对其欲望的满足。一般来讲,交易能够达成的条件是买卖双方在交易中都获得剩余。买方只有在预期获得的效用大于为商品支出的货币成本时才会愿意购买,所以我们可以认为达成交易时,买方的收益是略高于商品售价的一个数值。
假设A为买家,B为卖家。卖家生产(或购买)一个商品的成本是8元,定价10元出售。买家付出10元的成本购买商品,预期获得价值12元的效用。在双方交易时,由于信用缺失,双方各有两个选择。买家可以选择付款或不付款,卖家可以选择发货或不发货,在付款和发货的先后顺序不同的情况下(选择先款后货或货到付款),会出现四种情况,相应的双方损益如下图的博弈矩阵(Outcome Matrix)所示:
在博弈矩阵中,每个行列代表双方的一种策略,交叉位置即为双方采用相应策略时交易结果的收益描述,称为收益函数(Payoff Function);交易双方可以约定付款和发货的先后顺序,选择先付款后发货或货到付款。(付款,发货)这种双方策略的集合,称之为策略集(Strategy Sets)。下面为4中策略集的收益函数的具体描述:
●(付款,发货):双方达成交易,买方获得的收益为效用减去付出的成本,卖方获得的收益为售价减去商品成本,双方收益均为正向的2;
●(付款,不发货):买方损失全部资金,收益为-10;卖方获得全部资金,收益为10;
●(不付款,发货):买方未支付资金获得商品,收益为商品效用,即12;卖方损失货物未获得资金,收益为-8;
●(不付款,不发货):未达成交易,双方收益均为0。
通过分析上述博弈矩阵,我们可以得出一个明显的结论:在信用缺失的交易场景中,无论谁先采取行动,其都会面临一个损失较大的风险。而一个博弈中,每个参与方天然追求的都是自身利益的最大化,所以每个人都有足够的动机选择背叛(不合作)。对于卖方,通过背叛避免风险,同时有机会获得买方支付的资金,而对于买方,背叛行为可以使他有机会零成本获得卖方的商品。于是博弈陷入僵局,买方不会选择先付款,卖家也不会选择先发货。
实际上在支付体系建立的过程中也会面临这样的互信问题,前文也稍有涉及。假设市场上存在两个银行,两个银行客户间的相互转账使得双方有互相清算资金的需要。在这种清算体系中也会存在互信问题导致的困境。例如A银行的客户要给B银行的客户转账,A银行在向B银行发送转账指令后,由于B银行无法确认最终是否会收到A银行的结算资金,所以B银行拒绝为接收转账的客户提前垫付资金,那么转账行为就无法实时确认,需要等到A银行将实际的货币资金结算至A银行,才能为用户确认转账的有效性,这样运行的支付系统将会是极其低效的。
3. 纳什均衡
回到上述买卖双方博弈的例子,双方均无法确定对方的选择,每个人都会选择避免风险并实现利益最大化的策略。如果有一个策略,无论对方选择什么策略,我采取的策略总比采取其他任何策略都更好,那么这个策略就是我的严格优势策略(Strictly Dominant Strategy)。通过上述矩阵可以看出,买方的严格优势策略就是不付款,卖方的严格优势策略就是不发货。那么这种参与博弈的双方均为严格优势策略的策略集,被定义为纳什均衡(Nash Equilibrium)。这种情况下,每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
在上段提出的银行间清算的问题,实际上也会达到这种纳什均衡。对于每个银行来说,不进行垫付,而是选择在收到实际结算资金后再确认交易,即为严格优势策略,因为这保证了自身的资金安全。
4. 低效
在双方交易的场景中,买家希望能够正常付款、拿到货物;卖家也希望能正常卖出货物,并获得合理的收益。但这种缺乏互信带来的双方博弈使得交易不可能正常完成。对于各个银行来说,都希望能够跟其他银行建立结算的互信,从而提前垫资,为客户提供方便快捷的转账支付服务。但出于对自身资金安全的考虑,也会选择不垫资,进而陷入到这种博弈的困境中。
事实上大到宏观的政治经济、小到日常的生活当中均存在这种博弈,而这种博弈所达到的纳什均衡通常来说都是低效的,使得正常的经济活动无法进行,每个人都被迫获得了更差的结果。例如每个雇主都希望员工能够产出更多的工作成果,并且也愿意为了更好的工作成果支付更多的薪水;每个员工也都希望能够不断地提升自己,产出更好的成果来获得更多的收入。但实际上雇主会担心自己为员工付出的成本实际上高出了相应工作成果的市场价格,而员工也会担心自己付出额外的时间精力不会换回雇主等值的回报。所以我们看到这样的情况:员工在一家企业工作较长时间之后,实际拿到的薪资会越来越低于市场水平,跳槽之后通常能获得较大程度的薪资涨幅;或是员工已经具备了更好的能力,但仍有部分人会选择减少自己付出的精力,仅完成最低的工作目标。最终企业不得不为新员工支付更高的成本,而员工也不得不频繁跳槽,失去在相应领域持续深入的机会。再比如说在全社会的教育问题上,因为教育资源的总量是固定的,所以每个人都想尽量通过各种方式努力超过别人,获得更好的教育资源。但每个人的努力在获得的排名上实际上相互抵消了,最终的结果是每个学生都背负了繁重的课业负担,而几乎都没有获得比原来更好的教育资源。也就是我们所说的陷入了“内卷”。
5. 如何解决
这种博弈带来的低效是否能够通过某种方式解决呢?答案是肯定的。破除这种纳什均衡的主要方式有:建立互信、建立共识、重复博弈、破除博弈。
● 建立互信,即博弈双方通过某种方式建立相互信任。具体的方式可能有很多,我这里举一个简单粗暴的例子。如果线上交易的双方可以获取到互相的个人信息,例如姓名、家庭住址、工作单位等社会关系信息,那么双方就很容易建立互信,因为这时背叛的成本将会高很多;
● 建立共识,即博弈的双方通过某种方式建立对整个博弈策略集和相应结果的共识,各方都充分认识到如果不合作将会带来的后果。那么相应的,合作就相对更容易达成;
● 重复博弈,即把单次的博弈行为转变无限次的重复博弈。例如买卖双方可以建立长期的商品供应关系,那么双方都会倾向于选择合作。因为一旦选择背叛,在本次的交易中获得了很大的一次性收益,但相应的双方合作关系也会被破坏,所有后续可能的收益将无法再获得;
● 破除博弈,即通过引入可信第三方等方式跳出这个低效的博弈框架,建立全新的合作模式。例如淘宝未解决网购问题建立的支付宝担保支付体系。
通过更高层级的力量介入,强迫各方合作,破除无效博弈,个人认为这个方式是最有效的。具体到支付领域,央行发行具有法偿性的货币保证了整个经济体系有被广泛接受的单一货币,央行建设的清算体系使得各银行等金融机构能在统一的标准下建立合作,同时也会有相应的法律和足够的暴力手段惩罚体系内的不合作者。
理论上每一个层级内个体的无效博弈都可以通过更高一级的中心机构接入解决,但总会有不存在更高层级力量的情况,还是会面临博弈的困境。例如国际金融体系下的各方博弈,结果是美国通过霸权保证了美元体系的广泛接受,但这一体系仍存在着非常多的问题,导致跨境支付结算受到种种限制,使得整体的效率变低;国际政治体系下的各国博弈,事实上使得我们无法作为一个整体,使用尽可能多的力量去推进人类文明的发展,为每个人带来更美好的生活。
比特币这类加密货币引发我思考的最重要的一个点,就是其在不依赖更高层级力量的情况下成功建立了一个去中心的化的、参与方互信的网络,使得网络内的支付交易能够正常运行。虽然为此付出了高昂的成本(挖矿的电力),但其意义是重大的。我觉得人类文明作为一个整体,其未来发展速度和上限很大程度上取决于我们能否建立互信,破除无效博弈。我期待着有生之年能够看到人类可以用越来越低的成本建立互信,消除无谓的争斗,共同推动文明的整体发展,而不是等到某个强大的外部敌人出现之后才学会团结,恐怕将为时已晚。