— 囚徒困境 博弈论 合作激励 —
我们很多人看过中国导演姜文的《让子弹飞》,电影中姜文饰演的绿林侠匪张麻子和他的兄弟们,希望通过唤起民众的斗争意识除掉欺压百姓的鹅城恶霸黄四郎。发了钱、发了枪,民众都没有奋而起义,直到张麻子等人将黄的替身捉拿并斩首示众,大家以为黄本人已经死了,才一哄而上踩平了黄四郎的老巢。
黄四郎在鹅城作威作福,百姓们生活十分困苦,本应该团结起来反对他才是。尤其在有了钱财和武器资助之后,反抗一方的实力已经大大超过了黄四郎的武装力量,联合起来显然是对大家更为有利的选择。可为什么直到大家以为黄已经被处死,才匆忙去“拥护”革命的步伐?这里面涉及到的其实就是群体利益和个人利益之间冲突的问题。
鹅城处在黑暗统治之下,追求群体也即社会利益的实现应该重建一套更为公正的秩序,达到这个目的就需要人们揭竿而起,共同斗争。留在原地不反抗是不行的,然而最早冲上去的人又有可能受到伤害,甚至成为牺牲品,于是我们看到大家即使纷纷捡起了发到家门口的枪,但仍然只会小心翼翼地跟在队伍后面观望。
解释上述问题的理论基础来自博弈论,让我们来看一个著名的这方面的例子:囚徒困境。说的是警方逮捕了甲、乙两名嫌疑犯,但并没有足够证据指控二人入罪。这时候警方采用的办法是分开囚禁甲和乙,分别和二人见面,并向双方提供以下相同的选择:如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢半年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,两个人都判刑两年。
显然我们看到,双方均保持沉默对彼此都最为有利,然而由于囚徒被分开,没有办法了解到对方的信息,因此最终结果是他们基于自身的利益考量,都会选择互相揭发,而不是同守沉默。假设我们将整个社会模拟成由这两个人组成,那么社会集体的利益最大化,即两人都各坐牢半年的结果(加起来总共只有一年的损耗),就会因为彼此缺乏合作而受到损害。
“囚徒困境”的例子在我们生活的周围还有很多,这涉及到人类社会一个最根本的合作问题。可以说,整个文明的历史都是一部不同种族、阶层和思想方式的人们之间的合作历史,人类一直以来面临的最大问题就是如何通过通力合作认识自然,并且取得自身的极大发展。我们在过去遇到过无数的“囚徒困境”,问题的本质其实就是个体和集体的冲突。个体理性的选择是追求个人利益的最大化,而这种选择的结果往往又不能与集体理性,也即全社会的共同利益目标完全一致。
我们的个体潜藏了丰富的智慧,但是由于种种原因,人类常常体现出缺乏合作精神,我们因此遭受了很多的经济损失、生活不幸乃至流血冲突。在每一次摩擦和失败的经验教训中,我们不断地总结并找到了一个又一个的解决方法,进而有效提升了我们应对难题的能力。
在张维迎教授的《博弈与社会》一书中,针对合作问题总结出的最有效的方法就是采取激励。简单来说就是对于合作的行为予以奖励,对于不合作的行为予以处罚。这其中最主要的是采用物质激励的方式,当然有时候精神激励也很有效。此外在激励的过程中,我们还需要注意尽量让信息公开透明,从而让我们能够从中识别出谁选择了合作,谁选择了不合作,以保证激励行为被正确实施。
所以我们就可以清楚解释电影中出现的情况了,由于民众每个人自身的利益和整个鹅城的社会利益不完全统一,想要推动百姓拿起枪反抗恶霸,最核心是要给予反抗的参与者适当地激励。我们看到最开始给钱的时候姜文说有三成胜算,到了给枪的时候姜文说有七成,最后大家看见黄四郎被处决,便真正行动了起来,这时候也就完成了激励的最后一棒。
现实社会中,类似囚徒困境的例子还广泛存在于价格设定、公共礼仪乃至国与国的竞争等领域。我们在商场上看到过不少价格战,比如美国上世纪70年代联邦快递和UPS为了向对方领域渗透不断降价,以及2014年中国共享出行领域的两大巨头滴滴和快的疯狂补贴司机和用户。
在类似的情形中,由于竞争双方信息不对称,所以谁也没法先停手,往往导致两败俱伤。事实上,这种补贴大战最后的结果经常只能是监管部门出手加以制止,或者采取资本并购的方式人为结束博弈(滴滴快的的合并就是如此)。
在公共领域,一个日常的例子是我们经常会遇到修路的情况,假使右侧在施工,会让本应该靠右走的车辆改到靠左行驶(英联邦国家和地区与此相反),导致人们需要降低车速来相互调整。这个时候如果大家选择合作,交替使用左行车道就不会拥堵,当然这需要每个人都为此多等待一些时间。
但如果谁也不愿意等待,都争着想先行驶,就很容易僵在一起,导致整个道路都无法通行。现实情况是除非司机们普遍拥有很好的素质,否则一般都会有一排车堵在一起彼此怨愤,我们很多人也都在生活中遇到过类似的情况。
国与国之间同样如此,比如上世纪下半叶的美苏争霸,两国竞相大肆扩充核武器,以及近年来尘嚣直上的“碳排放量”分配问题的争吵。从人类整体利益出发显然应该尽量远离核威胁,停止大气污染的行为,但由于缺乏沟通与合作,大家担心如果自己停止危害,对方却继续类似行为的话,会对自身的权利造成损害。此外也有一些国家,正面临经济快速发展和环境治理的艰难权衡,所以各个参与国从自己的利益出发,往往会做出不少威胁到人类社会发展,最终也会危害到自己的事情。
我们试图运用激励的方法解决各种囚徒困境的问题,在此基础上,我们进一步形成了一系列的产权机制、社会规范和法律规则等,以期将激励手段变成具备连贯性的,能够被普遍理解和大范围应用的方式。
我们希望通过明晰产权,比如公司合并行为和分配股东利益,降低不必要的经济效率折损;我们通过教育司机养成互相尊重、礼让他人的文明驾驶习惯,用来减少人为造成的交通堵塞;我们站在人类命运与共的角度号召减少冲突,并对国际秩序的违反者予以谴责和制裁,以此促进全世界的和平与稳定。
围绕这些问题,我们曾经撰写了无数经典的理论和著作,也借此推动人类社会取得了不小的进步,但都没有能够完美的平息我们不断经历的各项冲突。我们始终没有达到柏拉图在《理想国》一书中描绘的情景,即形成一个正义感的社会,其中的每个人都尊重礼仪和规则、充满荣誉感并且为全体社会福祉不懈努力。时至今日,我们仍旧时不时会看到高速路上人为引发的汽车长龙。在我们生存的地球上,空气、水和生态环境整体也还是朝着恶化的方向在发展。
*李凯龙,数字机构劫波科技创始人兼CEO。
李先生就读于清华大学经济管理学院和法学院获得硕士学位,拥有香港中文大学mba及北京外国语大学语言文学学士文凭,并被公派到欧洲多个国家留学。李先生曾供职中美顶级的一/二级市场投资及基金;曾于腾讯从事研究与投资工作,期间在腾讯研究院担任首席研究员;曾出任中国五百强佳兆业金融控股总裁助理职务,负责战略业务规划及金融/科技/消费板块的投融资和运营管理。李先生还是清华-伯克利深圳学院和香港中文大学博士及研究生课程讲授学者,并为清华大学院系校友会之理事。