合作博弈的理论阐述
合作博弈与非合作博弈
博弈论是研究决策主体在发生相互作用时如何实现决策均衡的理论。其核心特征在于,每个对局人必须重视博弈中的机会成本。为了实现自身的利益目标而采取行动时,必须考虑对手各种可能的行动方案,并且在承担合作或不合作后果的基础上,做出合理的行动决策。
博弈论可分为合作博弈和非合作博弈。诺贝尔经济学奖获得者约翰•福布斯•纳什明确提出了合作博弈与非合作博弈的根本区别:如果博弈的参与者之间能自发地形成具有约束力的协议,它便是一个合作博弈,反之则是一个非合作博弈。具体而言,合作博弈和非合作博弈虽然都强调对局人为理性人,但合作博弈强调集体理性,注重决策方案的利益分配公平,而非合作博弈强调的是个体理性,在决策中将个人利益作为优先考量标准。
20世纪50年代,阿尔伯特•图克提出“囚徒困境”博弈,敏锐地道出了非合作博弈的局限性。在“囚徒困境”博弈中,两名囚犯均选择承认有罪,则各判刑8年;如果一人承认另一人不承认,则承认者可判刑3个月,不承认者判刑10年;如果两人均不承认则各判1年。假定博弈的对局人能理性地追求自身利益最大化,且不关心另外一人的利益,那么每个对局人都希望自己承认有罪而对方不承认有罪。在禁止信息交流、缺乏有效协议的情况下,每个对局人在个人利益驱使下选择承认有罪,则会导致对局双方在博弈中“双输”的结局,均被判刑8年。换言之,非合作博弈中个人理性选择的最佳策略,可能导致集体非理性的结局。如果在博弈中对局人相互合作,都选择不承认有罪,反而能得到对双方都有利的次优均衡结局。
博弈论及其相关的合作博弈、非合作博弈也对国际合作问题产生重要影响。罗伯特•基欧汉和约瑟夫•奈提出国际关系的“复合相互依存”理论,指出在国际行为体长期、全面的交往中,在同一领域重复多次博弈和同时在多个领域进行博弈,能减弱“囚徒困境”,增进沟通合作,形成国际行为体之间复合相互依存的良好态势。由此可见,进行无限多次重复的非合作博弈,可以达到合作的结果。
合作博弈的内涵
合作博弈关注的重点是用有约束力的承诺得到可行的结果。为实现合作博弈,博弈各方经过充分的信息交流与协商,建立有效的效用分配的制度性框架,以期达到集体理性与个体理性的统一。在合作博弈的实现状态下,不存在其他行动方案,使得博弈双方中一方的情况比其他方案好,而另一方的情况至少不比其他方案差,此时的结局实现了均衡的合理方案。
从经济学的角度看,合作博弈是指若干博弈参与者结成联盟,共同合作争取联盟效用最大化,并在联盟内部进行分配的博弈。联盟的共同利益是合作的基础,而各方的利益分歧则为合作博弈可能的不确定因素。参与博弈的各方必须首先确定博弈中的利益目标和需要支付的成本,并在各种选择中进行比较和取舍,经过成本收益计算,选择利益最大化的行动方案。
从更广阔的视阈来看,合作博弈理论不局限于分析联盟内的合作与联盟之间的博弈对抗,它是在某些共同经济利益、政治结构、价值观念或社会交往需要驱使下,各行为主体通过一定的互信机制,对各方收益进行合理分配的决策过程。这一理论除了在经济学领域的应用之外,还在国际关系、生态保护、基层治理等领域产生广泛的影响。
值得注意的是,不同学者在研究和运用“合作博弈”概念时,有不同的侧重点。一方面,“合作博弈”是合作行为的某一过程。如果一项合作行为实现了合作各方基本的利益目标之外,还产生某些合作的“剩余”,那么“合作博弈”概念则指向如何分配这份“剩余”,以及分摊合作的成本的过程;另一方面,“合作博弈”是博弈行为中一种可选择的结果。博弈参与者在缺乏有约束力的协议,或在有限的信息之下,基于个人理性会做出合作或不合作的行为选择。同时,非合作博弈在无限次重复博弈中也可能达成合作的结果。
由此引出的问题是,有哪些必须引起重视的内在要素,能够推动非合作博弈向合作博弈转变?在合作共识之下,怎样借助合作博弈构建合作剩余的公平分配框架?为解答上述问题,有必要考察合作博弈理论形成、发展、进而受到广泛关注的时代背景。
从非合作博弈到合作博弈的时代转向
人类对合作与冲突的研究有着深厚的历史传统。修昔底德对于古希腊城邦雅典、斯巴达战争冲突的考察,奠定了大国冲突关系研究的理论基础。马基雅维利对权力和均势状态的研究,反映出国家间博弈的理论雏形。现代经济学家在自由主义经济思想驱使下,从非合作博弈角度作出很多研究。
20世纪40年代,冯•诺依曼与奥斯卡•摩根斯坦正式提出了合作博弈的概念。20世纪50年代,罗伊德•夏普利提出的夏普利值,它是在理性人假设下,根据联盟中各局中人为联盟提供的边际贡献,对局中人的收益进行合理分配,达到个体理性与集体理性的均衡。20世纪60至90年代,关于博弈论的理论研究成果大量问世,衍生出完全、不完全合作博弈,静态、动态合作博弈等理论成果。
纵观合作博弈理论发展与成熟的过程,恰好与全球局势从冷战时代两大阵营冲突对抗走向冷战后全球化、多极化的历史发展轨迹相吻合。当前,世界经济结构步入深度调整时期,互联网技术进步使信息交流互动更为频繁,极端势力的渗透威胁着社会秩序稳定。在此时代背景下,全球范围内对于有效合作机制的强烈需求,正推动着理论研究和建设实践从非合作博弈到合作博弈的转向。
对于我国来说,重视合作博弈既源于社会主义建设实践的经验总结,也符合加快经济社会转型升级,扩大对外开放的现实需要。林毅夫在对我国1958年秋农业集体化的考察中,提出农业集体化变自愿为强制,从重复博弈变成一次博弈,原有协议的均衡难以为继,这种非合作博弈导致了农村生产力土崩瓦解的严重后果。改革开放以后,我国制造业企业逐步参与国际分工,出口贸易持续增加的同时不断遭到国外政府的反倾销调查,如何在国际政治经济博弈中,保障我国企业的经济权益,成为合作博弈必须关注的问题。
2013年3月,习近平总书记在莫斯科国际关系学院发表演讲,指出“这个世界,各国相互联系、相互依存的程度空前加深,人类生活在同一个地球村里,生活在历史和现实交汇的同一个时空里,越来越成为你中有我、我中有你的命运共同体”。人类命运共同体理念体现了中国与世界各国合作共赢的“全球观”,为世界提供一份思考人类前途的“中国方案”。十八届五中全会提出的五大发展理念中,协调、开放、共享发展理念均体现着合作博弈强调互信互利、实现公平分配的基本方向。
可见,理论研究和实践经验,国内外的历史传统和现实需求,都决定了非合作博弈到合作博弈的转向,合作博弈逐渐在国际国内社会发挥不可或缺的关键作用。
全球治理中的合作博弈案例
全球环境气候治理合作
全球化时代的环境治理是当代国际治理中重要的一部分,也是国际治理体系的重要组成部分。不同于以往的单一地区、国家内部的环境治理,近些年来,全球环境治理更加强调国际合作。这样一种合作治理体系主要是指处于不同发展程度的国家,包括不同发达国家、发展中国家在内,以及联合国环境署和其他非国家行为体按照国际环境法的规则、制度和价值规范,在人类生存品质和代际公平、资源和经济协调发展、主权和环境干预等方面进行多元合作竞争的复杂博弈状态。
随着全球化的推进,以及从环境问题的联动性上来看,跳出国家限制寻求国际上的合作已经成为环境治理的必然选择。环境作为一个特殊的治理主体,其更多的还具有整体性、跨国性和长期性等特点,也正因如此,当环境治理的受益范围或影响范围涉及多个主权国家甚至全球的时候,就不能简单地依靠单一国家的努力去采取治理手段。
环境治理具有的公共物品属性的非排他性,使其一旦被提供就能被包含在其中所有个体享有,即一旦有国家主动参与到全球环境治理的行动中,就会让其他未参与国家无条件的从气候治理、河流治理等方面获益。正是这样的原因,“搭便车”行为一直广泛存在于国际环境治理尤其是气候治理的中,这也降低了原本参与环境治理的国家的积极性,并使全球性的环境治理行动或条约经常会面对难以形成统一协定,或止步不前的局面。
在国际环境治理中,对单一国家来说,利益最大化的选择即为不参与合作治理,但是如果各国都选择非合作则会导致环境问题愈演愈烈,没有任何一个国家可以从中获益。为了促进跨国界环境治理的有效实行,在国际环境治理的问题上应采取合作博弈的形式使各国参与其中,即需要形成一个包含主要参与国的联盟。联盟的存在不仅为环境治理提供所需遵循的条约,也对成员国起到了一定的监督制约作用,以防止成员国为了追求自身的利益而背叛合作机制。
以2015年12月12日在巴黎气候变化大会上通过的《巴黎协定》为例,《巴黎协定》是历史上第一份涵盖了近200个国家和地区的协定,对全球联合管治环境气候具有里程碑意义。这一协定共有包括任务目标、损失损害、资金、技术、盘点机制等内容在内的29个条目,已于2016年4月22日至2017年4月21日开放签署,已收到了175个国家的签署。与此前的《京都议定书》一样,《巴黎协定》也要求至少要有55个参与国签署,且其温室气体排放量占全球排放量的55%以上才能使协定生效。
《巴黎协定》是继2005年签订的《京都议定书》之后在联合国气候变化公约下达成的第二份减排协定,但二者的实现途径却存在着本质区别。此前《京都议定书》中所规定的各国减排任务,实则上是一种自上而下的减排量强制性分配,而《巴黎协定》对各国减排任务的分配是一种自下而上的“国家自主贡献”。即以不同国家国情、能力为基础,根据共同但有区别的责任,由国家自主决定的方式实现减排任务。这种方式有效回避了《京都议定书》确定的自上而下任务中存在的发达国家、发展中国家不平等问题,在一定程度上增强了发达国家的积极性。而每五年一次的盘点机制也对各国起到了约束作用,进一步确保长期目标的实现。
《巴黎协定》相较于《京都议定书》具有更好可行性的主要原因在于,其有效地实现了参与各国间的合作共赢的机制,既充分考虑到了不同发展阶段国家应对气候变化能力水平的不同,也充分意识到了只让发达国家承担责任的“一刀切”行为的不合理性,达成了一种最大限度照顾各方关切的微妙平衡。而定期的盘点实则使这场全球范围的合作博弈成为了一种长效的重复博弈机制,同时也对各国起到敦促和监督作用。
东盟——俄罗斯:对话伙伴关系
随着1999年柬埔寨加入东盟,到现在东盟共有包括马来西亚、印度尼西亚、泰国、菲律宾、新加坡、文莱、越南、老挝、缅甸和柬埔寨在内的十个成员国,总人口超过5亿,使其毫无疑问成为世界上具有影响力的区域性国家联盟。尽管如此,东盟在发展过程中还是存在着不少内部、外部挑战,其中对东盟各国产生直接和间接的威胁来源主要是东南亚内部和亚太地区。有专家指出,俄罗斯虽不能对东盟的发展构成直接的外部威胁,但其仍是欧洲乃至世界强国,因此会对东南亚的局势产生一定影响。东盟在构建东南亚力量平衡战略时也应将俄罗斯的作用考虑在内。
东盟与俄罗斯的关系从1993年俄罗斯向东盟表达了建立关系的愿望后得以发展,随后东盟各成员国也一致认同俄罗斯的重要战略伙伴地位,并于1994年赋予俄罗斯东盟协商对话伙伴身份,1996年俄罗斯正式进入东盟全面对话国行列。不过随着亚洲金融危机的爆发,俄罗斯和东盟之间的对话陷入了停滞。直至普京出任俄罗斯领导人,推出了21世纪俄罗斯亚太政策构想并付诸实践,这为双方的进一步合作提供了基础。2010、2016年又分别召开了第二、第三次东盟—俄罗斯峰会。其中俄罗斯总统普京在第三届峰会上提出要加强与东盟成员国的经济合作,联合寻找打击国际恐怖组织、跨国犯罪等问题的新途径;协调东盟、欧亚经济联盟、上海合作组织和“一带一路”几大区域合作机制也是该峰会的一大主题。
各国之间的相互关系是国家对外决策的体现,而外部环境是一国做出对外决策时要考虑的重要因素,因此国家对外决策的制定本质就是博弈的过程。俄罗斯与东盟成员国之间的关系就是一种典型的合作博弈关系,双方通过开展务实合作取得了多方面的成果。二者不仅提高了政治互信水平、增强了安全领域的合作,经济贸易领域得到了有序的合作发展,社会文化交流也得到了稳步发展。俄罗斯与东盟之间通过签署一系列的条约、协议使双方合作博弈的关系进一步明确。主要表现在俄罗斯加入《东南亚友好合作条约》,这一条约对双方关系起到约束作用。此外,俄罗斯、东盟各成员国作为理性的个体,彼此之间存在着潜在相互的利益关系,为双方合作提供了基础。
通过合作的开展,俄罗斯、东盟双方也为各自带来了收益。对于俄罗斯来说,与东盟合作关系的建立扩大了其自身在东南亚地区的影响力,也为平衡大国关系建立更多的渠道;提升俄罗斯在东南亚地区的国家形象,减少负面印象;拓展海外市场,为俄罗斯能源、粮食等主要出口商品赢得更多的海外商机。而对于东盟而言,加强与俄罗斯的合作有助于提高东盟在国际舞台的影响;稳固东南亚地区秩序,平衡大国关系;加强国际贸易往来、深化能源合作。
国际金融监管合作
金融市场发展至今,其深度和广度同时在不断地扩展,其不仅是一国经济的重要影响因素,也是推动世界经济发展的主导因素。而金融市场自由化改革、外汇管制的放松、科技的进步等方面的变化,也使金融活动的地域限制及从事国际金融活动的成本大大降低,国际金融市场的联系得以更加密切,朝着国际金融市场一体化进一步发展。
但是,金融市场全球化的发展不仅仅促进了世界经济的繁荣,各国金融市场的紧密相连也导致了金融风险在全球范围内的扩张,一旦有金融危机出现必定会引起群体效应,波及到更多的国家。正是国际金融市场的这种联动性,加剧了国际金融监管的难度,也对各国金融监管合作提出了新的要求。在国际性质的金融监管组织出现之前,国际金融市场的监管存在着明显的国别化和分散化,监管体制的一体化难以实现。由于不同国家对金融行为的监管强度不同、政策不同,不可避免地会导致监管套利等行为的存在。各国政府推行监管竞争缺乏合作,追求国家的监管独立权和自由裁量权,从而引发了一系列的严重后果。
以国际合作、世界经济协调发展为前提,1945年12月生效的《布雷顿森林协定》建立起美元黄金挂钩、成员国货币和美元挂钩、实行可调整的汇率制度,这一制度的建立为结束当时混乱的国际金融秩序、推动国际贸易和世界经济增长创造了有利条件。尽管布雷顿森林体系在1971年随着美国对金本位制的放弃而崩溃,但是其在维护国际金融秩序中具有的正面意义不容否定,尤其是在布雷顿森林会议中建立的国际货币基金组织和世界银行现在仍在国际金融市场中发挥着重要的作用。
布雷顿森林会议可以被看作是国际金融市场的一次重要合作,它具有的意义以及产生的影响主要表现在:国际货币制度所包含的规则和执行、维护的手段第一次通过世界性的协定形式被明确地规定。布雷顿森林会议所取得的各国间的协调一致,不仅反映了各国的需求,维护了各国的共同利益,同时,这一协调的达成也表现出各国为了达成合作、适应全球经济发展的需要,在一定程度上牺牲的本国监管独立权、经济主权。而通过布雷顿森林体系存在的几十年可以看出,各国为合作所做出的努力也确实促进了全球经济复苏、国际贸易增长、全球金融市场的流通。
在布雷顿森林体系崩溃之后,各国并没有放弃对国际金融监管合作的追求。1974年巴塞尔委员会作为国际清算银行的正式机构得以成立,委员会制定并更新了《巴塞尔协议》,该协议有助于各国调整和制定银行监管的相关内容,使各国银行业监管标准趋于一致,更好地促进了国际银行业监管的合作。此外,1983年成立的国际证券事务监察委员会、1994年成立的国际保险监督官协会,分别负责证券业、保险业的国际监管协调和标准制定,形成了相应的国际监管体系。而2008年金融危机爆发之后在G7金融稳定论坛基础上扩展的包括了所有G20成员国的金融稳定理事会正式成立,并成为国际金融监管的核心组织,负责全球金融监管事务,以促进全球金融稳定为主要目标,制定和实施相关监管政策。
通过对70余年以来的国际金融监管合作的回顾可以看出,由于国家间的金融流通是不可隔断的,在这种背景下,国际金融监管合作是各国在金融市场监管博弈中的最优选择。通过建立起全球化的监管体系,对各国形成强制性的约束,明确国际监管的统一标准,不仅有利于各国金融市场的和谐发展,也可以使国际金融市场达到一个稳定的状态。反之,若各国对监管都保持着不合作的态度,那么国家间的监管竞争就会一直存在下去,各方只为自身利益考虑,而背弃“人类命运共同体”这一社会发展的必然趋势。
合作博弈的中国借鉴
上述合作博弈的经验已表明,对利益目标的基本共识是合作博弈的基础,以互信机制和公平分配机制为主体的博弈组织架构是实现合作博弈的制度结构。在我国的经济社会发展和对外开放进程中,合作博弈有助于社会治理水平的提升,也有助于新型大国关系的构建。为了在冲突与竞争中进一步加深合作,合作博弈理论与实践对当前我国的启示主要有以下四方面。
构建有效的合作博弈组织架构
“一带一路”倡议就是一种典型的合作博弈组织架构。有约束力的协议是合作博弈区别于非合作博弈的根本特征。具体而言,一种新的制度供给如果能够有效运转起来,首先其必须比旧的博弈制度提供给博弈参与者更多的利益。其次,合作博弈的组织架构必须审慎对待参与者“搭便车”的程度,防止在触及参与者各方利益矛盾时,“搭便车”动机削弱组织架构解决危机的能力。最后,要经过充分沟通与博弈建立起合作“剩余”的公平分配机制,形成完整的合作博弈组织框架。
倡导形成积极的合作文化
积极的合作文化是内化在各个博弈参与者个人行动和相互交往中的合作行为倾向。这种行为倾向是可选择、可建构的,能够对博弈中信任机制的达成起到事半功倍的效果。通过博弈参与者在博弈前积极地进行信息沟通,加深各方了解,并且有意识地加强融洽的合作氛围,可以在一定时期内形成积极的合作文化。中国作为合作文化的积极倡导者,在全球范围内提出“人类命运共同体”的合作理念,正是营造积极的合作文化的具体表现。积极的合作文化一旦形成,可以使自发的合作博弈导向一种自觉的合作结果。在国际国内的合作博弈领域,政府对内对外都应通过法律法规、政策制定、新闻传播等手段,倡导积极的合作文化。
增强博弈各方的利益相关度
加深合作的深度和广度,有助于博弈参与者更多的倾向于合作博弈。中俄、中美贸易中,跨国能源合作与跨国企业的发展让各国经济利益高度一体化,人才、技术、资本等要素跨区域流动正促进各国多方位、多领域的相互依存。因此,有意识地增强博弈参与者的利益相关程度,有利于在单一领域的合作博弈的实现,而单一领域长期多次博弈也有助于博弈参与者注重更长远利益,选择合作而非竞争对抗的策略。我国长期坚持对外开放的基本国策,实行“走出去”的经贸发展战略,能够增强博弈参与者的利益相关度。在国内经济社会发展中,增强博弈参与者利益相关度的策略应注意区分政府、企业、社会各主体的利益差异,重视复杂的社会关系网络对博弈参与者利益目标的影响,谨慎对待博弈中的非理性和不确定性因素。
不回避合作博弈中的冲突与竞争
相比于西方社会,从我国国内来看,一些博弈参与者受到更多“面子”“和为贵”观念的影响,在博弈中回避冲突与竞争,或者拒绝将竞争公开透明化,这导致在中国社会形成有效的合作博弈模式存在一定困难。公开透明度不足的合作博弈过程,不利于参与方利益矛盾的有效释放,而且信息、资金、权力占据优势地位的博弈参与者可能违背合作协议,牟取不当利益。为此,对于这些博弈参与者,在合作博弈框架下,不应回避冲突与竞争,而要建立有效的集体监督和第三方仲裁机制,帮助博弈参与者调和利益矛盾,增进多方合作。
【执笔:解轶鹏 李 懿】