首页 | 农村土地改革 | 法经济学茶座 | 法经济学论坛
     网站首页≯ 学者文集≯
博弈论基础:元理论的视角
文/丁利

 

 

【关键词】博弈论 解概念 元理论 理性 知识 进化 均衡
【全文】
  在《从惊讶到思考——数学悖论奇景》中,描写了一个梵学家的女儿苏珊和父亲打赌的故事。苏珊认为父亲并非能够预测未来所有事情,梵学家不服。于是苏珊说,有一件事,我写在我的纸上。如果你预测它能发生,你就在你的纸上写个,否则你就写个。我们第二天看你预测的对不对。梵学家愉快地答应了。但第二天作父亲的却傻眼了,因为苏珊写的是你在纸上写的是个不字,而梵学家写的是个字。不过他马上发现自己被女儿愚弄了,因为如果写个字,那么苏珊说的刚好是这件事,他应该写个字,所以怎么都不对。
  这个故事实际上可以看作是说谎者悖论的另一种形式。正如我们所知道的,所有的悖论都可以转化为一个关于不完备性的证明。那么,把这个打赌——博弈的故事,与元数学——证明论中著名的哥德尔不完备性定理联系起来,我们会发现逻辑学和博弈论之间的一种什么样的关联呢?博弈论学者能避免梵学者的尴尬吗?
  博弈论首先是一门数学。贝奈斯说得好,数学是研究可能的理想化结构的,那些结构可以在也可以不在物理世界中存在,也就是获得实现,易言之,它是研究可能世界的,是为其它学科提供模式(pattern)的;作为经济学的博弈论,正如物理学一样,其使命是选择恰当的模式来解释现实(物理)世界 。现在我们尝试通过对博弈论基础以及相关的工作做一个简单综览,讨论一下博弈论的基本解概念的合理性,其隐含的逻辑基础和知识论假设,这些前提条件与现实世界的关系,进而探讨博弈论未来的可能发展。
  
  博弈者与观察者:研究者与博弈论模型
  
  元数学的根本观念在于区分了系统外和系统内看问题,当然它要真正作到这点要求它在技术上提供如何把系统外的命题反映到系统内的形式化工具,比如哥德尔配数法。把从元理论的角度看作为一个原则,我们严格区分理论(通常所谓的模型)和理论对象(现象和事实)。对于博弈论学者来说,他参与的是一个研究者与研究对象之间的博弈(正如那个不幸的梵学家)。显然,现实世界的行为(纯策略)是无穷无尽的,而研究者的行为集合是各种各样的数学模型。不用说,研究者没有一个永远取胜的策略。但我们可以探究的是,研究者可采取的尽可能好的策略。
  虽然鲁宾斯坦认为,一个(博弈)模型是我们关于现实的观念的近似,而不是现实的客观描述的近似。这可能会招致主张经济学是经世致用之学的人物的批评。我想,通过适当的分析,我们会发现二者之间的冲突是似是而非的。模型和现实之间通过我们的观念联结起来,只要我们按照某种标准较好地刻画我们关于现实的观念(通过建立博弈模型),我们就会收获到作为副产品的对现实的客观描述的近似
  让我们先对模型作个说明。数理逻辑里的模型是指一个形式系统的解释,系统中的真命题在解释中取真值;而通常经济学(与物理学类似)所谓的数学模型是指对某种现象的理论解释。这两种用法之间的关系是很微妙的。
  对于研究者来说,我们可以认为理论对象即世界的存在状态可被一组无限多的真命题(以研究者的语言或世界自身为语言)来描述,这些真命题构成一个一致的逻辑上相容的体系,也就是说,世界的存在本身是没有矛盾的,矛盾只有可能出现于解释世界的理论中。但是由于理论的某种自我相关性,最精致的理论只能是世界本身。由于我们做不到这点 ,我们只能以有限的模式来解释无限的世界(即便二者之间是类似可数无穷多的自然数与不可数无穷多的实数之间的关系)。为了尽量实现理论的统一性(unity),我们只能选取尽量抽象的数学工具,建立一个关于现实世界的模式;理论里的基本逻辑原子应该有多重解释,因为我们应该尽量用简洁的系统解释尽可能多的现象而不是相反。
  在我们建立的关于世界的模型里,它的概念和命题要有足够的抽象性以实现应用上的广泛性。这些概念和命题在语义学上对应解释为现实世界里的现象以及现象之间的关联。这个对应是以某种失真为代价的。虽然这有点象是悖论,然而所有的精确科学都被近似性这个概念支配着。如果我们有必要的能力,又有足够好的运气,模型在我们可接受的范围内会成为对现实的客观描述的近似。所谓我们可接受,意味着我们接受对世界的粗粒化(coarse graining)刻画。
  一切现代科学都基于对手是愚蠢的这个假设上。如果说,这一假设在物理学中还是相当正确的话,那末在生物学中已不再是那么一回事(更不用说人文科学了)。博弈论与其它经济学理论的区别在于它研究理性人的互动行为。但它依然是通过模型来解释世界的。研究者描述了一个理想场景(实验),作为研究者,他仅仅是一个客观观察者(observer),本身隔离于他的观察对象。而博弈论的特殊性正在于,一定意义上他要探讨这个实验中的博弈者是如何象一个观察者一样思考并作出选择的。
  象物理学家面对自然一样,博弈论学者要努力对人类行为选择作出最本质的刻画。虽然研究对象是千变万化,而博弈论则通过一种几乎不变的语言的重组来应对。我们是通过结构来反映本质的。在几乎不改变基本概念的前提下,我们赋予它们更多更复杂的结构来刻画事物的所谓本质。如果我们比较幸运,有了一点理论进步,那也只不过是我们的理论精细化(fine)了,我们用更基本的元素的更复杂更细致的结构替代原来的结构,原来松散的东西被统一在新的系统里,也使一些原来所不能解释的命题在新的模型里能够得到解释。
  
  博弈的解及其基础
  
  如果我们认为博弈结构刻画了所有关于世界的物理方面的可能信息 ,那么博弈的解建立了可能世界与现实世界的关联。所有的解都可以看作是观察者从系统外看到(数学证明)的,但如果仅仅是在数学上证明其存在性则还不够,我们要使它成为构造性的。在这样一个可能世界中,如果博弈者是非常完美的理性(象一个上帝一样的观察者),那么博弈的路径和博弈者的行为选择是确定无疑的;如果博弈者是完全无知的,那么他的行为选择就是完全随机的。在二者之间有无穷多种可能性。我们通过在系统中加上一个知识结构来表明某些解确实是博弈的合理进行。这些知识结构体现了博弈者的理性程度,实际上我们所致力于的就是,博弈是如何在博弈者的知识和信息的作用下进行的,这些因素结合世界的物理规律所决定的世界的动力学过程是怎样的。
  从一个观察者的角度看,我们看到的是一个时间过程,我们关心的重点是对这个过程提供一个协调的解释。所以在理论体系中至少要有可观察性概念(没有可观察性概念,理论必然是不可证伪的),与之相对还会包括一定的理论性概念。至于我们是否能够完全严格地区分理论性概念与可观察性概念,要看我们以什么标准区分它们。在博弈论中,大致说来,我们可以认为博弈者的行为(action),行为导致的结果(outcomepayoff)等物理性(physical)的概念是可观察的(由于混合策略的存在,我们通常认为策略 strategy)是不能直接观察到的,只能通过行为体现出来),而博弈者的知识(knowledge)与信念(belief),信息(information),偏好(preference)以及计算与逻辑推理能力等决定他采取某种可观察行为的是理论性概念 。从研究者的角度看,最终目的是要得出关于可观察概念的命题。虽然根据克雷格定理,如果不利用理论性概念,我们原则上也能作到这一点,但理论性概念的意义在于它们可以帮助我们直觉上确信那些关于可观察性概念的命题的合理性(林,1985)。并且,如果仅仅是罗列世界的各种现象,理论就没有价值了,因为它仅仅是就事论事,而缺少一种广泛性或一般性(generality)的理论是没有多少吸引力的。
  
  理性、信念与均衡
  与其说,经济学尤其是博弈论是研究理性人的,到不如说它是研究人们是如何非理性的,更恰当的说法是,我们研究非完全或有界理性(bounded rationality)( Rubinstein, 1998)
  奥斯本和鲁宾斯坦指出,我们研究的模型假设每个决策者在如下意义上是理性的,他知道他的可选择对象,形成关于任何未知事物的预期,具备清晰的偏好,在某些优化过程后深思熟虑地选择他的行为。无论如何,博弈者必须做出行为选择 ;博弈者没有也不可能历尽所有可能世界,他也不能既做又不做某一件事(他不能同时生活在两个互斥的世界里)。理性的博弈者的行为选择原则上意味着,他总是在他的基本信念之下选择尽量实现他的偏好序中靠前的结果的行为。偏好由何种效用函数来刻画不是关键问题(简化起见,我们通常隐含地在冯诺依曼-摩根斯顿效用函数下讨论问题)。
  进一步,按照阿罗的说法,理性(rationality)是关于选择的。在任何给定的场景下,总有一个备选对象的机会集合,选择必须从中作出。理性的主要意思就是,从不同的备选对象集合作出的选择之间应该满足的一致性(consistency)条件。最常被提到的一致性条件就是不相关选择目标的独立性。这个一致性条件之所以有意义隐含地假设了决策者偏好的不变性。后者是大部分现有经济学理论的一个基本前提。而所谓偏好会发生变化的观点,我们认为是难以接受的,因为我们可以把它变为这样一个问题,即,存在更基本的偏好,原来的偏好可以看作是决策者实现基本偏好的一种策略或行为选择,而现在他的基本偏好没有改变,改变的是他实现偏好的知识和技术。
  这个一致性应该是理性的最低限制。我认为它本质上和我们对理论的一致性的最低要求是一回事。我们观察一个人,我们说他是理性地行动的最低要求是,他的行为按照理论所预见的方式作出决策;而如果我们关于他的行为的描述是逻辑上不一致的,那么由于不协调的理论蕴涵任意命题,种种荒诞不稽的行为都会出现。同样,如果这个人的偏好是变幻无常的,那么我们就没办法有效地解释或预见他的行为,我们只能沿着时间之箭历尽他的所有行为过程,作出可观察性概念的解释,而几乎不可能作出有意义的理论性解释。
  理性决策还涉及到一个自我相关和无穷回归问题。正如李普曼(Lipman, 1991),芒根和瓦里泽(Mongin & Walliser, 1988),史密斯(Smith, 1988)等人所指出,如果理性的计算和推理是需要时间的,那么理性决策面临的一个基本问题是,通过计算和推理寻求某种标准之下的最优本身是值得考虑的,同样这会带来另一个类似问题,即雷法曾提出的:你怎么知道是否值得对一个决策问题做形式化分析?它本身是一个决策问题吗?你能对它是否值得做一个决策分析进行决策分析?,如此无穷。这引致普适非理性(universal rational):无穷回归问题使得没有任何行为可被认为去实施它是理性的。与此相关的是,根据有界理性(比如算法复杂性)来刻画博弈者的决策方式,他优化处理他的理性局限性。这是西蒙的有限理性观点的一种形式化尝试。它所遇到的致命的批评是,这就假设了博弈者能解决一个比我们最初假设的他不能解决的问题更难的问题。决策的时间性问题意味着对博弈的理解的一个细微之处。展开型博弈中时间的重要性主要在于它决定博弈者行动的先后顺序。原则上,如果某种决策是需要时间成本的,那么它应该成为博弈的物理成分。最终,我们对所有博弈的一个隐含的假设是,在某个基本层次上,决策是独立于博弈的物理结构之外的,这个层次的决策是无时间的。
  博弈论虽然是探讨互动的理性决策行为,但它的方法论上的个人主义使它最终都是还原为个人决策问题,特别是一个个人贝叶斯决策问题。我们假设博弈者,象研究者一样,是某种形式的数学家。博弈的进行是他们计算和推理的自然结果。
  博弈者赖以计算和推理的基础是,他们关于博弈的物理结构以及博弈者的理性的知识或信念。正如迪克尔和古尔(Dekel & Gul 1997)所总结的,有两条发展线索,即逻辑的和贝叶斯式(Harsanyi, 1968; Mertens & Zamir, 1985; Tan & Werlang, 1988Brandenburger & Dekel, 1993 )的。贝叶斯式的信念结构来源于豪尔绍尼对不完全信息博弈的经典研究,那就是一个不完全信息情形的完全刻画应该包括每个博弈者对所有相关事件的信念,每个博弈者关于每个人的信念的信念,如此以至无穷这样一个无穷层次(它和逻辑式的区别不是本质性的)。而逻辑式的则按照另外一条道路发展起来,逻辑学家们作出了重大贡献。按照波纳诺(Bonano)等人的处理,一个博弈(策略型或展开型)的基本信息是可以用命题逻辑的语言来刻画的。而博弈者对这些信息的知识(或信念)以及知识的知识可以运用模态逻辑来描述。把模态算子直觉上理解为知道相信,那么加在命题逻辑(原则上对谓词逻辑也应该是有效的)中,就提供了对博弈者关于整个博弈结构的知识进行恰当描述的语言。但这是一种语法(syntax)描述,还有与它有本质联系并且某种程度上等价的语义描述,即克里普克的可能世界语义学。
  可能世界的观念可以追溯到莱布尼兹,克里普克和欣迪加等人作出了重要贡献。按照莱布尼兹的同一性原理,如果我们不能区分两个事物,那么我们把它们视为一类。所以,我们可以把世界的一个存在状态等价于在它上面成立的所有命题(这些命题使它区别于其它状态)。按照萨维奇的看法,世界是我们关注的对象,世界的一个(可能)状态是关于世界的描述,没有留下任何没有定义的相关方面,而世界的真实状态是事实上出现的状态,就是世界的真实描述
  用可能世界语义学描述博弈者的知识来源于欣迪加首先提出并经很多人发展了的如下观念,即,在世界的每一个状态中,行为者可以认为其它状态或世界也有可能发生,或者说他会认为他处在某几个可能世界之一中,这反映了他关于世界的不确定性(uncertainty);一个行为者的知识状态对应着多大程度上他能判断自己处在什么世界里(如果他是完全信息的,那么这种可能性对应关系就退化为严格单值函数)。如果在他认为可能的各个世界里某个命题是成立的,那么他知道这个命题是真的;如果在至少一个他认为可能的世界里这个命题不真,那么他不知道这个命题。假如我们在世界状态间的可能关系上加上各种条件,我们就会进一步得到关于模态算子的公理,进而得到各种模态逻辑系统。
  形式化地,我们用 来刻画一个不完全信息博弈的信息结构。其中, 是世界状态集合,事件就是世界状态的一个子集;对于每个博弈者 ,都有一个可能对应(possibility correspondence) ,即当真正状态是 时,博弈者认为可能的状态的集合是 ,我们一般可以解释为他只知道其中之一发生了,但不确切地知道到底哪个状态发生了(在克里普克语义学中,这个可能对应关系是世界状态之间的可达性(accessibility)); 上的先验概率分布。这样我们可以如下定义知道(knowledge)”(知道和信念(belief)之间的关系可以理解为,知道是概率为一的信念):如果博弈者 在状态 时的可能状态对应蕴涵着事件 中的某些状态成立,即 ,那么我们说博弈者在状态 时知道事件A,可以把他知道事件A的状态集合记作 ,这样我们就定义了一个知道算子。如果 ,则事件 是自明的(self-evident)。所谓某件事A 状态下是普遍知识,就是,它是真的,每个人都知道它是真的,每个人都知道每个人都知道它是真的,如此无穷,即对任何自然数n和任何序列 。在普遍知识的定义中无穷性是不可缺少的,鲁宾斯坦(Rubinstein, 1989)表明,再大的有限层次都不能作为普遍知识的恰当近似。反过来,如果我们有了一个性质良好的知道算子 ,同样可以通过 定义可能对应关系 。实际上只需满足如下两条性质:
  MC  ,即一个人知道事件A和事件B,那么他知道事件AB
  N   ,即他知道在所有可能世界里都成立的命题,即逻辑重言式。
  MCN就是通常所说的逻辑全知(logical omniscience)性质。
  特别地,我们强调如下三个公理:
  T(truth)   ,即如果你知道A那么A是真的,这通常被视为知道区别于相信的一个性质。又名非幻觉性”(non-delusion)。此时 满足自反性。
  PI(positive introspection)  ,即如果你知道某件事,那么你知道你知道它。此时 满足传递性。
  NI(negative introspection)  ,即如果你不知道某件事那么你知道你不知道它。此时 满足欧几里德性。
  如果这三个性质同时满足,那么语法上就是模态逻辑中著名的 系统,信息结构 就成为 的划分(partition)。由于模态逻辑有无穷多种可能的形式,所以我们原则上可以刻画出任何逻辑上可能的知识形式,体现不同强弱程度的理性。当然,这样处理隐含地假设了知识自然地具有层次性
  对知识或信息的这种处理方法得到了许多很深刻的结果。譬如,我们经常会关心的一个问题是,在什么情形下信息是有用的,因为我们会察觉许多情况下知道得越多越不见得有利。吉纳卡普勒斯(Geanakoplos, 1989)给出非常完美的刻画,信息有用的充分必要条件是,在预期效用最大化和贝叶斯信念更新假设下, 满足非幻觉性、传递性以及一个嵌套性(nestedness)”条件,即 ;另外他总结奥曼 等人的工作,在普遍先验条件下,完全地刻画了关于投机(speculation)”打赌(betting)”同意有分歧(agreeing to disagree)”的充要条件。那就是,在 满足非幻觉性、传递性和嵌套性时,人们仍然不会去投机、打赌或同意有分歧;在非幻觉性和正平衡性条件下,人们会去投机,但不会打赌或同意有分歧;在非幻觉性和平衡性条件下,人们会投机和打赌,但仍然不会同意有分歧;在理性程度进一步降低时,他们才会同意有分歧。莫里斯 把它们扩展到非常一般及动态的环境中。
  近几十年来,在逻辑学,博弈论,人工智能等不同领域众多学者的共同努力下,这个所谓普遍知识的领域在为各种博弈解概念提供严格的形式化基础方面作出了许多贡献,譬如奥曼和布兰顿博格关于纳什均衡的工作 以及奥曼和巴尔肯博格与温特 对逆向推理的工作等。对这方面的问题的主要文献的整理总结,刚好有迪刻尔和古勒在1995年世界经济学家大会上的综述报告 以及稍早的吉纳卡普勒斯在博弈论手册中的综述 。详细介绍相关的知识不是本文的目的,我们关注的是,在此背景中,博弈论作到了什么以及哪些是它可能没有作到的。我们可以强调我们特别感兴趣的几点。
  普遍知识是如何达到的呢?可以有如下几种方式,一是某个外部权威所宣布的;二,大家通过学习和交流。
  普遍先验(common prior)假设 是非常重要的,因为如果没有它简直什么事都会发生。纳什均衡解和奥曼主张的相关均衡解区别于劣策略删除解和可理性化解的地方在于前者要求普遍先验假设,即关于某个事情的先验概率是每个博弈者都知道的。这个假设也是通常所谓豪尔绍尼信条(Harsanyi doctrine)”的核心所在,即信念的不一致由信息的不一致来解释。但人们怎么会形成普遍先验假设呢?一个看似合理的解释是,如果有一个事前(ex ante)阶段,使得所有差异都成为它的结果,那么关于不确定性事物的概率分布的普遍先验假设就很有道理了。豪尔绍尼(Harsanyi, 1967-8)就是把所有不完全信息博弈转化为自然先行动的信息完全但不完美的贝叶斯博弈的。但从观察者的角度看,我们生活在同一个世界里,毫无疑问这个世界有唯一的历史起源,我们的所有差异都可以看作是,各种可能事件是由同样先验概率的世界沿着不同方向对称破缺所导致的。但恰恰有一种可能世界是,博弈者没有普遍先验。因为博弈者未必能象观察者一样了解过去的所有历史。另外,萨米特 提供了一个关于普遍先验的充要条件,即博弈者对未来能够形成共同期望。它在多大意义上针对何种问题才是合理的是值得琢磨的,我宁愿把它看作是学习和交流(在后面提到的进化博弈观念下)的合理结果。
  用模态逻辑的语言刻画博弈以及博弈者的知识和信息时,通常被大家所采用的模态逻辑系统S5意味着极强的理性形式,即博弈者掌握和加工处理信息过程中不犯任何错误,信息成为对所有可能世界的划分。我们可以考虑对它的各种形式的弱化
  如布兰顿伯格、迪刻尔和吉纳卡普勒斯所表明的,对一般化的知识结构,博弈的纳什均衡解依然存在。更重要的是,非划分的知识结构与普遍先验假设还有一种内在联系,即可以把弱化划分结构解释为弱化普遍先验假设
  重视非划分的知识结构的一个主要目的是,在S5S4中,博弈者不存在不知晓”(unaware)的事情。从观察者的角度看,博弈者不仅对有些事情是奈特意义上的不确定,而且是无知(ignorance)的。而PINI则使得博弈者没有他不知晓的事情。但进一步的分析表明,在标准模型中,由于MCN性质是包含在定义中的,知识的语法和语义之间的内在联系据以建立,真正的不知晓是不能刻画出的 。所以,不知晓是一个知识系统在元理论意义上的性质,不能在系统内构造式地被定义。当然,莫迪卡和鲁斯迪奇尼 在一般化的标准模型中定义出了不知晓。值得提到的是,莫里斯与李普曼提供了更基本的刻画知识的方法,即从博弈者的偏好出发来定义知识。这样甚至不必假设博弈者的理性,如逻辑全知性质 ......


中国法律经济学网登载此文出于学术研究之目的,绝不意味着中国法律经济学网赞同其观点或证实其描述。以上内容仅供研究者学习与交流,无意侵犯版权。如有侵犯您的利益,请告知。我们将尽快删除。

加入日期:2007/1/1浏览次数:2528
发表评论
名号:
内容:
验证: 4391
法律经济学网
联系站长: 柯华庆 lawgame@263.net 京ICP备09028584号
北京市昌平区中国政法大学法学院(102249)
本网站由卡卡鱼网提供技术支持 网站总访问量:1996356