资源描述
,*,经济博弈论基础,Economic,Game Theory,第一章,绪 论,第一节 博弈论与经济学,第二节 经济博弈论的产生与发展,第三节,经济博弈论内容体系,主要内容,一、博弈论的研究对象,博弈论是研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。,第一节,、博弈论与经济学,1.,从经济学的研究对象来看,传统观点:经济学是研究有限资源的最优配置的,一门学科。,物尽其用,现代观点:经济学是研究理性人行为的一门学科。,人尽其才,理性人 合作与冲突 博弈论,从,“,物尽其用,”,到,“,人尽其才,”,二,、博弈论与经济学的关系,2.,从新古典经济学的两个假设来看,假设一,:市场是完全竞争的;,假设二,:市场是完全信息的。,结 论,:市场可以达到一般均衡,资源配置达到,Pareto,最优。,两个假设与现实的背离,引出博弈论。,从,“,一般均衡,”,到,“,博弈均衡,”,二,、博弈论与经济学的关系,3.,从传统的消费理论来看,传统消费理论:,缺陷,:没有考虑消费者之间的相互影响问题,经济学离不开博弈论,二,、博弈论与经济学的关系,在经济系统中,各经济实体都有自己的利益,(,主要是经济利益,),。利益决定着经济实体的经济行为。而现代经济博弈论在承认各经济实体利益的基础上,更加侧重研究经济主体行为特征,能够协调它们的利益,更加侧重研究经济主体,(,局中人,),的行为方案,(,策略,),与其利益得失,(,支付函数,),的关系,从而推动经济发展和社会进步。,三,、博弈论的作用,博弈论思想源远流长,而能作为现代博弈论研究对象和内容的起源的博弈思想和实践活动而言,则可追溯到,2000,多年前齐王与田忌赛马以及,孙子兵法,中的军事博弈。,第二节、经济博弈论的产生与发展,1838,年,,Cournot,两寡头产量竞争模型,Antoine,Augustin,Cournot,Recherches,sur,les,Principes,Mathematiques,de la,Theorie,des,Richesses,1838.,English Edition:Researches into the Mathematical Principles of the Theory of Wealth,edited by N.Bacon,New York:Macmillan,1897.,古诺,.,财富理论的数学原理的研究,,商务印书馆,,1994,一、经济,博弈论的产生,1883,年,,Bertrand,两寡头价格竞争模型,Bertrand,J.,Theorie Mathematique de la Richesse Sociale,Journal des Savants,1883,499-508.,一、经济,博弈论的产生,作为博弈论诞生的标志,Von Neumann,J.&O.Morgenstern,The,Theory of Games and Economic,Behavior,Princeton University Press,1944.,冯,诺依曼和摩根斯顿,:,博弈论与经济行为,三联书店,2004.,John von Neumann(1903-1957),Oskar Morgenstern(1902-1977),非合作博弈均衡理论,John F.Nash,:,美国普林斯顿大学,Reinhard,Selten,:,德国波恩大学,John,C.Harsanyi,:,美国加州大学泊克莱分校,1994,年,Nobel,经济学奖,1,、,The bargaining problem,Econometrica,1950,18:155,162.,2,、,Equilibrium points in n-person games,Proceedings of the National Academy of Sciences,1950,36:48,49.,John F.Nash,的代表作,3,、,Noncooperative games,Doctoral dissertation,1950.,4,、,Noncooperative games,Ann.of Math,.,1951,54:286,295.,5,、,Two-person cooperative games,Econometrica,1953,21:128,140.,John F.Nash,的代表作,1,、,Spieltheoretische Behandlung eines Oligopol-modells mit Nachfragetr,gheit,Zeitschrift fur die gesamte Staatswissenschaft,1965,12:301,324.,2,、,Re-examination of the perfectness concept for equilibrium points in extensive games,International Journal of Game Theory,1975,4:25,55.,3,、,The Chain-Store Paradox,Theory and Decision,April 1978,9:127,129.,Reinhard,Selten,的代表作,1,、,Games with incomplete information played by Bayesian players I II&III,Management Science,1967,68,14:159,182,320,334,486,502.,2,、,Rational Players and Bargaining Equilibrium in Games and Social Situations,Cambridge University Press,1977.,3,、,Harsanyi,J.And R.Selten,A General Theory of Equilibrium Selection in Games,Cambridge:MIT Press,1988.,John C.,Harsanyi,的代表作,非对称信息下的激励机制设计理论,James A.,Mirrlees,:,英国剑桥大学,William,Vickrey,:,美国哥伦比亚大学,1996,年,Nobel,经济学奖,逆向选择:非对称信息下的市场交易理论,George,Akerlof,美国加州大学泊克莱分校,Michael Spence,美国斯坦福大学,Joseph E.,Stiglitz,美国哥伦比亚大学,2001,年,Nobel,经济学奖,通过博弈论分析而增进我们对冲突和合作的理解,Robert J.,Aumann,以色列耶路撒冷希伯来大学理性研究中心,Thomas C.Schelling,美国哈佛大学肯尼迪政府学院和马里兰大学经济学系暨公共政策学院,2005,年,Nobel,经济学奖,机制设计理论,Leonid,Hurwicz,美国明尼苏达大学经济学教授,Eric S.,Maskin,普林斯顿大学社会科学院高等研究院,Roger B.,Myerson,芝加哥大学经济系教授,2007,年,Nobel,经济学奖,Leonid Hurwicz,生于,1917,年,8,月,21,日,美国明尼苏达大学经济学名誉教,授,其主要研究领域包括机制和,机构设计以及数理经济学。,2007,年,Nobel,经济学奖,Eric S.Maskin,普林斯顿大学社会科学院,高等研究院教授,其经济学理论已经,在经济、政治科学及法律的领域产生,了深远影响。目前的研究课题为机制,设计理论,重复博弈,收入不均衡问,题以及投票理论。,2007,年,Nobel,经济学奖,Roger B.Myerson,芝加哥大学经济系教授,,1976,年获得哈佛大学应用数学系哲学博士学位,其博士论文题为:一种合作博弈理论,(A Theory of Cooperative Games),2007,年,Nobel,经济学奖,博弈论成为主流经济学的一部分,1.,重视微观基础,2.,重视人与人之间关系的研究,3.,重视信息在经济中的作用,二、博弈论对经济学发展的影响,1,、,Von Neumann,体系,标准型,扩展型,合作型,第三节,、经济博弈论内容体系,2,、合作博弈与非合作博弈,局中人之间是否有具有约束力的协议,博弈可分为:,合作博弈,:有。强调团体理性,效率、公平和公正,非合作博弈,:没有。强调个人理性、个人最优选择,其结果可能是有效率的,也可能是无效率的。,第三节,、经济博弈论内容体系,(,1,)从局中人行动的时间顺序上,分为:,静态博弈,:,局中人同时行动,或虽然局中人的行动有先有后,但后行动者不能够观察到先行动者的行动;,动态博弈,:,局中人的行动有先有后,且后行动者能够观察到先行动者的行动。,非合作博弈可以从两个角度进行分类,(,2,)从局中人掌握信息的角度,分为:,完全信息博弈,:,是指局中人对自己与其他局中人的所有与博弈有关的事前信息(策略空间、支付函数等)有充分的了解。,(,局中人的支付函数是,共同知识,),不完全信息博弈,非合作博弈可以从两个角度进行分类,.,四种不同类型的博弈,信息,行动,顺序,完全信息,不完全信息,静态,完全信息静态博弈,纳什均衡,Nash(1950,1951),不完全信息静态博弈,贝叶斯纳什均衡,Harsanyi,(1967-1968),动态,完全信息动态博弈,子博弈完美纳什均衡,Selten,(1965),不完全信息动态博弈,完美贝叶斯纳什均衡,Selten,(1975);,Kreps&Wilson(1982),经济博弈论基础,Economic,Game Theory,第二部分,非合作博弈理论,第二章 策略型博弈,第三章 扩展型博弈,第四章 贝叶斯博弈,第五章 动态贝叶斯博弈,主要内容,第一节 策略型博弈的表示,第二节 重复剔除严格劣策略均衡,第三节,纳什均衡,第四节,混合策略纳什均衡,第五节 纳什均衡的存在性,第二章 策略型博弈,同时行动,如何决策,策略型,(,标准型)表述,适合表示静态博弈,扩展型表述,适合表示动态博弈,博弈有两种表述方法,一、策略型博弈的含义,完全信息静态博弈又称为策略型博弈,。,完全信息,是指局中人对自己与其他局中人的所有与博弈有关的事前信息(策略空间、支付函数等)有充分的了解,(,局中人的支付函数是共同知识,),。,静态博弈,是指在博弈中,局中人同时采取行动,或者局中人的行动有先有后,但后行动者不能知道先行动者的行动选择。,第一节,策略型博弈的表示,二、策略型博弈的三个要素:,1,、局中人(,Players):1,2,n,;,2,、策略(,Strategies):,;,3,、支付函数(,Payoff,functions),表示为:,第一节,策略型博弈的表示,1,、有限博弈:,(1),博弈中局中人人数有限,;,(2),每个局中人只有有限个策略。,2,、零和博弈:,博弈中局中人所获支付之和为零,即一方所得为另一方所失。,三,、两种特殊博弈类型,1,、局中人,:甲,乙,2,、策 略,:,坦白,不坦白,3,、支付函数,支付矩阵,(双人有限博弈),每个位置上第一个数字表示局中人,1,在对应的策略组合中得到的支付,第二个数字表示局中人,2,的相应所获支付。,例,2.1,囚徒困境及其策略型表示,(Tucker,1950),乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,不坦白,-8,,,-1,-2,,,-2,囚徒困境的支付矩阵,乙,甲,石头,剪刀,布,石头,0,,,0,1,,,-1,-1,,,1,剪刀,-1,,,1,0,,,0,1,,,-1,布,1,,,-1,-1,,,1,0,,,1,例,2.2,石头、剪刀、布的支付矩阵,田忌,齐王,上中下,上下中,中上下,中下上,下上中,下中上,上中下,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,上下中,1,,,-1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,中上下,1,,,-1,-1,,,1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,中下上,-1,,,1,1,,,-1,1,,,-1,3,,,-3,1,,,-1,1,,,-1,下上中,1,,,-1,1,,,-1,1,,,-1,-1,,,1,3,,,-3,1,,,-1,下中上,1,,,-1,1,,,-1,-1,,,1,1,,,-1,1,,,-1,3,,,-3,例,2.3,田忌赛马的支付矩阵,局中人,:男,女,策 略,:男:看足球,看芭蕾,女:看足球,看芭蕾,支付矩阵,:见下一页,例,2.4,性别大战(,battle of the sexes),女,男,足球,芭蕾,足球,3,,,2,1,,,1,芭蕾,-1,,,-1,2,,,3,性别大战的支付矩阵,一、基本思想:,如果一个局中人在任何情况下从某种策略中得到的支付均小于从另一种策略中得到的支付,那么显然对他而言,前一种策略劣于后一种策略。,从个人利益出发,被剔除的策略不会被局中人采用。从而可以利用剔除严格劣策略的概念来简化博弈局势,可能会得到博弈的解。,第二节,重复剔除严格劣策略均衡,如果存在 ,对于所有的,都有,且其中至少有一个为严格不等式,则称 是第,i,个,局中人的一个,严格劣策略,。,二、严格劣策略的定义,1,、根据,理性的局中人不会选择严格劣策略,这一原则,可以通过重复剔除严格劣策略的方法对博弈进行求解。,2,、,其方法是,:对每个局中人寻找严格劣策略,由于它不会被局中人选择实施,所以找到一种后就可以将其从博弈局势中剔除,从而得到一种新的缩减后的博弈局势,对这种新局势重复上述过程,直到无法找到新的严格劣策略为止,。,三、重复剔除严格劣策略,对局中人甲而言,无论局中人乙采取何种策略,采用,“,不坦白,”,策略得到的支付都小于采用,“,坦白,”,策略。局中人甲的,“,不坦白,”,策略严格劣于,“,坦白,”,策略,.,“,不坦白,”,策略都是一种严格劣策略,从而可以剔除。博弈中局中人各自从自身利益出发的理性选择(博弈均衡解)就是,(坦白,坦白),。,四,、囚徒困境的解,乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,不坦白,-8,,,-1,-2,,,-2,例,2.1,囚徒困境的支付矩阵,甲:,“,不坦白,”,相对于,“,坦白,”,是严格劣策略,乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,乙:,“,不坦白,”,相对于,“,坦白,”,是严格劣策略,乙,甲,坦白,坦白,-6,,,-6,例,2.5,利用重复剔除严格劣策略求解,乙,甲,左,中,右,上,1,,,0,1,,,2,0,,,1,下,0,,,3,0,,,1,2,,,0,乙:,“,右,”,相对于,“,中,”,是严格劣策略,乙,甲,左,中,右,上,1,,,0,1,,,2,0,,,1,下,0,,,3,0,,,1,2,,,0,甲:,“,下,”,相对于,“,上,”,是严格劣策略,乙,甲,左,中,上,1,,,0,1,,,2,下,0,,,3,0,,,1,乙:,“,左,”,相对于,“,中,”,是严格劣策略,乙,甲,左,中,上,1,,,0,1,,,2,重复剔除,严格劣策略均衡是,(,上,中,),乙,甲,中,上,1,,,2,1,、每一步剔除需要局中人间相互了解的更进一步假定,如果我们把这一过程应用到任意多步,需要假定,“,局中人是理性的,”,是共同知识。,2,、这一方法对博弈结果的预测经常是不准确的,.,五、重复剔除严格劣策略有两个缺陷,乙,甲,石头,剪刀,布,石头,0,,,0,1,,,-1,-1,,,1,剪刀,-1,,,1,0,,,0,1,,,-1,布,1,,,-1,-1,,,1,0,,,1,例,2.2,石头、剪刀、布的支付矩阵,利用重复剔除严格劣策略无法求解,例,2.6,利用重复剔除严格劣策略无法求解,乙,甲,左,中,右,上,0,,,4,4,,,0,5,,,3,中,4,,,0,0,,,4,5,,,3,下,3,,,5,3,,,5,6,,,6,大多数的博弈局势中使用剔除严格劣策略的方法能够对博弈局势进行简化,但可能得不到博弈的均衡解。,需要引入非合作博弈理论中的核心概念,纳什均衡,(,Nash Equilibrium,),。,六、注意,一、纳什均衡的思想,“,双赢,”,或,“,多赢,”,第三节 纳什均衡,它是关于博弈结局的一致性预测,如果所有局中人预测一个特定的纳什均衡会出现,那么这种均衡就会出现。,只有纳什均衡才能使每个局中人均认可这种结局,而且他们均知道其他局中人也认可这种结局。,二、纳什均衡的意义,1,、,博弈的纳什均衡,是这样一种最优策略组合,是一种你好、我好大家都好的理性结局,其中每一个局中人均不能也不想单方面改变自己的策略而增加收益,每个局中人选择的策略是对其他局中人所选策略的最佳反应。,三、纳什均衡的定义,2,、数学定义:,在策略型博弈 中,如果对于每个局中人,i,,存在 ,都有,或,则称策略组合 是此博弈,G,的一个,纳什均衡,。,三、纳什均衡的定义,1,、双人有限博弈:双划线法,首先对局中人,2,的每一个策略,局中人,1,寻找支付最大的策略,在其对应支付下划线;,然后对局中人,1,进行相应的步骤;,最后,凡是两个局中人支付下均被划线的结局就是纳什均衡。,四、纳什均衡的求法,用双划线法可以求出纳什均衡,:,(坦白,坦白),(,-6,,,-6,),意义:揭示个人理性与集体理性之间的矛盾,。,例,2.1,囚徒困境的纳什均衡,乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,不坦白,-8,,,-1,-2,,,-2,乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,不坦白,-8,,,-1,-2,,,-2,乙,甲,坦白,不坦白,坦白,-6,,,-6,-1,,,-8,不坦白,-8,,,-1,-2,,,-2,局中人:大猪,小猪,策 略:大猪:按,等待,小猪:按,等待,支付矩阵:见下一页,纳什均衡:,(按,等待),例,2.7,智猪博弈(,boxed pigs),小猪,大猪,按,等待,按,5,,,1,4,,,4,等待,9,,,-1,0,,,0,例,2.7,智猪博弈的支付矩阵,小猪,大猪,按,等待,按,5,,,1,4,,,4,等待,9,,,-1,0,,,0,小猪,大猪,按,等待,按,5,,,1,4,,,4,等待,9,,,-1,0,,,0,女,男,足球,芭蕾,足球,3,,,2,1,,,1,芭蕾,-1,,,-1,2,,,3,例,2.4,性别大战博弈的支付矩阵,女,男,足球,芭蕾,足球,3,,,2,1,,,1,芭蕾,-1,,,-1,2,,,3,女,男,足球,芭蕾,足球,3,,,2,1,,,1,芭蕾,-1,,,-1,2,,,3,局中人,:甲,乙,策 略,:甲:放左手,放右手,乙:猜左手,猜右手,支付矩阵,:见下一页,没有纳什均衡,例,2.8,猜左右手游戏,乙,甲,猜左手,猜右手,放左手,-1,,,1,1,,,-1,放右手,1,,,-1,-1,,,1,乙,甲,猜左手,猜右手,放左手,-1,,,1,1,,,-1,放右手,1,,,-1,-1,,,1,乙,甲,猜左手,猜右手,放左手,-1,,,1,1,,,-1,放右手,1,,,-1,-1,,,1,2,、连续性博弈纳什均衡的求法,首先求出每个局中人对其他局中人策略组合的反应函数,即在其他局中人策略组合给定时极大化自己的支付,得到的最佳反应策略表现为其他局中人策略组合的函数;,然后将这些反应函数联立求解即得到博弈的纳什均衡解。,四、纳什均衡的求法,局中人:,厂商,1,,厂商,2,策 略:,厂商,1,:选择产量,厂商,2,:选择产量,假 设:,价格,支付函数,(,利润函数,),:,例,2.9,两寡头产量竞争,Cournot,(,1838,)模型,Cournot,模型求解,反应函数,:,纳什均衡:,Cournot,模型求解,假设两寡头可以串谋,共同确定产量,Q,使总利润最大化,,利润函数为:,(Q)=Q(a-Q-c),总利润最大的产量为:,称为,契约曲线,总利润为:,比较及含义:,两寡头产量串谋模型,Q,1,厂商,2,的反应曲线,纳什均衡,契约曲线,厂商,1,的反应曲线,O Q,2,图,1,反应曲线、纳什均衡与契约曲线,局中人,:厂商,1,,厂商,2,策 略,:厂商,1,选择价格 ;厂商,2,选择价格,假 设,:,两寡头固定成本都为,0,,边际成本为常数,c,消费者对厂商,1,和,2,生产产品的需求量分别为:,;,例,2.10,两寡头价格竞争,Bertrand,(,1883,)模型,支付(利润)函数:,最优化的一阶条件是,:,Bertrand,(,1883,)模型及求解,反应函数:,纳什均衡价格:,Bertrand,(,1883,)模型及求解,在,n,个局中人的策略型博弈中,,1,、如果重复剔除严格劣策略剔除掉除策略组合,s,以外的所有策略,则这一策略组合,s,为该博弈的唯一的纳什均衡。,2,、如果策略组合,s,是一个纳什均衡,那么它就不会被重复剔除严格劣策略所剔除。,纳什均衡是比重复剔除严格劣策略更强的解概念。,五、纳什均衡与重复剔除严格劣策略均衡,一、举例说明混合策略纳什均衡,例,2.8,猜左右手游戏,第四节 混合策略纳什均衡,乙,甲,(,q,),猜左手,(,1-q,),猜右手,(,p,),放左手,-1,1,1,-1,(,1-p,),放右手,1,-1,-1,1,在甲选 ,乙选 这种策略时,,他们的期望效用分别为:,混合策略与期望效用,甲和乙的目标是,:,最优化的一阶条件是,:,混合策略纳什均衡,混合策略纳什均衡为:,混合策略纳什均衡,1,、混合策略,(,mixed Strategy),局中人,i,的一个混合策略 是在其纯策略空间,上的一个概率分布,其中 是,i,选择策略,的概率。局中人,i,的混合策略空间 是他的所有混合策略构成的集合。,纯策略可以理解为混合策略的特例。如 等价于,二、混合策略纳什均衡,在混合策略组合 下,局中人,i,的期望效用函数为:,其中,2,、期望效用函数,在策略型博弈 中,如果对于每个局中人,i,,存在 ,都有,或,则称 是博弈,G,的一个,混合策略纳什均衡,。,3,、混合策略纳什均衡,奇数定理,(Wilson 1971),:几乎所有的有限博弈都有奇数个纳什均衡。,4,、奇数定理,例,2.11,社会保障博弈,局中人,:政府和下岗工人,策 略,:政 府:救济,不救济,下岗工人:找工作,不找工作,支付矩阵,为:,三、应用举例,工人,政府,找工作,不找,救济,3,,,2,-1,,,3,不救济,-1,,,1,0,,,0,女,男,足球,芭蕾,足球,3,,,2,1,,,1,芭蕾,-1,,,-1,求出性别大战博弈的混合策略纳什均衡,定理,1,:,(,Nash,1950,)每个有限策略型博弈至少存在一个纳什均衡(纯策略的或混合策略的)。,第五节 纳什均衡的存在性,Brouwer,不动点定理,:如果,X,是非空的有界闭凸集,,f(x),是,X,到自身的连续映射,那么至少存在一个,x,X,,使得,f(x)=x,,,x,称为不动点。,Kakutani,不动点定理,:,设,f(X),是点集,X,上的一个集值映射,如果,X,是非空的有界闭凸集,并且对于所有的,x,X,,,f(x),是非空的、凸的且上半连续的,那么至少存在一个,x,X,,使得,xf(x),,,x,称为不动点。,纳什均衡的存在性证明,1,、,集值映射,:对于集合,X,上的任何一个点,x,,如果,f(x),给出唯一的一个点,y,Y,,则,f(x),称为从,X,到,Y,的映射;如果,f(x),给出一个集合,f(x)Y,,则,f(x),称为从,X,到,Y,的,集值映射,。,映射是集值映射的特例。,2,、,上半连续,:设,f(x),是,X,到自身的一个,集值映射,如果对于所有的,x,X,和包含,f(x,),的开集,V,,都存在,x,的一个邻域,U,,使得对于所有的,x,U,,有,f(x)V,,则称,f(x),是上半连续的,。,注:集值映射和上半连续,定理,2,:,(Debreu,1952,;Glicksberg,1952,;Fan,1952),在,n,人策略型博弈中,如果每个局中人的纯策略空间,S,i,是欧氏空间中的一个非空的有界闭凸集,支付函数,u,i,(,s),是连续的且对,s,i,是拟凹的,那么该博弈存在一个纯策略纳什均衡。,定理,3,:,(Glicksberg,1952),在,n,人策略型博弈中,如果每个局中人的纯策略空间,S,i,是欧氏空间中的一个非空的有界闭凸集,支付函数,u,i,(s),是连续的,那么该博弈存在一个混合策略纳什均衡。,定理,1,的推广:从有限到无限,经济博弈论基础,Economic,Game Theory,第二部分,非合作博弈理论,第二章 策略型博弈,第三章 扩展型博弈,第四章 贝叶斯博弈,第五章 动态贝叶斯博弈,主要内容,第一节 扩展型博弈的表述,第二节 扩展型博弈的纳什均衡,第三节 子博弈完美纳什均衡,第四节,重复博弈,第三章 扩展型博弈,行动有先有后,如何制胜,1,、一局博弈可能有不止一个纳什均衡,,事实上,有些博弈可能有无数个纳什均衡,究竟哪个纳什均衡实际上会发生?不知道。,2,、纳什均衡并不一定导致帕累托最优,。例如,“,囚徒困境,”,意味纳什均衡并不导致帕累托最优,导致了个人理性与集体理性的矛盾。对于这样的问题,纳什均衡没有给出解决的办法。,一、纳什均衡存在的问题,3,、纳什均衡假定:每个人将别人的策略视为给定,选择对自己最有利的策略,即如果其他局中人不改变策略,任何单个局中人不能通过单方面改变策略来提高他的效用或收益。,这种完全信息的假定不符合实际情况,。,一、纳什均衡存在的问题,4,、在纳什均衡中,局中人在选择自己的策略时,把其他局中人的策略当作给定的,不考虑自己的选择如何影响对手的策略。这个假设在研究静态博弈时是成立的,因为在静态博弈下,所有局中人同时行动,无暇反应。但对动态博弈而言,这个假设就有问题了。当一个人行动在先,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者自然会理性地预期到这一点,所以不可能不考虑自己的选择对其对手的选择的影响。,一、纳什均衡存在的问题,5,、与第,4,个问题相联系,由于不考虑自己选择对别人选择的影响,,纳什均衡允许了不可置信威胁的存在,。,这就引出了泽尔腾(,Selten,)的贡献。,一、纳什均衡存在的问题,对,“,纳什均衡,”,加以修正,提出了,“,子博弈完美纳什均衡,”,和,“,颤抖手完美纳什均衡,”,,去剔除那些不合理的纳什均衡,提出了,“,均衡选择,”,问题。,二、,Selten,的贡献,一、扩展型博弈的含义,完全信息动态博弈又称为扩展型博弈,。,扩展型博弈,是指在完全信息博弈中,局中人的行动有先有后,后行动者可以观察到先行动者的行动。,第一节,扩展型博弈的表述,二、扩展型博弈的表述,扩展型扩展的是策略型中的策略,有六个要素:,1,、局中人集合;,2,、局中人的行动顺序;,3,、局中人的行动空间;,4,、局中人的信息集;,5,、支付函数;,6,、外生事件的概率分布。,第一节,扩展型博弈的表述,1,、结点(,nodes,),2,、枝(,branches,),:行动,3,、信息集(,information set,),:,(,1,)同一个局中人的一些结点构成的集合;,(,2,)表示博弈到了这个集合,但不知到了这个集合的哪一个结点上。,三,、博弈树,两家房地产开发商,A,、,B,,考虑是否在同一地段开发写字楼,各自面临的选择是开发还是不开发。房地产市场充满了风险,风险来自市场需求的不确定性:需求可能大,也可能小。该博弈的行动顺序为:,(,1,)开发商,A,首先行动,选择开发或者不开发;,(,2,)在,A,决策后,自然选择市场需求的大小;,(,3,)开发商,B,在观测到,A,的选择和市场需求后,决定开发或不开发。,例,3.1,房地产开发博弈,开发,不开发,N N,大 小 大 小,B B B B,开发 不开发 开发 不开发 开发 不开发 开发 不开发,房地产开发博弈的博弈树,开发,不开发,N,N,大 小 大 小,B,B,B,B,开发 不开发 开发 不开发 开发 不开发 开发 不开发,房地产开发博弈的博弈树,开发,不开发,N,N,大 小 大 小,B,B,B,B,开发 不开发 开发 不开发 开发 不开发 开发 不开发,房地产开发博弈的博弈树,1,、完美信息,(,perfect,information,)博弈,是指博弈中所有信息集都是单点集。在完美信息博弈中,一次只有一个局中人在行动,而且他在行动时知道博弈所有以往行动的历史。,2,、完美回忆(,perfect,recall,)博弈,是指没有局中人会忘记自己所知道的信息,所有局中人都记得自己以往的行动选择。,四、完美信息博弈与完美回忆博弈,一、以房地产开发博弈,为例说明从,扩展型表述构造出策略型表述,,从而求出,纳什均衡,。,扩展型,扩展型博弈纳什均衡,博弈,策略型,策略型博弈纳什均衡,二、局中人的策略,是关于行动的一个完整的计划,它明确了在局中人可能会遇到的各种情况下对可行行动的选择。,第二节,扩展型博弈的纳什均衡,例题,:,房地产开发博弈,A,开发 不开发,B,B,开发 不开发 开发 不开发,(,-3,,,-3,)(,1,,,0,)(,0,,,1,)(,0,,,0,),第二节,扩展型博弈的纳什均衡,三、扩展型博弈的纳什均衡,B,A,(,开,开,),(,开,不,),(,不,开,),(,不,不,),开发,不开,三、扩展型博弈的纳什均衡,B,A,(,开,开,),(,开,不,),(,不,开,),(,不,不,),开发,-3,-3,-3,-3,1,0,1,0,不开,0,1,0,0,0,1,0,0,三、扩展型博弈的纳什均衡,B,A,(,开,开,),(,开,不,),(,不,开,),(,不,不,),开发,-3,-3,-3,-3,1,0,1,0,不开,0,1,0,0,0,1,0,0,此博弈有三个纳什均衡:,(开发,,(,不开发,开发,),),(开发,,(,不开发,不开发,),),(不开发,,(,开发,开发,),),三、扩展型博弈的纳什均衡,1,、定义扩展型博弈的策略,2,、定义扩展型博弈的纳什均衡,三、扩展型博弈的纳什均衡,1,、有限扩展型博弈:,扩展型博弈有有限个信息集,每个信息集上只有有限个行动。,2,、定理,:,(,Zemelo,1913;Kuhn,1953,)完美信息有限,扩展型博弈存在纯策略纳什均衡。,四、有限扩展型博弈,一、子博弈:,称,G,1,是,G,的一个子博弈,如果满足:,1,、子博弈,G,1,是原博弈,G,的一部分;,2,、子博弈,G,1,必须从单结信息集开始;,3,、子博弈,G,1,的信息集和支付向量都继承自原博弈,G,。,第三节,子博弈完美纳什均衡,房地产开发博弈有三个子博弈,除原博弈外,还有:,B,B,开发 不开发 开发 不开发,(,-3,,,-3,)(,1,,,0,)(,0,,,1,)(,0,,,0,),G,1,G,2,例,3.1,房地产开发博弈的子博弈,二、子博弈完美纳什均衡,(,Subgame,perfect Nash Equilibrium),扩展型博弈的一个策略组合是子博弈完美纳什均衡当且仅当它在每一个子博弈上都构成纳什均衡。,第三节 子博弈完美纳什均衡,三、子博弈完美纳什均衡的求法,1,、定义,2,、逆向归纳法(,Backward Induction),完美信息有限博弈,第三节 子博弈完美纳什均衡,例,3.1,、,房地产开发博弈,的子博弈完美纳什均衡:,定义求法,逆向归纳法求法,四、举例,房地产开发博弈,A,开发 不开发,B,B,开发 不开发 开发 不开发,(,-3,,,-3,)(,1,,,0,)(,0,,,1,)(,0,,,0,),子,博弈完美纳什均衡的求法,房地产开发博弈,A,开发 不开发,B B,不开发 开发 不开发,(,1,,,0,)(,0,,,1,)(,0,,,0,),子,博弈完美纳什均衡的求法,房地产开发博弈,A,开发 不开发,B,B,不开发 开发,(,1,,,0,)(,0,,,1,),子,博弈完美纳什均衡的求法,房地产开发博弈,A,开发 不开发,B B,不开发 开发,(,1,,,0,)(,0,,,1,),子,博弈完美纳什均衡的求法,局中人,:厂商,1,,厂商,2,策 略,:厂商,1,先行动,选择产量去,q,1,;,厂商,2,观察到,q,1,后,选择自己的产量,q,2,.,假 设,:价格,支付(利润)函数,:,例,3.2,两寡头产量竞争的,Stackelberg(1934),模型,用逆向归纳法求出子博弈完美纳什均衡:,(1),Stackelberg,模型求解,代入,(1),式得,:,Stackelberg,模型求解,子博弈完美纳什均衡:,与,Cournot,模型的纳什均衡比较,:,子博弈完美纳什均衡 纳什均衡,动态博弈时,厂商,2,有后动优势,。,动态,Bertrand,模型求解,利用逆向归纳法求解出的 子博弈完美纳什均衡的 结果与现实 存在一定的 差异,受到了一些学者的批评。,其中最著名的是蜈蚣博弈及其实验。,五、逆向归纳法的不足,小宝,C,大宝,C,小宝,C,大宝,C,小宝,C,大宝,C,S,S,S,S,S,S,例,3.4,蜈蚣博弈,小宝,C,大宝,C,小宝,C,大宝,C,大宝,C,S,S,S,S,S,例,3.5,蜈蚣博弈,一、重复博弈:,同样结构的博弈重复多次。,1,、重复博弈的基本特征:,(,1,)单次博弈之间没有实质联系,即前一阶段的博弈不改变其它阶段的博弈结构;,(,2,)所有局中人能够观测并记忆以往的博弈历史;,(,3,)局中人的总支付为各阶段支付的贴现值之和或者加权平均值。,第四节,重复博弈,2,、影响重复博弈均衡结果的主要因素:,(,1,)博弈重复的次数;,(,2,)信息的完备性。,一、重复博弈,1,、有限次重复博弈的子博弈完美纳什均衡,以囚徒困境为例,二、有限次重复博弈,2,、定理:,以阶段博弈,G,构成的重复,T,次(,Te,i,的,v,(对每个,i),,存在一个贴现因子,1,使得对于所有的,,,v=(v,1,v,2,v,n,),是一个特定的子博弈完美均衡的支付向量。,三、无限次重复博弈,无名氏定理的含义,:在无限次重复博弈中,如果局中人有足够的耐心(即,足够大),那么,任何满足个人理性的可行的,支付向量都可以通过一个特定的子博弈完美均衡而实现。,三,、,无限次重复博弈,经济博弈论基础,Economic,Game Theory,第二部分,非合作博弈理论,第二章 策略型博弈,第三章 扩展型博弈,第四章 贝叶斯博弈,第五章 动态贝叶斯博弈,主要内容,第一节 贝叶斯博弈及其策略型表示,第二节 贝叶斯纳什均衡,第三节,拍卖与招标博弈分析,第四节 混合策略纳什均衡重新解释,第四章 贝叶斯博弈,不了解对手,同时行动时,如何抉择,一、不完全信息与贝叶斯博弈,完全信息,:支付函数是共同知识,不完全信息,:至少有一个局中人不能确定其他局中人的支付函数,第一节 贝叶斯博弈及其策略型表示,例,4.1,市场进入博弈,在位者,高成本情况 低成本情况,默许 斗争 默许 斗争,进入,进入者,不进入,不完全信息博弈举例,40,50,-10,0,30,80,-10,100,0,300,0,300,0,400,0,400,例,4.2,求爱博弈,求爱者,品德好 品德差,求爱 不求爱 求爱 不求爱,接受,你,不接受,不完全信息博弈举例,100,100,0,0,-100,100,0,0,0,-50,0,0,0,0,0,0,Harsanyi,(,1967-68,)方法,:,引入一个虚拟的局中人,“,自然,”,,自然首先选择局中人的特征,局中人知道自己的特征,其他局中人不知道。,把不完全信息博弈转化为完全但不完美信息博弈。,二、,Harsanyi,转换,N,高,p,低,1-p,
展开阅读全文