博弈论与信息经济学.pptx_咨信网zixin.com.cn

资源描述

第一章导导论论以色列希伯莱大学教授罗伯特奥曼恩(Robert J.A u m a n n)和美国马里兰大学经济学系和公共政策学院教授托马斯斯基林(Thomas C.S c h e l l i n g)。一、博弈论的研究对象与内容wGame theory:Game theory:对策论对策论游戏理论游戏理论博弈论博弈论 1.1.社会行为主体（社会行为主体（individual or group of individual or group of peoplepeople）相互关联）相互关联，相互依存和相互作用的普，相互依存和相互作用的普遍性。遍性。（1 1）相互关联）相互关联（2 2）相互依存）相互依存（3 3）相互作用）相互作用2.2.对社会行为主体的基本假定对社会行为主体的基本假定理性人假定理性人假定（1 1）理性人假定：动机自利，完全理性算计）理性人假定：动机自利，完全理性算计能力，效用最大化；能力，效用最大化；（2 2）既定约束假定：偏好既定，能力与资源）既定约束假定：偏好既定，能力与资源禀赋既定；禀赋既定；（3 3）完全信息假定：信息是充分的、对称的、）完全信息假定：信息是充分的、对称的、完全的，该知道的都知道；完全的，该知道的都知道；（4 4）零交易成本假定；）零交易成本假定；3.3.社会向为主体相互作用的基本类型社会向为主体相互作用的基本类型（1 1）协同合作）协同合作（2 2）矛盾对抗）矛盾对抗4.4.博弈论是研究人们矛盾和对抗性关系中的博弈论是研究人们矛盾和对抗性关系中的行为决策规律的学科行为决策规律的学科 w它主要关心的问题：它主要关心的问题：（1 1）在在矛矛盾盾对对抗抗人人们们的的行行为为决决策策是是否否有有规规律，规律如何达到？律，规律如何达到？（2 2）人人们们的的行行为为是是不不断断相相对对变变化化还还是是会会趋趋于稳定和收敛？于稳定和收敛？（3 3）稳定和收敛的条件是什么？）稳定和收敛的条件是什么？假假设设有有x x,y,y两两个个人人，且且他他们们的的行行为为选选择择为为B Bx x,B,By y,有有B Bx x=F=Fx x(B(By y),B),By y=F=Fy y(B(Bx x).).是是否否存存在在（B Bx x*,B,By y*）使使y y选选择择B By y*时时,x,x选选B Bx x*，并且同时当，并且同时当x x选择选择B Bx x*时时y y选择选择B By y*?在什么条件下存在（在什么条件下存在（B Bx x*,B,By y*）?从从任任意意的的（B Bx x,B,By y）开开始始，会会不不会会收收敛敛到（到（B Bx x*,B,By y*）?如如果果B Bx x*或或B By y*有有一一个个微微小小的的扰扰动动，B By y*或或B Bx x*会不会发散会不会发散?若若B Bx x=B=Bx x*+，则，则B By y=F=Fy y(B(Bx x*+)+)当当 0 0时时,B,Bx x B Bx x*,B,By y=F Fy y(B(Bx x*+)是是否会否会 By*By*w 如：以色列与巴勒斯坦人的博弈，印度与巴基斯坦关于克什米尔的争端与博弈。以色列：当巴勒斯坦选择人体炸弹爆炸时，选择侵略与占领。巴勒斯坦：当以色列选择侵略时，选择人体炸弹。w 关于耶鲁撒冷的地位？阿拉法特是否会作错误的选择？哈马斯与以色列该如何选择?w 在什么条件下，以色列和巴勒斯坦都会选择和平？w 大陆和台湾的对局博弈:统一还是分裂?w 台湾检方与陈水扁的博弈中国越南菲律宾在南海问题的博弈w第一阶段:中国的反击与越南的溃败(1974年西沙反击战);w第二阶段:中国的退守与越南菲律宾的冒进;(1)中国为什么提出共同开发?(2)历史占有现实与200海里经济区的冲突;w第三阶段:中国在南海问题上为什么态度突然强硬起来?越南菲律宾采取的相应对策;(1)南海资源的发现;(2)中国国力的强大;南海问题的最终归向在哪里?w南海是否最终难免一战?战争的可能结局又是什么?美日会介入南海冲突吗?w和平谈判和共同开发能够解决南海问题吗?俄罗斯人说:领土问题从来不是靠谈判解决的.俄罗斯政府在北方四岛问题上的强硬态度.南海问题上的四种基本战略对局 A ;B C ;D E ;F G ;H中中国国战战和和越南越南菲律宾菲律宾战战和和二、博弈论的创立与发展11943年，冯诺依曼摩根思坦出版了博弈论与经济行为一书，分析了孤岛上的“鲁宾逊”一个人的经济行为选择与社会交换条件下的多人经济行为选择的区别：“鲁宾逊”面临的是一个普通的极大值问题，而在多人交换经济中，结果不仅取决于他自身的行为，而且取决于其他人的行为选择。冯诺依曼摩根思坦发现，此前的经济学只是研究解决了“鲁宾逊”所面临的单方选择问题，而没有研究解决经济行为相互依存条件下的行为选择问题。纳什的贡献2、1951年Nash提出了Nash均衡的概念，并证明了Nash均衡的存在真正奠定了博弈论作为一门学科的基础。之前,虽然有很多人致力于研究博弈对策的规律，但总没有得出有意义的成果，直到Nash。那什（1）非均衡策略w设当x取策略B Bx x时,y的最优对策B By y=F Fy y(B Bx x),以及当y取策略B By y时,x的最优策略B Bx x=F Fx x(B By y)。w设x的策略集合为B Bx x=B Bx x(Bx1,Bx2,BxN)w设y的策略集合为B By y=B By y(By1,By2,ByN)w当x选择策略Bxn时，y选择策略Bym,对于x的策略Bxn,Bym不是y的最优策略。对于y的策略Bym,Bxn也不是x的最优策略。（2）上策均衡w 对x来说，存在一个策略Bxn*wB Bx x(Bx1,Bx2,BxN),对于y的任意策略B Bymym B By y(By1,By2,ByN),Bxn*都是一个最优策略，则Bxn*称为上策。w 同时对y来说，存在一个策Bym*B By y(By1,By2,ByN)，对于 Bxn B Bx x(Bx1,Bx2,BxN)，Bym*都是y的最优策略，Bym*亦称为y的上策（或超优策略）。w 当x和y选择策略组合(Bxn*,Bym*)时，x和y谁不会改变策略，则称这种局面为上策均衡或超优均衡。w 孙悟空72变，如来佛手掌心w 小孩斗法w三十六计,走为上计w不变应万变（3）Nash均衡w 设存在一个策略组合Bx和By，且Bx B Bx x(Bx1,Bx2,BxN),By B By y(By1,By2,ByN),当x选择Bx时，y的最优策略选择是By,同时，当y选择By时，x的最优选择是Bx,因此，x和y选择了Bx和By 时，谁都不会再改变策略。这种局面称为Nash均衡，是Nash最早提出并证明了它的存在。w例囚徒困境（prisoners dilemma）w 坦白 B 不坦白 A坦白 A不坦白例中美南海飞机撞击事件的博弈w 美道歉美不道歉中方退还中方不退还 -8 -8 0 -10 -10 0 -1 -1 5 5 -2 4 4 -2 0 0w例(3):智猪博弈智猪博弈-搭便车问题搭便车问题w w 小猪按小猪等大猪按大猪等w大猪先吃大猪先吃9 9，小猪剩，小猪剩1,1,按的成本为按的成本为2 2，总食量，总食量1010w小猪先吃小猪先吃4 4，大猪剩，大猪剩6,6,同时吃，大猪同时吃，大猪7 7、小猪、小猪3 3 问题:大猪还是小猪该按按钮?5 1 4 4 9 -1 0 0例(4)斗鸡博弈 1962年,苏美古巴导弹危机,两国面临的局面与选择wNash均衡与环保问题：污染问题个体理性与整体理性进进进进退退退退进进进进进进进进退退退退退退退退-2 ;-2-2 ;-2 2 ;02 ;0 0 ;2 0 ;2 0 ;00 ;0美美美美苏苏苏苏问题:w(1)鲁宾逊”孤岛”经济与寡头竞争经济区别在哪里?w(2)或者说给定条件下的静态经济世界和竞争动变过程中的经济世界的区别在哪里?w(3)什么是纳什均衡?纳什均衡与传统经济学的局部均衡和一般均衡方法区别在哪里?w(4)为什么说纳什均衡概念奠定了博弈论的理论基石?w31965年，泽尔腾将动态分析引入Nash均衡，提出了子博弈精练Nash均衡的概念。w（1）静态博弈与动态博弈静态博弈：一次性，同时决策动态博弈：重复性，可以有先后决策w（2）多重Nash均衡的存在的可能性如：恋爱博弈爱男不爱女爱女不爱在此有两个Nash均衡：（爱，爱），（不爱，不爱）5 5 -2 3 3 -2 0 0（3）精练Nash均衡排除不可信的Nash均衡w 有些Nash均衡的可信度（可能性）较低，因此可以予以排除，主要考虑那个可性最大（最可信）的Nash均衡。如上例：如果我知道女朋友非常爱我那么就不需要考虑（不爱，不爱）的均衡。w 如果认为女朋友一点也不爱我，就不需要考虑（爱，爱）的Nash均衡。女女不爱不爱爱爱(0 0)(0 0)男男爱爱不爱不爱(0 0)(0 0)(5 5)(5 5)树状扩展型博弈41968年，海萨尼研究了不完全信息条件下的静态博弈，提出了贝叶斯Nash均衡概念。（1）不完全信息不知道双方支付矩阵，偏好结构。w（2）高成本在位者和低成本在位者（见书28页）w（3）贝叶斯Nash均衡。在仅有对手的概率w性知识的条件下，寻求期望效用最大化51975年，泽尔腾等人，又进一步把贝叶斯Nash均衡从静态博弈扩展到动态博弈，提出了精炼贝叶斯Nash均衡的概念。（1）条件概率和贝叶斯公式（2）通过对方的行为选择使关于对方的概率性知识不断精练（3）例子：黔驴和老虎博弈论的最新发展w6 二十世纪八十年代,史密斯把生物演化方程引入博弈论,提出了演化稳定战略的概念,使演化博弈论获得了快速发展.w7 几乎与此同时,合作博弈理论研究也取得了突破性进展.三、博弈论与现代经济学w1经济学的源流与发展w 亚亚当斯密当斯密李嘉李嘉图图萨萨伊伊边际边际学派学派数理学派数理学派马马克思克思列宁列宁凯恩斯弗里德曼弗里德曼希克斯希克斯萨缪尔森萨缪尔森马歇尔新古典经济学凯恩斯的心理动机储蓄偏好流动性偏好2新古典经济学的理论特征：（1）完全信息（2）完全理性（自利最大化计算智能）（3）交易成本为零（4）既定制度、技术，市场分工水平（5）最优均衡（局部均衡与一般均衡）3主流经济学面临的各种理论挑战（1）福利经济学家庇古对传统经济学的质疑w 外部性与市场失灵w 公共产品供给的市场失灵自然垄断产业与政府管制政府管制（2）信息经济学对经济学的质疑：信息不对称与“柠檬市场”问题（3）制度经济学对经济学的影响w交易成本与产权制度对市场效率的影响。经济学的最新发展w(4)演化经济学对主流经济学的质疑w(5)实验经济学对主流经济学的修正w(6)行为经济学对主流经济学的挑战（7）博弈论方法对经济学研究方法和理论视野的变革研究方法影响:从局部和一般均衡转向纳什均衡研究视野的影响:囚徒困境与理性最优第二章完全信息静态博弈一几个基本概念（1）参与人行为主体;（2）行为战略;（3）效用支付;(4)完全信息w信息的均等性;任何一方都不具有相对于对方的信息优势和劣势w信息的透明性;你知道我知道的,我也知道你知道的;你还知道我知道你知道的,我也知道你知道我知道的;w信息的充分性;博弈双方信息是足够的充分的.(5)信息信念与信仰w信息:真的知道;w信念:自以为知道(以有限或局部信息为依据);w信仰:以无法知道的东西为知道(无真实信息依据);w共同知识与一致预期:(6)共同知识与一致预期w共同知识:双方知识信息集合当中完全相同的部分,即我知道你也知道的,你知道我也知道的;w一致预期:博弈双方基于共同知识对自身和对方的未来行为选择的预期的完全一致状态;二完全信息静态博弈的特点w双方信息的均等性透明性充分性;w双方一次性同时选择行为策略;w知道而没有看到;三三完全信息静态博弈纳什均衡完全信息静态博弈纳什均衡(一)Nash均衡定义设存在一个策略组合Bx和By，且Bx B Bx x(Bx1,Bx2,BxN),By B By y(By1,By2,ByN),当x选择Bx时，y的最优策略选择是By,同时，当y选择By时，x的最优选择是Bx,因此，x和y选择了Bx和By 时，谁都不会再改变策略。这种局面称为Nash均衡，是Nash最早提出并证明了它的存在。n n人博弈纳什均衡定人博弈纳什均衡定w设:G=A1,A2,A3,.,AN;U1,U2,U3,UNw如果存在一个策略组合a1*,a2*,aN*，其中a1*A1,a2*A2,.,aN*AN,使Ui*=Uia1*,a2*,aN*Uia1*,ai-1*,aij*,ai+1*,aN*w对 i N都成立，则a1*,a2*,aN*为Nash均衡。(二二)纳什均衡案例纳什均衡案例例囚徒博弈（prisoners dilemma）w 坦白 B 不坦白 A坦白 A不坦白例中美南海飞机撞击事件的博弈w 美道歉美不道歉中方退还中方不退还 -8 -8 0 -10 -10 0 -1 -1 5 5 -2 4 4 -2 0 0w例(3):智猪博弈智猪博弈-搭便车问题搭便车问题w w 小猪按小猪等大猪按大猪等w大猪先吃大猪先吃9 9，小猪剩，小猪剩1,1,按的成本为按的成本为2 2，总食量，总食量1010w小猪先吃小猪先吃4 4，大猪剩，大猪剩6,6,同时吃，大猪同时吃，大猪7 7、小猪、小猪3 3 问题:大猪还是小猪该按按钮?5 1 4 4 9 -1 0 0例(4)斗鸡博弈 1962年,苏美古巴导弹危机,两国面临的局面与选择wNash均衡与环保问题：污染问题个体理性与整体理性进进进进退退退退进进进进进进进进退退退退退退退退-2 ;-2-2 ;-2 2 ;02 ;0 0 ;2 0 ;2 0 ;00 ;0美美美美苏苏苏苏四纳什均衡与囚犯困境w个人理性与群体理性;每个人的聪明选择加总一定是聪明的选择吗?w斯密信条:”看不见的手”与新自由主义;w囚犯困境:个人理性与群体理性的矛盾与冲突囚徒困境:个人理性与公共理性的冲突与悖论w公地悲剧w过度猎捕w环境污染w核武器扩散w金融危机w价格大战问题：w(1)什么是囚徒困境？囚徒困境说明了什么？试举更多理性人选择陷入囚徒困境的例子w（2）试用囚徒困境说明市场可能失效的原因，以及政府对经济管理调控的作用？你主张一个完全自由的市场和一个完全无为而治的政府吗？w（3）美国金融危机的原因是什么？最发达最有效率的美国金融市场为什么出错？最聪明的美国金融家如何共同做了一件大傻事？w（4）如何可能摆脱和防止囚徒困境可能的途径与方法？交流交往协商达成共识或者通过外部控制干预.当代人类面临的重大危机及其理性根源当代人类面临的重大危机及其理性根源一、核战危险w核扩散：印、巴、以、伊朗、朝鲜中、苏、法、英、美（日本）二、恐怖主义（生物恐怖，电脑病毒，核恐怖，化武恐怖）三、水资源危机（中国北方）四、荒漠化五、大气圈异变（臭氧空洞，温室效应，北极冰融）六、病毒侵袭（SARS,AIDS,尼罗河）当代人类面临的危机及其根源所在问题的原因：人类的自利行为（根源于自利理性）a.人口的繁殖过量 b.对大自然的过渡侵夺 c.有污物质的过度排放 d.国家主义、民族主义已经走到了尽头，个人主义也已经走到了尽头。地球是我们共同的家园，人类是一个生存共同体。五 Nash均衡的求解法(一)有限离散策略博弈纳慎均衡解法w划线法划线法w严格下策消去法严格下策消去法(二)无限连续策略博弈纳什均衡解法反映函数方法:w设设:U:Ux x=U=Ux x(x,y)U(x,y)Uy y=U=Uy y(x,y)(x,y)wx,y,Ux,y,Ux x,U,Uy y连续，连续，U Ux x,U,Uy y二阶可微二阶可微w并且 0,0,则求解反映函数:=0 =0w其解即为Nash均衡（三）零和博弈的Nash均衡 a.a.零和博弈零和博弈 U Ux x+U+Uy y=0=0（损人才能利己）（损人才能利己）b.b.负和博弈负和博弈 U Ux x+U+Uy y0 0 0（利己又不损人（利己又不损人,或或利己又利人）利己又利人）问题：以下博弈属于哪类博弈？wa.生产产量博弈无市场、资源约束下（正和博弈）有市场、资源约束下（零和博弈）wb.财富分配博弈（财政预算，奖金分配，单位分房）wc.两男争一女或两女争一男的博弈wd.权利博弈（强权意志，权利社会）（零和）（强权与服从的对称性）we.写诗比赛博弈（正和博弈）画画比赛博弈（正和博弈）学习竞赛博弈（正和博弈）运动竞技博弈第一，有限离散策略零和博弈w最大最小值方法:wX给出一个策略ax，则y会给出一个行动ay，使Ux(ax,ay)=minUx(ax,ay),而x要选择一个ax*,使Ux最大,Ux(ax*,ay*)=max minUx(ax,ay)=min maxUx(ax*,ay*).w y的一个策略ay，x却会选一个ax使Ux最大，即Ux(ax,ay)=maxUx(ax,ay),则y会选一个ay*使Ux(ax*,ay*)=minmaxUx(ax,ay)第二,无限连续策略零和博弈的Nash均衡解wUx=Ux(Xa,Ya)wUy=Uy(Xa,Ya)wXa,Ya是连续可微的行为变量wUx,Uy是Xa,Ya的效用函数w如果：Ux,连续w并且 =0，0 (极小值条件)w =0，0(极大值条件)w则求解反映函数方程w对X而言:=0 =0 极大极小w对Y而言：=0 =0 极小极大 w则解x*,y*是满足最大最小条件的Nash均衡解。w由于Ux=-Uy，所以对x而言求得的解与对y而言求得的解是等价的，可以相互推出。(四四)循环相克博弈的循环相克博弈的NashNash均衡解法均衡解法（1）什么是循环相克博弈w 博弈者的任何一项战略行为都受到对方某种战略的完全克制,对手之间的各个战略,形成相互克制的封闭环.（2）循环相克博弈的纯战略Nash均衡不存在“石头、剪子、布”游戏（3）循环相克博弈只存在混合战略Nash均衡游戏:剪刀-斧头-锤w 甲w乙剪刀石头布剪刀 0 ;0 0 ;1 1 ;0石头 1 ;0 0 ;0 1 ;0布 0 ;1 1 ;0 0 ;0w何谓混合战略捣浆糊战略？设:,Ax=ax1,ax2,axn,Ay=ay1,ay2,aymw设x在Ax中随机选择战略，且某种战略被选择概率是 ,=1,则 =(ax1),(ax2),(axN)是x的混合战略。w同理，y的混合战略 =(ay1),(ay2),(aym)（4）混合战略Nash均衡的确定原则无差异原则w 即给定我的混合战略，你的任何战略都是无差异的。同时，给定你的混合战略，我的任何战略也都是无差异的。w 在循环相克博弈中，均衡的状态就是从彼此克制中摆脱，使彼此相克转为彼此都不能相克彼此不被对方克制的状态就是一种双方同时实现最优的状态。因为，任何一种纯战略都会陷入被对方克制的局面，只有采取一种混合战略，才能摆脱相互克制的局面。同时，这种混合战略还必须使对方的战略都无差异。（5）例：政府与流浪汉的博弈找工作流浪救济不救济w 通过划线法可知，上述的博弈的纯战略Nash均衡不存在，但是存在混合战略Nash均衡。3 ，2 -1 ，3 -1 ，1 0 ，0w 第一个问题通过重复博弈解决重复性博弈均衡制成制度坦白从宽牢底坐穿抗拒从严回家过年w 第二个问题通过博弈解决子博弈精炼Nash均衡（动态博弈）w智猪博弈搭便车例：大户做庄，小户跟风大户铺路、修桥，小户跟风大企业创新，小企业模仿大股东监督，小股东不管w性别战博弈w俄罗斯与车臣绑匪的博弈博弈种类及均衡解法离散、有限策略博弈：划线法连续、无限策略博弈：反映函数法零和博弈：最大最小法循环相克博弈：混合战略人和命运环境的博弈w人的知识甚少，而不确定性太多，所以完全凭信仰来决定。w捣浆糊策略，万精细策略，西瓜皮策略w追求信仰以不变应万变w人生战略：a.以不变应万变，信仰坚定 b.随遇而安战略，脚踹西瓜皮 c.糊涂战略，难得糊涂恋爱博弈：你爱我，我爱你。你不爱我，我不爱你。机会主义战略无论你是否爱我，我要追求你。信仰战略知识与博弈均衡(1)知识可以扩展博弈的策略集合战争博弈:古代矛盾近代枪炮坦克现代导弹反导弹人与自然的博弈(2)共同知识有利于达成博弈的Nash均衡制度与博弈均衡（1）制度提供了一种关于行为策略的共同信息，即什么是可能的什么是不可能的。w制度是博弈均衡。原始状态：一些人与一些人的战争，掠杀、抢夺、偷盗。w社会契约制度博弈均衡w如环保制度的形成，也是在保护环境和破坏环境的博弈中形成的。（2）制度是一种信息的浓缩，关于策略集合的信息。但反过来，制度又为博弈提供了行为预期。w如：市场竞争受法规制度的规范信仰与博弈均衡（一）不同的信仰有不同的效用函数（二）不同的信仰有不同的策略集合伊斯兰原教义主义者：a.伊斯兰教义 b.古兰经(妇女蒙面，不工作)例一：基督教文明：a.b.现代，大众传媒，女性优先w文明的冲突独裁与自由的博弈w王权天授w真命天子w普天之下w天生平等卢梭w天赋人权自由平等w上帝面前人人平等w真理面前人人平等w独裁宪政与自由 w终身制普选制反应函数方法一、产量竞争模型（库洛特博弈）N个企业，P=a-Q,Q=P=a-Q,Q=i i=q=qi i(a-Q-c)(a-Q-c)=q =qi i(a-c)-q(a-c)-qi i2 2-q-q-i-iq qi i =-q=-qi i2 2+(a-c-+(a-c-q q-i-i)q)qi i =-2 =-2q qi i+(a-c-+(a-c-q q-i-i)=0)=0wa-c-qa-c-q-i-i=2q=2qi i a-c=(n-1)q a-c=(n-1)qi i+2q+2qi iw q qi i=双寡头模型w1 1=q=q1 1(a-(a-q q1 1-q q2 2-c)-c)w2 2=q=q2 2(a-(a-q q1 1-q q2 2-c)-c)wP=a-QP=a-Q 成本=c=cw=-2q=-2q1 1+(a-q+(a-q2 2-c)=0 q-c)=0 q1 1=w =-2q =-2q2 2+(a-q+(a-q1 1-c)=0-c)=0w-2q-2q2 2+(a-c)=0+(a-c)=0w-2q-2q2 2+a-+-c=0+a-+-c=0wq q2 2=q=q1 1二、价格竞争模型二、价格竞争模型（豪泰林（豪泰林HotellingHotelling）消费者在消费者在0 0和和1 1之间均匀分布，密度之间均匀分布，密度为为1 1，距离成本系数为，距离成本系数为t t，设住在，设住在x x的的人在人在shop1shop1与与shop2shop2无差异。无差异。wD D1 1=x D=x D2 2=1-x=1-xwP P1 1+xt=P+xt=P2 2+(1-x)t+(1-x)twD D1 1=x=x=wD D2 2=1-x=1-x=w1 1=(P=(P1 1-c)D-c)D1 1=(P=(P1 1-c)(P-c)(P2 2-P-P1 1+t)+t)w2 2=(P=(P2 2-c)D-c)D2 2=(P=(P2 2-c)(P-c)(P1 1-P-P2 2+t)+t)w设设a 0,1-a-b 0,a 0,1-a-b 0,距离成本为距离成本为tdtd2 2w设设x x到到与与无差异无差异w则则P P1 1+t(x-a)+t(x-a)2 2=P=P2 2+t(1-b-x)+t(1-b-x)2 2w t(x-a+1-b-x)(x-a-1+b+x)=P t(x-a+1-b-x)(x-a-1+b+x)=P2 2-P-P1 1 (2x-a-1+b)=(2x-a-1+b)=x=x=三、公共草场模型设有一种公共草场，n个农民，各养羊gi,共，羊的平均价值为V。当G 0 G Gmax时，V(G)=0w社会最优为maxCV(G)-GcmaxCV(G)-Gcw一阶条件为V(GV(G*)+G)+G*V V(G(G*)=c)=cw显然 G G*GG*wV(GV(G*)-V(G)-V(G*)=G=G*V V(G(G*)-G)-G*V V(G(G*)四、公共物品的私人供给模型设n个居民，公共物品为G=居民i的效用函数为ui(xi,G)预算约束为Mi=pxxi+pCgi 混合战略Nash均衡1.纯战略Nash均衡的非存在性案例w社会福利博弈w 找工作流浪救济不救济对一种循环相克的博弈和剪子，包袱，锤博弈，就没有Nash均衡，任何纯战略都不可能实现均衡。3 ，2 -1 ，3 -1 ，1 0 ，0 2.混合战略Nash均衡对纯战略Nash均衡的补充w但是，如果政府和流浪汉各自选择一种混合战略都可以实现一种Nash均衡，如政府以(0.5，0.5）的概率选择救济和不救济，流浪汉以(0.2，0.8）的概率来选择工作和流浪，却是一种相互耦合的最优决策。w 给定我的混合战略，你的任何选择的期望效用无差异，同时给定你的混合策略，我的任何期望效用无差异。w如何摆脱循环相克？w只有选择一种混合策略 3 ,2 -1 ,3 -1,1 0 ,0不救济不救济救济救济找工作找工作流浪流浪政政府府流浪汉流浪汉0.20.20.80.80.50.50.50.5-0.2,1.5-0.2 ,1.5-0.2,1.5-0.2 ,1.5政政府府流浪汉流浪汉-0.2,1.5-0.2 ,1.5-0.2,1.5-0.2 ,1.5政政府府流浪汉流浪汉3.混合战略的定义 N个竞争者，其每人的策略集为Si=Si1(Si1),Si2(Si2),Sik(Sik)i在Si集中随机选择策略,每种策略选择的概率是:则叫混合战略组合。4.混合策略的Nash均衡：给定对手的混合策略，我的策略是无差异的。给定我的混合策略，对手的策略是无差异的无差异均衡.w 在这里，使对手无差异就是最优，因为可以避免被对手相克，使你无法克我。w 使纯战略下的循环相克博弈，变成混合战略下的无差异均衡博弈。w 譬如，在政府和流浪者博弈中，流浪汉应该选一种混合战略，不被政府相克，使政府在选择救济或是不救济间无差异。w 设流浪者混合策略为(r,1-r），在此策略下，政府选择救济的期望效用是:VG(1,r)=3r+(-1)(1-r)=4r-1w应该等于选择不救济的期望效应:VG(0,r)=(-1)r+0(1-r)=-rw所以4r-1=-r,r=0.2,1-r=0.8w同样，设政府的混合策略是(,1-)，则此策略亦应该使流浪者在选择工作或不工作之间无差异。wVL(,1)=2 +1-=1+wVL(,0)=3+0(1-)=3=1+w即政府选择 =0.5时，流浪者在工作与不工作之间无差异。可以证明这种无差异及是最优的。如果 ,政府将选择单方相克的纯策略如果 ,流浪汉将选择单方相克的纯策略如果 ,则双方处于混合战略均衡状态。(相互策略无差异状态)1 10.20.20.50.5图视如下:5.5.税收监管博弈税收监管博弈混合战混合战略博弈选择的又一个案例。略博弈选择的又一个案例。w参与人、纳税人、税务机关。参与人、纳税人、税务机关。w设设a a应纳税，应纳税，c c监督成本，监督成本，F F罚款。罚款。a-c+F,-a-F a-c ,-a 0 ,0 a ,-a监督监督不监督不监督逃税逃税不逃税不逃税税税局局纳税人纳税人6.6.混合战略与不完全信息的区别混合战略与不完全信息的区别.w不完全信息：不完全信息：对奸猾纳税人的监督成本很高对奸猾纳税人的监督成本很高(C(CH H)对普通纳税人的对普通纳税人的监督成本较低监督成本较低(C(CL L)。但税局对纳税人的类型不确知，。但税局对纳税人的类型不确知，但有一个概率性的知识，如：但有一个概率性的知识，如：是第一类型，是第一类型，是第是第二类型，这属于不完全信息博弈。二类型，这属于不完全信息博弈。这是概然性信息，而混合策略是概然策略。这是概然性信息，而混合策略是概然策略。a-cH+F,-a-F a-cH ,-a 0 ,0 a ,-a逃税逃税不逃税不逃税监督监督不监督不监督 NashNash均衡的多重性及对多重均衡的多重性及对多重NashNash均衡的选择与甄别均衡的选择与甄别.一、一、NashNash均衡的多重性均衡的多重性w 例一：性别战博弈例一：性别战博弈 2 ,1 0 ,0 0 ,2 1 ,2足球足球芭蕾芭蕾足球足球芭蕾芭蕾女男有两个有两个NashNash均衡：均衡：(足球足球,足球足球)，（芭蕾，芭蕾）。，（芭蕾，芭蕾）。w例二：斗鸡博弈例二：斗鸡博弈 -3 ,-3 2 ,0 0 ,2 0 ,0进进 B B 退退进进退退A A 如如19621962年的古巴导弹危机：美国出动年的古巴导弹危机：美国出动军舰拦截苏联载导弹核武的战船。军舰拦截苏联载导弹核武的战船。w例三：分赃博弈二、对不同二、对不同NashNash均衡的选择与甄别均衡的选择与甄别帕累托最优型帕累托最优型NashNash均衡均衡w 设设x,yx,y是两个是两个player,(aplayer,(ax x1 1,a,ay y1 1)和和(a(ax x2 2,a,ay y2 2)是两组是两组NashNash均衡策略，均衡策略，(u(ux x1 1,u,uy y1 1)和和(u(ux x,u,uy y)是是x x和和y y在两种在两种NashNash均衡策略下的效用（）均衡策略下的效用（）w如果满足如果满足u ux x1 1u ux x，并且，并且u uy y1 1u uy y，则称，则称,(a(ax x1 1,a,ay y1 1)是帕累托最优的是帕累托最优的NashNash均衡。均衡。w例一：战争与和平的博弈例一：战争与和平的博弈 -5 ,-5 8 ,-10 -10 ,8 10 ,10战争和平战争和平战争战争和平和平X园园Y园园这里有两组这里有两组Nash均衡：（战争，战争）均衡：（战争，战争），（和平，和平）。但，（和平，和平）。但ux和平和平ux战争战争，并且，并且uy和平和平uy战争战争，因此，因此,(ax和平和平,ay战争战争)是比是比(ax和平和平,ay战争战争)帕累托占优的帕累托占优的Nash均衡。均衡。.风险稳定风险稳定(浮动浮动)型型NashNash均衡均衡w 设设(a(ax x1 1,a,ay y1 1),(a),(ax x2 2,a,ay y2 2)是两组是两组NashNash均衡均衡,(u(ux x1 1,u,uy y1 1),(u),(ux x,u,uy y)是是x x和和y y的的NashNash均衡效用均衡效用()()w 如果如果a ax x1 1出现一个微量浮动出现一个微量浮动 ,则则a ay y1 1就就不再是不再是y y的最优策略的最优策略,u,uy y(a(ax x1 1+,a+,ay y1 1)u uy y(a(ax x2 2+,a+,ay y1 1)。则称则称(a(ax x2 2,a,ay y2 2)是风险稳是风险稳定型定型NashNash均衡。均衡。w例一、两个企业的合作博弈 9 ,9 0 ,8 8 ,0 6 ,6真心合作真心合作假意合作假意合作真心合作真心合作假意合作假意合作企业企业B企业企业Aw 该博弈有两个该博弈有两个NashNash均衡（真均衡（真，真），真），（假（假，假），而（真，假），而（真，真）是较（假，真）是较（假，假）帕累托占优的假）帕累托占优的NashNash均衡。均衡。但实际上真心合作总是比较困难的，但实际上真心合作总是比较困难的，这是因为（真这是因为（真，真）的风险稳定性差，是，真）的风险稳定性差，是风险浮动型均衡，而（假风险浮动型均衡，而（假，假）是风险，假）是风险稳定型的稳定型的NashNash均衡。均衡。w 只要企业只要企业A真心合作的可能真心合作的可能 aA真真,则则B的最优策略的最优策略就不是就不是aB真真，而是，而是aB假假。w 证明如下：证明如下：w u uB B真真(a(aA A真真 -aA A真真 ,a,aB B真真)=9(1-)=9(1-)u uB B假假(a(aA A真真 -aA A真真 ,a,aB B假假)=8-2)=8-2 当当时，时，u uB B真真 u0,6-7 0w即即 u uB B假假(a(aA A假假 -aA A假假 ,a,aB B假假)u)uB B真真(a(aA A假假 -aA A假假 ,a,aB B真真)。也就是说只要。也就是说只要a aA A假假的浮动程度的浮动程度小于小于 ,就不会改变均衡策略就不会改变均衡策略,因此因此(a(aA A假假,a,aB B假假)是一对风险稳定性的是一对风险稳定性的NashNash均衡策略。均衡策略。w 这两个分析说明了人与人之间以及企业这两个分析说明了人与人之间以及企业与企业之间的真诚的信任与合作与企业之间的真诚的信任与合作难以建立的难以建立的原因。许多人往往会取曹孟德的策略原因。许多人往往会取曹孟德的策略“宁我宁我负天下人，莫让天下人负我负天下人，莫让天下人负我”。w 真诚的合作与真心的友谊往往是非常脆真诚的合作与真心的友谊往往是非常脆弱的，经不起挫折，因此是非常不稳定的。弱的，经不起挫折，因此是非常不稳定的。因为好朋友如果稍有不忠不慎得罪怠慢之处，因为好朋友如果稍有不忠不慎得罪怠慢之处，你就会有被欺骗，吃苍蝇的感觉。你就会有被欺骗，吃苍蝇的感觉。w行为偏离发生的原因通常有三种行为偏离发生的原因通常有三种:（1 1）蓄意偏离）蓄意偏离机会主义倾向导致蓄意偏机会主义倾向导致蓄意偏离，以谋求单方面的好处。离，以谋求单方面的好处。（2 2）行为的误差）行为的误差任何行为都可能产生误任何行为都可能产生误差。差。（3 3）由于偶发因素导致的行为偏离，并没有）由于偶发因素导致的行为偏离，并没有主观故意。主观故意。（4 4）误解）误解行为并没有偏离，但是其中的行为并没有偏离，但是其中的某一方误判了对方的行为，认为某一方误判了对方的行为，认为对方对方行为偏出正轨。行为偏出正轨。w例二：狩猎博弈例二：狩猎博弈两个猎人猎捕鹿、兔两个猎人猎捕鹿、兔 5 ,5 0 ,3 3 ,0 3 ,3猎鹿猎鹿猎兔猎兔猎人猎人A猎鹿猎鹿猎兔猎兔猎人猎人Bw 该博弈有两组该博弈有两组NashNash均衡（猎鹿，猎均衡（猎鹿，猎鹿）、（猎兔，猎兔），但第一组鹿）、（猎兔，猎兔），但第一组NashNash均衡不稳定。任何一方的策略略有偏离均衡不稳定。任何一方的策略略有偏离浮动，均衡就会失陷，就不成立。而第浮动，均衡就会失陷，就不成立。而第二组均衡是稳定性均衡，对方的策略浮二组均衡是稳定性均衡，对方的策略浮动和偏离，对他的效用不发生负面改变。动和偏离，对他的效用不发生负面改变。3.3.聚点均衡聚点均衡在多重在多重NashNash均衡中，如果存在某种因均衡中，如果存在某种因素使其中的一种均衡成为更可能繁盛的聚素使其中的一种均衡成为更可能繁盛的聚焦点，则这一焦点，则这一NashNash均衡称为聚占均衡。均衡称为聚占均衡。（这种因素可能使文化、历史、信息等）（这种因素可能使文化、历史、信息等）例一：选食物博弈例一：选食物博弈 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1海鲜海鲜牛肉牛肉猪肉猪肉A海鲜海鲜牛肉牛肉猪肉猪肉Bw 如果如果A,BA,B是广东、宁波人，是广东、宁波人，则聚点均衡则聚点均衡是（海鲜，海鲜）。是（海鲜，海鲜）。w 如果如果A,BA,B是伊斯兰人，则聚点均衡是是伊斯兰人，则聚点均衡是（牛肉，牛肉）。（牛肉，牛肉）。w 如果如果A,BA,B是内地人，则聚点均衡是（猪是内地人，则聚点均衡是（猪肉，猪肉）。肉，猪肉）。例二：性别博弈例二：性别博弈如果是男生，则（足球，足球）是聚点均衡。如果是男生，则（足球，足球）是聚点均衡。如果是女生，则（芭蕾，芭蕾）是聚点均衡。如果是女生，则（芭蕾，芭蕾）是聚点均衡。例三：报时博弈例三：报时博弈（1212，1212）最可能是聚点均衡。）最可能是聚点均衡。例四：城市分组博弈例四：城市分组博弈（杭州宁波，长春沈阳）是聚点均衡。（杭州宁波，长春沈阳）是聚点均衡。例五：分赃博

展开阅读全文