资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,博弈论和企业决策,博弈论和企业决策,完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,返回,完全信息静态博弈,1,、占优战略均衡,(,1,)定义,有,n,个参与人的战略式表述为博弈,G=S,1,,,S,n,;,u,1,u,n,战略组合,s,*,=(s,*,1,,s,*,i,,s,*,n,),是一个占优战略均衡,如果对于每一个,i,s,*,i,是给定其他参与人任何选择,s,i,=(s,1,,,s,i,-1,s,i,+1,,,s,n,),的情况下第,i,个参与人的最优战略,即:,u,i,(s,*,i,s,i,),u,i,(s,i,s,i,),s,-i,s,i,s,*,占优战略均衡,完全信息静态博弈,1,、占优战略均衡,(,2,)举例:囚犯困境(,Prisoners dilemma),经典的囚犯困境,占优战略均衡,完全信息静态博弈,类似的囚犯困境,排队,闯红灯,价格战,占优战略均衡,完全信息静态博弈,高尚是高尚者的墓志铭,卑鄙是卑鄙者的通行证,环境污染,战争,军备竞赛,只要人人都献出一点爱,高尚与卑鄙,占优战略均衡,完全信息静态博弈,2,、重复剔除的占优均衡重复剔除严格劣战略,(,1,)劣战略和严格劣战略,令,s,i,和,s,i,是参与人,i,可选择的两个战略,如果对于其他参与人任何选择,s,i,=(s,1,,,s,i,-1,s,i,+1,,,s,n,),,参与人,i,从,s,i,得到的支付严格小于从,s,I,得到的支付,即:,u,i,(s,*,i,s,i,),u,i,(s,i,s,i,),s,-i,我们说战略,s,i,严格劣于战略,s,i,重复剔除的占优均衡,重复剔除严格劣战略,完全信息静态博弈,2,、重复剔除的占优均衡重复剔除严格劣战略,(,2,)重复剔除的占优均衡,战略组合,s*=(s*1,s*i,,s*n),称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一的战略组合。,重复剔除的占优均衡,重复剔除严格劣战略,完全信息静态博弈,(3)举例,智猪博弈:多劳不多得,重复剔除的占优均衡,重复剔除严格劣战略,完全信息静态博弈,智猪博弈:多劳少得,适得其反,重复剔除的占优均衡,重复剔除严格劣战略,置之死地而后生(破釜沉舟),完全信息静态博弈,3、纳什均衡,(,1,)定义,有,n,个参与人的战略式表述为博弈,G=S,1,,,S,n,;,u,1,u,n,战略组合,s,*,=(s,*,1,,s,*,i,,s,*,n,),是一个纳什均衡,如果对于每一个,i,s,*,i,是给定其他参与人选择,s,*,i,=(s,*,1,,s,*,i-1,s,*,i+1,,s,*,n,),的情况下第,i,个参与人的最优战略,即:,u,i,(s,*,i,s,*,i,),u,i,(,s,i,s,*,i,),s,i,S,i,i,纳什均衡,完全信息静态博弈,(,2,)纳什均衡和占优战略均衡及重复剔除的占优均衡之间的关系,纳什均衡,完全信息静态博弈,(3)应用分析,斗鸡博弈,性别战,纳什均衡,应用分析,完全信息静态博弈,库诺特寡头竞争模型(1838年),已知:两个企业的成本函数为,C=,c,q,,,市场逆需求函数为,P=a-(q,1,+,q,2,),求:企业的产量和利润,解:,p,1,=,Pq,1,-C,1,=(,a-(q,1,+,q,2,),)-cq,1,p,2,=,Pq,2,-C,2,=(,a-(q,1,+,q,2,),)-cq,2,垄断市场分析:,q,1,*,=q,2,*,=1/4(a-c),,p,1,=p,2,=1,/8(a-c),2,库诺特寡头市场分析:,q,1,*,=1/2(a-c-q,2,*,),q,2,*,=1/2(a-c-q,1,*,),q,1,*,=q,2,*,=(a-c)/3,,p,1,=p,2,=1,/9(a-c),2,纳什均衡,应用分析,完全信息静态博弈,伯川德寡头竞争模型(1883年),如果企业的竞争战略是价格而不是产量,伯川德证明,即使只有两个企业,在均衡情况下,价格等于边际成本,企业的利润为零,与完全竞争市场均衡一样。这便是所谓的“伯川德悖论”(,Bertrand Paradox)。,解开这个悖论的办法之一是引入产品的差异性。如果不同企业生产的产品是有差异的,替代弹性就不会是无限的,此时消费者对不同企业的产品有着不同的偏好,价格不是他们感兴趣的唯一变量。在存在产品差异的情况下,均衡价格不会等于边际成本。,纳什均衡,应用分析,完全信息静态博弈,豪泰林(,Hotelling,),价格竞争模型(1929年),产品差异有多种形式。我们现在考虑一种特殊的差异,即空间上的差异(,special differentiation),,这就是经典的豪泰林模型。,在豪泰林模型中,产品在物质性能上是相同的,但在空间位置上有差异。因为不同位置上的消费者要支付不同的运输成本,他们关心的是价格与运输成本之和,而不单是价格。,假定有一个长度为1的线性城市,消费者均匀地分布在0,1区间里,分布密度为1。假定有两个商店,分别位于城市的两端,商店1在,x0,,商店2在,x1,,出售物质性能相同的产品。每个商店提供单位产品的成本为,c,,消费者购买商品的旅行成本与离商店的距离成比例,单位距离的成本为,t。,这样,住在,x,的消费者如果在商店1采购,要花费,tx,的旅行成本;如果在商店2采购,要花费,t(1x)。,纳什均衡,应用分析,完全信息静态博弈,我们现在考虑两商店之间价格竞争的纳什均衡。假定两个商店同时选择自己的销售价格。令,Pi,为商店,i,的价格,,Di,(p,l,,p,2,),为需求函数,,i1,2。,如果住在,x,的消费者在两个商店之间是无差异的,那么,所有住在,x,左边的将都在商店1购买,而住在,x,右边的将在商店2购买,需求分别为,D,l,x,D,2,l,一,x。,这里,,x,满足:,p,l,+,tx,p,2,十,t(1,一,x),解得最优解为,p,1,*=p,2,*=c+t,每个企业的均衡利润为:,p,1,=p,2,=,t/2,纳什均衡,应用分析,完全信息静态博弈,对模型的进一步分析,我们将消费者的位置差异解释为产品差异,这个差异进步可解释为消费者购买产品的旅行成本。旅行成本越高,产品的差异就越大,均衡价格从而均衡利润也就越高。原因在于,随着旅行成本的上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断力加强,商店之间的竞争越来越弱,消费者对价格的敏感度下降,从而每个商店的最优价格更接近于垄断价格。另一方面,当旅行成本为零时,不同商店的产品之间具有完全的替代性,没有任何一个商店可以把价格定得高于成本,我们得到伯川德均衡结果。,在以上的分析中,我们假定两个商店分别位于城市的两个极端。事实上,均衡结果对于商店的位置是很敏感的。考虑另一个极端的情况,假定两个商店位于同一个位置,x。,,此时,他们出售的是同质的产品,消费者关心的只是价格,那么,伯川德均衡是唯一的均衡:,P,1,P,2,C,,1,=,2,=0,纳什均衡,应用分析,完全信息静态博弈,4,、公共物品的私人提供,(,1,)囚犯困境,(,2,)智猪博弈,(,3,)斗鸡博弈,完全信息静态博弈,5,、混合战略纳什均衡,(,1,)石头、剪子、布,完全信息静态博弈,5,、混合战略纳什均衡,(2),混合战略,在,n,个参与人博弈的战略式表述,G=S,1,,,S,n,;,u,1,u,n,中,假定参与人,i,有,K,个纯战略:,S,I,=s,i1,,,s,iK,,,那么,概率分布,i,=(,i1,iK,),称为,i,的一个混合战略,这里,iK,=(,s,ik,),是,i,选择,s,ik,的概率,对于所有的,k=1,K,0,iK,1,1,K,iK,=1.,(3),混合战略纳什均衡,在,n,个参与人博弈的战略式表述,G=S,1,,,S,n,;,u,1,u,n,中,混合战略组合,*,=(,*,1,*,n,),是一个纳什均衡,如果对于所有的,i=1,n,下式成立:,v,i,(,*,i,*,-i,)v,i,(,i,*,-i,),i,i,在此,v,i,(,i,-i,)=(,j,(,s,j,),u,i,(s),完全信息静态博弈,(3)监督博弈,税收机关与纳税人,雇主与雇员,这里,,V,是雇员的贡献,,W,是雇员的工资,,H,是雇员的付出,,C,是检查的成本。同时,我们假定,HC。,在这个假设下,该博弈不存在纯战略纳什均衡。,求解混合战略纳什均衡得知:雇主检查的概率*=,H/W,,雇员偷懒的概率*=,C/W。,求解雇主支付,W,为多少时,其期望收益最大。,完全信息静态博弈,6,、纳什均衡的存在性和多重性,(,1,)存在性定理,在,n,人战略式博弈中,如果每个参与人的纯战略空间,S,i,是欧氏空间上一个非空的、闭的、有界的凸集,损益函数,u,i,(s),是连续的且对,s,i,是拟凹的,那么,至少存在一个纯战略纳什均衡。,(,Debreu,,1952;,Glicksberg,,1952;Fan,1952),在,n,人战略式博弈中,如果每个参与人的纯战略空间,S,i,是欧氏空间上一个非空的、闭的、有界的凸集,损益函数,u,i,(s),是连续的,那么,至少存在一个混合战略纳什均衡。,(,Glicksberg,,1952),每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)(纳什,1950),完全信息静态博弈,6,、纳什均衡的存在性和多重性,(,2,)多重性,分蛋糕,性别战,“聚点”均衡:文化、历史(接人)、道德(进门)、法律(右行),“廉价磋商”,完全信息动态博弈,1,、博弈树,(,1,)结,(,2,)枝,(,3,)信息集,A,A,B,A,A,A,B,完全信息动态博弈,2,、举例:房地产开发(),两个房地产公司,A,和,B,一个城市里开发房产,他们可以分别选择是否开发,首先是,A,决定是否开发,然后,B,决定是否开发,同时,他们可能面临不同的市场需求状况(需求大和需求小)。博弈过程如图所示。,B,B,N,B,B,A,N,(4,4),(8,0),(-3,-3),(1,0),(0,0),(0,1),(0,0),(0,8),开发,不开发,需求大,需求小,开发,不开发,完全信息动态博弈,2,、举例:房地产开发(),如果,B,在决策时并不知道自然的选择,那么其信息集就由原来的四个减少为两个。博弈过程如图所示。,B,B,N,B,B,A,N,(4,4),(8,0),(-3,-3),(1,0),(0,0),(0,1),(0,0),(0,8),开发,不开发,需求大,需求小,开发,不开发,完全信息动态博弈,2,、举例:房地产开发(),如果,B,在决策时知道自然的选择,但并不知道,A,的选择,那么其信息集虽然也是两个,但却与前述的不同。博弈过程如图所示。,B,B,N,B,B,A,N,(4,4),(8,0),(-3,-3),(1,0),(0,0),(0,1),(0,0),(0,8),开发,不开发,需求大,需求小,开发,不开发,完全信息动态博弈,2,、举例:房地产开发():另一种表述,在博弈中,自然的信息集总是假定是单结的。因为自然是随机行动的,自然在参与人决策之后行动等价于自然在参与人之前行动,但参与人不能观测到自然的行动。博弈过程也可以如图所示。,B,B,N,B,B,A,(4,4),(8,0),(-3,-3),(1,0),(0,0),(0,1),(0,0),(0,8),开发,不开发,需求大,需求小,开发,不开发,A,完全信息动态博弈,3,、举例:父女之争,(,1,)承诺(,commitment),或威胁,(,2,)承诺或威胁可信吗?,(,3,)“人质”现象,台湾,(4),信用(,trust),为什么要讲信用?,信用,不,讲信用,讲信用,不讲,信用,0,0,5,-5,讲,信用,-,5,5,3,3,一次博弈时的策略选择,重复博弈中的策略选择,据江苏经济报2002年3月26日报道,中国企业联合会理事长张彦宁透露,中国每年因为逃废债务造成的直接损失约为1800亿,由于合同欺诈造成的直接损失约为55亿,产品质量低劣和制假售假造成的直接损失至少为2000亿,由于“三角债”和现款交易增加的财务费用约为2000亿。,完全信息动态博弈,如何让人们讲信用?,信用,不,讲信用,讲信用,不讲,信用,0,0,-5,5,讲,信用,5,-5,3,3,第三方强制(法律),信誉机制,完全信息动态博弈,如何让人们讲信用?,传统社会的信誉机制,转型时期的信用缺失,现代社会的信誉机制,信用,完全信息动态博弈,完全信息动态博弈,4,、举例:斯坦克尔伯格(,stackelberg,),寡头竞争模型(1934年),已知,P=a-q,1,-q,2,企业的边际成本,MC=AC=c,企业1选择,q,1,,,然后企业2选择,q,2,q,2,=1/2(a-c-q,1,),q,1,*,=1/2(a-c),q,2,*,=1/4(a-c),p,1,=1,/8(a-c),2,,,p,2,=1,/16(a-c),2,在博弈中,拥有信息优势可能会使参与人处于劣势,如果企业选择的是价格而不是产量,则为后动优势,完全信息动态博弈,5,、举例:市场进入博弈,B,B,(40,50),(-10,0),(0,300),默许,斗争,进入,不进入,A,默许,斗争,(0,300),A,的战略:进入、不进入,B,的战略:(,默许、默许)、(斗争、斗争),(默许、斗争)、(斗争、默许),完全信息动态博弈,5,、举例:市场进入博弈,B,B,(40,50),(-10,0),(0,300),默许,斗争,进入,不进入,A,默许,斗争,(0,300),A,的战略:进入、不进入,B,的战略:(,默许、默许)、(斗争、斗争),(默许、斗争)、(斗争、默许),完全信息动态博弈,5,、举例:市场进入博弈,(40,50),(-10,0),(0,300),进入,不进入,B,B,默许,斗争,A,默许,斗争,(0,300),纳什均衡:(进入、(,默许、默许),(,不进入、,(斗争、斗争),(,进入、,(默许、斗争),(,不进入、,(斗争、默许),完全信息动态博弈,6,、子博弈精炼纳什均衡,子博弈:原博弈的一部分,它本身可以作为一个独立的博弈进行分析,子博弈精炼纳什均衡(“序贯理性”,,sequential rationality),房地产开发,:(开发、(不开发、开发),B,B,开发,不开发,A,开发,不开发,(-3,-3),(0,1),(1,0),(0,0),开发,不开发,扩展式博弈的战略组合,s*=(s*,1,,s*,i,,s*,n,),是一个子博弈精炼纳什均衡,如果:,(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡,完全信息动态博弈,6,、子博弈精炼纳什均衡,房地产开发(),子博弈精炼纳什均衡:,企业,A:,开发,企业,B:,如果,A,不开发,则不论需求大小都开发;如果,A,开发,则需求大时开发,需求小时不开发。,B,B,N,B,B,A,N,(4,4),(8,0),(-3,-3),(1,0),(0,0),(0,1),(0,0),(0,8),开发,不开发,需求大,需求小,开发,不开发,完全信息动态博弈,7,、逆向归纳法与罗森塞蜈蚣博弈,逆向归纳法,罗森塞蜈蚣博弈(,Rosenthsal,,1981),1,D,A,(1,1),2,D,A,(0,3),1,D,A,(98,98),2,D,A,(97,100),1,D,A,(99,99),2,D,A,(98,101),(100,100),重复博弈(,repeated games),1,、基本特征,(,1,)前一阶段的博弈不改变后阶段的博弈结构,(2)所有参与人都能观测到博弈过去的历史,(,3,)参与人的总损益是过去所有阶段的损益的贴现值之和,重复博弈(,repeated games),2,、有限次重复博弈,(,1,)连锁店悖论(,chain-store paradox),(,2,),囚犯困境,重复博弈(,repeated games),3、无限次重复博弈(以囚犯困境为例),(,1,)可选择的战略,雷锋战略,曹操战略,冷酷战略(,grim strategies),又叫触发战略,心太软战略,一报还一报(,Tit-for tat),人鬼战略,欺软怕硬(又叫检验者战略,,H、TESTER),镇定者战略,精神病患者(醉汉战略),无限次重复博弈,重复博弈(,repeated games),(,2,)何为最优战略?,无限次重复博弈,1,2,3,4,5,6,合计,1,2,3,4,5,6,合计,重复博弈(,repeated games),(3)对“一报还一报”的进一步分析,特点,它是善良的,它是可激怒的,它是宽容的,它是清晰的(容易被辨识),无限次重复博弈,重复博弈(,repeated games),若干建议,不要嫉妒,不要首先背叛,对合作和背叛都要给于回报(,as soon as possible),不要耍小聪明,无限次重复博弈,重复博弈(,repeated games),若干启示,无限次重复博弈,相爱总是简单,相处却是太难,合作的基础不是真正的信任,而是关系的持续性,重复博弈(,repeated games),(4)对冷酷战略的进一步分析,突然选择不合作的总收益,R=5+,2,+-,n,=5+/(1-),持续合作的收益,R=3+3+3,2,+-3,n,=3/(1-),在什么条件下会选择背叛?,“万岁、万岁、万万岁”,无限次重复博弈,重复博弈(,repeated games),(5)双寡头分析,无限次重复博弈,在,寡头市场,窜谋的产量各是1/4(,a-c),,利润各为1/8(,a-c),2,,,一旦一方选择不合作(产量为3/8(,a-c),,则在该期的收益上升为9/64(,a-c),2,,,并,导致今后双方的不合作(产量为1/3(,a-c),,收益永远下降为1/9(,a-c),2,。,重复博弈(,repeated games),(5)双寡头分析,无限次重复博弈,在,双寡头市场,贴现率,9/17,,,双方才会保持持久的合作,。,如果有,N,个寡头企业,则合作均衡的贴现率要求是,1/,(1+4n/(n+1),2,),重复博弈(,repeated games),(6)无名氏定理(,folk theorem),无限次重复博弈,如果博弈重复无限次,或者每次结束的概率足够小,如果,充分接近1,任何个人理性可行支付向量都可以作为子博弈精炼纳什均衡结果出现,不完全信息静态博弈,1,、市场进入博弈,1、,进入者是否进入取决于对在位者类型的判断。,2、,若高成本的概率大于,1/5,,进入者选择进入,在位者如果是高成本则选择默许,反之选择斗争。,3、,若高成本的概率小于,1/5,,进入者选择不进入,在位者选择斗争。,不完全信息静态博弈,2,、求爱博弈,1、被求者,是否接受取决于对求爱者类型的判断。,2、,若求爱者是优的概率大于,1/2,,被求者选择接受,求爱者选择求。,3、,若求爱者是优的概率小于,1/2,,被求者选择不接受,求爱者选择不求。,不完全信息静态博弈,3,、,静态贝叶斯纳什均衡,(1)不完全信息静态博弈的战略式表述,不完全信息静态博弈的战略式表述包括:参与人的类型空间,1,,-,,n,,,条件概率,p,1,,-,,p,n,,,类型依存战略空间,A,1,(,1,),-A,n,(,n,),,和类型依存支付函数,u,i,(,a,i,,-,a,n,;,1,),-,u,n,(,a,i,,-,a,n,;,n,)。,参与人,i,知道自己的类型,i,i,,,条件概率,p,i,=p,i,(,-i,i,),描述给定自己属于,i,的情况下,参与人,i,有关其他参与人类型,-i,-i,的不确定性。我们用,G=A,1,,-A,n,;,1,,-,,n,;p,i,,-,,p,n,;,u,i,,-,u,n,代表这个博弈。,不完全信息静态博弈,(2)不完全信息静态博弈的贝叶斯纳什均衡,不完全信息静态博弈,G=,A,1,,,-A,n,;,1,,,-,,,n,;,p,i,,,-,,,p,n,;,u,i,,-,u,n,的纯战略贝叶斯纳什均衡是一个类型依存战略组合,a,i,*,(,i,),i=1,n,,,其中每个参与人,i,在给定自己的类型,i,和其他参与人类型依存战略,a,-i,*,(,-i,),的情况下最大化自己的期望效用函数,v,i,。,不完全信息动态博弈,1,、基本思路,(,1,)自然选择参与人的类型。,(,2,)后行动者能够观测到先行动者的行动,但不能观测其类型。,(,3,)由于行动是类型依赖的,行动传递着类型的某种信息,所以后行动者可以通过行动观测来推断其类型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。,(,4,)先行动者预测到这一点,就会设法选择对自己有利的信息,避免传递对自己不利的信息。博弈不仅是参与人选择行动的过程,而且是不断修正信念的过程。,不完全信息动态博弈,2,、贝叶斯法则,(,1,)类型:好人(,GP)、,坏人(,BP),(,2,),行动:好事(,GT)、,坏事(,BT),(,3,),一个人做好事的概率,Prob,(GT)=P(GT/GP)P(GP)+P(GT/BP)P(BP),(,4,),一个人做了好事是好人的概率,Prob,(GP/GT)=P(GT/GP)P(GP)/,Prob,(GT),不完全信息动态博弈,3,、举例:市场进入博弈,不完全信息动态博弈,(,1,)进入者是否进入取决于对在位者类型的判断,(,2,)进入者将依据在位者的价格选择而修正对在位者类型的判断,(,3,)在位者需要考虑价格选择的信息效应,所以,在位者选择什么价格不仅与自身的成本函数有关,而且与进入者的先验概率及条件概率有关。,(,4,)若高成本的先验概率小于1/5,则出现混同均衡:在位者不论成本高低,都选择中等价格,进入者只有在观测到高价格时才选择进入,(,5,)若高成本的先验概率大于1/5,则出现分离均衡:在位者在低成本时,选择低价格,在高成本时,选择高价格,进入者观测到低价格时选择不进入,观测到中价格或高价格时才选择进入。(低成本在位者通过低价格显示自己是低成本,此乃“认证费”),不完全信息动态博弈,4,、信号传递博弈,垄断限价,银行的楼,文凭,广告,孔雀开屏,阿克尔洛夫现年61岁,供职于加州大学伯克利分校。,斯彭斯现年58岁,供职于斯坦福大学。,斯蒂格利茨现年58岁,,曾任美国前总统克林顿的经济顾问委员会主席,世界银行副行长兼首席经济学家,,现供职于哥伦比亚大学。,信息经济学,1、旧车市场,(,Akerlof,,1970),2、保险市场(,Rothschild and,Stiglitz,,1976),3、“劣币驱逐良币,”(格雷欣,法则,),4、假货市场,如果小流氓都留光头,一个正派的人就不会留光头,即使他本来也喜欢留光头,小流氓把正派人驱逐出光头市场。,不完全信息动态博弈:逆向选择,只有在分离均衡中,教育水平才会成为传递雇员能力的信号。关键在于:只有高能力的人才愿意(能够)接受更高的教育。反之,如果接受教育的成本与能力无关(如很容易通过考试、论文答辩),低能力的人就会模仿高能力的人,选择同样的受教育水平。与此同时,人们被迫接受过多的教育,以显示自身的能力。,不完全信息动态博弈:劳动力市场的信号,在劳动力市场上存在着有关雇员能力的信息不对称,雇员知道自己的能力,雇主不知道,但雇员的受教育程度向雇主传递有关雇员能力的信息。因为:接受教育的成本与能力成反比,不同能力的人的最优教育程度是不同的。,不完全信息动态博弈:劳动力市场的信号,不完全信息动态博弈,5、不完全信息与资源配置效率,不完全信息会导致资源配置的效率损失。,不完全信息条件下,所有权的初始分配是重要的。,不完全信息所导致的效率损失只是在不完全竞争的情况下才是重要的。效率损失随交易人数的增加而减少。,
展开阅读全文