博弈论的理论与方法.ppt_咨信网zixin.com.cn

资源描述

,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,MICROECONOMICS|,微观经济学,浙江大学经济学院,*,微观经济学（,Microeconomics,）,浙江大学经济学院,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,MICROECONOMICS|,微观经济学,浙江大学经济学院,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,微观经济学（,Microeconomics,）,浙江大学经济学院,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论的理论与方法,1,博弈论的理论与发展,定义与问题,博弈论（,Game Theory,），亦译“对策论”、“赛局理论”，从英文字面直译也可做“游戏”（,Game,）的理论理解。,简明定义：,博弈论是关于策略相互作用的理论，研究社会活动中人与人之间,“,斗智,”,的方式和结果。,从经济活动角度看：,博弈论研究的是经济主体行为方式之间的相互依存，相互影响，相互作用及其所产生的各种相应的结果。,传统,Micro,研究效用（函数）最大化，生产（函数）最大化，主要涉及人与物（商品、生产要素）的关系，较少涉及人与人的关系。,当经济研究涉及人与人（企业与企业）的关系时，例如厂商的价格战，博弈论就成了一个有用的分析工具。,博弈论的发展,博弈论产生于,30-50,年代,A,、,1944,年，冯,诺依曼、摩根斯坦恩合作发表,博弈论与经济行为,，将博弈论引入关于经济不确定性分析（预期效用概念），是博弈论正式诞生的标志；,B,、,1950,年代初，普林斯顿大学数学系在塔克教授指导下，形成了一个博弈论研究的博士生小组，从,“,囚徒困境,”,分析中创立了,“,纳什均衡,”,，奠定了现代博弈论基础。,博弈论在,60-80,年代迅速发展，,90,年代形成一个大的高潮。,博弈论本身迅速发展，大规模进入经济分析领域，又进入社会、政治、军事、国际关系研究领域，显示出极强的解释力，应用领域急剧扩张。,1994,年，博弈论主要代表人物纳什（,Nash,）、豪尔绍尼,(Harsanyi),、泽尔滕,(Selten),获诺奖。,2005,年，奥曼（,RJAumann,）和谢林（,TCSchelling,）获诺奖。,博弈分类及对应的均衡概念,行动顺序,信息,静态,动态,完全信息,完全信息静态博弈,纳什均衡（,NE,）,完全信息动态博弈,子博弈精炼,NE,不完全信息,不完全信息静态博弈,贝叶斯,NE,不完全信息动态博弈,精炼贝叶斯,NE,博弈的不同类型,乙,Y,N,甲：,5,乙：,5,甲：,10,乙：,0.5,甲：,0.5,乙：,10,甲：,2,乙：,2,Y N,甲,：局中人,-,博弈的参与者；,：策略,-,行动方案,：支付,-,收益或效用；,：信息结构,-,参与,者对,、,、,的了解,博弈模型的基本要素,利用博弈论来分析寡头垄断厂商行为的基本方法是先构造出一个支付表或者支付矩阵，以表明寡头垄断厂商可能采用的各种不同的策略以及这些策略的组合和相应的结果。假设,A,和,B,为两家寡头垄断的厂商，它们各自的总收益不仅是自己的产品价格的函数，同样也是对方的产品价格的函数。,2,两人常数和博弈模型（,Two-person Constant-sum Game,）,由于两家寡头垄断厂商共同面临着一个需求的价格弹性为一（）的市场需求，因此，无论它们各自采取何种价格策略，两家寡头垄断厂商的总收益均等于一个常数，即：,根据上述假定的条件建立起来的寡头垄断厂商的博弈论模型，称之为,“,两人常数和博弈模型,”,。,现假定厂商,A,和厂商,B,都有两个可供选择的价格策略，分别记作,A,1,、,A,2,和,B,1,、,B,2,。据此，厂商,A,和厂商,B,所选择的各种价格策略组合及其各自的总收益如以下支付表所示。,厂商,A,的支付表,B,A,B,1,B,2,A,1,a,11,=50 a,12,=100,A,2,a,21,=80 a,22,=120,厂商,B,的支付表,B,A,B,1,B,2,A,1,b,11,=50 b,12,=0,A,2,b,21,=20 b,22,=-20,上述支付表也可以改写为下列支付矩阵的形式：,以上的矩阵运算表明，只要我们知道其中一个厂商的支付矩阵和常数和，就可以通过运算得知另一个厂商的支付矩阵。同时，只要从任一支付矩阵或厂商的总收益之和中减去常数和，就可以将常数和支付矩阵转变为零和矩阵，即：,两人零和博弈中的零和矩阵表明，两家厂商的总收益之和为常数时，无论寡头垄断厂商采用何种价格策略，一家寡头垄断厂商的得益，相应地也就是另一家寡头垄断厂商的损失。,面临上述支付矩阵，如果寡头垄断厂商,A,是一个在决策时非常谨慎的风险回避者，就会注意到对于自己的两种可能选择的价格策略中的任一种策略的采用，都将可能出现的最糟糕的结局（即收益最小的结局）。也就是说，如果寡头垄断厂商,A,采用,A,1,，当,B,采用,B,1,价格策略时，此时,A,所能获得的最小收益是,TR,A,=a,11,=50,；如果,A,采用,A,2,，,B,仍采用,B,1,价格策略时，,A,所能获得的最小收益为,80,（,TR,A,=a,21,=80,）。因而，厂商,A,在采用,A,1,和,A,2,这两种价格策略所产生的最糟糕的结果中，相比较而言，较好的结果还是,TR,A,=a,21,=80,，厂商,A,将会把价格策略,A,2,作为自己的最优选择。,这种厂商的策略选择行为，在博弈论中称为,“,从最小收益中选择最大收益（,Maximize the Minimun Payoffs,）,”,其数学表达式形式为：,min a,1j,=a,11,=50,j,min a,2j,=a,21,=80,j,max min a,ij,=a,21,=80,i j,同样，对于寡头垄断厂商,B,来说，如果它也是一个在决策中非常谨慎的风险回避者，也会在自己所选择的价格策略可能产生的最糟糕的结果中，选择相对而言能产生较好结果的价格策略，即：,min b,i1,=b,21,=20,i,min b,i2,=b,22,=-20,i,max min b,ij,=b,21,=20,j i,由于在常数和博弈模型中，厂商,A,的得益即为厂商,B,的损失，,所以，也可以直接利用厂商,A,的支付矩阵来分析厂商,B,的选择行为。,因此，如果厂商,B,采用价格策略,B,1,，厂商,B,的最大损失为,80,（也即厂商,A,的最大收益为,80,）；若厂商,B,采用,B,2,这种价格策略，此时厂商,B,的最大损失将为,120,（即厂商,A,的最大收益为,120,）。为了从可以选择的策略所可能产生的最大损失中选择最小的损失，厂商,B,将会选择价格策略,B,1,。,这种,“,从最大损失中选择最小损失,”,的厂商博弈行为，用数学形式表达为：,max a,i1,=a,21,=80,i,max a,i2,=a,22,=120,i,min max a,ij,=a,21,=80,j i,将上述厂商,A,的,“,从最小收益中选择最大收益,”,的行为和厂商,B,“,从最大损失中选择最小损失,”,的行为结合起来加以分析，则有：,max min a,ij,=min max a,ij,=a,21,=80,i j j i,这一博弈论模型的分析结论表明，厂商,A,和厂商,B,都一致地选择了它们各自的价格策略的组合,a,21,（或者,b,21,），结果产生了一个稳定的博弈解或者均衡解。,因为，此时,a,21,=80,，既不是厂商,A,的最大收益（或者厂商,B,的最大损失），也不是厂商,A,的最小收益（或者厂商,B,的最小损失）。在博弈论中，这一博弈的均衡解被称为,“,纳什均衡,”,（,Nash Eguilibrium,）或被称为,“,鞍点,”,（,Saddle Point,）。所谓,“,鞍点,”,，就是博弈所具有的确定的解。存在,“,鞍点,”,的博弈，也被称为严格确定的博弈（,Strictly Determined Game,）。相应地，求解,“,鞍点,”,的方法在博弈论模型中被称为,“,极小,极大定理,”,（,Min,Max Theorem,）。,最优混合策略的博弈模型中，单纯策略的选择结果，支付矩阵中不存在着,“,鞍点,”,，这时，博弈双方需要采用最优混合策略，才能得到最大收益的期望值。,3,最优混合策略模型（,Optimun Mixed Strategy,）,现在设在一个由两家寡头垄断厂商构成的常数和博弈模型中，厂商,A,和厂商,B,各自的支付矩阵如下：,如果厂商,A,根据,“,极小,极大定理,”,来确定其所选择的价格策略，则有,：,min a,1j,=a,12,=10,j,min a,2j,=a,21,=20,j,max min a,ij,=a,21,=20,i j,同样，如果厂商,B,也根据,“,极小,极大定理,”,来确定其所选择的价格策略，则有：,max a,i1,=a,11,=40,i,max a,i2,=a,22,=30,i,min max a,ij,=a,22,=30,j i,由此可见，在上述博弈模型中，并不存在任何,“,鞍点,”,，即：,max min a,ij,min max a,ij,i j j i,在这种情形下，厂商,A,若知道厂商,B,将采用,B,2,，则厂商,A,将会采用,A,2,，这样厂商,A,将得到,a,22,=30,a,21,=20,的收益。但是，一旦厂商,B,发现厂商,A,采用,A,2,，它就会改变策略采用,B,1,，使厂商,A,的收益降至,a,21,=20,。同样，厂商,A,一旦发现厂商,B,采用,B,1,，也会改变策略采用,A,1,，使自己的收益增至为,a,11,=40,。当厂商,B,一旦发现厂商,A,采用,A,1,，它又会改变策略采用,B,2,，使厂商,A,的收益降至,a,12,=10,，,两家寡头垄断厂的这种价格策略选择过程中的,“,斗智,”,将会一直不断地持续下去，因此，博弈的解是极其不确定的。,max ai2=a22=120,（当厂商B同时采用策略B1时）,博弈论产生于30-50年代,最优混合策略的博弈模型中，单纯策略的选择结果，支付矩阵中不存在着“鞍点”，这时，博弈双方需要采用最优混合策略，才能得到最大收益的期望值。,min max aij=a21=80,min max aij=a22=30,这种厂商的策略选择行为，在博弈论中称为“从最小收益中选择最大收益（Maximize the Minimun Payoffs）”,其数学表达式形式为：,上述支付表也可以改写为下列支付矩阵的形式：,如果厂商A根据“极小极大定理”来确定其所选择的价格策略，则有：,a21=80 a22=120,众所周知，位于芝加哥市区的西尔斯大楼（Sears Tower）是美国最高的建筑，它使得能进入该大楼办公的公司具有一种特殊的荣誉和自豪感。,以上进入阻挠博弈的厂商支付矩阵可以用博弈树的形式表示如下：,如果A采用A2，B仍采用B1价格策略时，A所能获得的最小收益为80（TRA=a21=80）。,在上述例子中，设厂商A的最优混合策略为：以概率a采用策略A1，以概率（1-a）采用策略A2，则在厂商B同时相应采用策略B1，或者策略B2时，厂商A的预期收益为：,在博弈论中，这一博弈的均衡解被称为“纳什均衡”（Nash Eguilibrium）或被称为“鞍点”（Saddle Point）。,最优混合策略的博弈模型中，无论支付矩阵中的列数（即厂商B可以选择的策略数目）是多少，只要支付矩阵的行数（即厂商A可以选择的策略数目）是两行，就可以利用图解法来找到厂商收益的极大极小值及其最优混合策略。,以厂商A为例，如果厂商A现在转而以的概率采用策略A1，以,厂商为了避免采用单纯策略（即或者是,A,1,或者是,A,2,）而造成的博弈过程中的不利局面，可以放弃单纯策略的选择方法，改为采用混合策略来更好地获取收益。以厂商,A,为例，如果厂商,A,现在转而以的概率采用策略,A,1,，以,的概率采用策略,A,2,，那么，根据上述厂商,A,采用,A,1,和,A,2,的两种概率分布，厂商,A,在博弈中的预期收益为：,（当厂商,B,同时采用策略,B,1,时）,（当厂商,B,同时采用策略,B,2,时）,当然，厂商,B,在此种情形下也可能采用混合策略来减少自身的损失，如果这样的话，厂商,A,在每次博弈中的预期收益将在,100/3,与,50/3,之间。,最优混合策略的博弈模型中，无论支付矩阵中的列数（即厂商,B,可以选择的策略数目）是多少，只要支付矩阵的行数（即厂商,A,可以选择的策略数目）是两行，就可以利用图解法来找到厂商收益的极大,极小值及其最优混合策略。在上述例子中，设厂商,A,的最优混合策略为：以概率,a,采用策略,A,1,，以概率（,1-,a,）采用策略,A,2,，则在厂商,B,同时相应采用策略,B,1,，或者策略,B,2,时，厂商,A,的预期收益为：,（,1,）,（,2,）,或者,上述厂商,A,的预期收益方程所反映的预期收益与采用各种策略的概率两者间的相互关系，可以用下图加以表示。,TR,TR,40,40,30,30,20,20,10,10,25,K,E,C,M,T,L,N,D,H,F,G,S,图混合策略解,上图中，,ST,代表厂商,A,的预期收益曲线（），,KL,代表另一条厂商,A,的预期收益曲线（）。当厂商,A,以的概率采用策略,A,1,时，若同时厂商,B,采用策略,B,1,，则厂商,A,的收益在,ST,曲线的,C,点，即；反之，若同时厂商,B,采用策略,B,2,，则厂商,A,的收益在,KL,曲线的,D,点，即；如果厂商,B,也采用混合策略，则厂商,A,的收益将在,C,点与,D,点之间。,由此可推论出，,KES,和,TEL,表示无论厂商,B,采取单纯策略或混合策略时厂商,A,在任何一种概率分布下可能获得的预期收益。由于在厂商,A,所有预期收益中的最小收益为曲线,SEL,，该曲线代表的最高收益为,E,点，所以，厂商,A,预期的收益极小,极大值为,GE,。由于,E,点同时又是两条预期收益曲线的交点，所以，可以利用式（,1,）和式（,2,）组成联立方程组来求解极小,极大值及相应的厂商,A,的最优混合策略，即：,将上述解得的代入式（,1,）和式（,2,），可以解得厂商,A,的预期收益值（,ER,1,和,ER,2,）：,上述最优混合策略模型的分析结果表明：厂商,A,的最优混合策略是以的概率采用策略,A,1,，以的概率采用策略,A,2,，这时，无论厂商,B,以何种方式采用何种策略，厂商,A,都可以获得,TR,1,=25,的收益。或者说，当厂商,A,以，的概率来采用策略,A,1,和,A,2,时，厂商,A,的极小,极大值为,ER,1,=ER,2,=25,。,运用相同的方法，也可以求得厂商,B,的最优混合策略为以的概率采用策略,B,1,，以的概率采用,B,2,，这样，厂商,B,的极小,极大值也为,25,。,综上所述，在最优混合策略博弈模型中，如果两家寡头垄断厂商都采用混合策略的话，那么双寡头垄断的博弈模型就会产生一个严格确定的解。,连续博弈模型中，往往是博弈的某一方先采取某种策略，然后博弈的另一方在对博弈的对手的选择已有比较充分了解的前提下来选择自己的最佳策略。下面我们以进入阻挠策略为例来考察连续博弈模型。,4,连续博弈模型（,Sequential Games,）,众所周知，位于芝加哥市区的西尔斯大楼（,Sears Tower,）是美国最高的建筑，它使得能进入该大楼办公的公司具有一种特殊的荣誉和自豪感。因此，大楼的拥有者（假定为厂商,）可以获得远远高于其他办公大楼的办公室租金。现在假定另一家厂商,正在考虑是否建造一幢比西尔斯大楼更高的办公大楼，因为厂商,知道，如果它建造起一幢高于西尔斯大楼的办公大楼，而同时拥有西尔斯大楼的厂商,不采取任何反击策略的话，那么，它就可以获得丰厚的收益。,反之，如果厂商,采取反击策略的话（例如再建造另一幢比厂商,的办公大楼更高的大楼），那么，厂商,不仅得不到丰厚的收益，反而会严重亏损。同样，对于厂商,而言，如果它默认厂商,建造一幢新的最高的办公大楼这一行为，不采取任何反击策略，则它的收益将会大幅度下降；反之，如果它采取反击策略的话，它的收益甚至会有更大幅度的下降，但是，这时厂商,在这种反击下也将惨遭亏损。假设这两家厂商博弈的支付矩阵如下：,表厂商的支付矩阵,厂商,厂商,进入,不进入,反击,R,1,=30,R,2,=-50,R,1,=100,R,2,=0,不反击,R,1,=40,R,2,=70,R,1,=100,R,2,=0,上述支付矩阵同样可以写为：,=,=,以上进入阻挠博弈的厂商支付矩阵可以用博弈树的形式表示如下：,图博弈的扩展型：博弈树（,1,）,厂商,厂商,A,进入,B,不进入,C,反击,D,不反击,E,R,1,=30 R,2,=-50,R,1,=40 R,2,=70,R,1,=100 R,2,=0,在上述假定条件下，由于厂商,实行反击策略时的收益（,R,1,=30,）要小于不实行反击策略的收益（,R,1,=40,），所以，厂商,将会不顾厂商,宣称实行反击策略的威胁，采用进入的策略，建造更高的办公大楼。因为，这时在厂商,看来，以厂商,自身的收益考虑，厂商,的威胁是不可置信的。,但是，如果我们改变一下上述分析中的某些假定，假定现在厂商,掌握了某种成本更低的实行反击的策略或手段（例如只要追加,10,单位的投入，通过对西尔斯大楼的加层就可以使西尔斯大楼重新高于厂商,建造的新办公大楼）。这样，新的博弈树就变成下列形式：,谢谢观看,

展开阅读全文