博弈论期末复习题.doc_咨信网zixin.com.cn

资源描述

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A L R U 1,3 2,5 D 4,1 6,2 解：由划线解得知有一个纯战略均衡（）再看看它是否有混合战略均衡设以玩混合战略，则有均衡条件：得，这是不可能的，故无混合战略均衡，只有这一个纯战略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡解：由奇数定理，若使它先有两个纯战略均衡，则很可能就有另一个混合战略均衡。 B A L R U 5,6 2,5 D 4,1 6,2 将博弈改成上述模型，则得同样，设的混合战略为，则于是混合战略均衡为。二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 2 1 2 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 2 1 1 2 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上，1认为2选的概率为，则1选的支付 1选的支付故1必选。给定1在第二个决策结上选，2在左边决策结上会选，故子博弈精炼均衡为四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为，其中为厂商1的产量。第2个厂商的成本函数为，其中为厂商2的产量，为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本是厂商2的“私人信息”，厂商1认为在上呈均匀分布。设市场需求函数为，其中为价格，两个厂商都以其产量为纯战略，问纯战略贝叶斯均衡为何？解：给定，厂商1的问题是因。厂商1不知道，故目标函数为一阶条件：得（1）厂商2的问题是：一阶条件：得（2）代入式（1）：得代入式（2）：若，则若信息是完全的且，则古诺博弈均衡为，。这说明信息不完全带来的高效率。 2、完美信息动态博弈。会用策略式表达、扩展式表达。用方框找纳什均衡，用树找子博弈精炼均衡。讲理由，看例题。该博弈中有三个纳什均衡：不进入，（进入，进入）进入，（不进入，进入）进入，（不进入，不进入）前两个均衡的结果(进入，不进入)，即A进入，B不进入；第二个均衡结果是(不进入，进入)，即A不进入，B进入如果理论得到这样的结果，无助于预测博弈参与人的行为。此外，纳什均衡假定，每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应，即参与人并不考虑自己的选择对其他人选择的影响，因而纳什均衡很难说是动态博弈的合理解。必须在多个纳什均衡中剔除不合理的均衡解，即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样，子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。 ①{不进入，（进入，进入）} ② {进入，（不进入，进入）}③{进入，（不进入，不进入）} 前边得到的三个纳什均衡中，均衡①意味着当A不进入时，B选择进入；而当A选择进入时，B仍选择进入（B威胁无论如何都要进入市场）。显然，当A选择进入时，B仍选择进入是不合理的，如果A进入市场，B选择“不进入”比选择“进入”收益要更大，理性的B不会选择进入，而A知道B是理性的，因此也不会把该战略视为B会选择的战略。因此，B的战略（进入，进入）是不可置信威胁。 ①{不进入，（进入，进入）} ② {进入，（不进入，进入）} ③{进入，（不进入，不进入）} 均衡③意味着当A进入时，B选择不进入；而当A选择不进入时，B仍选择进入（B威胁无论如何都不进入市场）。显然，当A选择不进入时，B仍选择不进入是不合理的，B的战略是不可置信的。只有均衡②是合理的：如果A进入，B不进入；如果A不进入，B进入。因为A是先行动者，理性的A会选择“进入”（他知道B是理性的，B不会选择“进入”），而理性的B选择“不进入”。观察博弈树上的三个均衡中，B的不可置信战略中的反应，在第二阶段B开始行动的两个子博弈中不是最优；而合理的纳什均衡中，B的战略在所有子博弈中都是最优的，与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡 (8,1) (1,2) 发送者 (2,7) (10,8) 接收者自然接收者 (6,5) （4,1）发送者 (7,3) (3,7) 解：有四种可能：混同均衡，，分离均衡，，设为接收者看见时认为发送者是的后验概率。看，则，非均衡路径上当接收者看见，选的支付为选的支付为故选。当接收者看见，选的支付为选的支付为当选，接收者会选，得支付10，要求不选，对无要求，因总会选。当选，接收者会选，得支付3，要求不选是不可能的，因选是占优于选的，故此混同均衡，不存在。再看混同均衡，此时为非均衡路径上的后验概率，当接收者看见，选的支付为选的支付为故接收者必选。当接收者看见时，选的支付为选的支付为故必选。这样，无论发送者发出或信号，接收者总选，给定接收者总是选。会选，会选。故，不是混同均衡。看分离均衡，，接收者看见时，必选接收者看见时，必选此时，选，选故，是一个分离均衡。最后看分离均衡，，接收者看见时，必选接收者看见时，必选给定接收者总选，故，不是分离均衡。故只有一个纯战略子博弈精炼分离均衡鹰-鸽(Hawk-Dove)博弈 (1) 参与人：争食的两只动物-动物1和动物2。动物1和动物2的行动空间都是一样的，即：Ai={鹰，鸽} i=1，2 支付矩阵如下： (2) 此博弈属于完全信息静态博弈，根据奇数定理知道共有三个纳什均衡，两个纯策略纳什均衡和一个混合策略纳什均衡。两个纯策略纳什均衡是：(鹰，鸽)和(鸽，鹰)。混合策略纳什均衡是：动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布，即：首先，动物1应该以q的概率选择鹰，以1-q的概率选择鸽，使得动物2在鹰或者鸽之间无差异，那么可得q*：由4(1-q) = q+3(1-q) 得q*=50%；其次，动物2应该以a的概率选择鹰，以1-a的概率选择鸽，使得动物1在鹰或者鸽之间无差异，那么可得a*：由4(1-a) = a+3(1-a) 得a*=50%。 (3) 此博弈实际就是一个斗鸡博弈，在现实生活许多现象都与此类似，如市场进入、前苏联与美国在世界各地争抢地盘等。七、狩猎博弈此博弈同样是一个完全信息静态博弈，参与人是两个猎人，他们的行动是选择猎鹿或者猎兔。支付矩阵如下：根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡，即：(鹿，鹿)和(兔，兔)，也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。由于存在两个纯策略纳什均衡，现实中究竟哪个均衡会出现就是一个问题，这是多重纳什均衡下的困境。但是，比较两个纳什均衡，很容易发现两人都猎鹿帕累托优于两人都猎兔，所以，对两个猎人而言，都猎鹿是一个“更好”的纳什均衡，因此，在现实中两个人都决定猎鹿的可能性要更大一些。然而，正如卢梭所言，如果一只野兔碰巧经过他们中的一个人附近，那么也许这个人会去猎兔而使猎鹿失败，因为两个人都猎兔也是一个纳什均衡，这就是人的自私性。此外，在多个纳什均衡下，博弈之外的其他因素有助于我们判断哪个均衡会出现。比如，两个猎人是好朋友，经常合作，那么我们几乎可以100%的肯定他们都会同时选择猎鹿。如果他们是仇敌，那么我们可以肯定他们不会合作猎鹿，因此他们都会选择各自猎兔。来源:考试大-考博考试不完全信息夫妻博弈混合策略均衡给定妻子分别以q,1-q的概率选择时装、足球，则丈夫选择时装、足球的期望收益相等，即1.q+0.(1-q)=0.q+3.(1-q)，解得妻子选择时装、足球的概率分别为（3/4，1/4）给定丈夫分别以p,1-p的概率选择时装、足球，则妻子选择时装、足球的期望收益相等，即2.p+0.(1-p)=0.p+1.(1-p)，解得妻子选择时装、足球的概率分别为（1/3，2/3）当妻子以（3/4，1/4）的概率分布随机选择时装表演和足球，丈夫以（1/3，2/3）的概率随机选择时装表演和足球时，双方都无法通过单独改变策略，即单独改变随机选择纯策略的概率分布而提高利益，因此双方的上述概率分布的组合构成一个混合策略纳什均衡。该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为： q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3; q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4 双方的期望收益均小于纯策略时的期望收益。某些静态贝叶斯博弈的例子 1、市场进入博弈一个完全垄断企业B正在垄断一个行业市场，另一个潜在的试图进入该行业的企业A，称A为进入者，B为在位者。A不知道B的成本特征，设B有两种可能的成本，即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。表6.1 市场进入博弈 B 高成本低成本默认斗争默认斗争 A 进入 40,50 -10,0 30,80 -10,100 不进入 0,300 0,300 0, 400 假定B知道进入者A的成本为高成本，且与B为高成本时的成本相同。假若信息是完全的，则当B为高成本时，唯一的精炼纳什均衡为（进入，默认），另一纳什均衡（不进入，斗争）是含有不可置信的威胁。当B为低成本时，唯一的纳什均衡为（不进入，斗争），即若A进入行业，具有低成本优势的B将通过降低价格将A逐出市场。由于存在行业进入成本，所以A被逐出市场后将有净的10单位进入成本的损失。当A不知道B的成本情况时，他的选择将依赖于他对B的成本类型的主观概率或先验概率密度。设A对B是高成本的先验概率判断为，则A认为B为低成本的概率为。如果A进入，其期望支付为如果1不进入，其期望支付为0。当且仅当或时，A选择进入；反之，当时，A不进入。于是，贝叶斯均衡为：（进入，默认），高成本，；（进入，斗争），低成本，；（不进入，*），其中*表示可以是斗争，也可以是默认。 2 成本信息不对称的古诺博弈例3.10给出的古诺博弈中，每个厂商的成本函数是共同知识。这里，我们假设每个厂商的成本函数是私人信息，具体规定如下：两个企业生产相同产品在同一市场上进行竞争性销售，市场需求函数为，，为产品价格，Q为市场需求量。假设充分大时总有，企业的成本函数为，其中为企业的总成本，为其产量，为其平均成本，为常数且，故也是边际成本。是企业的私人信息，企业不知道但认为在上呈均匀分布，，，。且进一步假定在呈均匀分布是共同知识，，。企业的支付函数是其利润函数因故设静态贝叶斯均衡为，则由均衡战略的类型依存性有于是的期望支付为显然，由概率分布密度的归一化条件及在上呈均匀分布假设，有或即于是，一阶条件：（6.5）同样由对称性有（6.6）在上式两端对进行积分（6.7）在式（6.5）两端对积分（6.8）将式（6.7）代入式（6.8）的右端，得（6.9）由对称性有代入式（6.5）得同理有于是得静态贝叶斯均衡为。当充分大时，和均为非负数。当时，；均衡利润，即成本较高的一方利润较低，产量较低。当时，博弈退化成完全信息静态博弈的场合。为了与例3.26相比较，进一步设，，则这正好回到例3.26的结果。若假设，，，则，这与完全信息博弈均衡相同。若假设，，则，此时每个厂商都误以为对方的成本较自己高的可能性大一些，从而过于自信地扩大产量。相反，若假设，，则，此时每个厂商都误以为对方的成本较自己低的可能性大一些，从而过于谨慎地计划自己的产量。寡头市场两个企业遵循古诺模型，a企业成本c1=20q1，b企业成本c2=60q2，市场需 1、求p=400-q。(1)厂商1和厂商2的反应函数(2)均衡价格和厂商1和厂商2的均衡产量。(3)厂商1和厂商2的利润 1).profit1=q1*[400-(q1+q2)]-20q1 profit2=q2*[400-(q1+q2)]-60q2 分别求偏导：400-2q1-q2-20=0;400-2q2-q1-60=0 反应函数：q1=190-q2/2;q2=170-q1/2 2)联立反应函数，解得q1=140 q2=100 3)profit1=19600;profit2=10000 15

展开阅读全文