关于定价的博弈论模型.doc-资源下载-咨信网让知识获取变得高效

关于定价的博弈论模型.doc

1、CH13 关于定价的博弈论模型分析寡头市场的最大困难在于策略问题。在此情形下，市场上仅有几家企业，每一家企业在做决策时，都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。一、基本概念在一些情况下，个人或企业必须作出策略性选择，并且最终的结果依赖于每一个行动者的选择，这种情况就可以看成是一个博弈。1博弈的三要素任何一个博弈都必须具备三个要素：（1）博弈的参与者参与人的具体身份无关紧要，在博弈中没有“好人”与“坏蛋”之分，我们只是简单地假设每个参与者在考虑到对手行为的前提下，做出最有利的策略性选择。（2）策略策略是博弈参与者的行动规则。在非合作博弈中，参与者之间不能

2、就策略选择达成一个有约束力的协议。（3）支付（payoffs）支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面，既包括显性的货币报酬，也包括隐性的参与者关于结果的心理感受。2. 符号两个参与者（A和B）之间的博弈G用下式表示其中，和分别表示参与者A和参与者B的可选策略，和分别表示当参与者A和B分别选择策略a和策略b时，各自所得到的支付（）。二、Nash均衡市场均衡：在均衡价格和产量下，买方和卖方都没有动力去改变自己的行为。Nash均衡：对于策略组合（），如果给定其它参与者的策略，没有一个参与者会选择单方面偏离，那么这个策略组合就构成一个Nash均衡。也就是说对于所有对于所有对纳

3、什均衡的理解设想所有参与者在博弈之前达成一个（没有约束力的）协议，规定每个参与人选择一个特定的战略。那么，给定其他参与人都遵守此协议，是否有人不愿意遵守此协议？如果没有参与人有积极性单方面背离此协议，我们说这个协议是可以自动实施的（self-enforcing），这个协议就构成一个纳什均衡。否则，它就不是一个纳什均衡。三、一个例子两个厂商（A和B）决定自己花多少钱用于做广告。每个厂商可以选择较高的预算（H）或较低的预算（L）。1博弈的扩展式表述图13.12博弈的策略式（规范式）表述表13.13占优策略和Nash均衡从表13.1可以看出，低预算（L）是厂商B的占优策略，即不管厂商A选择哪一种策略

4、，L都是厂商B的最佳选择。由于该博弈的结构是公共知识，厂商A也知道L是厂商B的占优策略，所以厂商A将选择L。因此，该博弈的均衡是（L，L）。请验证（L，L）构成一个Nash均衡，而其它三个策略组合都不是Nash均衡。四、混合策略Nash均衡上面的博弈存在唯一的Nash均衡，但是并非所有博弈都是如此。在下图所示的猜谜博弈中，没有上述意义上的Nash均衡存在；而在“性别之战”博弈中，存在两个Nash均衡。儿童BH(正面)T(反面)儿童AH(正面)1,-1-1,1T(反面)-1,11,-1表13.2 猜谜博弈表13.3 “性别之战”Nash均衡不存在的一个主要原因是参与人的策略较少，缺乏灵活性。在以

5、下两种情况下，参与者的潜在策略数无穷大，就可以保证博弈至少存在一个均衡：（1）参与者的策略是某一区间内的连续变量（比如厂商对产量或价格的选择）；（2）参与者使用混合策略以一定的概率选择某种概率。相应地，以概率1选择某种行动的策略叫做“纯策略”。下面，我们来求解“猜谜博弈”的混合策略Nash均衡。Suppose that the players decide to randomize amongst his strategies and play a mixed strategy. Player A could flip a coin and play H with probability r

6、and T with probability 1-r , and player B flip a coin and play H with probability s and T with probability 1-s.Given these probabilities, the outcomes of the game occur with the following probabilities: H-H , rs; H-T, r(1-s); T-H, (1-r)s; T-T,(1-r)(1-s). Player As expected utility is then given by O

7、viously, As optimal choice of r depends on Bs probability, s. If , utility is maximized by choosing . If , A should opt for . And when , As expected utility is 0 no matter what value of r is choosen. As best response function is For player B, expected utility is given by Now, when , Bs expected util

8、ity is maximized by choosing . If , A should opt for . And when , As expected utility is independent of what s is choosen. Bs best response function is Nash equilibria are shown in the figure by the intersections of optimal response curves for A and B.Or, we can get the equilibrium through the FOC 对

9、上式的理解：在给定参与人B采用混合战略的情况下，如果混合战略是参与人A的最优选择，必有。同样的，在给定参与人A采用混合战略的情况下，如果混合战略是参与人B的最优选择，必有。这样，混合策略Nash均衡就可以由以下两式得到即这样很容易就可以得到上面的混合策略Nash均衡。四、囚徒困境囚徒B坦白抵赖囚徒A坦白-3，-30.5，-10抵赖-10，0.5-2，-2表13.3 囚徒困境抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the game since every playe

10、r will 坦白. Notice that I dont have to know anything about the other player. 囚徒困境：个人理性与集体理性之间的矛盾。This result highlights the value of commitment in the Prisoners dilemma commitment consists of credibly playing strategy 抵赖. 囚徒困境的广泛应用：军备竞赛、卡特尔、公共品的供给。五、动态博弈参与人A首先行动，参与人B在观察到参与人A的行动以后，再行动。相对于动态博弈，参与者同时行动，

11、或者虽然行动上又先后，但是后行动者不能观察到先行动者的选择的博弈叫做静态博弈。1. 扩展式表述图13.22策略式表述表13.4请注意企业B的策略和策略空间。策略是对行动规则的完备描述，由于在参与者A选择以后，参与者B可能面临两种情况参与者A选择了H或者选择了L，因此，参与者B的策略就要分别描述这两种情况下自己的行动选择。以策略（L，H）为例，它表示如果参与人A选择了L，那么参与人B就选择L，如果参与人A选择了H，那么参与人B也选择H。3. 均衡（1）Nash均衡根据表13.4的策略式表述，该博弈一共有3个纯策略Nash均衡：L, (L, L)、L, (L, H)和H, (H,L)。其中，L,

12、(L, H)和H, (H,L)并不合理。以H, (H,L)为例，参与人A之所以选择H，是因为他相信如果自己选择了L，参与人B将选择H。但是很明显，参与人B的这一“威胁”并不可信。因为一旦参与人A真的选择了L，对参与人B来说，最有选择是L而不是H。策略组合L, (L, H)同样存在这一问题。只有L, (L, L)是唯一合理的均衡。因此，Nash均衡不能剔除动态博弈中的不可信威胁。为了得到更为合理的均衡，我们需要更强的均衡概念。（2）子博弈精炼（完备）均衡（Subgame Perfect Equilibrium）定义：一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结（包括终点结）组成，它

13、不能切割原博弈的信息集。图13.2中的博弈包含3个子博弈原博弈本身以及由参与者B的两个决策结点开始的两个子博弈；而图13.1中的博弈仅包含1个子博弈，那就是原博弈本身。定义：如果策略组合在每一个子博弈上都构成Nash均衡，那么，该策略组合构成子博弈精炼（完备）均衡。运用逆向归纳法，我们可以剔除不可信威胁，得到子博弈精炼均衡L, (L, L)。六、重复博弈在重复博弈中，参与者的策略集扩大。在这种博弈中，前期的行动结果可能影响到后期的行动选择，因此，需要考虑可信威胁和子博弈精炼的问题。重复博弈的结果受博弈重复次数的影响很大。1有限期重复博弈BLRAU1，13，0D0，32，2表13.5很容易看出，

14、该博弈的唯一Nash均衡是（U，L）一个典型的囚徒困境博弈。由逆向归纳法可知，在重复次数有限的情况下，重复博弈的唯一子博弈精炼均衡是每一期博弈的策略组合都是（U，L）即简单地重复单期博弈的Nash均衡。2无限期重复博弈上述逻辑在无限期重复博弈中不再适用。在无限期博弈中，逆向归纳法没有一个起始点。在此情形下，参与者可以宣布自己将采用“触发策略”（trigger strategy）从第一期开始，自己一直采用最优的合作策略，即（D，R），只要其它参与者也这样做；一旦发现有人背离此策略组合，将永远采用单期Nash均衡策略（U，L）。要使两个参与人都采用触发策略成为一个子博弈精炼均衡，必须使该威胁（承诺

15、）可信。假设在第K期，参与人A宣布自己将采用触发策略，在该期合作，那么参与人B有无动力背离？如果参与人B合作，在每一期都可以得到2；如果背离（选择L），在第K期得到3，而在随后的每一期得到1。以表示贴现因子。如果合作，参与人B的总收益的现值是如果背离，参与人B的总收益的现值是参与人选择合作当且仅当即也就是说，只要参与人有足够的耐心，合作就可以实现。这就是著名的“无名氏定理”的主要内容。七、静态博弈中的定价假设有两个企业，A和B，均以不变的边际成本c生产相同的产品。每个企业的策略是选择各自的价格，和。显然，价格不可能小于c。由于两家企业的产品是同质的，因此，如果，我们假设两家企业的市场份

16、额相等。1Bertrand-Nash均衡假设两家企业的生产能力不受限制。该博弈的唯一均衡是。如果企业A的价格高于c，企业B将选择一个比稍低的价格得到这个市场，并取得正的利润。2生产能力约束：Cournot均衡假设双寡头垄断中的每个厂商必须选择一个有特定能力的产出水平，在该产出水平范围内，边际成本为常数，高于此水平则边际成本无穷大。显然，厂商首先选择产出量然后选择价格的两阶段博弈与古诺竞争的实质是一样的。一旦厂商确定了生产能力（产量），唯一可行的价格就是使市场需求量等于两个厂商市场能力之和的价格。假设两家厂商的生产能力非别为和，并且，其中是逆需求函数。如果，总需求超过产业总产量，那么任意一家企业

17、都可以通过略微提高价格（仍然能够卖出）以获取正的利润。因此，不可能是一个均衡。另一方面，如果，厂商A可以稍微降低一点自己的价格，将自己的销量提高到，也能获得更多的利润。因此，也不可能是一个均衡。唯一的均衡就是。在Cournot竞争和Bertrand竞争中，厂商数目都是两个，但是二者的均衡迥异，这说明博弈（资源配置）结果高度依赖于竞争的具体形式。3重复博弈和默契合谋假设Bertrand博弈可以无限期地重复下去，贴现因子为（或者假设贴现因子为1，但是在每一期，博弈继续进行的概率都为）。在情形下，两个厂商都实行“触发策略”是可能的。假设垄断价格为。假设两家企业从一开始就选择价格，如果发现有厂商偏离此

18、价格，则在后续博弈中一直选择完全竞争价格c。如果某家厂商在第K期背离，选择一个略低于的价格得到整个市场，并因此得到垄断利润（实际上略低于此）。由于在后续博弈中，对方会采用触发策略进行惩罚，利润为零。因此，背离的总收益为。如果不背离，两家厂商在每一期都得到。因此，没有厂商选择背离当且仅当即默契合谋成立的条件：（1）厂商A的背叛行为很容易被厂商B察觉；（2）厂商B愿意长期采取自损性惩罚行为。八、承诺性投资和进入阻止在以前讨论厂商进入或退出市场时，都没有考虑厂商之间的策略性行为。实际上，厂商在决定进入或退出市场时，一般都会猜测其行为对于其对手的行为以及未来市场价格的影响。在图13.6中，在位企业（企业1）可以通过不可转移的投资（sunk cost），阻止竞争对手（企业2）进入市场。因为有了这种不可转移的投资，企业1的“打击”威胁变得可信。图13.6P460，Example15.7 自学。九、进入和不完全信息十、不完全信息博弈9

邮箱/手机：
验证码：	获取验证码
温馨提示：	支付成功后，系统会自动生成账号（用户名为邮箱或者手机号，密码是验证码），方便下次登录下载和查询订单；
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？