博弈论第二章 (1).pdf_咨信网zixin.com.cn

资源描述

2014/9/221第二章完全信息静态博弈完全信息静态博弈即各博弈方同时决策，且所有博弈方对各方收益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。第二章完全信息静态博弈 1、博弈的标准式和纳什均衡 2、应用举例 3、混合策略和纳什均衡的存在性 4 1、博弈的标准式和纳什均衡 2、应用举例 3、混合策略和纳什均衡的存在性 4、二人零和博弈二人零和博弈 1、博弈的标准式和纳什均衡一、博弈的标准式表述二、重复剔除严格劣战略三、纳什均衡1、标准式的三要素(1)参与人(或称为博弈方）(2)每个参与人可选择的战略集(3)收益：针对所有参与人可选择的战略组合，每一个参与人获得的收益一、博弈的标准式表述2014/9/22210:39:535假设一个博弈有假设一个博弈有n个博弈方，博弈方i的策略集个博弈方，博弈方i的策略集(又称策略空间又称策略空间)为S为Si i(i=1,2,(i=1,2,n)，用s,n)，用sijij S Si i表示博弈方i的第j个策略；若s表示博弈方i的第j个策略；若si iSSi i(i=1,2,(i=1,2,n),称s=(s,n),称s=(s1 1,s,s2 2,s,sn n)为一个策略组合；若用s)为一个策略组合；若用s-i-i=(s=(s1 1,s,s2 2,s,si-1i-1,s,si+1i+1,s,sn n),则 s=(s),则 s=(si i,s,s-i-i)。2、博弈的数学表述一、博弈的标准式表述10:39:5362、博弈的数学表述用u用ui i(s)=u(s)=ui i(s(s1 1,s,s2 2,s,sn n)(i=1,2,)(i=1,2,n)表示博弈方i在策略组合s=(s,n)表示博弈方i在策略组合s=(s1 1,s,s2 2,s,sn n)的得益,u)的得益,ui i是策略集S是策略集S1 1SS2 2SSn n上的多元函数。上的多元函数。定义：若一个定义：若一个N人博弈的策略空间为S人博弈的策略空间为Si i,得益函数为：u,得益函数为：ui i(s)=u(s)=ui i(s(s1 1,s,s2 2,s,sn n)(i=1,2,)(i=1,2,n),则该博弈表示为：G=N,S,n),则该博弈表示为：G=N,S1 1,S,S2 2,S,Sn n；u；u1 1,u,u2 2,u,un n。一、博弈的标准式表述3、举例：囚徒困境（用双变量矩阵来描述）双变量矩阵可由任意多的行和列组成，“双变量”指的是在两个博弈方的博弈中，每一个单元格有两个数字，分别表示两个参与者的收益。-5，-50，-8-8，0-1，-1坦白不坦白坦白不坦白囚徒2囚徒2囚徒1囚徒1一、博弈的标准式表述3、举例（2）：斗鸡博弈一、博弈的标准式表述退退BABA进退进进退进独木桥独木桥-3，-32，00，20，0横行代表囚徒1的收益，在两个数字中放在前面；列行代表囚徒2的收益，在两个数字中放在后面。2014/9/2233，-31，-11，-11，-1-1,11，-11，-13，-31，-11，-11，-1-1,11，-11，-13，-31，-11，-11，-1-1,11，-1-1,11，-1-1,13，-31，-11，-11，-1-1,11，-1-1,11，-11，-13，-31，-11，-11，-11，-11，-11，-11，-1-1,13，-31，-11，-11，-1-1,11，-11，-13，-31，-11，-11，-1-1,11，-11，-13，-3一、博弈的标准式表述3、举例（3）：齐王田忌赛马齐王上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌4、注：同时选择战略，不意味着行动必须是同时的；标准式不仅可用来描述静态博弈，也可以用来描述序贯行动的动态博弈，只不过在分析问题时，扩展式博弈更常用。一、博弈的标准式表述1、占优均衡如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，那么这个策略组合肯定是所有博弈方都愿意选择的，必然是该博弈比较稳定的结果。我们称这样的策略组合为该博弈的一个“占优均衡”（Dominant-strategy Equilibrium）。占优均衡是博弈分析中最基本的均衡概念之一，占优均衡分析是最基本的博弈分析方法。囚徒的困境博弈中的（坦白，坦白）实际上就是一个占优均衡。二、重复剔除严格劣战略2、占优均衡分析的局限性并非每个博弈方都有这种绝对偏好的上策，而且常常是所有博弈方都没有上策，因为博弈方的最优策略随其他博弈方的策略而变化正是博弈问题的根本特征，是博弈关系相互依存性的主要表现形式。因此占优均衡不是普遍存在的。例如斗鸡博弈，赛马博弈就没有占优均衡，因为各个博弈方的任何策略都不是绝对最优的，每个博弈方都没有绝对偏好的上策。所以，占优均衡并不能解决所有的博弈问题，最多只是在分析少数博弈时有效。二、重复剔除严格劣战略2014/9/2243、重复剔除严格劣战略（1）、思路和原理反思占优均衡分析的思路，不难发现占优均衡分析釆用的决策思路是一种选择法的思路，是在所有可选择策略中选出最好一种。剔除法与选择法在思路上正好相反，它是通过对可选策略的相互比较，把不可能采用的较差策略排除掉，从而筛选出较好的策略，或者至少缩小候选策略的范围。这种剔除法的思路导出了博弈分析中的重复剔除严格劣战略法（Iterated Elimination of Strictly Dominated Strategies）。二、重复剔除严格劣战略（2）定义一般地，如果在一个博弈中，不管其他博弈方的策略如何变化，一个博弈方的某种策略给他带来的得益，总是比另一种策略给他带来的得益要小，那么我们称前一种策略为相对于后一种策略的一个“严格劣策略”。二、重复剔除严格劣战略（3）、举例（3）、举例为了说明重复剔除严格劣策略法与占优均衡分析的区别，我们用一个例子来说明。首先看下图中这个抽象掉现实问题内容的，两个博弈方分别有三种和两种策略的不对称博弈问题。博弈方1博弈方2博弈方1博弈方21,01,30,10,40,22,0上下左中右博弈方1博弈方2博弈方1博弈方21,01,30,40,2上下左中博弈方1博弈方2博弈方1博弈方21,01,3上左中博弈方2博弈方21,3上中二、重复剔除严格劣战略(4)重复剔除严格劣策略法的缺陷重复剔除严格劣策略也不能解决所有博弈的分析问题。因为在许多博弈问题中，上述相对意义上的严格劣策略往往不存在。如猜硬币、齐威王田忌赛马、石头，剪子，布等赌胜博弈，没有任何博弈方的任何策略是相对其他策略的严格劣策略。此外，在策略数较多的博弈中，重复剔除严格劣策略法只能消去其中的部分策略，不能消去的策略组合并不惟一，因此仍然不能完全解决这些博弈问题。二、重复剔除严格劣战略2014/9/225如果消去的弱劣战略，不是严格劣战略，则消去顺序会影响结果例例：博弈G如下图博弈G如下图：1,81,81,61,62,8 82,8 80,8 0,8 0,8 0,8 0,90,91,51,50,80,80,60,6博弈方博弈方L M R U博弈方SD二、重复剔除严格劣战略10:39:53181,81,81,61,62,8 82,8 80,8 0,8 0,8 0,8 0,90,91,51,50,8 0,8 0,6 0,6 解：解：1）博弈方的策略“）博弈方的策略“L”和“和“M”都是策略“都是策略“R”的弱劣策略的弱劣策略(不是严格劣策略不是严格劣策略)，消去策略“，消去策略“L”和“和“M”后为：后为：USD0,90,80,90,81,81,8R博弈方的策略“博弈方的策略“S”和“和“D”都是策略“都是策略“U”的严格劣策略，消去策略“的严格劣策略，消去策略“S”和“和“D”后剩下唯一策略组合后剩下唯一策略组合（U,R）。L M RU SD10:39:53191,81,81,61,62,8 82,8 80,8 0,8 0,8 0,8 0,90,91,51,50,8 0,8 0,6 0,6 2）博弈方的策略“）博弈方的策略“S”和“和“D”都是策略“都是策略“U”的弱劣策略的弱劣策略(不是严格劣策略不是严格劣策略)，消去策略“，消去策略“S”和“和“D”后为后为:博弈方的策略“博弈方的策略“M”和“和“R”都是策略“都是策略“L”的弱劣策略的弱劣策略(不是严格劣策略不是严格劣策略)，消去策略“，消去策略“M”和“和“L”后剩下唯一策略组合后剩下唯一策略组合（U,L）。L M RU SD1,81,61,81,62,8 2,8 L M R U(重复提出弱劣策略会把纳什均衡剔除掉，保留下来的也未必是纳什均衡)4、划线法（1）思想在具有策略和利益相互依存性的博弈问题中，各个博弈方的收益既取决于自己选择的策略，还与其他博弈方选择的策略有关，因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。根据这种思想，科学的决策思路应该是：先找出自己针对其他博弈方每种策略的最佳对策，即自己的可选策略中与其他博弈方的策略配合，给自己带来最大收益的策略（这种相对最佳对策总是存在的，不过不一定惟一），然后在此基础上，通过对其他博弈方策略选择的判断，包括对其他博弈方对自已策略判断的判断等，预测博弈的可能结果和确定自己趵最优策略。二、重复剔除严格劣战略2014/9/226（2）举例博弈方1博弈方2博弈方1博弈方21,01,30,10,40,22,0上下左中右二、重复剔除严格劣战略例1例1-5，-50，-8-8，0-1，-1坦白不坦白坦白不坦白囚徒2囚徒2囚徒1囚徒1划线法分析囚徒困境二、重复剔除严格劣战略例2例2划线法是一种非常简便的博弈分析方法，由于它以策略之间的相对优劣关系为基础，因此在分析用收益矩阵表示的博弈问题时具有普遍适用性。当然，这并不意味着每个用收益矩阵表示的博弈都可以用划线法求出确定性的博弈结果。事实上，许多博弈根本不存在确定性的结果，当然也就无法用划线法找出这种结果。我们通过一些例子来说明。二、重复剔除严格劣战略-1，11，-11，-1-1，1正面反面正面反面猜硬币方猜硬币方盖硬币方盖硬币方例3、猜硬币博弈例3、猜硬币博弈二、重复剔除严格劣战略2014/9/2272，10，00，01，3时装足球时装足球丈夫丈夫妻子妻子划线法分析夫妻之争二、重复剔除严格劣战略例4、夫妻博弈例4、夫妻博弈二、重复剔除严格劣战略此外，划线法还可以解决三人博弈问题,只是随着决策者人数和策略的增多，用策略式表述越来越复杂此外，划线法还可以解决三人博弈问题,只是随着决策者人数和策略的增多，用策略式表述越来越复杂例 5 投票博弈例 5 投票博弈假定三个参与人1，2，3要在三个项目A,B,C中投票选择一个。规则是同时投票且不允许弃权，得票数最多的项目当选。如果得票数相同，即每个项目一票，则项目A当选。再假设不同项目当选时，三个博弈方的收益表示如下：假定三个参与人1，2，3要在三个项目A,B,C中投票选择一个。规则是同时投票且不允许弃权，得票数最多的项目当选。如果得票数相同，即每个项目一票，则项目A当选。再假设不同项目当选时，三个博弈方的收益表示如下：123123123()()()2()()()1()()()0uAuBuCuBuCuAuCuAuB二、重复剔除严格劣战略解：该博弈共有27种可能的策略组合，需要用三个标准式来描述：解：该博弈共有27种可能的策略组合，需要用三个标准式来描述：2，0，11，2，02，0，12，0，1ABAB参与人2参与人2参参与人1与人1参与人3选A参与人3选A2，0，10，1，22，0，12，0，12，0，1CC二、重复剔除严格劣战略1，2，01，2，02，0，11，2，0ABAB参与人2参与人2参参与人1与人1参与人3选B参与人3选B1，2，00，1，22，0，11，2，02，0，1CC2014/9/228二、重复剔除严格劣战略2，0，11，2，00，1，20，1，2ABAB参与人2参与人2参参与人1与人1参与人3选C参与人3选C0，1，20，1，22，0，12，0，10，1，2CC通过划线法找出的具有稳定性的策略组合，不管是否惟一，都有一个共同的特性，即其中每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。在两人博弈的情况下，就是“给定你的策略,我的策略是我最好的策略；给定我的策略，你的策略也是你最好的策略”。事实上，具有这种性质的策略组合，正是非合作博弈理论中最重要的一个解概念，即博弈中的“纳什均衡”（Nash Equilibrium）。三、纳什均衡纳什一个孤独的天才纳什1928年出生在美国西弗吉尼亚州，他21岁就获得普林斯顿大学博士学位，不到30岁已经闻名遐迩。1950年，纳什发表了他的“非合作博弈”博士论文，引入了著名的“纳什均衡”理论，不但奠定了博弈论的数学基础，而且在后来得到了商业策略家的广泛应用。纳什30岁时得了妄想型精神分裂症，被精神分裂症困扰了30多年。1994年获得诺贝尔经济学奖。2001年获得奥斯卡金像奖的电影美丽心灵讲述的就是纳什的故事。*is在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方i的策略，都是对其余博弈方策略的组合的最佳对策，也即对任意都成立，则称为的一个纳什均衡。),(*niss,;,11nnuuSSG),.,(),.,(*1*1*1*1*1*1niijiiniiiisssssusssssuij iSs),(*niss,;,11nnuuSSG),.,(*1*1*1niissss也称之为纯策略纳什均衡（也称之为纯策略纳什均衡（Pure-strategy Nash Equilibrium,PNE）三、纳什均衡1、纳什均衡的定义1、纳什均衡的定义2014/9/2292、纳什均衡的一致预测性一致预测性一致预测性是是指这样一种性质：如果所有博弈方都预测一个特定的博弈结果会出现，那么所有的博弈方都不会利用该预测或者这种预测能力，选择与预测结果不一致的策略，即没有哪个博弈方有偏离这个预测结果的愿望，因此这个预测结果最终真会成为博弈的结果。即：如果所有博弈方都预测一个特定的纳什均衡会出现，那么，没有人有兴趣作不同的选择。一致预测性是纳什均衡的本质属性。一致预测性使纳什均衡是稳定的和自我强制的。三、纳什均衡3、纳什均衡与重复剔除严格劣策略3、纳什均衡与重复剔除严格劣策略三、纳什均衡占优均衡和纳什均衡之间的关系是：占优均衡是包含在纳什均衡范围之内的，占优均衡肯定是纳什均衡，但纳什均衡不一定是占优均衡。划线法与纳什均衡的关系更清楚，前两者正是在可以用得益矩阵表示的博弈中寻找纳什均衡的方法。纳什均衡和重复剔除严格劣策略法之间的关系要复杂一些，关键是这两者之间是否存在相容性，也即重复剔除严格劣策略法是否会消去纳什均衡？对于纳什均衡和重复剔除严格劣策略法的关系，下面的两个定理给出了答案。35定理1定理1：在：在n个博弈方的博弈G=Sn个博弈方的博弈G=S1 1,S,S2 2,S,Sn n；u；u1 1,u,u2 2,u,un n 中，如果中，如果s s*=(s=(s1*1*,s,s2*2*,s,sn*n*)是G的一个纳什均衡，那么重复剔除严格劣策略法一定不会将它消去。是G的一个纳什均衡，那么重复剔除严格劣策略法一定不会将它消去。证：用反证法：证：用反证法：设策略组合设策略组合(s(s1*1*,s,s2*2*,s,sn*n*)是博弈G的一个纳什均衡，且博弈方i的策略s是博弈G的一个纳什均衡，且博弈方i的策略si*i*，是该策略组合中第一个由于相对于该博弈方的其他策略是严格劣测而被消去的策略(也许是在其他某些策略被消去以后)。则必然存在博弈方i的某个策略，是该策略组合中第一个由于相对于该博弈方的其他策略是严格劣测而被消去的策略(也许是在其他某些策略被消去以后)。则必然存在博弈方i的某个策略s sii，该，该s sii在在s si*i*被消去的时候还没有被消去，并且是相对于被消去的时候还没有被消去，并且是相对于s si*i*的占优策略，即满足：的占优策略，即满足：三、纳什均衡u ui i(s(sii,s,s-i-i)u)ui i(s(sii,s,s-i-i)(1)对任意由其他博弈方此时尚未消去的所有策略构成的策略组合s(1)对任意由其他博弈方此时尚未消去的所有策略构成的策略组合s-i-i=(s=(s1 1,s,si-1i-1,s,si+1i+1,s,sn n)都成立)都成立。由于假设s由于假设sii是纳什均衡是纳什均衡(s(s1*1*,s,s2*2*,s,sn*n*)的各方策略中第一个被消去的，因此其他博弈方的策略s的各方策略中第一个被消去的，因此其他博弈方的策略s11,s,si-1i-1,s,si+1i+1,s,snn，在s，在sii被消去的时候都还没有被消去，于是对s被消去的时候都还没有被消去，于是对s-i-i=(s=(s1 1,s,si-1i-1,s,si+1i+1,s,snn)也必须成立即:)也必须成立即:u ui i(s(sii,s,s-i*-i*)u)ui i(s(sii,s,s-i*-i*)(2)(2)三、纳什均衡2014/9/221010:39:5337这显然与(s这显然与(s1*1*,s,s2*2*,s,sn*n*)是纳什均衡策略组合的假设相矛盾，因为不等式(2)表明s)是纳什均衡策略组合的假设相矛盾，因为不等式(2)表明sii不是博弈方i对其他博弈方的策略组合的最佳反应。该矛盾证明了开头所作的：纳什均衡被重复剔除严格劣策略法消去的假设是不可能成立的，这样定理1就得到了证明。不是博弈方i对其他博弈方的策略组合的最佳反应。该矛盾证明了开头所作的：纳什均衡被重复剔除严格劣策略法消去的假设是不可能成立的，这样定理1就得到了证明。三、纳什均衡10:39:5338定理2：定理2：在n 个博弈方的博弈G中，如果重复剔除严格劣策略法排除了除在n 个博弈方的博弈G中，如果重复剔除严格劣策略法排除了除s s*=(s=(s1*1*,s,s2*2*,s,sn*n*)之外的所有策略组合，那么之外的所有策略组合，那么s s*一定是该博弈惟一的纳什均衡。一定是该博弈惟一的纳什均衡。证：证：定理2的后半部分即唯一性可由定理1的结论得到证明。下面用反证法证明前半部分：定理2的后半部分即唯一性可由定理1的结论得到证明。下面用反证法证明前半部分：三、纳什均衡设重复剔除严格劣策略法已经消去除了设重复剔除严格劣策略法已经消去除了s s*=(s=(s1*1*,s,s2*2*,s,sn*n*)以外的所有策略组合。但s以外的所有策略组合。但s*却不是一个纳什均衡。就是说，至少存在某个博弈方i的某个策略却不是一个纳什均衡。就是说，至少存在某个博弈方i的某个策略s si i使得：使得：u ui i(s(si i,s,s-i*-i*)u)ui i(s(si*i*,s,s-i*-i*)(1)(1)但由于但由于s s*是经过重复剔除严格劣策略法以后留下的惟一策略组合，因此是经过重复剔除严格劣策略法以后留下的惟一策略组合，因此s si i必然是被重复剔除严格劣策略法消去的策略。也就是说，在重复剔除严格劣策略的反复消去过程中的某个阶段，必然存在某个当时还没有被消去的策略必然是被重复剔除严格劣策略法消去的策略。也就是说，在重复剔除严格劣策略的反复消去过程中的某个阶段，必然存在某个当时还没有被消去的策略s sii使得：使得：三、纳什均衡u ui i(s(si i,s,s-i-i)u)ui i(s(si i,s,s-i-i)(2)(2)对由此时尚未被消去的，其他博弈方的策略构成的所有策略组合对由此时尚未被消去的，其他博弈方的策略构成的所有策略组合s s-i-i都成立。由于都成立。由于s s*是本博弈经过重复剔除严格劣策略法以后惟一留下的策略组合，因此策略s是本博弈经过重复剔除严格劣策略法以后惟一留下的策略组合，因此策略s11,s,si-1i-1,s,si+1i+1,s,snn始终不会被消去，因此也应该满足(2)式，即:始终不会被消去，因此也应该满足(2)式，即:u ui i(s(si i/,s,s-i*-i*)u)ui i(s(si i,s,s-i*-i*)(3)(3)三、纳什均衡2014/9/221110:39:5341如果如果s si/i/就是就是s si*i*,即即s si*i*是相对于是相对于s si i的严格占优策略，则(3)式和(1)式相矛盾，从而的严格占优策略，则(3)式和(1)式相矛盾，从而s s*不是纳什均衡的假设不能成立。这就证明了定理不是纳什均衡的假设不能成立。这就证明了定理。如果如果s si/i/与与s si*i*不同，则不同，则s si/i/在重复剔除严格劣策略的过程中也必须被消去(要不然在重复剔除严格劣策略的过程中也必须被消去(要不然s s*就不会是留下的惟一的策略组合)。就不会是留下的惟一的策略组合)。三、纳什均衡10:39:5342进一步推定在某阶段存在进一步推定在某阶段存在s si/i/是相对于是相对于s si/i/的的严格占优策略，用严格占优策略，用s si/i/和和s si/i/分别代替分别代替s si/i/和和s si i时，(2)式和(3)式仍然必须成立，如果时，(2)式和(3)式仍然必须成立，如果s si/i/就是就是s si*i*，则与上相同也证明了定理。否则用，则与上相同也证明了定理。否则用s si/i/代替代替s si/i/重复上述过程。这样，总会找到某个重复上述过程。这样，总会找到某个s si(k)i(k)就是就是s si*i*,从而证明在前述假设下必然导致(1)式和(3)式的矛盾，否定前述假设成立的可能性，由此证明了定理2。从而证明在前述假设下必然导致(1)式和(3)式的矛盾，否定前述假设成立的可能性，由此证明了定理2。三、纳什均衡43根据上一节的分析已经明白，分析完全信息静态博弈的关键是找出其中的纳什均衡。但前面所讨论都是可通过策略之间的两两比较进行分析的有限策略博弈模型。在无限策略、连续策略空间的博弈中，纳什均衡的概念同样适用。我们通过具体模型来说明这种博弈的纳什均衡分析方法。根据上一节的分析已经明白，分析完全信息静态博弈的关键是找出其中的纳什均衡。但前面所讨论都是可通过策略之间的两两比较进行分析的有限策略博弈模型。在无限策略、连续策略空间的博弈中，纳什均衡的概念同样适用。我们通过具体模型来说明这种博弈的纳什均衡分析方法。2、应用举例 2、应用举例一、古诺模型二、伯特兰德寡头模型三、公共资源问题四、反应函数的局限性 2、应用举例 2、应用举例2014/9/221210:39:5345一、古诺（Cournot）模型一、古诺（Cournot）模型古诺模型是研究寡头垄断市场的古诺模型是研究寡头垄断市场的经典模型经典模型，在古诺模型中,假设一个市场有两家生产同一种产品的厂商。如果厂商1的产量为q，在古诺模型中,假设一个市场有两家生产同一种产品的厂商。如果厂商1的产量为q1 1，厂商2的产量为q，厂商2的产量为q2 2，则市场总产量为，则市场总产量为QqQq1 1十q十q2 2。设市场出清价格P(即可以将产品全部卖出去的价格)是市场总产量的函数(即逆需求函数)设市场出清价格P(即可以将产品全部卖出去的价格)是市场总产量的函数(即逆需求函数)P=P(Q）a-QP=P(Q）a-Q。再设两厂商有相同的单位生产成本。再设两厂商有相同的单位生产成本c c1 1=c=c2 2=c=c,且都没有固定成本，则该博弈中两博弈方的,且都没有固定成本，则该博弈中两博弈方的收益收益(即两厂商各目的利润)分别为:(即两厂商各目的利润)分别为:和和虽然本博弈中两博弈方都有虽然本博弈中两博弈方都有无限多种无限多种可选策略，但根据纳什均衡的定义我们知道，纳什均衡就是具有相互是最优对策性质的各博弈方策略组成的策略组合。可选策略，但根据纳什均衡的定义我们知道，纳什均衡就是具有相互是最优对策性质的各博弈方策略组成的策略组合。11211)(),(cqQpqqqu1211)(cqqqaq22212)(),(cqQpqqqu2212)(cqqqaq(1)(2)一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:534712*1121*2122max()max()qqq aqqcqq aqqcq因此，如果假设策略组合因此，如果假设策略组合(q(q1*1*,q,q2*2*)是本博弈的纳什均衡，则(q是本博弈的纳什均衡，则(q1*1*,q,q2*2*)必须是使得两博弈方的收益达到最大值,即满足:)必须是使得两博弈方的收益达到最大值,即满足:一、古诺（Cournot）模型一、古诺（Cournot）模型要求上式的最大值,只需(1)、(2)两式分别对q要求上式的最大值,只需(1)、(2)两式分别对q1 1、q、q2 2求偏导并令两个偏导数都等于零,由此可得q求偏导并令两个偏导数都等于零,由此可得q1*1*,q,q2*2*应满足方程组:应满足方程组:112121222020uacqqquacqqq 一、古诺（Cournot）模型一、古诺（Cournot）模型2014/9/2213解之得该方程组唯解之得该方程组唯的一组解:的一组解:*121()3qqac两博弈方的均衡得益(利润)分别为:均衡总产量为：两博弈方的均衡得益(利润)分别为:均衡总产量为：*122()3Qqqac*21122121(,)(,)()9uqquqqac具体地具体地,若设若设:=8,=2ac则则:*1212=2,=4,=4qqQuu一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5350如果想对上述博弈结果作效率评价，可以再从两厂商总体利益最大化的角度作一次产量选择，根据已知条件求实现总得益(总利润)最大的总产量。设总产量为Q，则总得益为如果想对上述博弈结果作效率评价，可以再从两厂商总体利益最大化的角度作一次产量选择，根据已知条件求实现总得益(总利润)最大的总产量。设总产量为Q，则总得益为UPQ cQQ(8Q)2Q6Q QUPQ cQQ(8Q)2Q6Q Q2 2。很容易求得使总得益最大的总产量。很容易求得使总得益最大的总产量Q*3Q*3，最大总得益，最大总得益U*9U*9。一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5351将此结果与两厂商独立决策，追求自身而不是共同利益最大化时的博弈结果相比，不难发现此时总产量较小，而总利润却较高。因此从两厂商的总体来看，根据总体利益最大化确定产量效率更高。换句话说，如果两厂商更多考虑合作，联合起来决定产量，先定出使总利益最大的产量后各自生产一半(将此结果与两厂商独立决策，追求自身而不是共同利益最大化时的博弈结果相比，不难发现此时总产量较小，而总利润却较高。因此从两厂商的总体来看，根据总体利益最大化确定产量效率更高。换句话说，如果两厂商更多考虑合作，联合起来决定产量，先定出使总利益最大的产量后各自生产一半(1.5,1.51.5,1.5单位)，则各自可分享到的利益为单位)，则各自可分享到的利益为4.54.5，比只考虑自身利益的独立决策行为得到的利益要高。，比只考虑自身利益的独立决策行为得到的利益要高。一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5352当然，在独立决策、缺乏协调机制的两个企业之间，上述合作的结果并不容易实现，即使实现了也往往是不稳定的。合作难以实现或维持的原因主要是：各生产一半实现最大总利润产量的产量组合当然，在独立决策、缺乏协调机制的两个企业之间，上述合作的结果并不容易实现，即使实现了也往往是不稳定的。合作难以实现或维持的原因主要是：各生产一半实现最大总利润产量的产量组合(1.5,1.5）(1.5,1.5）不是该博弈的纳什均衡策略组合。不是该博弈的纳什均衡策略组合。一、古诺（Cournot）模型一、古诺（Cournot）模型2014/9/221410:39:5453也就是说，在这个策略组合下，双力都可以通过独自改变(增加)自己的产量而得到更高的利润，它们都有突破1.5单位产量的冲动。在缺乏由强制作用的协议等保障手段的情况下，这种冲动注定了维持上述较低水平的产量组合是不可能的，两厂商早晚都会增产，只有达到纳什均衡的产量水平也就是说，在这个策略组合下，双力都可以通过独自改变(增加)自己的产量而得到更高的利润，它们都有突破1.5单位产量的冲动。在缺乏由强制作用的协议等保障手段的情况下，这种冲动注定了维持上述较低水平的产量组合是不可能的，两厂商早晚都会增产，只有达到纳什均衡的产量水平(2，2)(2，2)时才会稳定下来。因为只有这时候任一厂商单独改变产量才不利于自己，这实际上也是一种时才会稳定下来。因为只有这时候任一厂商单独改变产量才不利于自己，这实际上也是一种“囚徒困境”“囚徒困境”，如果将遵守限额还是突破限额作为厂商面临的选择，则构成了得益矩阵如下图的博弈。，如果将遵守限额还是突破限额作为厂商面临的选择，则构成了得益矩阵如下图的博弈。一、古诺（Cournot）模型一、古诺（Cournot）模型4.5,4.53.75,55,3.754,4厂商2不突破突破厂商2不突破突破当然不难看出该博弈是一个囚徒困境博弈。上述两寡头产量博弈只是古诺模型中比较简单的一个特例，更一般的古诺模型是包括n 个寡头的寡占市场产量决策。但其分析方法是一样的。典型例子：当然不难看出该博弈是一个囚徒困境博弈。上述两寡头产量博弈只是古诺模型中比较简单的一个特例，更一般的古诺模型是包括n 个寡头的寡占市场产量决策。但其分析方法是一样的。典型例子：石油输出国组织的限额和突破问题石油输出国组织的限额和突破问题F4F4厂商1不突破突破厂商1不突破突破一、古诺（Cournot）模型一、古诺（Cournot）模型2、反应函数2、反应函数古诺模型的纳什均衡也可以通过对划线法思路的推广来求，划线法的思路是先找出古诺模型的纳什均衡也可以通过对划线法思路的推广来求，划线法的思路是先找出每个博弈方每个博弈方针对针对其他博弈方所有策略其他博弈方所有策略(或策略组合)的(或策略组合)的最佳最佳对策，然后再找出相互构成最佳对策的各博弈方策略组成的策略组合，也就是博弈的纳什均衡。对策，然后再找出相互构成最佳对策的各博弈方策略组成的策略组合，也就是博弈的纳什均衡。在无限策略的古诺博弈模型中这样的思路实际上也是可行的，只是其他博弈方的策略现在有无限多种，因此各个博弈方的最佳对策也有无限种，它们之间往往构成一种连续函数关系。在无限策略的古诺博弈模型中这样的思路实际上也是可行的，只是其他博弈方的策略现在有无限多种，因此各个博弈方的最佳对策也有无限种，它们之间往往构成一种连续函数关系。一、古诺（Cournot）模型一、古诺（Cournot）模型在上面讨论的两寡头古诺模型中，对厂商2的任意产量q在上面讨论的两寡头古诺模型中，对厂商2的任意产量q2 2，厂商1的最佳对策产量q，厂商1的最佳对策产量q1 1，就是使己在厂商2生产产量q，就是使己在厂商2生产产量q2 2的情况下利润最大化的产量，即q的情况下利润最大化的产量，即q1 1是最大化问题：是最大化问题：11121max(6)2 qqqqq的解。上式对q的解。上式对q1 1求导并令导数等于0：求导并令导数等于0：1121620uqqq由此得：由此得：11221()(6)2qR qq2、反应函数2、反应函数一、古诺（Cournot）模型一、古诺（Cournot）模型2014/9/221510:39:5457这样我们得到了对于厂商2的每个可能的产量，厂商1的这样我们得到了对于厂商2的每个可能的产量，厂商1的最佳对策最佳对策产量的计算公式，它是厂商2产量的一个连续函数，我们称这个连续函数为厂商1对厂商2产量的一个产量的计算公式，它是厂商2产量的一个连续函数，我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”“反应函数”(Reaction Function)。同样的方法，我们可再求出厂商2对厂商1产量q(Reaction Function)。同样的方法，我们可再求出厂商2对厂商1产量q1 1的反应函数：的反应函数：22111()(6)2qR qqq q2 26363q q1 1由于这两个反应函数都是连续的线性函数，因此可以用坐标平面上的两条直线表示它们,如图:由于这两个反应函数都是连续的线性函数，因此可以用坐标平面上的两条直线表示它们,如图:21()R q12()R q(2,2)2、反应函数2、反应函数一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5458从图中可以看出，当一方的产量选择为0时，另一方的从图中可以看出，当一方的产量选择为0时，另一方的最佳反应为3最佳反应为3。这正是实现市场总利润最大的产量，因为这时候等于由一个厂商垄断市场，市场总体利润就是该厂商的利益；当一方的产量达到6时，另一方。这正是实现市场总利润最大的产量，因为这时候等于由一个厂商垄断市场，市场总体利润就是该厂商的利益；当一方的产量达到6时，另一方被迫选择0被迫选择0，因为这时后者坚持生产已经，因为这时后者坚持生产已经无利可图无利可图。在两个反应函数对应的两条直线上，只有它们的交点在两个反应函数对应的两条直线上，只有它们的交点(2，2)(2，2)代表的产量组合，才是由相互对对方的最佳反应产量构成的。R代表的产量组合，才是由相互对对方的最佳反应产量构成的。R1 1(q(q2 2)上的其他所有点(q)上的其他所有点(q1 1,q,q2 2)只有q)只有q1 1是对q是对q2 2的的最佳反应最佳反应，q，q2 2不是不是对q对q1 1的最佳反应，而R的最佳反应，而R2 2(q(q1 1)上的点则刚好相反。)上的点则刚好相反。2、反应函数2、反应函数一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5459根据纳什均衡的定义，根据纳什均衡的定义，(2，2)(2，2)是该古诺模型的纳什均衡，并且因为它是惟一的一个，因此应该是该是该古诺模型的纳什均衡，并且因为它是惟一的一个，因此应该是该博弈的结果博弈的结果。这个结论与前面直接根据纳什均衡定义得到的完全样。这个结论与前面直接根据纳什均衡定义得到的完全样。2、反应函数2、反应函数一、古诺（Cournot）模型一、古诺（Cournot）模型10:39:5460现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德1883年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于，伯特兰德模型中各厂商所选择的是现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德1883年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于，伯特兰德模型中各厂商所选择的是价格价格而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。二、伯特兰德(Bertrand)寡头模型二、伯特兰德(Bertrand)寡头模型2014/9/221610:39:5461上述产品有一定差别是指两个厂商生产的是同类产品，但在品牌、质量和包装等方面有所不同，因此伯特兰德模型中厂商的产品之间有很强的上述产品有一定差别是指两个厂商生产的是同类产品，但在品牌、质量和包装等方面有所不同，因此伯特兰德模型中厂商的产品之间有很强的替代性替代性。但又不是完全可替代，即价格不同时，价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P。但又不是完全可替代，即价格不同时，价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P1 1和P和P2 2时，它们各自的时，它们各自的需求函数需求函数为：为：111211 112(,)=qq P Pab Pd P221222221(,)=qq P Pab Pd P和和二、伯特兰德(Bertrand)寡头模型二、伯特兰德(Bertrand)寡头模型10:39:5462从上式可以看出产品之间是有差别的，其中d从上式可以看出产品之间是有差别的，其中d1 1，d

展开阅读全文