1、第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。1本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展22.1 基本分析思路和方法2.1.1 上策均衡2.1.2 严格下策反复消去法2.1.3 划线法2.1.4
2、箭头法32.1.1 上策均衡上策上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果n上策均衡不是普遍存在的4n为什么上策均衡不是普遍存在的?因为博弈方的最优策略随其他博弈方的策略而变化正是博弈问题的根本特征,是博弈关系相互依存性的主要表现形式。如齐王田忌赛马,古诺产量博弈、猜硬币等。n任何策略都不是绝对最优的,每个博弈方都没有绝对偏好的上策。n上策均衡不普遍存在正是博弈理论的价值所在。
3、如果普遍存在,与一般的个人优化问题没有实质区别,博弈分析也就不会有什么新意,更不可能成为一门独立的理论,更不可能成为一种重要的、革命的理论方法了。5 2.1.2 严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略n与上策均衡的区别与联系:1.上策均衡是一种选择法的思路,即从所有可选策略中选出最好一种的思路。而严格下策是一种排除的思路,即排除法。两种在形式上正好相反。如囚徒困境中“不坦白”是“坦白”的严格下策。62.有些博弈不存在上策均衡但却存在某些严格下策,因此只可以运用严格下策反复消去法而不能运用上策均衡。一般来说,
4、严格下策反复消去法比上策均衡分析的适用面要广一些。如下列博弈:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中7n严格下策反复消去法能否解决所有的博弈问题呢?n不能。如猜硬币、齐王田忌赛马、石头剪刀布等赌胜博弈。失效的原因是什么呢?n仍然是在典型的博弈问题中,博弈方之间普遍存在策略依存的特征。也就是说,一个博弈方的不同策略之间,往往不存在绝对的优劣关系,而只存在相对的、有条件的优劣关系。因此利用策略之间的绝对优劣关系分析筛选的严格下策反复消去法也无法应用。因此也不能成为博弈分析的一般方法论。82.1.3 划线法基于上策均衡和严格下策反复消去法的局限性,
5、我们必须进一步寻找更普遍适用的博弈分析方法,那应该向什么方向寻找这种方法呢?必然是以策略之间的相对优劣关系,而不是绝对优劣关系为基础的适用性较强的博弈分析方法。-划线法科学的决策思路应是:科学的决策思路应是:先找出自已针对其他博弈方每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,但不一定唯一),然后在些基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。92.1.3 划线法方法:方法:对于其他博弈方每一种策略或者策略组合,找出自己的最佳策略
6、,并在得益上划线。应用1,01,30,10,40,22,0左中右上下博弈方1博弈方210-5,-50,-8-8,0-1,-1囚囚徒徒困困境境由此可见,划线法是一种非常简便的博弈分析方法,由于它以策略之间的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈问题时具有普遍适用性。但并不意味着每个用得益矩阵表示的博弈都可以用划线法求出确定性的博弈结果。事实上,许多博弈根本不存在确定性的结果,当然也就无法用划线法找出这种结果。11 意味着猜硬币博弈中没有哪一个策略组合的双方策略,相互都是对对方策略的最佳对策略。-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争 意味着
7、博弈中有两个策略组合都是对对方策略的最佳对策略。12 值得强调的是:虽然猜硬币和夫妻之争博弈中,划线法也没有完全解决博弈的最终结果的问题,但它至少已经使我们对它们的博弈方策略偏好之间的一致不一致、共同利益和矛盾冲突的情况有了更加清楚的认识,这对进一步解析这些博弈中博弈方的行为有很重要的意义。因此,与在这些博弈问题中根本无法运用的严格下策反复消去法相比,划线法还是有优势的,这一点在分析更复杂的博弈模型时会表现的更加明显。132.1.4 箭头法-5,-50,-8-8,0-1,-1囚囚徒徒困困境境箭头法基本思路:对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略
8、而增加得益。如果能,用箭头指示得益增加的方向。应用142.1.4 箭头法1,01,30,10,40,22,0-1,11,-11,-1-1,1猜猜硬硬币币152.1.4 箭头法2,10,00,01,3夫夫妻妻之之争争箭头法与划线法的联系与区别:两者都是基于相对优劣关系进行分析的,得到的结论也都是一致的,因此是可以相互替代的方法。但他们分析的思路和角度是不同的。162.2 纳什均衡2.2.1 纳什均衡的定义2.2.2 纳什均衡的一致预测性质2.2.3 纳什均衡与严格下策反复消去法17 划线法或箭头法找出的具有稳定性的策略组合,不管是否惟一,都有一个共同的特性,就是其中每个博弈方的策略都是针对其他博
9、弈方策略或策略组合的最佳对策。事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个解概念,即博弈中的“纳什均衡”。182.2.1 纳什均衡的定义n策略空间:n博弈方 的第 个策略:n博弈方 的得益:n博弈:纳什均衡纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡192.2.2 纳什均衡的一致预测性质一致预测一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这
10、个预测结果的愿望,因此预测结果会成为博弈的最终结果n只有纳什均衡才具有一致预测的性质n一致预测性是纳什均衡的本质属性n一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能20值得注意的是:值得注意的是:n虽然纳什均衡是博弈结果的一致预测,但纳什虽然纳什均衡是博弈结果的一致预测,但纳什均衡分析却并不一定能对所有博弈的结果都却出均衡分析却并不一定能对所有博弈的结果都却出准确的预测。因为纳什均衡的一致预测性质本身准确的预测。因为纳什均衡的一致预测性质本身并不保证各博弈方的预测是相同的,相同的预测并不保证各博弈方的预测是相同的,相同的预测是一致预测性质的前提而不是结果。是一致预测性质的前
11、提而不是结果。n有许多博弈其实根本无法准确预测,因为有些有许多博弈其实根本无法准确预测,因为有些博弈不存在纳什均衡,而另有一些博弈又有多重博弈不存在纳什均衡,而另有一些博弈又有多重纳什均衡且相互无显著的优劣或效率差别。纳什均衡且相互无显著的优劣或效率差别。n此外,还存在博弈方的理性、能力等与假设不此外,还存在博弈方的理性、能力等与假设不符的情况,这些都会影响纳什均衡在博弈分析中符的情况,这些都会影响纳什均衡在博弈分析中的预测作用。的预测作用。212.2.3 纳什均衡与严格下策反复消去法222.2.3 纳什均衡与严格下策反复消去法命题命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除
12、了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题命题2.2:在n个博弈方的博弈 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的严格下策:严格下策:对于某一策略 ,若 则称 为 的严格下策。232.3 无限策略分析和反应函数2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性242.3.1 古诺的寡头模型寡头产量竞争以两厂商产量竞争为例222126qqqq-=254.5,4.55,3.753.75,5
13、4,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈262.3.2 反应函数古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古诺模型的反应函数图示理性局限和古诺调整272.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感282.3.4 公共资源问题公共草地养羊问题以三农户为例 n=3,c=429合作:总体利益最大化合作:总体利益最大化竞争:个体利益最大化竞争:个体利
14、益最大化302.3.5 反应函数的问题和局限性n在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。n即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。312.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和严格下策反复消去法2.4.4 混合策略反应函数322.4.1 严格竞争博弈和混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1
15、正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念33二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡混合策略纳什均衡:包含混合策略的策略组合,
16、构成纳什均衡。34三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方博弈方2博博弈弈方方1 策略 得益博弈方1 (0.8,0.2)2.6博弈方2 (0.8,0.2)2.635四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中
17、下上中下上中下上中下上中下上中下上中下田田 忌忌齐齐威威王王得益矩阵36五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对首位的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率0-D-D守卫得益(睡)SPt 小偷偷的概率137V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P小偷得益(偷)VPg 守卫睡的概率1382.4.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时 装足 球时装足球丈丈
18、 夫夫妻妻子子夫妻之争夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25)0.67博弈方2 (1/3,2/3)0.7539二、制式问题1,30,00,02,2ABAB厂商厂商2厂厂商商1制式问题制式问题 制式问题混合策略纳什均衡 A B 得益厂商1:0.4 0.6 0.664厂商2:0.67 0.33 1.29640三、市场机会博弈-50,-50100,00,1000,0进不 进进不进厂商厂商2厂厂商商1市场机会市场机会 进 不进 得益厂商1:2/3 1/3 0厂商2:2/3 1/3 0412.4.3 混合策略和严格下策反复消去法3,1
19、0,20,23,31,31,1LRUMD博弈方博弈方2博博弈弈方方1博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益422.4.4 混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布43夫妻之争博弈2,10,00,01,3时装足球丈夫丈夫时装足球妻妻子子夫妻之争夫妻之争rq111/31/3(r,1-
20、r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布442.5 纳什均衡的存在性纳什定理纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。n教材证明。主要根据是布鲁威尔和角谷的不动点定理。n纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。452.6 纳什均衡的选择和分析方法扩展2.6.1 多重纳什均衡博弈的分析2.6.2 共谋和防共谋均衡462.6 纳什均衡的选择和分析方法扩展既然纳什均衡具有普遍性,那么能否可以彻底解决所有的博弈问题?回答是否定的!纳什均衡分析同样并不一定能
21、彻底解决一个博弈问题,因为纳什均衡的存在性并不等于惟一性,在许多博弈中纳什均衡是不惟一的,而且不同的纳什均衡相互之间也没有明显的优劣关系,从而博弈方的选择会遇到困难。472.6.1 多重纳什均衡博弈的分析n帕累托上策均衡n风险上策均衡n聚点均衡n相关均衡48一、帕累托上策均衡一、帕累托上策均衡 事实上,并不是所有多重纳什均衡都会导致分析的困难。因为虽然有些博弈中存在多个纳什均衡,但很可能这些纳什均衡有明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡。换句话说,可能有这些纳什均衡中的某一个,给所有博弈方带来的利益,都大于其他所有纳什均衡会带来的利益。实际上就是帕累托效率意义上的优劣关系,因此用
22、这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。n对大多数多重纳什均衡博弈来说,引进混合策略并没有解决问题,因为混合策略本身不一定比纯策略更好,而且对于确定哪个纯策略更好也没有作用。49-5,-5-10,88,-1010,10战争和平国家国家2战争和平国国家家1战争与和平战争与和平 战争与和平博弈:这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平和平,和平)是本博弈的一个帕累托上策均衡。寡头市场的价格竞争博弈也类似。n战争与和平博弈战争与和平博弈50二、风险上策均衡 存在帕累托效率意义上优劣关系的情况下,帕累托上策均衡选择的基本法
23、则是容易理解的。不过帕累上策均衡并不是有强制力的法则。更重要的是有时候其他某种同样是合理的选择逻辑的作用超过帕累托效率的选择逻辑,因此完全理性的决策者也不一定选帕累托上策均衡。因此,考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。51二、风险上策均衡9,98,00,87,7LR博弈方博弈方2UD博博弈弈方方1风险上策均衡(风险上策均衡(D,R)52二、风险上策均衡5,53,00,33,3鹿兔子猎人猎人2鹿兔子猎猎人人1猎鹿博弈风险上策均衡(兔子,兔子)风险上策均衡(兔子,兔子)53二、风险上策均衡值得注意的是:博弈方对风
24、险上策均衡的选择倾向,有一种自我强化的机制。当部分或所有博弈方选择风险上策均衡的可能性增强的时候,任一博弈方选择帕累托上策均衡的期望得益都会进一步变小,这就使得各博弈方更倾向于选择风险上策均衡,而这又进一步使选择帕累托上策均衡策略的得益更小,从而形成一种选择风险上策均衡的正反馈机制,使其出现的机会越来越大。54三、聚点均衡n利用博弈设定以外的信息和依据选择的均衡n文化、习惯或者其他各种特征都可能是聚点均衡的依据n城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子55四、相关均衡5,14,40,01,5LR博弈方博弈方2UD博博弈弈方方1相关均衡例子相关均衡例子三个纳什均衡
25、三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬天气,抛硬币)币),但仍不理想。相关装置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题56一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B2.6.2 共谋和防共谋均衡57二、防共谋均衡 如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B)是防共谋均衡 (U,L,A)不是防共谋均衡58