gametheory2-3.ppt_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,2,完全信息静态博弈,2.1,基本分析思路和方法,2.2,纳什均衡,2.3,无限策略博弈分析和反应函数,2.4,混合策略和混合策略纳什均衡,2.5,纳什均衡的存在性,2.6,纳什均衡的选择和分析方法扩展,2,完全信息静态博弈,2,混合策略引例：警察与小偷,2.4,混合策略和混合策略纳什均衡,3,2.4,混合策略和混合策略纳什均衡,猜硬币博弈,1,-1,-1,1,-1,1,1,-1,反面,正面,反面,正面,没有一个策略组合构成纳什均衡,盖币方,猜,币,方,该如何行动？,（,1,）严格竞争博弈和混合策略的引进,4,2.4,混合策略和混合策略纳什均衡,行动原则,:,自己的策略选择不能预先被另一方知道或猜测,在博弈的多次重复中，要避免自己的选择带有规律性,保证自身策略选择的随机性,以,一定的概率分布,在策略空间中随机选择,混合策略,5,2.4,混合策略和混合策略纳什均衡,博弈方,按照一定的概率,，,随机地,从纯策略空间中选择一种纯策略作为实际的行动。,定义,1,：混合策略,6,2.4,混合策略和混合策略纳什均衡,如猜币博弈中：博弈方的策略空间（正面，反面）,混合策略：,（,q,，,1-q,）,以概率,q,选择,正面,，以概率,1-q,选择,反面,纯策略可以理解为混合策略的特例,如石头、剪刀、布中：博弈方的策略空间（石头，剪刀，布）,混合策略：,（,1/2,，,1/4,，,1/4,）,以概率,1/2,选择,石头,，以概率,1/4,选择,剪刀,，以概率,1/4,选择,布,7,混合策略伴随的是,支付的不确定性,面对不确定的结果时，该如何进行策略选择呢？,盖币方,猜,币,方,-1,1,1,-1,1,-1,-1,1,反面,正面,反面,正面,面对不确定的结果时，博弈方关心的是,期望支付,。,猜币博弈,2.4,混合策略和混合策略纳什均衡,8,定义,2,：混合策略纳什均衡,纯策略纳什均衡是混合策略纳什均衡的特殊情形。,纳什均衡的实质：,单独偏离没有好处,。,2.4,混合策略和混合策略纳什均衡,9,社会福利博弈,2,3,3,-1,1,-1,0,0,游荡,流浪汉,政府,救济,不救济,寻找工作,没有一个策略组合构成纳什均衡,2.4,混合策略和混合策略纳什均衡,混合策略纳什均衡举例：,10,例：社会福利博弈,3,2,-1,3,-1,1,0,0,游荡,流浪汉,救济,0.5,不救济,0.5,寻找工作,政府,假定：政府的混合策略（,0.5,，,0.5,）。,在政府混合策略（,0.5,0.5,）下，,流浪汉的任何策略（,纯的,或,混合的,）带来的期望支付都是,1.5,。,因此，,流浪汉的,任何一种策略,都是对政府混合策略（,0.5,，,0.5,）的,最优反应,。,0.5,2,+0.5,1,=1.5,则流浪汉：,EU,L,（寻找工作）,=,EU,L,（游荡）,=,0.5,3,+0.5,0,=1.5,表明：,2.4,混合策略和混合策略纳什均衡,11,3,2,-1,3,-1,1,0,0,游荡,0.8,流浪汉,救济,不救济,寻找工作,0.2,政府,假定：流浪汉的混合策略（,0.2,，,0.8,）,表明：在流浪汉混合策略（,0.2,0.8,）下，政府,的任何策略（,纯的,或,混合的,）带来的期望支付都是,-0.2,。,因此，政府,的,任何一种策略,都是对流浪汉混合策略（,0.2,，,0.8,）的,最优反应,。,则政府：,EU,G,（救济）,=,EU,G,（不救济）,=,0.2,（,-,1,）,+0.8,0,=-0.2,0.2,3,+0.8,（,-,1,）,=-0.2,2.4,混合策略和混合策略纳什均衡,12,流浪汉的,任何一种策略,都是对政府,混合策略（,0.5,，,0.5,）,的,最优反应,。,政府,的,任何一种策略,都是对流浪汉,混合策略（,0.2,，,0.8,）,的,最优反应,。,流浪汉的,混合策略（,0.2,，,0.8,）,是对政府,混合策略（,0.5,，,0.5,）,的,最优反应,。,政府的,混合策略（,0.5,，,0.5,）,是对流浪汉,混合策略（,0.2,，,0.8,）,的,最优反应,。,得到混合策略组合：政府（,0.5,，,0.5,）,流浪汉（,0.2,，,0.8,）,每个参与人的混合策略都是给定对方混合策略时的最优策略,混合策略纳什均衡,2.4,混合策略和混合策略纳什均衡,13,社会福利博弈中的混合策略纳什均衡：,政府：,（,0.5,，,0.5,）,？,流浪汉：,（,0.2,，,0.8,）,？,如何求解混合策略纳什均衡？,2.4,混合策略和混合策略纳什均衡,14,求解混合策略纳什均衡,盖币方,猜,币,方,-1,1,1,-1,1,-1,-1,1,反面,正面,反面,正面,支付等值法,支付最大化法,例,1,：猜币博弈,2.4,混合策略和混合策略纳什均衡,15,盖币方,猜币方,-1,1,1,-1,1,-1,-1,1,反面,正面,反面,正面,支付等值法,如果一个混合策略（而不是纯策略）是盖币方的最优选择，一定意味着盖币方在正面与反面之间是无差异的。,2.4,混合策略和混合策略纳什均衡,16,盖币方,猜币方,-1,1,1,-1,1,-1,-1,1,反面,正面,反面,正面,支付最大化法,猜币方以,0.5,的概率选择正面，以,0.5,的概率选择反面,2.4,混合策略和混合策略纳什均衡,17,盖币方,猜币方,-1,1,1,-1,1,-1,-1,1,反面,正面,反面,正面,盖币方以,0.5,的概率选择正面，以,0.5,的概率选择反面,2.4,混合策略和混合策略纳什均衡,18,猜币方,反面,盖币方,-1 1,1 -1,1,-1,-1 1,反面,正面,反面,正面,2.4,混合策略和混合策略纳什均衡,盖币方,猜币方,盖币方,正面,猜币方,正面,盖币方,反面,19,3,2,-1,3,-1,1,0,0,游荡,流浪汉,救济,不救济,寻找工作,政府,2.4,混合策略和混合策略纳什均衡,例,2,：社会福利博弈,20,3,2,-1,3,-1,1,0,0,游荡,流浪汉,救济,不救济,寻找工作,政府,2.4,混合策略和混合策略纳什均衡,21,政府,不救济,流浪汉,流浪汉,3,2,-1,3,-1,1,0,0,游荡,救济,不救济,寻找工作,政府,救济,流浪汉,2.4,混合策略和混合策略纳什均衡,22,例,3,：激励的悖论,小偷和守卫的博弈,偷,不偷,不睡,睡,小偷,守卫,一,小偷,欲偷窃有,守卫,看守的仓库，若小偷去偷时守卫睡觉（不负责任），则小偷偷窃成功（令其价值为,V,），若守卫没有睡觉（尽职尽责），则小偷会被抓住坐牢（设其效用为,-P);,假设守卫睡觉而未被偷的效用为,S,，守卫睡觉而被偷则被解雇，其效用为,-D,。,V,，,-D,-P,，,0,0,，,S,0,，,0,纯策略均衡？,存在混合策略均衡,2.4,混合策略和混合策略纳什均衡,23,2.4,混合策略和混合策略纳什均衡,24,例,4,：监督博弈,以税收检查为例,检查,不检查,不逃税,逃税,税收机关,纳税人,不存在纯策略均衡,计算混合策略纳什均衡,为什么应纳税款越多，纳税人逃税的概率越小？,说明,2.4,混合策略和混合策略纳什均衡,25,足球,芭蕾,芭蕾,足球,小明,小红,2,，,1,0,，,0,-1,，,-1,1,，,2,2.4,混合策略和混合策略纳什均衡,纳什均衡：,(,足球,足球,),、,(,芭蕾,芭蕾）,（,2,）多重均衡博弈和混合策略,博弈方的决策思路和原则与,没有纯策略纳什均衡的严格竞争博弈,有所不同,。,在纯策略范围内，无法对博弈方的选择提出确定性建议。,26,足球,芭蕾,芭蕾,足球,小明,小红,2,，,1,0,，,0,-1,，,-1,1,，,2,2.4,混合策略和混合策略纳什均衡,博弈方通过协商可获得较高的得益。,27,以社会福利博弈为例：,3,2,-1,3,-1,1,0,0,游荡,流浪汉,救济,不救济,寻找工作,政府,2.4,混合策略和混合策略纳什均衡,（,3,）混合策略反应函数,28,政府的最佳反应函数,：,2.4,混合策略和混合策略纳什均衡,29,3,2,-1,3,-1,1,0,0,游荡,流浪汉,救济,不救济,寻找工作,政府,2.4,混合策略和混合策略纳什均衡,30,流浪汉的最佳反应函数,：,2.4,混合策略和混合策略纳什均衡,31,流浪汉的最佳反应函数,：,政府的最佳反应函数：,2.4,混合策略和混合策略纳什均衡,32,乙,甲,A,C,R,T,3,，,1,0,，,2,1,，,0,M,0,，,2,1,，,0,2,，,1,B,1,，,2,-1,，,3,0,，,1,练习,1,：博弈,G,的得益矩阵如图所示，求混合策略纳什均衡。,2.4,混合策略和混合策略纳什均衡,甲：,B,是相对于,T,的严格下策,乙：,R,是相对于,A,的严格下策,33,博弈方,2,博弈方,1,左,右,上,1,，,0,1,，,0,中,2,，,0,0,，,2,下,0,，,3,3,，,0,练习,2,：博弈,G,的得益矩阵如图所示，求混合策略纳什均衡。,2.4,混合策略和混合策略纳什均衡,34,2.4,混合策略和混合策略纳什均衡,35,2,完全信息静态博弈,2.1,基本分析思路和方法,2.2,纳什均衡,2.3,无限策略博弈分析和反应函数,2.4,混合策略和混合策略纳什均衡,2.5,纳什均衡的存在性,2.6,纳什均衡的选择和分析方法扩展,2,完全信息静态博弈,36,2.5,纳什均衡的存在性,（,1,）纳什定理,在一个由,n,个博弈方的博弈,中，如果,n,是有限的，且都是有限集,(,对,),则该博弈至少存在一个纳什均衡，但可能包含混合策略。,每一个,有限博弈,至少存在一个纳什均衡（纯策略的或混合策略的）。,37,2,完全信息静态博弈,2.1,基本分析思路和方法,2.2,纳什均衡,2.3,无限策略博弈分析和反应函数,2.4,混合策略和混合策略纳什均衡,2.5,纳什均衡的存在性,2.6,纳什均衡的选择和分析方法扩展,2,完全信息静态博弈,38,2.6,纳什均衡的选择和分析方法扩展,（,1,）帕累托和风险上策均衡,帕累托上策均衡,甲,乙,9,9,0,0,0,0,7,7,R,U,D,L,纯策略纳什均衡：,（,U,，,L,）、（,D,，,R,）,（,U,，,L,）帕累托上策均衡,在多重纳什均衡中，,可能存在某个纳什均衡,，给所有博弈方带来的利益，都大于其它所有纳什均衡带来的利益。,39,风险上策均衡,甲,乙,9,9,0,8,8,0,7,7,R,U,D,L,纯策略纳什均衡：,（,U,，,L,）、（,D,，,R,）,（,D,，,R,）风险上策均衡,2.6,纳什均衡的选择和分析方法扩展,如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时，都偏爱其中某一纳什均衡，则该纳什均衡就是一个,风险上策均衡,。,40,2.6,纳什均衡的选择和分析方法扩展,（,2,）聚点和相关均衡,聚点均衡,博弈方可能使用某些被抽象掉的信息达到一个均衡,（,Schelling,，,1960,）,例,1,：情侣博弈：纳什均衡,(,足球,足球,),(,芭蕾,芭蕾,),例,2,：分钱博弈,假设两个人分一百块钱，每个人独立地把自己要求的数额（分别记为,x1,和,x2,）写在纸上，然后由公正的第三方来主持和判定最终的分配数额。,规则：如果,x1+x2 100,，则每个人得到自己要求的数额；否则两个人一分钱都得不到。,纳什均衡,：任何满足,x1+x2=100,的（,x1,，,x2,）,41,相关均衡,2.6,纳什均衡的选择和分析方法扩展,博弈方在博弈开始之前通过磋商并决定建立一种,“,信号装置,”,，他们一致同意选择策略依赖于,“,信号装置,”,的某种信号的随机发生。通过这种建立在博弈之外的随机过程而达到的结果称为,相关均衡,（,Aumann,1974,),。,42,甲,乙,6,1,0,0,5,5,1,6,R,U,D,L,纯策略纳什均衡：,（,U,L,）,（,D,R,）,相关信号规则,1(,丢硬币,),：,甲：正面选,U,；反面选,D,乙：正面选,L,；反面选,R,相关信号规则,2(,掷色子,),：,甲：,1,或,2,选,U,；,3-6,选,D,乙：,1-4,选,L,；,5,或,6,选,R,(U,L),(D,R),各以,1/2,的概率发生,(U,L),(D,R),和,(D,L),各以,1/3,的概率出现,混合策略纳什均衡,（,1/2,1/2,）,（,1/2,1/2,）,（期望得益（,3,，,3,）,2.6,纳什均衡的选择和分析方法扩展,双方期望得益多少？,双方期望得益多少？,43,2.6,纳什均衡的选择和分析方法扩展,（,3,）共谋和防共谋均衡,多人博弈的共谋问题,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,A,-2,-2,0,-5,-5,0,-5,-5,0,-1,-1,5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,B,纯策略纳什均衡：,（,U,，,L,，,A,）、（,D,，,R,，,B,）,前者帕累托优于后者,博弈的结果会是什么呢？,存在,共谋,(Coalition),的可能性,44,防共谋均衡,2.6,纳什均衡的选择和分析方法扩展,如果一个博弈的某个策略组合满足下列要求：,（,1,）没有任何单个博弈方的“串通”会改变博弈的结果，即单独改变策略无利可图；,（,2,）给定选择偏离的博弈方有再次偏离的自由时，没有任何两个博弈方的串通会改变博弈的结果；,（,3,）依此类推，直到所有博弈方都参加的串通也不会改变博弈的结果。,满足上述要求的均衡策略组合称为“,防共谋均衡,”。,一个策略组合，不仅要求参与人在这个策略组合下没有单独偏离的激励，而且也要求没有合伙集体偏离的激励。,45,2.6,纳什均衡的选择和分析方法扩展,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,A,-2,-2,0,-5,-5,0,-5,-5,0,-1,-1,5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,B,纯策略纳什均衡：,（,U,，,L,，,A,）、（,D,，,R,，,B,）,防共谋纳什均衡,46,练习,1,：,下图是两人博弈的标准式表述：,上,下,右,左,参与人,1,参与人,2,3,，,3,0,，,1,1,，,0,2,，,2,（,1,）找出此博弈的所有纯策略纳什均衡。,（,2,）哪个纳什均衡是帕累托上策均衡？,（,3,）哪个纳什均衡是风险上策均衡？,2.6,纳什均衡的选择和分析方法扩展,47,练习,2,：,下述三人博弈中，博弈方,1,选择行策略,U,或,D,，博弈方,2,选择列策略,L,或,R,，博弈方,3,选择矩阵,A,或矩阵,B,。,U,D,R,L,博弈方,1,博弈方,2,5,，,5,，,8,0,，,0,，,5,0,，,0,，,5,7,，,7,，,0,博弈方,3,矩阵,A,U,D,R,L,博弈方,1,博弈方,2,博弈方,3,矩阵,B,（,1,）找出此博弈的所有纯策略纳什均衡。,（,2,）在所有纯策略纳什均衡中，哪个是抗共谋均衡？,2.6,纳什均衡的选择和分析方法扩展,3,，,3,，,5,0,，,0,，,5,0,，,0,，,5,4,，,4,，,6,

展开阅读全文