资源描述
本章内参不完全信息动态博弈-完美贝叶斯均衡-弱完美贝叶斯均衡与完美贝叶斯均衡-信号传递博弈的弱完美贝叶斯均衡 可观察行动不完全信息多阶段博弈的完美贝叶斯均衡-扩展式精炼序贯均衡序贯均衡与完美贝叶斯均衡的比较策略式精炼 颤抖手完美均衡 适当均衡主要参考资料 Fudenberg&Tirole(1991),Chapter 8.Gibbons(1992),Chapter 4.MWG(1995),Chapter 9.2不完全信息动忐博弈 不完全信息动态博弈可以通过海萨尼转换转变 为信息完全但不完美的博弈。(Harsanyi,1967-1968)转换后的博弈只有唯一的一个子博弈。子博弈 完美的逻辑对不完全信息博弈不起作用:即使 在每一期期末参与者都观察到了其他参与者的 行动,由于参与者不知道别人的类型,所以从 某一期的开始并不能构成一个定义良好的子博 弈,除非已经给定了参与者的后验信念,因此 我们无法检验后续的策略是否是一个纳什均衡。3例子:不完全信息挑战博弈 挑战者1决定是否要挑战在位者2。该挑战者 可能是强大的,也可能是孱弱的。挑战者清楚 自己的实力,但在位者并不知道对手的实力。在位者的实力是共同知识。博弈结果如下:如果挑战者放弃挑战,双方的 得益为(0,2);若挑战者强大并进行了挑战,在位者进行抵抗(F)和退让(A)的得益分别 为(-1,-2)和(3,0);若挑战者孱弱并挑战,则 结果分别为(-2,-1)和(2,1)。4例子:不完全信息挑战博弈例子:不完全信息挑战博弈(Out,F)和(In,A)都是纳什均衡,也都是子博 弈完美均衡。无法运用子博弈完美剔除不合理的纳什均衡。-(Out,F)成为纳什均衡,依赖于参与者2的一个不 可信的无效威胁F,一旦参与者1选择进入,理性 的参与者2就不会实施其威胁。因此(Out,F)是一 个包含无效威胁的子博弈完美均衡。子博弈完美在完全信息动态博弈中能够有效地 进行均衡精炼,但在不完全信息博弈中往往是 无效的。如何剔除这类博弈中不合理的纳什均 衡?6不完全信息动走博弈不完全信息动态博弈的基本思路:-“自然”首先选择参与者的类型,这是私人信息。接 着参与者有先后地选择行动。后行者能观察到先行者的行动,但无法观察到先行 者的类型。但因行动是类型依存的,后行者可以通 过观察到的行动来推断对方的类型或修正其先验信 念。而先行者预测到这一点,因而会设法传递对自己有 利的信息。因此博弈过程也是不断修正信念的过程。后续博弈 在扩展式博弈中要求参与者是序贯理性的,在 完全信息博弈中,我们可以用子博弈完美的方 式确定参与者的序贯理性行为。在上例中,当自然首先行动时,整个博弈只有 唯一一个子博弈,从而没有办法用子博弈确定 序贯理性。8后续博弈 定义10.1在扩展式博弈中,由某一个决策结点 x出发,其后的枝结集构成结点x的后续博弈(Continuation Games)。后续博弈是完全信息博弈中子博弈概念的扩展,可 以开始于任何完全信息集,而不再仅仅开始于单点 信息集。-如果参与者的策略要成为博弈的一个完美贝叶斯均 衡,不仅必须是整个博弈的贝叶斯均衡,还必须构 成每一个后续博弈的贝叶斯均衡。9后续博弈:例子1后续博弈的预期得益回顾定义6.1和6.3,有如下记号:纯策略:s;.Hi 4 A(心 策略组合:s,a x的后续终点结记为z e Z(x)c Z。在策略组 合s下,由结点x开始到达终点结z的概率 为Pr(zls,x),由结点工开始的后续得益:Ui(5 I X)=ZPr(zls,x)%(z)zgZ(x)11信念 对于不完美信息博弈,有的信息集为单结点,有的为多结点,此时,某一结点后可能没有子 博弈,但存在后续博弈。由于多结点的信息集中,不同的结点对应不同 的后续博弈,其后续得益也不同,因此,在多 结点的信息集上考虑最优反应,需要参与者对 自己所处的结点有一个信念。12信念 当出现多点信息集时,参与者的预期后续得益 依赖于他对自己处在哪一个结点上的信念。定义10.2对于参与者,的某个信息集砧 参与 者z的信念是定义在中所有结点上的一个概 率分布,表明当该信息集到达时,参与者,认 为自己处在该信息集中每一个结点上可能性的 大小。13信念系统 定义10.3扩展式博弈的一个信念系统(A System of Beliefs)是一个为博弈中的每个(除根结点和终结点之外的)结点规定概率值 的函数,该函数为每个参与者在每个信息集规 定了一个概率分布,代表了每个参与者认为自 己处于每个信息集中每个结点上的可能性。信 念函数满足:(1)/(x)e 0,1,Vx e AA(Zu0);(2)=1,e%V/exe/z-14信念系统:例子15均衡精炼的要求1:R1存在一个信念系统。即在每一个信息集,应该 行动的参与者必须对博弈进行到该信息集中哪 一个结点有一个信念。对于单点信息集,参与者的信念是达到该结点的概 率为1(即退化的概率分布);对于多结点信息 集,参与者的信念是在该信息集中不同结点上的一 个概率分布。每个参与者在每一个对应的信息集都有一个信念,由所有参与者的所有这些信念构成的集合就是一个 信念系统。16序贯理性 参与者是序贯理性的(SequentiallyRational),是指如 果轮到他行动时,他总是根据对所处情况的判断,来 最大化他的预期得益。-参与者的序贯理性策略是指该策略为参与者在博弈过 程中遇到的每一种情况规定一个最优反应。-参与者的一个策略在其某一信息集上是序贯理性的,如果参与者在到达该信息集时若按照该策略在该信息 集上规定的行动来选择行动的话,将在后续博弈中获 得最大预期得益。17单点信息集上的序贯理性定义10.4策略组合s在信息集(结点)x上是 序贯理性的,当且仅当$5=arg m患(s_x?l x),其中口是在信 息集X规定的行动。对参与者,来说,其策略在信息集X上是序贯理性的,当且仅 当一旦博弈到达结点x,给定其他人在此结点后续博弈中都按 照该策略组合来行动,i的策略在该信息集x上规定的行动将 最大化这一结点的后续得益。18单点信息集上的序贯理性:例子-根据前面求出的纳什均衡,分别计算从结点N和 Strong到终结点(3,0)的概率以及相应的后续得益。完美信息博弈的序贯理性-在完美信息博弈中,所有的信息集都是单点的,此时 子博弈和后续博弈是相同的,所以序贯理性要求和子 博弈完美是一致的。1多点信息集上的序贯理性定义10.5给定信念系统,策略组合。对参与 者,在信息集片上是序贯理性的,当且仅当 Og E arg max M也%9一地,3)1%,h产(/(%)1 1 1-即,策略组合对参与者,在信息集九上是序贯理性 的,当且仅当给定,.在到达某一信息集时对所处结 点的信念以及在此结点后所有的行动,都有在该策 略组合所确定的条件下,策略组合中参与者,在此 信息集上的策略能够最大化预期的后续得益。21多点信息集上的序贯理性:例子-给定信念0.1,0.9,参与者2选择R是序贯理性的。1(3,1)(-1,3)(0,2)(1,5)22均衡精炼的要求2:R2给定博弈的信念系统,参与者的策略必须满足 序贯理性的要求。即在每一个信息集应该行动 的参与者所采取的行动(以及该参与者随后的 策略),在给定了该参与者在该信息集处的信 念以及其他参与者随后的策略时必须是最优的。这里,随后的策略是一个完备的行动计划,涵盖了 在该给定的信息集到达之后可能发生的各种可能性。23均衡路径上的信息集和不在均 衡路径上的信息集定义10.6对于一个给定扩展式博弈的给定的均 衡策略组合,如果博弈根据该策略组合进行时 将以尹的概率到达某信息集,我们称此信息集 在均衡路径上(on the equilibrium path)。反 之,如果博弈按照该均衡策略进行时,肯定不 会达到某信息集(即均衡策略赋予该信息集0 概率),我们称此信息集不在均衡路径上或处 于均衡路径之外(off the equilibrium path)。24对参与者信念的要求:(Seltens HorseJ参与者对所处的结点如何进行判断呢?(4,4,4)(1,1,1)(5,5,0)(2,2,2)25对参与者信念的要求:例子CSelten,s HorseJ-参与者3需要考虑选择什么策略。他会问自己:“假如 该我行动,到底参与者1在和我斗(处在结点13),还是参与者2在和我斗(处在结点14)?”换句话 说,参与者3需要知道自己处在这些结点上的条件概 率。-如果这些条件概率是参与者3所关心的,那么,参与 者1和2在各自行动的时候,也会猜测参与者3对这 些条件概率的判断。进一步,参与者1行动时,还需 要猜测2是如何猜测3的,3是如何猜测1和2如何猜 测自己的,等等。26对参与者信念的要求:例子CSelten,s HorseJ 对于相互预期的参与者来说,关于所处结点的 哪一种信念是合理的呢?一个基本的要求是参与者需要根据贝叶斯法则 结合均衡策略来形成,即信念要和均衡策略所 规定的行动保持一致性。27均衡精炼的要求3:R3 对在均衡路径上的信息集,参与者对所处结点 x的信念(对需要根据贝叶斯法则和参与者的 均衡策略。确定。即根据参与者的均衡策略组 合5计算到达结点X所在信息集h(x)的概 率,参与者对结点X的信念即为在该结点的条 件概率:(x)=Pr(x I A(x),cr)=Pr(x I er)28信念与策唯的弱I致性 定义10.7给定参与者的均衡策略5信 念系统是弱一致的,如果满足:(1)对在均衡路径上的信息集,参与者的信 念如条件R3所示,由贝叶斯法则和参与者的 均衡策略给出。(2)对不在均衡路径上的信息集,参与者的 信念可以是任意给定的一个概率分布。29弱完美贝叶斯均衡(Weak PerfectBayesian Equilibrium,WPBE J定义10.8 一个策略组合和信念系统(g)是弱 完美贝叶斯均衡,如果满足:(1)给定参与者的信念系统,策略组合。是序贯理性的;(2)给定参与者的均衡策略5信念系统 是弱一致的。-弱完美贝叶斯均衡即为满足要求RI、R2和R3的策 略组合和信念系统(G-有了对所处结点的合理的信念,参与者就可以确定 在每个信息集上的最优反应。因此,WPBE在后续 博弈的基础上,通过引入信念体现了序贯理性原则。30弱完美贝叶斯均衡:例1验证策略组合(Out,F)以及信念系统0.5,0.5,0.1,弱完美贝叶斯均衡:例232弱完美贝叶斯均衡:例2(1)确定参与者3的最优行动:-参与者3判断参与者2选择L的概率为p,选择R 的概率为lp,在这个信念下,根据多点信息集上 的序贯理性的要求,参与者3在此信息集上会选择 能够最大化预期的后续得益的行动。因此,参与者 3会比较他比较两种选择给他带来的预期得益:-选择L,预期得益为2-4;-选择R,预期得益为l+2p-因此,如果Pv 1/3,他会选择L,否则他会选择R,。33弱完美贝叶斯均衡:例2(2)确定参与者2的最优行动:-给定夕v 1/3,他知道了参与者3会选择L,这时参 与者2选择L的预期得益为2,选择R的预期得益 为L所以参与者2会选择L;-给定22 1/3,他知道参与者3会选择R:这时参与 者2选择L的预期得益为3,选择R的预期得益为 L所以参与者2仍会选择L;-这样,参与者2的最优行动是无论p取何值,他都 会选择Lo34弱完美贝叶斯均衡:例2(3)确定参与者1的最优行动:-给定夕v 1/3,参与者1知道这时参与者3会选择 L,参与者2会选择L,因此他选择A的预期得益 为2,选择D的预期得益为1,所以参与者1会选 择A;-给定P2 1/3,参与者1知道此时参与者3会选择 R,参与者2会选择L,这时他选择A的预期得益 为2,选择D的预期得益为3,所以参与者1会选 择D。35弱完美贝叶斯均衡:例2(4)根据最优行动的组合,确定夕的大小:-对路径(A,L,L),此时参与者3的信息集不在均衡 路径上,根据WPBE中信念弱一致性的要求,可以 对p任意赋值。在夕v 1/3的条件下(A,L,U)构成 了WPBE;而子博弈完美要求夕=1,这与21/3矛 盾,故(A,L,L)不构成SPE;-对路径(D,L,R),此时参与者3的信息集在均衡路 径上,根据WPBE中弱信念一致性的要求,对于处 在均衡路径上的信息集,信念由贝叶斯法则决定,这时夕二1,与-2 1/3相吻合,故(D,L,R)既是 WPBE,也是SPE o36弱完美贝叶斯均衡的缺陷在WPBE中,对信念的唯一要求是在均衡路径 上时需要一致,而对于均衡路径之外没有任何 要求。这导致WPBE这一概念在预测博弈结果 时会有不合理之处。如例2中,在夕V 1/3时,(A,L,U)构成WPBE但不 构成SPE,实际上(L,U)不构成对应子博弈的纳什 均衡。因此,需要对这一概念加强,主要是对非均衡 路径上的信念施加另外的一致性要求。37弱完美贝叶斯均衡的缺陷:例子因为在非均衡路径上的信念不合理,WPBE可能不是 子博弈完美的。1(-3,-1)(1,-2)(-2,-1)(3,1)38均衡精炼的要求4:R4对不在均衡路径上的信息集,参与者对 所处结点X的信念(X)需要根据贝叶斯 法则和参与者可能的均衡策略确定。可能的均衡策略是指均衡策略在非均衡路径 上规定的行动,将在后面给出说明。39完美贝叶斯均衡f Perfect Bayesian Equilibrium,PBEJ-定义10.9 一个策略组合和信念体系(g)是完美贝叶 斯均衡,如果满足:(1)给定参与者的信念系统,策略组合。是序贯 理性的;(2)对在均衡路径上的信息集,参与者的信念由贝 叶斯法则和参与者的均衡策略。确定;(3)对不在均衡路径上的信息集,参与者的信念由 贝叶斯法则和参与者可能的均衡策略确定。完美贝叶斯均衡即为满足要求RI、R2、R3和R4的策略组合和 信念系统(cr,)。40完美贝叶斯均衡:例子-根据贝叶斯完美纳什均衡(PBE)中条件3的要求,参与者2在信息集上的信念应该是自己处在右边的结 点上,即=0。1完美贝叶斯均衡的性质 PBE的直观意义:-参与者在任何信息集上(无论是均衡路径上还是均 衡路径外)都不会选择严格劣策略;参与者)不会相信参与者,在任何信息集上选择严 格劣策略。PBE的性质:-PBE是均衡策略和均衡信念的结合:给定信念,策 略组合是最优的;给定策略组合,信念是根据贝叶 斯法则从均衡策略组合和所观测得到的行动得到的。因此,完美贝叶斯均衡是一个对应的不动点。42完美贝叶斯均衡:练习验证策略组合(A,L,U)和信念夕=0不构成PBE,而策 略组合(D,L,R)和信念p=1构成PBE。计算Setons Horse的PBE策略组合(Rl,R2,R3)和信念p 2/5构成PBE。(4,4,4)(1,1,1)(5,5,0)(2,2,2)44完美贝叶斯均衡的局F艮C1J-如果均衡策略为(A,A;L)由于参与者2的可能行动 也没有到达3的信息集,这时条件3对于参与者3的(1,2,1)(3,3,3)也,1,2)(0,1,1)完美贝叶斯均衡的局F艮(2)在PBE中,我们对均衡路径上的信念施加的一 致性要求仅仅只是和均衡策略相一致;-人们会猜测先行动的一方不会使用严格劣策 略,但也不会使用均衡劣策略(被均衡策略所 占优的策略)。46完美贝叶斯均衡的局F艮(2)(Out,(F,F)和信念 p=1 构成PBE。注意:如果1偏离 上述均衡策略,则 2会认为既然1没 有选择out,肯定 是希望选择一个比 out更好的策略,不会选择均衡劣策 略ini,因此信念 应是p=0o47信号传成博弈 信号传递博弈是包含信念更新和完美性问题的 一种最简单的博弈。-两个参与者:1为领导者(发送方),2为跟随者(接收方)。参月者1具有关于其类型的私人信息,并选 择行动ax G 4。-参与者2的类型是共同知识,他观察到火并选择行 动 4。两个参与者的混合行动空间分别为劣和42,其元 素分别为名和 a?o 参与者,的得益函数为%(%,为,二1248信号传遹博弈-博弈开始前,参与者2关于参与者1类型的先验信念夕 是共同知识。参专者1亩策略规定了对每一种类型e在行动力上的 M既率分布助。-参与者2的策略则规定了对于每一个行动力在行动的 上画一个版率分希a2Qa1)o-参与者2采取3(%),类型为。的参与者1采取策略 3(助的得益为%(bi,/,0=ZZ。10)01(a11%)%,?,。)ax%参与者1采取3(助时,参与者2采取策略巧(%)的(事前)得益为Z P(8)(E Z(%I 8)%(。2 1%)2(%,。2,)0。249信号传遍博弈:信念的更新 参与者2在选择自己的行动之前观察到参与者1的行 动,应更新其对e的信念,并根据上的后验概率(%)来选择出。-后验概率的形成根据贝叶斯法则。在贝叶斯均衡中,参与者1根据其类型。选择策略仞,参与者2 知道了 3*并观察到的,即可用贝叶斯法则将以)更 新到中。贝叶斯法则:根据全概率公式PrQ,0)=Pr(力助Pr(=Pr(例6)Pr(i),可得 Pr(63)=Pr(QjOPr(O/Pr3i),其中边际概率 Pr(i)=ePr(i 助 Pr(。50信号传遹博弈:序贯理性子博弈完美均衡向信号传递博弈的自然扩展就 是完美贝叶斯均衡,它要求对每一个由,参与 者2都要基于为最大化其得益,这里参与者2 采取策略巧(%)的条件得益为:Z(夕1%)2(%,%()4)=ZZ(I%)2(。1,。2,夕)0 0 a251信号传透博弈的弱完美贝叶斯 均衡-定义10.10信号传递博弈的一个弱完美贝叶斯均衡是一 个策略组合CT*和后验信念(必1),使得*(PJ V&%(I argmax/Qi,.,。)%(P2)V%,cr;(I%)arg max V(夕 I%)%(%,的 超)劭 e(B)如果工夕(夕)。;(。夕),则夕(。%)=2(e)b;(%。)/Z p(夕)(见。)如果ZM夕)0;(。11夕)二,则M氏)是0上的任意概率分布。夕52信号传遹博弈的弱完美贝叶斯 均衡-条件B和P2是完美性条件,即序贯理性要求R2。前者 是说参与者1把对于参与者2的影响考虑进来;后者 表明参与者2在给定他对应的后验信念时,对于参与 者1的行动作出最优反应。-条件B对应于贝叶斯法则的运用,对应于要求RI、R3o-要求R4在这里不满足。如果力不是参与者1在某种类 型下最优策略的一部分,则观察到火就是一个零概率 事件,就无法应用贝叶斯法则确定后验信念。此时任 何后验信念(必J都是允许的,因而在某些信念下构 成最优反应的任何行动。2都可以被采取。这意味着唯 一被排除掉的是那些在给定力时的劣行动。53例:两期声誉博弈 Kreps和Wilson(1982b)、Milgrom和Roberts(1982)声誉模型的一个简化版本。时期1:两家厂商都在市场上。但只有厂商1(在位者)选择行动:“争夺”或“容纳”。如果容 纳,则厂商2(进入者)可获利润。2,但若争夺,厂商2只 能获利02,。2。尸2。厂商1有两种类型:“清醒”和“疯狂”。“清醒”的厂商1若容纳则获利。1,若争夺获利尸J。1片。但 若垄断,获利为Mq。“疯狂时,厂商1必定争夺。-令夕为在位者为清醒的概率,1-夕为其疯狂的概率。54fc两期声誉博弈-时期2:进入者的选择 此时只有进入者选择行动但“留下”或“退出”。若其选择留下,如果在位者是清醒的,则进入者可获利。2,在位者获利。1;如果在位者是疯狂的,则进入者获利尸2。若其选择退出,则得益为零,在位者获利M。-两期之间的贴现率为唬-假定“疯狂”的在位者总是选择争夺,因而需要分析“清 醒”的在位者的行为。从静态角度可以确定他在时期1 选择容纳;但动态角度看,争夺可能令对方相信他是 疯狂的(即建立声誉),迫使对方退出,从而在时期2 获得更高利润M。55潜在的完美贝叶斯均衡分离均衡(SeparatingEquilibrium):不同类型的在位者在时期1 选择不同行动,即)磊星类型选择容纳。此时进入者在时期2有完 全信息,即清醒I/=容纳)=1疯狂I%=争夺)=1混同均衡(Pooling Equilibrium):两个类型的在位者在时期1选 择相同的行动。此时进入者在时期2观察到行动之后并不更新其 信念:清醒I a1=争夺)=p准分离均衡(Semi-Separating Equilibrium):清醒的类型可能会 争夺或容纳,即在混同均衡和分离均衡之间随机选择。后验信念 为:清醒 I ax=争夺)g(0,p)清醒I a1=容纳)=156分寓均衡存在的条件-其充分必要条件为WMC)-必要性:分离均衡中清醒选择容纳的得益为。(进入者会留下,他期望在时期2获利。2)。若清醒 选择争夺,将使对方相信他疯狂从而获利尸1+3M1O-充分性:考虑这样的策略和信念:清醒会容纳,对方 观察到容纳,就推测到在位者是清醒,从而留下;疯 狂会争夺,对方观察到争夺,正确地推测到在位者为 疯狂,从而退出。很明显,这些策略和信念构成一个PBE。57混同均衡存在的条件-此时当观察到争夺时,进入者的后验概率与其先验概 率相同。对清醒来说争夺的代价很大,因此只有争夺 能产生一个正的退出概率时他才可能争夺,因此其必 要条件为,进入者在时期2留下的期望得益为负,即 pD2+(1-p)P2 4 Oo-考虑以下策略和信念:两种类型都争夺;进入者有后 验信念清醒I%=争夺)=P,且(8二清醒I=容纳)=1,当且仅当观察到容纳时才留下。清醒类型 的均衡利润为尸1+5拓;他会从容纳中得到。1(1+8 因此,如果上式不成立,所建议的策略和信念就构成 准分离的PBE。58可观察行动不完全信息多阶段 博弈-一类更一般的博弈。-参与者,的类型可属于有限类型空间)晨 暂时假 定类型之间相互独立,因此先验分布p是各个边缘分 布的积,即p(e)=RPi(4)i=l其中Pi 是参与者,.类型为q的概率。博弈开始时每 个参与者都知道自己的类型,但不知道对手的类型。59可观察行动不完全信息多阶段 博弈-博弈时期数目为7+1,九 在每一时期工参 与者同时选择行动,所选择的行动在期末显示。参与 者并不获得进一步的关于8的观察。-假定每一参与者在每期的行动集独立于类型。令呢 4(加)表示参与者i在时期t的行动,d为相应的行动 向量,加=(心,qi)表示时期,初的历史。行为策略 将可能的历史和类型集映射到行动空间上:响此可)是给定小和耳时参与者i选择行动生的概率。参与者 i的得益为.(+】,0o60后续博弈和对信念的限制-为将子博弈完美的概念进行扩展,要求策略组合产生 一个贝叶斯纳什均衡,不仅对整个博弈,而且对从每 个时期/开始的每一可能历史之后的后续博弈都是 如此。-然而这些后续博弈不是真子博弈,因为它们不是产生 于单点信息集。因此,为使后续博弈转换成真正的博 弈,就必须在每个后续博弈的开始规定好参与者的信 念。-将参与者,.认为对手类型为内的条件概率定义为 从(幻加),并假定对所有的参与者八时期人历史小 和类型可都有定义。61对信念的F艮制:条件B(1)B(l)后验信念是相互独立的,且所有类型的参 与者,都具有相同的信念:对所有的8、,和 忖,都有4(/必)=1!4(4 山)-该条件要求甚至未预料到的观察也不会让参与者相 信其对手的类型是相关的。62对信念的F艮制:条件B(2)B(2)只要可能,就用贝叶斯法则将信念自0)更新到从(呼加+1):对所有的八人.和af e 肉(加),如果存在力有人闻出)0和%(.。(即给定时参与者,赋予dj正概率),则对所有的?都有,(%1(忆,)=4(外出)%(4出0)2月网由)巴(4店3)63对信念的F艮制:条件B(2)该条件比一般性地使用贝叶斯法则更强一些,因为 它适用于时期t的历史小概率为0时从时期,到,+1的信念更新,还适用于当广有正概率且某些参与 者koj在时期t选择0概率行动时对参与者j的信 念更新的情况。-这一要求的目的是,如果从(9)代表参与者在给定 时的信念,且t时没有什么“奇怪”的事情发生,就应该使用贝叶斯法则形成,+1期的信念。64对信念的F艮制:条件B(3)B(3)对所有的小、八八斗、屋和今,如果a1 6;,则有-该条件可称为“不传递任何关于你所不知道的事情的 信号、因为参与者左巧对参与者,尚不知道的参 与者)的类型无任何信息。65对信念的F艮制:条件B(4)B(4)对所有的、%以及?可。左,有,(4 以)=勺01)=(历)-这一条件意味着后验信念与给定加时在。上的共同 联合分布是一致的,该联合分布满足(分.0)(即)=(“)与念者 参信与,的参 时同定 立相湄好于策 基的 和日0此 行这彼 者。对66对策略的F艮制:条件P-有了满足条件B(l)B(4)的策略组合。和信念系统 扩展子博弈完美均衡的自然方式就是要求,对任意,和生 所有从W开始的策略都是后续博弈的贝叶斯均 衡。正式地,给定概率分布夕和历史死 令从忆为 q)表示类型为名的参与者i在达到勿时在策略组合。下的预期得益。相应的条件为:(P)对每个参与者人类型耳、参与者,的其他策略b 以及历史死都有I I)2 I I hf)67可观察行动不完全信息多阶段 博弈的完美贝叶斯均衡定义10.11对可观察行动不完全信息多阶段博 弈,完美贝叶斯均衡是一个策略组合和信念系 统(G),满足条件P和B一B(4)。-条件P满足了要求R2。条件B(l)B(4)满足了要求RI、R3和R4。68例:重复的公共产品博弈 原博弈:两个参与者同时决定是否供给公共产 品,该决策是0-1决策。若至少有一人提供,双方的效用都是1,否则为零;供给成本为小 参与者的类型是他们的成本。假定公共产品带来的效用是公共知识,但每个 参与者的成本是私人信息,但都知道q服从区 间GC上的连续二严格递增的独立同分布 尸(),这里(从而0亿)=0,P(c)=1)o69例:重复的公共产品博弈2提供不提供1提供1 _1 _。21-cv)1不提供1,1-。20,070例:重复的公共品博弈现假定博弈进行两期,贴现因子为儿参与者 的目标函数为两期得益之和(第二期得益贴 现)。每一期中参与者的行动空间均为0,1。其策 略是由0。(1)和01(1跳,5)(当其成本为Ci 且历史为00,01,10,11时,参与者在 第二期提供的概率)构成的一个组合。71对称PBE的寻找 可证明(习题)在任何PBE中对每一参与者都 有临界成本2,当且仅当。.时参与者,会 在时期1提供,且0裔1。在对称PBE中,应有311冬=&。先计算出在给 定后验信念时时期2的贝叶斯均衡,这个后验 信念是由均衡策略和时期1的结果确定的。分别考虑时期1的三种情况:都不提供、都提 供和只有一个人提供。72都不提供的情形此时可判断双方的成本均超过3 累积信念为因此后验的尸(q 100)=P(g)P(c)1 1-P(c)P(c.100)=0q e c.c c cforfor在时期2的对称均衡中,必存在一个临界成 本。当且仅当参与者才会提供。73都不提供的情形临界成本等于对手不提供的概率=(1尸)/(1尸()注意两个时期中的临界点不同。将用到如下结论:如果在时期1都不提供,则 类型6将在时期2提供,其得益将为 v00(c)=l-co74都提供的情形 此时的后验累积概率为1 P(c)尸(G 111)=1for c.e 0,c for c.e c,c 在时期2的对称均衡中,参与者提供当且仅 当这里每个参与者的临界 成本等于其对手不提供的条件概率c=P(a)-P(c)/P(c)特别注意类型金不提供,其在时期2的得益为 vn(c)=P(c)/P(c)75只有一人提供的情形 假定时期1中参与者,提供而/不提供,因而 可有6金的。类型金在时期2的得益将为 v10(c)=l-c 和 v01(c)=1 o 推导时期1的均衡:类型6必须在提供与不提 供之间无差异,即l-c+3P(c)vn(c)+1-P(c)v10(c)=P(c)+vi(c)+1-P(c)v00(c)76结论-代入上述结果,可得l-P(c)=c+P(c)c-上式有一个显而易见的涵义:如果在时期1提供,类 型e就花费了e但却提供了本不会提供的公共品。而 且,如果不提供,就显示出其类型最多为e而不会传 递信号说其类型超过自因为类型s在时期2将会提供 而无论今天是否提供。-进一步可得这里为博弈仅进行一次的临界 点。这意味着在此均衡中,两期博弈的时期1的提供 要少于一次博弈的情况。这来源于如下事实:每个参 与者都可以通过建立一个不愿意提供公共品的名声而 受益。77犷展式精炼 首先对博弈树进行回顾。Kreps和Wilson(1982a)对一般的完美记忆有 限博弈,将完美贝叶斯均衡的条件P扩展到条 件S(代表序贯理性),将条件B扩展并精炼到 条件C(代表一致性),由此得到更强的均 衡-序贯均衡(S equential Equilibrium)。78博弈树回顾-考虑有限完美记忆博弈。有限个参与者,=1,/,有限个决策结XX。在完美记忆博弈中,所有参与者都不会忘记曾经知道过的任 何信息,清楚他们以前所选择的行动。-令力代表包含结点X的信息集。在结点X选择行动 的参写著记为3。参与者Z(x)在统点X的混合或行为 策略为0命)或0(历。用E表示所有的策略组合CT 太蜜,0)的集谷,崇义夕为外生的自然行动的概率-给定5以尸。(%)与尸气入)分别表示到达结点X和信息 集的概率。一个信念系统规定了在每个信息集的 信念:a(X)表示参与者/(X)到达信息集h(x)时在结点79博弈树回顾尸。(X)=1,Pa(x2)=Pa(y2)=0.5,Pa(x3)=0.1,Pa(y3)=P7(w3)=0.4;po(h)=0.9,h=巧,为,叫;尸0(Z)=Pa(z7)=0.1,Pa(z2)=Pa(z4)=Pa(z6)=0,Pa(z3)=Pa(z5)=0.4;博弈树回顾-色点结记为Z。达到终点结Z时参与者i的得益 记为%(z)。在给定信息集力达到,参与者的信念由(力 给出,策略组合为。时,令火.()(h4(右)表 示参与者,伏)的期望得益。一个状态(assessment)(a)指定了策略 组合。和一个信念系统。所有可能状态的集 合用T来表示。81序贯均衡:条件s-对条件P的适当的扩展是,给定信念系统,任何参与者 在任何信息集都无法通过偏离而获益:(S)一个状态是序贯理性的,如果对于任何信息集和 可选的策略K(),都有%()(b I 九()N%()(),*()IX()注意参与者相信其对手在每个信息集都将遵守均衡组合。(包括那些如果所有参与者都遵照。不会达到的信息集)。对于多阶段博弈,条件S等价于条件P。82序贯均衡:条件C-令。表示所有完全混合的(行为)策略,即对所有的 h和勺g,(/z)都满足0(%)0的组合o的集合。如果则对所有结点X都有尸所以贝 叶斯法则可计算出每个信息集的信念:(%)=po(x)/p 鼠 h(x)。-令于。表示使得bE。且可以根据贝叶斯法则从b 中(唯一地)加以定义的所有状态(5)的集合。-(C)一个状态是一致的,如果对于中。中的某个 序列(d,)有:(d4)=lim(cr,)ons83序贯均衡 定义10.12 一个序贯均衡是一个满足条件S和C 的状态(2)。在条件C中,策略cr和相应的信念系统可以 认为是完全混合的策略和相应信念系统的极限。这样,状态(a)的一致性,也可以将中。中 的状态序列理解为9)的“颤抖工-在极限理论中,数列/的极限为4/在y的左右(或上下)波动,并随着的增加波幅越来越小地 接近于丹 这些V可以视作产生的颤抖。84Kreps和Wilson f 1982aJ 一致性定义的动机Kreps和Wilson f 1982aJ 一致性定义的动机 参与者1赋予结点X和V的概率分别为1/3和 2/3。无论处于哪个结点,他选择U的概率为 L选择D的概率为0。但若他选择了 D,参 与者2该如何修正其信念?因为参与者1无法区分的类型,很自然就可以 要求他在两个结点上偏离的可能性一致。这一 想法促使参与者2在与V上分别赋予二 1/3与(y)=2/3。然而由于均衡时D的概率 为0,任意都与贝叶斯法则相容。86Kreps和Wilson f 1982aJ 一致性定义的动机 Kreps和Wilson(1982a)的一致性处理使得该 博弈产生“正确的信念工 对任何趋于。的序列,将其视为参与者1“颤抖”并选择D的概率,可有(y)+)3 由此确定的信念尊重了原来的信息结构,也说 明)=1/3是“正确的信念 于是排除其他 任何信念,尽管它们并不违背贝叶斯法则。87序贯均衡的性质 存在性:-对任何有限的扩展式博弈,都至少存在一个序贯均衡。-上半连续:-序贯均衡序列关于得益是上半连续的。即固定扩展式和先验 信念P,对任何收敛到某个U的得益序列川(定义为一个博 弈),如果对所有的,状态(CT,以)是博弈次的一个序贯 均衡,并且收敛到一个状态(2),贝是博弈M的一个 序贯均衡。-均衡的结构:定理10.1(KrepsW Wilson,1982a)对一般性的有限完美记 忆扩展式博弈,在终点结上的序贯均衡概率分布是有限的。88序贯均衡的性质无关行动与策略(Kohlberg和Mertons,1986):-加入一个显然无关的行动或策略后,序贯均衡集可 能会发生改变。相关序贯均衡:-序贯均衡可以推广到允许存在相关策略的情形。-在多阶段博弈中有三种做法(Forges,1986;Myerson,1986):-可以允许参与者在博弈前的阶段(“时期1”)收到信息。-可以允许参与者随着时间(在每一期)慢慢收到信息。-给参与者的信息可以根据其信息随机发送。89序贯均衡与完美贝叶斯均衡的 比较-在扩展式博弈中,序贯均衡的定义强于完美贝叶斯均 衡,或者说,序贯均衡是完美贝叶斯均衡的精炼。-但是验证序贯均衡或者说验证一致性条件C是一件困难 的事。定理10.2(Fudenberg和Tirole,1991)考察一个独立类型的 不完全信息多阶段博弈。如果每个参与者至多有两种可能的 类型(即对每个3#0Z.2),或者存在两个时期,则条件B 就等价于条件C,因此PBE的集合与序贯均衡的集合是重合的。-多阶段博弈PBE的条件B还可以进一步扩展到相对信念后,可 以得到同样的结论(Fudenberg和Tirole,1991)。90策哆式精嫉颤抖手完美均衡(Trembling-Hand Perfect Equilibrium,Selton 1975):-颤抖手完美均衡要求策略是完全混合策略的极限,而且对于 收敛序列中的每一个纯策略都必须赋予一个至少是最小的权 重(必须颤抖),在这个条件下,每个参与者的策略相对于 其对手的策略而言是(在受约束的条件下)最优的。-因而,与序贯均衡的区别在于策略必须沿着收敛子序列一直 处于均衡,而不仅仅是在极限时才处于均衡。这一区别只给 出了很小的差异,事实上序贯均衡集与完美均衡集“对几乎所 有的博弈,都是重合的。适当均衡(Proper Equilibrium,Myerson 1978):-对完美均衡进行了精炼,要求沿着被扰动策略的收敛序列,参与者在代价越高的“错误”上犯错的可能性越小。91颤抖手完美均衡的基本思想-在任何博弈中,参与者都有一定的可能犯错误,一个 策略只有当它在允许所有参与者都可能犯错误的情况 下仍是最优策略的组合时,才是一个均衡。-Selton(1975)将非均衡事件的发生解释为“颤抖Z当 一个参与者发现发生了不该发生的事件(博弈偏离均 衡路径),即把其归结为其他参与者的非蓄意错误。-由此,博弈树上每一结点出现的概率都为正,从而每 一结点上的最优反应都可定义,原博弈的均衡即可理 解为被颤抖扰动后的博弈的均衡的极限。92颤抖手完美均衡:策略式中的 三种等价定义定义10.13A策略式博弈的一个“后约束均衡”(-Constrained Equilibrium)是一个完全混合的策略组合使得对每个参与者3 都是&(,)/,5 约束于 0(S)咐)的规划max。的解,其中0 V 忒S)心一个完美均衡是当趋于0时合约束 均衡的任一极限。一个完美均衡是某个受约束博弈序列的纳什均衡的极限。93例:颤抖如何郝助精炼均衡集?94例:颤抖如何郝助精炼均衡集?均衡集的精炼:该博弈存在两个纯策略纳什均衡(Li,R2
展开阅读全文