完全信息静态博弈基础理论.pptx

资源描述

v 在本章中，我们讨论如下简单形式的博弈在本章中，我们讨论如下简单形式的博弈:v开始时由参与者同时选择行动，然后根据所有参与开始时由参与者同时选择行动，然后根据所有参与者的选择，每个参与者得到各自的结果者的选择，每个参与者得到各自的结果(一定的收益一定的收益或支出或支出)。v在此类静态在此类静态(即各方同时行动即各方同时行动)的博弈中，我们的分的博弈中，我们的分析又仅限于完全信息博弈的情况，即每一参与者的析又仅限于完全信息博弈的情况，即每一参与者的收益函数收益函数(根据所有参与者选择行动的不同组合决定根据所有参与者选择行动的不同组合决定某一参与者收益的函数某一参与者收益的函数)在所有参与者之间是共同知在所有参与者之间是共同知识识(common knowledge)。1.1.A 基础理论基础理论:博弈的标准式和纳什均衡博弈的标准式和纳什均衡v1.1.A 博弈的标准式表述博弈的标准式表述v在博弈的标准式表述中，每一参与者同时选择一个在博弈的标准式表述中，每一参与者同时选择一个战略，所有参与者选择战略的组合决定了每个参与战略，所有参与者选择战略的组合决定了每个参与者的收益。者的收益。v我们借一个经典的例子说明博弈的标准式我们借一个经典的例子说明博弈的标准式囚徒囚徒困境。困境。囚徒困境：囚徒困境：v两个犯罪嫌疑人被捕并受到指控，但除非至少一个两个犯罪嫌疑人被捕并受到指控，但除非至少一个人招认犯罪，警方并无充足证据将其按罪判刑。警人招认犯罪，警方并无充足证据将其按罪判刑。警方把他们关入不同牢室，并对他们说明不同行动带方把他们关入不同牢室，并对他们说明不同行动带来的后果。如果两人都不坦白，将均被判为轻度犯来的后果。如果两人都不坦白，将均被判为轻度犯罪，入狱一个月罪，入狱一个月;如果双方都坦白招认，都将被判入如果双方都坦白招认，都将被判入狱狱6个月个月;最后，如果一人招认而另一人拒不坦白，最后，如果一人招认而另一人拒不坦白，招认的一方将马上获释，而另一人将判入狱招认的一方将马上获释，而另一人将判入狱9个月个月所犯罪行所犯罪行6个月，干扰司法加判个月，干扰司法加判3个月。个月。v囚徒面临的问题可用下图所示的双变量矩阵表来囚徒面临的问题可用下图所示的双变量矩阵表来描述。描述。v“双变量双变量”指的是在两个参与者的博弈中，每一指的是在两个参与者的博弈中，每一单元格有两个数字，分别表示两个参与者的收益。单元格有两个数字，分别表示两个参与者的收益。v在此博弈中，每一囚徒有两种战略可供选择在此博弈中，每一囚徒有两种战略可供选择:坦白坦白(或招认或招认)、不坦白、不坦白(或沉默或沉默).v在一组特定的战略组合被选定后，两人的收益由上在一组特定的战略组合被选定后，两人的收益由上图双变量矩阵中相应单元的数据所表示。图双变量矩阵中相应单元的数据所表示。v习惯上，横行代表的参与者习惯上，横行代表的参与者(此例中为囚徒此例中为囚徒1)的收益的收益在两个数字中放前面，列代表的参与者在两个数字中放前面，列代表的参与者(此例为囚徒此例为囚徒2)的收益置于其后。的收益置于其后。博弈的要素：博弈的要素：v现在我们回到一般情况。现在我们回到一般情况。v博弈的标准式表述包括博弈的标准式表述包括:v（1）博弈的参与者；）博弈的参与者；v（2）每一参与者可供选择的战略集；）每一参与者可供选择的战略集；v（3）针对所有参与者可能选择的战略组合，每）针对所有参与者可能选择的战略组合，每一个参与者获得的收益。一个参与者获得的收益。v考虑考虑n个参与者的博弈个参与者的博弈：v（1）参与者从参与者从1到到n排序排序;v（2）设其中任一参与者的序号为）设其中任一参与者的序号为i，令，令Si代表参与代表参与者者i可以选择的战略集合可以选择的战略集合(称为称为i的战略空间的战略空间)，其中，其中任意一个特定的战略用任意一个特定的战略用si表示表示(有时我们写成，有时我们写成，si Si表示战略表示战略si是战略集是战略集Si中的要素中的要素);v（3）令）令(s1,.,sn)表示每个参与者选定一个战略形表示每个参与者选定一个战略形成的战略组合，成的战略组合，ui表示第表示第i个参与者的收益函数，个参与者的收益函数，ui(si,.,sn)即为参与者选择战略即为参与者选择战略(s1,.,sn)时第时第i个个参与者的收益。参与者的收益。博弈的标准式表述博弈的标准式表述v将上述内容综合起来，我们得到将上述内容综合起来，我们得到:v 定义定义在一个在一个n人博弈的标准式表述中，参与者的战人博弈的标准式表述中，参与者的战略空间为略空间为S1,Sn，收益函数为，收益函数为u1,un，我们用，我们用G=S1,Sn;u1,un表示此博弈。表示此博弈。同时选择战略的含义：同时选择战略的含义：v尽管我们曾提到尽管我们曾提到,在博弈的标准式中，参与者是同时选在博弈的标准式中，参与者是同时选择战略的，但这并不意味着各方的行动也必须是同时择战略的，但这并不意味着各方的行动也必须是同时的。只要是每一参与者在选择行动时不知道其他参与的。只要是每一参与者在选择行动时不知道其他参与者的选择就足够了。像上例中牢里分开关押的囚徒，者的选择就足够了。像上例中牢里分开关押的囚徒，可以在任何时间作出他们的选择。可以在任何时间作出他们的选择。v更进一步，尽管在本章中博弈的标准式只用来表示参更进一步，尽管在本章中博弈的标准式只用来表示参与者行动时不清楚他人选择的静态博弈，但标准式也与者行动时不清楚他人选择的静态博弈，但标准式也可用来表示序贯行动的博弈，只不过另一种变通的方可用来表示序贯行动的博弈，只不过另一种变通的方式式博弈的扩展式表述更为常用，它在分析动态问博弈的扩展式表述更为常用，它在分析动态问题时也更为方便。题时也更为方便。1.1.B 重复剔除严格劣战略重复剔除严格劣战略v下面开始介绍如何着手分析一个博弈论问题。下面开始介绍如何着手分析一个博弈论问题。v我们从囚徒的困境这个例子开始，因为它较为简单，我们从囚徒的困境这个例子开始，因为它较为简单，只需用到理性的参与者不会选择只需用到理性的参与者不会选择严格劣战略严格劣战略这一原这一原则。则。严格劣战略的定义：严格劣战略的定义：v定义定义在标准式的博弈在标准式的博弈G=S1,Sn;u1,un中，令中，令si和和si”代表参与者代表参与者i的两个可行战略的两个可行战略(即即si和和si”是是Si中的元素中的元素)。如果对其他参与者每一个可能的战略组。如果对其他参与者每一个可能的战略组合，合，i选择选择si的收益都小于其选择的收益都小于其选择si”的收益，则称的收益，则称战略战略si相对于战略相对于战略si”是严格劣战略是严格劣战略:vui(s1,si-1,si,si+1,sn)ui(s1,si-1,si”,si+1,sn)对其他参与者在其战略空间对其他参与者在其战略空间S1,Si-1,Si+1,Sn中中每一组可能的战略（每一组可能的战略（s1,si-1,si+1,sn）都成立。）都成立。重复剔除严格劣战略均衡：重复剔除严格劣战略均衡：v理性的参与者不会选择严格劣战略，因为他理性的参与者不会选择严格劣战略，因为他对对其他人选择的战略其他人选择的战略)无法作出这样的推断，使这一无法作出这样的推断，使这一战略成为他的最优反应。战略成为他的最优反应。v这样，在囚徒的困境中，一个理性的参与人会选这样，在囚徒的困境中，一个理性的参与人会选择招认，于是（招认，招认）就成为两个理性参择招认，于是（招认，招认）就成为两个理性参与者的结果，尽管与者的结果，尽管(招认，招认招认，招认)带给双方的福利都带给双方的福利都比比(沉默，沉默沉默，沉默)要低。要低。现在，我们来看理性参与者不选择严格劣战略这一原现在，我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。则是否能解决其他博弈问题。v考虑图考虑图1.1.1所示抽象博弈的例子：所示抽象博弈的例子：重复剔除严格劣战略均衡的缺陷：重复剔除严格劣战略均衡的缺陷：v上面的过程可称为上面的过程可称为“重复剔除严格劣战略重复剔除严格劣战略”。v尽管此过程建立在理性参与人不会选择严格劣战略尽管此过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上，它仍有两个缺陷这一合情近理的原则之上，它仍有两个缺陷:v第一，每一步剔除都需要假定，参与者间相互了解。第一，每一步剔除都需要假定，参与者间相互了解。v如果我们要把这一过程应用到任意多步，就需要假如果我们要把这一过程应用到任意多步，就需要假定定“参与者是理性的参与者是理性的”是共同知识。是共同知识。v这意味着，我们不仅需要假定所有参与人是理性的，这意味着，我们不仅需要假定所有参与人是理性的，还要假定所有参与人都知道所有参与人是理性的，还要假定所有参与人都知道所有参与人是理性的，还需要假定所有参与人都知道所有参与人都知道所还需要假定所有参与人都知道所有参与人都知道所有参与人是理性的，如此等等，以至无穷。有参与人是理性的，如此等等，以至无穷。v第二个缺陷在于这一方法对博弈结果的预测经常第二个缺陷在于这一方法对博弈结果的预测经常是不精确的。例如，在下图是不精确的。例如，在下图1.1.4中的博弈中，就中的博弈中，就没有可以剔除的严格劣战略。既然所有战略都经没有可以剔除的严格劣战略。既然所有战略都经得住对严格劣战略的重复剔除，该方法对分析博得住对严格劣战略的重复剔除，该方法对分析博弈将出现什么结果毫无帮助。弈将出现什么结果毫无帮助。1.1.C 纳什均衡的导出和定义纳什均衡的导出和定义v下面我们介绍纳什均衡，它是一种博弈的解的概念，下面我们介绍纳什均衡，它是一种博弈的解的概念，可以对非常广泛类型的博弈作出严格得多的预测。可以对非常广泛类型的博弈作出严格得多的预测。v导出纳什均衡的途径之一，是证明：导出纳什均衡的途径之一，是证明：v如果博弈论可以为博弈问题提供一个惟一解，此解如果博弈论可以为博弈问题提供一个惟一解，此解一定是纳什均衡。一定是纳什均衡。v原因如下：原因如下：v设想在博弈论预测的博弈结果中给每个参与者选设想在博弈论预测的博弈结果中给每个参与者选定各自的战略。为使该预测是正确的，必须使参定各自的战略。为使该预测是正确的，必须使参与者自愿选择理论给他推导出的战略。这样，每与者自愿选择理论给他推导出的战略。这样，每一参与者要选择的战略必须是针对其他参与者选一参与者要选择的战略必须是针对其他参与者选择战略的最优反应。择战略的最优反应。v这种理论推测结果可以叫做这种理论推测结果可以叫做“战略稳定战略稳定”或或“自自动实施动实施”的，因为没有参与人愿意独自离弃他所的，因为没有参与人愿意独自离弃他所选定的战略。选定的战略。v我们把这一状态称为纳什均衡。我们把这一状态称为纳什均衡。纳什均衡的定义：纳什均衡的定义：v定义定义在在n个参与者标准式博弈个参与者标准式博弈G=S1,Sn;u1,un中，中，如果战略组合如果战略组合s*1,s*n满足对每一参与者满足对每一参与者i，si*是是(至至少不劣于少不劣于)他针对其他他针对其他n-1个参与者所选战略个参与者所选战略s*1,s*i-1,s*i+1,s*n 的最优反应战略，则称战略组合的最优反应战略，则称战略组合s*1,s*n 是该博弈的一个纳什均衡。即是该博弈的一个纳什均衡。即:vui(s*1,s*i-1,s*i,s*i+1,s*n)ui(s*1,s*i-1,si,s*i+1,s*n)对所有对所有Si中的中的si都成立，亦即都成立，亦即s*i是以下是以下最优化问题的解最优化问题的解:纳什均衡与协议的理念纳什均衡与协议的理念v和纳什均衡推导密切相关的是和纳什均衡推导密切相关的是协议的理念协议的理念:对给定的对给定的博弈，如果参与者之间要商定一个协议决定博弈如博弈，如果参与者之间要商定一个协议决定博弈如何进行，那么一个有效的协议中的战略组合必须是何进行，那么一个有效的协议中的战略组合必须是纳什均衡的战略组合，否则，至少有一个参与人会纳什均衡的战略组合，否则，至少有一个参与人会不遵守该协议。不遵守该协议。v为更准确地理解纳什均衡这一概念，下面求解几个为更准确地理解纳什均衡这一概念，下面求解几个例题。例题。寻找纳什均衡的方法：划线法寻找纳什均衡的方法：划线法v一个最直接办法就是：简单查看每一个可能的战略组一个最直接办法就是：简单查看每一个可能的战略组合是否符合定义中不等式的条件。合是否符合定义中不等式的条件。v在两人博弈中，这一方法开始的程序如下在两人博弈中，这一方法开始的程序如下:对每一个对每一个参与者，并且对该参与者每一个可选战略，确定另一参与者，并且对该参与者每一个可选战略，确定另一参与者相应的最优战略。参与者相应的最优战略。v图图1.1.5中，就把图中，就把图1.1.4所示博弈作了上述处理，对所示博弈作了上述处理，对参与者参与者i的每一个可选战略，在参与者的每一个可选战略，在参与者j使用最优反应使用最优反应战略时的收益下面划了横线。战略时的收益下面划了横线。v如果在一对战略中，每一参与人的战略都是对方战略如果在一对战略中，每一参与人的战略都是对方战略的最优反应战略，则双变量矩阵相应单元的两个收益的最优反应战略，则双变量矩阵相应单元的两个收益值下面都被划了横线值下面都被划了横线)。猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头一按钮，控制食量。按一下进食一按钮，控制食量。按一下进食10单位，但支付单位，但支付2单位单位成本。如大猪先到，大猪吃到成本。如大猪先到，大猪吃到9单位，小猪单位，小猪1单位；如小单位；如小猪先到，大猪吃猪先到，大猪吃6单位，小猪单位，小猪4单位；如同时到，大猪单位；如同时到，大猪6单位，小猪单位，小猪4单位。单位。智猪博弈智猪博弈1：多劳不多得（张维迎，：多劳不多得（张维迎，P010）5 1 4 4 9 1 0 0 小猪小猪按按等等按按大猪大猪等等猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头一按钮，控制食量。按一下进食一按钮，控制食量。按一下进食8单位，但支付单位，但支付2单位成单位成本。如大猪先到，大猪吃到本。如大猪先到，大猪吃到7单位，小猪单位，小猪1单位；如小猪单位；如小猪先到，各吃先到，各吃4单位；如同时到，大猪单位；如同时到，大猪5单位，小猪单位，小猪3单位。单位。智猪博弈智猪博弈2：多劳少得（张维迎，：多劳少得（张维迎，P034035）3 1 2 4 7 1 0 0 小猪小猪按按等等按按大猪大猪等等猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头猪圈里一头大猪和一头小猪。圏的一头有一槽，另一头一按钮，控制食量。按一下进食仅一按钮，控制食量。按一下进食仅4单位，但支付单位，但支付2单位单位成本。如大猪先到，大猪吃到成本。如大猪先到，大猪吃到4单位，小猪单位，小猪0单位；如小单位；如小猪先到，吃猪先到，吃4单位；如同时到，大猪单位；如同时到，大猪3单位，小猪单位，小猪1单位。单位。智猪博弈智猪博弈3：劳而不得！：劳而不得！1 -2-2 4 4 -2 0 0 小猪小猪按按等等按按大猪大猪等等作业v请设计一个多劳多得的智猪博弈。纳什均衡和重复剔除严格劣战略均衡的关系纳什均衡和重复剔除严格劣战略均衡的关系v如果用重复剔除严格劣战略把除战略组合如果用重复剔除严格劣战略把除战略组合s*1,s*n外所有的战略组合都剔除掉，则该所存战略组合就是外所有的战略组合都剔除掉，则该所存战略组合就是此博弈惟一的纳什均衡。此博弈惟一的纳什均衡。v不过，由于重复剔除严格劣战略并不经常会只剩下惟不过，由于重复剔除严格劣战略并不经常会只剩下惟一的战略组合，纳什均衡作为比重复剔除严格劣战略一的战略组合，纳什均衡作为比重复剔除严格劣战略更强的解的概念，自然受到更多关注，理由如下更强的解的概念，自然受到更多关注，理由如下:v如果战略组合如果战略组合s*1,s*n是一个纳什均衡，它一定不是一个纳什均衡，它一定不会被重复剔除严格劣战略所剔除，但也可能有重复剔会被重复剔除严格劣战略所剔除，但也可能有重复剔除严格劣战略无法剔除的战略组合，其本身却和纳什除严格劣战略无法剔除的战略组合，其本身却和纳什均衡一点儿关系都没有。均衡一点儿关系都没有。纳什均衡的存在性纳什均衡的存在性v证明了纳什均衡是一个比重复剔除严格劣战略条件证明了纳什均衡是一个比重复剔除严格劣战略条件更强的解的概念之后，我们还必须解决一个问题，更强的解的概念之后，我们还必须解决一个问题，就是纳什均衡作为博弈解的概念，条件是否太强了，就是纳什均衡作为博弈解的概念，条件是否太强了，即我们即我们能否确定纳什均衡一定是存在的能否确定纳什均衡一定是存在的?v纳什纳什(1950)证明了在任何有限博弈证明了在任何有限博弈(即参与者即参与者n和战和战略集略集S1，Sn都是有限的博弈都是有限的博弈)中，都存在至少一中，都存在至少一个纳什均衡个纳什均衡(这一均衡可能包含了混合战略，我们将这一均衡可能包含了混合战略，我们将在后面讨论在后面讨论)。v古诺（古诺（1838）在双头垄断模型这一特定的环境中提）在双头垄断模型这一特定的环境中提出了同样的均衡概念，并通过构造的方法证明了模出了同样的均衡概念，并通过构造的方法证明了模型中均衡的存在性。型中均衡的存在性。v在以后的每一个应用分析中，我们都将沿袭古诺的在以后的每一个应用分析中，我们都将沿袭古诺的思路思路:即将通过构造一个纳什均衡即将通过构造一个纳什均衡(或条件更强的均或条件更强的均衡衡)的方法，证明均衡本身的存在性。的方法，证明均衡本身的存在性。纳什均衡的局限性：纳什均衡的局限性：v我们用另一经典例子作为本节小结我们用另一经典例子作为本节小结性别战博弈性别战博弈。关于这一博弈的传统表述关于这一博弈的传统表述(这一博弈从这一博弈从20世纪世纪50年年代就开始使用了代就开始使用了)，是一男一女试图决定安排一个晚，是一男一女试图决定安排一个晚上的娱乐内容，我们分析这一博弈的中性版本。上的娱乐内容，我们分析这一博弈的中性版本。v不在同一地方工作的不在同一地方工作的帕特（男）帕特（男）和和克里斯（女）克里斯（女）必必须就去听歌剧和看职业拳击赛选择其一，帕特和克须就去听歌剧和看职业拳击赛选择其一，帕特和克里斯都希望两人能在一起渡过一个夜晚，而不愿分里斯都希望两人能在一起渡过一个夜晚，而不愿分开，但帕特更希望能一起看拳击比赛，克里斯则希开，但帕特更希望能一起看拳击比赛，克里斯则希望能在一起欣赏歌剧，如下面双变量矩阵所示望能在一起欣赏歌剧，如下面双变量矩阵所示:v(歌剧，歌剧歌剧，歌剧和和(拳击，拳击拳击，拳击)都是纳什均衡。都是纳什均衡。v可见：如果博弈论可以为一个博弈提供惟一解，此可见：如果博弈论可以为一个博弈提供惟一解，此解一定是一个纳什均衡。这一命题没有提及解一定是一个纳什均衡。这一命题没有提及博弈论博弈论不能提供惟一解的可能情况不能提供惟一解的可能情况。v同时还论证了如果参与者之间能就如何进行给定的同时还论证了如果参与者之间能就如何进行给定的博弈达成一个协议，该协议也一定是一个纳什均衡。博弈达成一个协议，该协议也一定是一个纳什均衡。但这一命题同样没有考虑但这一命题同样没有考虑不能达成协议的可能情况不能达成协议的可能情况。v在一些有多个纳什均衡的博弈中，在一些有多个纳什均衡的博弈中，有一个均衡比其有一个均衡比其他均衡明细占优他均衡明细占优后面各章的主要理论内容就是找后面各章的主要理论内容就是找出不同类型博弈的这种占优均衡出不同类型博弈的这种占优均衡)，这时，多个纳什，这时，多个纳什均衡的存在本身也不会引出其他问题。均衡的存在本身也不会引出其他问题。v不过，在上面讲的性别战博弈中，不过，在上面讲的性别战博弈中，歌剧，歌剧歌剧，歌剧)和和(拳击，拳击拳击，拳击)又又难分优劣难分优劣。v这说明博弈论对有些博弈并不能提供惟一解，参与这说明博弈论对有些博弈并不能提供惟一解，参与者间也不能就该博弈的进行达成协议。者间也不能就该博弈的进行达成协议。v在这样的博弈中，纳什均衡用于预测博弈将如何进在这样的博弈中，纳什均衡用于预测博弈将如何进行的作用就大大减弱了。行的作用就大大减弱了。1、多重性：、多重性：v许多博弈往往存在不止一个纳什均衡，而许多博弈往往存在不止一个纳什均衡，而且相互之间有时没有明显的优劣关系。且相互之间有时没有明显的优劣关系。v即使相互之间有明显的优劣关系，我们也即使相互之间有明显的优劣关系，我们也不能保证，博弈方一定会选择较优的纳什不能保证，博弈方一定会选择较优的纳什均衡。均衡。v因此需要根据对手的情况适时作出反应，因此需要根据对手的情况适时作出反应，将原则的坚定性和策略的灵活性有机结合。将原则的坚定性和策略的灵活性有机结合。多重纳什均衡博弈的分析多重纳什均衡博弈的分析v2、几个常用的甄别标准、几个常用的甄别标准v（1）帕累托优势标准）帕累托优势标准v适用于多个纳什均衡之间存在明显的优劣适用于多个纳什均衡之间存在明显的优劣关系，博弈的某个纳什均衡给所有局中人关系，博弈的某个纳什均衡给所有局中人带来的收益，都大于其他纳什均衡带来的带来的收益，都大于其他纳什均衡带来的收益。这种按支付大小筛选出来的纳什均收益。这种按支付大小筛选出来的纳什均衡，比其他纳什均衡具有帕累托优势。衡，比其他纳什均衡具有帕累托优势。v猎鹿博弈猎鹿博弈2 20 11 0 1 1 局中人局中人2坚守坚守擅离擅离坚守坚守局中人局中人1 擅离擅离v战争与和平战争与和平v（谢识予，（谢识予，P93）5 5 8 1010，8 10，10 战争战争国家国家1 和平和平国家国家2战争战争和平和平v（2）风险优势标准）风险优势标准v考虑不同纳什均衡之间的风险状况，风险考虑不同纳什均衡之间的风险状况，风险小的优先。小的优先。v测定风险的方法有二：测定风险的方法有二：v第一是期望支付法；第二是偏离损失比较第一是期望支付法；第二是偏离损失比较法。法。v期望支付法：寻找占优战略期望支付法：寻找占优战略v（王则柯，（王则柯，P125126）9，9 0，8 8，0 7，7 上上局中人局中人1 下下局中人局中人2上上下下v这种方法通过假设概率情况来计算期望这种方法通过假设概率情况来计算期望支付，从而测定风险。这容易引起混淆，支付，从而测定风险。这容易引起混淆，有很不严密的地方。有很不严密的地方。v偏离损失乘积比较法：偏离损失乘积比较法：v比较比较甲偏离均衡甲偏离均衡A的损失的损失乙偏离均衡乙偏离均衡A的损失的损失甲偏离均衡甲偏离均衡B的损失的损失乙偏离均衡乙偏离均衡B的损失的损失v乘积大的风险大，具有风险优势乘积大的风险大，具有风险优势v（王则柯，（王则柯，P126127）6，6 0，5 5，0 4，4 上甲下乙左右 v（3）聚点均衡）聚点均衡v在现实生活中，局中人可能会使用某些被在现实生活中，局中人可能会使用某些被博弈模型抽象掉的信息来达成一个共识，博弈模型抽象掉的信息来达成一个共识，从而达到一个均衡。这些信息往往跟社会从而达到一个均衡。这些信息往往跟社会文化习惯、局中人过去博弈的历史和经历文化习惯、局中人过去博弈的历史和经历有关。这就是聚点均衡概念的基本思想。有关。这就是聚点均衡概念的基本思想。v案例：案例：v假定你和你热恋中的恋人正在打电假定你和你热恋中的恋人正在打电话，突然，连接中断。这时候，你话，突然，连接中断。这时候，你将如何行动？聚点是什么？将如何行动？聚点是什么？0，0 3，2 2，3 0，0 重打重打男男不打不打女女重打重打不打不打v（4）颤抖手精练均衡）颤抖手精练均衡v泽尔滕在泽尔滕在1975年的一篇论文，提出了颤抖年的一篇论文，提出了颤抖手精练均衡（手精练均衡（trembling-hand perfect equilibrium），进一步精练纳什均衡。基），进一步精练纳什均衡。基本思想是：在任何一个博弈中，每一个局本思想是：在任何一个博弈中，每一个局中人都有一定的犯错误的可能性。局中人中人都有一定的犯错误的可能性。局中人所选择的一个策略组合，只有当它在允许所选择的一个策略组合，只有当它在允许每个局中人都可能犯小小的错误时仍是所每个局中人都可能犯小小的错误时仍是所有局中人的最优策略组合时，才是一个足有局中人的最优策略组合时，才是一个足够稳定的均衡。（正式的定义，见：王则够稳定的均衡。（正式的定义，见：王则柯，柯，P140）v由于局中人的由于局中人的“手手”（策略选择）可能（策略选择）可能颤抖（偏离纳什均衡的要求），致使他颤抖（偏离纳什均衡的要求），致使他们的策略集中的每一个纯策略都有被选们的策略集中的每一个纯策略都有被选中的可能，即：中的可能，即：v每一个纯策略被选中的概率都严格为正。每一个纯策略被选中的概率都严格为正。v颤抖手精练均衡的证明方法颤抖手精练均衡的证明方法（张维迎，（张维迎，P210；王则柯，；王则柯，P141142）B左左中中右右上上A 中中下下 124 103 122 120 112 111 123 81 132证明策略组合证明策略组合（上，左）是颤抖手均衡：（上，左）是颤抖手均衡：v第一步，设第一步，设A选择上中下的概率都为正，比选择上中下的概率都为正，比如：选下的概率如：选下的概率1/m，选中的概率，选中的概率1/m，于，于是，是，2/m就是就是A选上的过程中犯错误的概率，选上的过程中犯错误的概率，正确的概率为正确的概率为12/m。v第二步，计算在第二步，计算在A选择上中下的概率分别为选择上中下的概率分别为12/m、1/m、1/m的情况下，的情况下，B分别选分别选左中右的期望支付，并进行比较。左中右的期望支付，并进行比较。v如果（上，左）是颤抖手均衡，那么如果（上，左）是颤抖手均衡，那么B选左选左的期望支付必然大于其他二个策略。的期望支付必然大于其他二个策略。v第三步，令第三步，令m趋于无穷大，以满足错误足够趋于无穷大，以满足错误足够小的要求，然后比较小的要求，然后比较B选择左、中、右的期选择左、中、右的期望支付，得：望支付，得：B选择左是最优的策略。选择左是最优的策略。v第四步，运用同样的方法，设第四步，运用同样的方法，设B选择左中右选择左中右的概率，且都为正，如：分别为的概率，且都为正，如：分别为12/n、1/n、1/n。v第五步，计算给定第五步，计算给定B的概率的条件下，的概率的条件下，A选上选上中下的期望支付，并将上和中下进行比较。中下的期望支付，并将上和中下进行比较。v如果（上，左）是颤抖手均衡，那么如果（上，左）是颤抖手均衡，那么A选上选上的期望支付必然大于其他二个策略。的期望支付必然大于其他二个策略。v第六步，令第六步，令n趋于无穷大，比较趋于无穷大，比较A选上、中、选上、中、下的期望支付，得：下的期望支付，得：A选择上是最优策略。选择上是最优策略。证毕！证毕！

展开阅读全文