收藏 分销(赏)

4博弈分析.pptx

上传人:丰**** 文档编号:4182816 上传时间:2024-08-12 格式:PPTX 页数:32 大小:499.31KB 下载积分:12 金币
下载 相关 举报
4博弈分析.pptx_第1页
第1页 / 共32页
4博弈分析.pptx_第2页
第2页 / 共32页


点击查看更多>>
资源描述
第第4 4章章 博弈分析博弈分析4.1 博弈分析初步博弈分析初步4.2 矩阵博弈的两种策略矩阵博弈的两种策略4.3 矩阵博弈的解法矩阵博弈的解法MBA学位课数据模型与决策学位课数据模型与决策2024/8/11 周日24.1.1 博弈现象和博弈论博弈分析又称博奕论博奕论,是研究具有斗争或竞争性质现象的数学理论和方法,它既是现代数学的一个新的分支,也是运筹学的一个重要组成部分。博弈论发展的历史并不很长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般日常生活等都有着密切的联系,并且处理问题的方法又有明显特色,所以在管理领域日益引起了广泛的重视。在博弈论中,把具有斗争或竞争性质的现象就称作博弈现象。在现实生活中,博弈现象是普遍存在的,如古代中国战国时期的“齐王赛马”,就是一个典型的博弈现象。博弈现象的一个共同特点博弈现象的一个共同特点是:参加斗争的各方具有完全不同的利益和目标。为了达到各自的利益和目标,各方必须充分考虑和估计对手可能采取的各种行动方案,并针锋相对地选择对自己最有利或最合理的方案。博弈论就是专门研究博弈现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案的数学理论和方法。第第4章章 博弈分析博弈分析4.1 博弈分析初步博弈分析初步为了便于对不同的博弈问题进行研究,博弈论将博弈问题根据不同方式进行了分类。分类方式主要包括:(1)根据局中人的个数,分为 二人博弈和多人博弈,多人博弈中局中人多于二人。(2)根据各局人中的赢得函数的代数和是否为零,可分为 零和博弈和非零和博弈。(3)根据局中人之间是否允许合作,可分为 合作博弈和非合作博弈。(4)根据局中人策略集合中的策略个数,可分为有限博弈和无限(或连续)博弈。(5)根据策略的选择是否与时间有关,可分为 静态博弈和动态博弈。(6)根据博弈模型的数学特征,可分为 矩阵博弈、连续博弈、微分博弈、阵地对策、凸博弈、随机博弈 等。在众多的博弈模型中,有重要地位的是二人有限零和博弈二人有限零和博弈,又称矩阵博弈矩阵博弈。这类博弈是到目前为止在理论研究和求解方法方面都比较完善的一个博弈论分支。尽管矩阵博弈基本上是一类最简单的博弈论模型,但其研究的思想和方法具有十分重要的代表性,体现了博弈论的一般思想和方法,而且它的研究结果也是研究其它博弈模型的基础,因此,基于这些认识,本章将主要介绍矩阵博弈的基本内容。4.1.2 博弈问题的三要素 为了对博弈问题进行数学上的分析,必须建立博弈问题的数学模型,称为博弈模型。不论博弈模型在形式上有何不同,一般都必须包括以下三个基本要素:一、局中人一、局中人在一个博弈中,有权决定自己行动方案的博弈参加者称为局中人。在二人博弈中,有两个局中人,通常用局中人和局中人表示;在多人对策中,则有多个局中人,通常用表示局中人的集合。在博弈现象中,局中人并不一定都是具体的人,它可以理解为个人,也可以理解为一个集体,如球队、军队、企业等,还可以是非人的客观状态,如天气状况、经济形势等。另外,在博弈中利益完全一致的参加者只能看成是一个局中人。如桥牌赛中的南北方和东西方尽管各有两人,共四人参加竞赛,但只能算两个局中人。博弈论中对局中人的一个重要假设是:每个局中人都是“理智的”,即对于每一个局中人来说,都不存在侥幸心理,不存在利用其它局中人的决策失误来扩大自身利益的行为或预期。2024/8/11 周日5二、策略集合二、策略集合一个博弈中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加博弈的每一个局中人i(iI)的策略集合记为 iS,一般地,每一局中人的策略集合中至少应包括两个策略。如在“齐王赛马”中,如果用(上、中、下)表示以上马、中马、下马依次参赛,那么它就是一个完整的行动方案,即为一个策略。可见,齐王和田忌各自都有六个策略(3!个):(上、中、下)、(上、下、中),(中、上、下)、(中、下、上)、(下、上、中)、(下、中、上)、三、赢得函数三、赢得函数(支付函数)(支付函数)一个博弈中,每位局中人所出策略形成的一博弈略称作一个局势。对于二人博弈一个局势可用Sij表示,即局中人I出第i个策略局中人II出第j个策略形成的局势。在多人博弈中假定有n个局中人,每个局中人都从自己的策略集合中选出一个策略,则全部的局势数。比如田忌赛马问题中,就总共有6636个局势。当一个局势出现后,必然会有一个竞争结局,把这种竞争结局用数量来表示,就称作赢得函数或支付函数,用)()(sHi表示。一个局势实际就是一次较量,而赢得也就是较量一次的结果。如在”齐王赛马”中,齐王和田忌的策略集合分别为),.,(6211aaaS=和),.,(6212bbbS=.这样,齐王的任一策略 ia和田忌的任一策略 jb就构成了一个局势ijS。如两人分别采用策略 1a和 1b,则齐王的赢得为)(111SH3,田忌的赢得为3)(111-=SH。在二人有限零和博弈中,每一局势的赢得函数可以用矩阵来表示,把赢得函数用矩阵来表示,就称作赢得矩阵(或支付矩阵)。一般地,当博弈问题中的局中人局中人,策略集合策略集合和赢得函数赢得函数这三个要素确定后,一个博弈模型也就确定了。2024/8/11 周日74.1.3 博弈问题举例 一、招揽乘客问题一、招揽乘客问题有两家客运公司A和B,同时服务于甲、乙两地之间,每年在这个区间流动的乘客数为一常数,因此,其中一家乘客增多,就意味着另一家乘客减少。在这种情况两家都力图采取措施以招揽更多的乘客。假定每个公司可采取的措施有以下三种:(1)优质服务,即什么都不做仅通过优质服务赢得乘客;(2)口头宣传,即在行车其间对乘客进行各种口头宣传;(3)打广告,即运用各种广告媒体做广告宣传。于是总共可以有9种局势,在每一种局势下A公司的赢得函数可以表列如下:B公司A公司优质服务口头宣传打广告优质服务口头宣传打广告02007002000250600200100 问两公司各应采取何种措施,才能招揽到更多乘客?2024/8/11 周日8二、差旅问题二、差旅问题某人要由甲地去乙地出差,汽车公司规定,到乙的单程车票是35元,来回车票是50元。根据经验,甲地常有车去乙地办事,因此出差人极有可能搭便车回来而不必乘汽车公司的车。于是,出差人面临的情况是:或者买单程车票,或者买来回车票。买单程车票若有便车可搭,只需要35元车费;但如果无便车可搭则需要再另花35 元买一张回程票,总共要花费70元钱。买来回车票,不论是否有便车可搭,都得花去50元钱。那么到底是买单程车票好呢还是买来回车票好?这一问题的赢得矩阵可以表述如下:1b 2b)()()(5070503521来回单程无便车有便车aa在这里 局中人局中人是客观情况是客观情况,局中人局中人是乘客即出差人是乘客即出差人,赢得矩阵表示汽车公司的赢得函数。当然也可以把乘客作为局中人I来考虑。这时的赢得函数需要用负数来表示。客观情况2024/8/11 周日9三、曹操的去路问题三、曹操的去路问题三国时赤壁大战之后,曹操率领残兵败将企图逃往南郡,途中来到了一个三岔路口,前面有两条道,一条是小路即华容道,窄险难行;另一条是大路,便于行军,但比小路要多走50里路。两条路都可能有诸葛亮的伏兵。在这紧急关头,曹操盘算着博弈;诸葛亮的伏兵到底会在哪条路上?曹军到底走哪条路较妥?若走小路,如果遇到伏兵,曹军将全军覆没;如果没有伏兵,曹军虽能顺利到达南郡,但因山路险窄,兵马辎重损失较大。若走大路,因大路不便于伏兵,且便于冲杀突过,所以,既使遇到伏兵也不至于全军覆没,若大路没有伏兵,曹军能顺利地到达南郡,重整旗鼓,再次决战。那么,曹操究竟应取何种策略,是走小路还是走大路才能保证自己损失最小呢?对这一博弈问题,可以采取打分的方法将诸葛一方的“得失”用适当的数字表示出来。根据分析,诸葛一方的赢得矩阵(分数)可以用下表表示:(曹操一方)1b 2b(诸葛一方))()()()(80809010021大路小路大路小路-aa四、齐王赛马问题 根据已知条件,在同等数的马中,田忌的马不如齐王的马,但如果田忌的马比齐王的马高一等数,则田忌可获胜。于是可得到齐王的赢得矩阵为:田忌齐王上中下 上下中 中上下 中下上 下中上 下上中上中下上下中中上下中下上下中上下上中3 1 1 1 1 11 3 1 1 1 11 1 3 1 1 11 1 1 3 1 11 1 1 1 3 11 1 1 1 1 3如果将齐王与田忌的马分别进行比赛,则可以形成 9个局势,其结果如下表:田忌齐王上 中 下上中下1 1 11 1 11 1 1该表可用以解释前一表的结果。请同学们试写出“石头、剪刀、布”两碰吃游戏的赢得矩阵。“石头、剪刀、布”两碰吃游戏的赢得矩阵:石头 剪刀 布石头剪刀布Click to show Answer2024/8/11 周日124.2.1 矩阵博弈的纯策略 矩阵博弈,也就是二人有限零和博弈二人有限零和博弈二人有限零和博弈二人有限零和博弈,即博弈中有两个人,每个人 的策略都是有限的,其中一人所得为另一人所失,得失之和为零。它的 一般定义是);,(21ASSG=,其中,1S和2S是每一局中人的策略集合,A是局中人的赢得矩阵,并有:),.,(3211maaaaS=),.,(3212nbbbbS=mnmmnnaaaabbaaaA.212222111211 1S和2S中的每一个元素都称作一个纯策略,纯策略ia和jb选定 后,就形成了一个纯 局势),(jiba,这样的纯局势共有mn 个。4.2 矩阵博弈的两种策略矩阵博弈的两种策略2024/8/11 周日13。例4.1 设有一矩阵博弈);,(21ASSG=,其中:-=6104801213936A 试分析每一局中人各方应采取何种策略最为有利?这里需要注意的是需要注意的是,在矩阵博弈中,“零和零和”的含义的含义是指赢得和支付 之和为零,或者说是赢得矩阵和支付矩阵之和为零,同一矩阵中所有元素 之和表示一局中人在所有可能的局势中的赢得之和或支付之和,不一定为0。解:由A容易看出,局中人的最大赢得是9,如果他想赢得这个数,他就要选纯策略3a。由于局中人也是假定的理智竞争者,他考虑到局中 人会出3a的心理,便准备以3b对付之,使对方不但得不到9反而失掉10。局中人当然也会猜到局中人的这种心理,故转而出4a来对付,使局中 人得不到10反而失掉6;如此,相互追逐不休。所以,如果双方都不想 冒险,都不存在侥幸心理,就应该考虑到对方必然会设法使自己所得最多而 2024/8/11 周日14使对手所得最少这一点,从而从自己可能出现的最不利的情形中选择一个 最有利的情形作为决策的依据,这就是所谓的“理智行为”,也是博弈双方 实际上可以接受并采取的一种稳妥的策略。这类似于进行一项非确定型决策。每一位决策人(即局中人)都面临 有若干种自然状态,究竟会出现哪一种状态决策人并不知道(每一位局中 人都不可能知道对方的策略),在这种情况下,决策人经常可能会采取的一 个策略就是,从最不利的状态出发选择最好的方案,换句话说也就是“从最 坏处着想,向最好处努力”。局中人局中人所以,有均衡点 a222以上分析表明,局中人和的“理智行为”是分别选纯策略2a和2b,这时局中人的赢得值和局中人的所失值绝对值相等,局中人得到了预期的最少赢得2,而局中人也不会给他的对手带来比2更多的所得,两人相互竞争的结果使博弈出现了一个平衡局势即(2a,2b),这个局势是双方均可以接受且对于双方来说都是一个最稳妥的结果。因此 2a和2b就分别称作局中人和局中人的最优纯策略。对于一般的矩阵对策,有如下定义:定义 4.1对于矩阵博弈);,(21ASSG=,若GijijijjiVaa=maxminminmax则称GV为博弈的值博弈的值博弈的值博弈的值,称使该式成立的纯局势),(*jiba为G在纯策略意义下的解纯策略意义下的解纯策略意义下的解纯策略意义下的解(或平衡局势),称*ia和*jb分别为局中人和的最优纯策略最优纯策略最优纯策略最优纯策略。2024/8/11 周日16 从例4.1中还可以看出,实际上GV也就是平衡局势(2a,2b)的对应元素22a,它既是所在行的最小元素,又是所在列的最大元素,即有:jiaaa2222 (i=1,2,3,4;j=1,2,3)在这里,22a就称作例4.1中矩阵博弈G的一个鞍点。将这一事实推广到一般的矩阵博弈,可得如下定理:定理4.1矩阵博弈);,(21ASSG=在纯策略意义下有解的充要条件是:存在纯局势),(*jiba,使得对于任意的i和j,有:jijiijaaa*也就是存在一个鞍点元素。(证明从略)顾名思义,鞍鞍点点正象一个马鞍的中心,马鞍的中心依我们观察的方向不同,是槽又是脊,如图4.1所示。课堂练习:课堂练习:试找出4.1.3中的4个例子即“招揽乘客问题”、“差旅问题”、“曹操的去路”和“齐王赛马问题”的鞍点。8 我们还可以看一个生活中实实在在的案例。谈话博弈(沉默是金)谈话博弈(沉默是金)反应好 反应不好 谈不谈 反应好 反应不好 谈不谈无鞍点2024/8/11 周日18对博弈值的一种形象理解 咆哮的狼狗 一只可怜的小兔子被关在花园里,花园的形状如右图所示,南面是个矩形,北面是半圆形。在篱笆外面有一条街道,一只凶恶的大猎狗紧贴篱笆沿着大街东奔西跑,一面狂吠着,一面竭力想接近小白兔,试图吞噬它。而可怜的兔子呢,当然想竭力躲避这个可怖的威胁设法尽一切可能使它和恶狗之间的距离离得越远越好。现在请大家看图,兔子原来处于图中C的位置,也就是半圆部分的圆心。恶狗现在窜到1的位置,兔子马上逃到1,因为很明显,在整个花园中,离1最远的位置就是1;恶狗当然不甘心,它马上奔到2,因为这时候,2是离开1最近的地方(恶狗只能沿着大街奔跑,不能跳过篱笆),于是兔子又逃到2,恶狗再追到3;兔子又逃往3,。这样一直追下去,最后兔子逃到了极限位置R,而恶狗追到D,这时候,双方都感到了满足。因为兔子如果再动一动的话,距离反而会减小,而恶狗呢,它如果再走动的话,和兔子的距离反而会增大,而这都是与它们的主观愿望相抵触的,于是,它们之间达到了“平衡”。距离DR,就是达一局博弈的“值”。4.2.2 矩阵博弈的混合策略根据前面的讨论,我们已经知道,在一个矩阵博弈);,(21ASSG=中,按照“从最不利的状态出发选择最好的策略”的原则(该原则也叫“最最最最大最小大最小大最小大最小”原则原则原则原则),局中人能保证的充其量最少赢得的不低于:ijjiaVminmax1=而局中人能保证的充其量最大损失不过是:ijijaVmaxmin2=一般地说,局中人局中人的赢得不会多于局中人的赢得不会多于局中人的损失的损失,故总有21VV。当21VV=时,矩阵博弈在纯策略条件下有解,且21VVVG=,这时的矩阵博弈称作为有鞍点的矩阵博弈有鞍点的矩阵博弈有鞍点的矩阵博弈有鞍点的矩阵博弈。而当21 V V时,根据定义4.1 对策问题不存在纯策略意义下的解。这时的矩阵博弈均为无鞍点矩阵博弈无鞍点矩阵博弈无鞍点矩阵博弈无鞍点矩阵博弈。2024/8/11 周日20例例例例4.24.2 求矩阵博弈);,(21ASSG=的解,其中=4563A解:因为ijjiaVminmax1=4 ijijaVmaxmin2=5 21 V,显然,在这里不存在鞍点元素。V所以,当双方都根据“从最不利的状态出发选择最好的策略”的原则选择纯策略纯策略纯策略纯策略时,两人应分别选择2a和1b策略。但是当局中人选2a时,他的实际赢得,由于局中人选的是1b将赢得5,比其预期的最多盈得1V4要多。所以,1b实际不是局中人实际不是局中人实际不是局中人实际不是局中人的最优策略的最优策略的最优策略的最优策略。同时,当局中人出2a时,局中人的正确选择应是2b。但当局中人选2b时,局中人又会选1a。这样,局中人出1a和2a的可能性及局中人出 1b和 2b的可能性都不能排除。换言之也就是说,对两个局中人来说,根本不存在一个使双方都可以接受的平衡局势,即不存在纯策略意义下的解。在这样的情况下,一个比较切合实际合乎逻辑的想法必然是:既然局中人都没有最优纯策略可出,是否可以给出一个不同策略的概率分布。比如,在例 4.2 中局中人可制定这样一种策略,即分别以概率)43,41(选取纯策略),(21aa,这种策略就称作为一个混合策略混合策略。同样,局中人也可以制定这样一个混合策略,即分别以概率)21,21(选取纯策略),(21bb。显然,混合策略并不具有唯一性混合策略并不具有唯一性混合策略并不具有唯一性混合策略并不具有唯一性。下面给出矩阵博弈混合策略及其在混合策略意义下解的定义。定义定义定义定义4.24.2设有矩阵博弈);,(21ASSG=,其中nmijaA=)(,记 )1;,.,2,1,10(1=miiimpmipEpP)1;,.,2,1,10(1=njjjnqnjqEqQ其中,mE和nE分别表示m维和n维的欧氏空间,并规定 p 为 m 维的行向量,q 为 n 维的列向量;则称 P 和 Q 分别为局中人和局中人的混合策略集合混合策略集合混合策略集合混合策略集合,称(p,q)为一个混合局势混合局势混合局势混合局势。同时,将局中人的期望赢得期望赢得期望赢得期望赢得或赢得函数或赢得函数或赢得函数或赢得函数记为:pAqqpaqpEjminjiij=11),(仍以例4.2为例,按照给定的混合策略,2921214563)43,41(),(=qpE 期望赢得的概念是容易理解的。因为在混合策略条件下,每次双方会选择哪一个纯策略完全是一个随机事件,而任何一个纯局势的出现,都是两个相应的纯策略共同出现的结果,根据概率论知识,交事件交事件交事件交事件的概率就等于相应事件概率之积;同时,在混合策略条件下,其中的每一个纯局势可能出现的博弈值也完全是一个随机变量,而根据数学期望的定义,随机变量的期望随机变量的期望随机变量的期望随机变量的期望就等于每一随机变量与其相应概率之积的代数和。由于矩阵博弈的混合策略并不唯一,因此如何找到最优混合策略是一个重要问题。定义4.3设p,q分别为局中人和局中人的任一混合策略,若存在局中人的某个混合策略*p和局中人的某个混合策略*q,使下式成立则称GV为博弈的值博弈的值博弈的值博弈的值,*p和*q分别称作局中人和的最优混合策略最优混合策略最优混合策略最优混合策略,(*p,*q)称作该混合博弈的解混合博弈的解混合博弈的解混合博弈的解。这一定义是容易理解的。因为这里博弈的原则仍然是“从最不利的状态出发选择最好的策略”,这样对于局中人来说,对他最不利的状态就是,局中人总是力图使他自己的损失或对手的赢得最小化,也就是说,而对于局中人来说,他所面临的最不利的状态就是,局中人总是力图使他自己的赢得或对手的损失最大化,也就是说,),(max),(*qpEqpEPp=所以,定义4.3 中的等式实际也等价于下面的等式:GPpQqQqPpVqpEqpE=),(maxmin),(minmax定理定理4.24.2 矩阵博弈G在混合策略意义下有解的充要条件是:存在混合策略*pP,*qQ,使得对于任意的pP和qQ:),(),(),(*qpEqpEqpE这一条件与定义定义4.3 中的等式是完全等价的。它说明,如果局中人采用自己的最优策略,而不采用最优策略,的赢得将会减少(小于双方都采用最优策略时的所得);如果局中人采用自己的最优策略,而不采用最优策略,的损失将会更大(大于双方都采用最优策略时的损失)。由于定理4.2的条件与定义4.3 中的等式等价,因此显然有:*),(qApqpEVG=或者:4.3.1 4.3.1 既约矩阵及其行列式解法既约矩阵及其行列式解法 所谓的既约矩阵既约矩阵既约矩阵既约矩阵,即不存在优超现象的矩阵。优超现象优超现象优超现象优超现象是指这样一种现象,即在一个给定的矩阵中,存在某一行或某一列与另一行或另一列相比要优(大于等于或小于等于)的现象。在存在优超现象的情况下,如果甲策略优超于乙策略,则甲策略就称作优势策略优势策略,乙策略就称作劣势策略劣势策略。如在下面的矩阵A中:显然,第4行优超于第1行,第3行优超于第1行和第2行,故可划去第1和第2行,得到:在A1中,第1列优超于第3列,第2列优超于第4列和第5列,因此划去第3、4、5列,得到:4.3 矩阵博弈的解法矩阵博弈的解法2024/8/11 周日26 显然,第1行仍优超于第3行,划去第3行得:解之,得到:有鞍点的矩阵博弈有鞍点的矩阵博弈有鞍点的矩阵博弈有鞍点的矩阵博弈一般都存在着明显的优超现象优超现象优超现象优超现象。请同学们试着检查“招揽乘客问题招揽乘客问题招揽乘客问题招揽乘客问题”、“差旅问题差旅问题差旅问题差旅问题”和 例例例例4.14.1是否存在优超现象。划去劣势策略的过程通常也称作非既约矩阵的约简2024/8/11 周日27 对于一个既约方阵既约方阵既约方阵既约方阵通常通常可采用行列式解法求解,以33的矩阵博弈为例。如有博弈 G=(s1,s2;A),其中:先求局中人先求局中人I的混合策略的混合策略。可先用第1列减第2列,第2列减第3列(也可以用第3列减第2列,第2列减第1列。想一想,为什么),得到:其次,求策略a1的混合比频数。可先划去第1行,计算余下的方阵的行列式的值:1102 26;再依次划去第二行、第三行求a2、a3的混合比频数分别为:6和48(行列式的值不计符号),即各个策略的混合比为:1:1:8。A既无鞍点,也不存在优超现象,属既约矩阵故可用行列式解法行列式解法行列式解法行列式解法求解。再求局中人再求局中人II的混合策略的混合策略。用第1行减第2行,第2行减第3行(当然,也可以用第3行减第2行,第2行减第1行。想一想,为什么),得到:应用类似的方法,可得到三种策略的混合比为:19:7:4。课堂练习:课堂练习:请同学们试着用行列式解法求出“石头剪刀布”游戏的解。(Click to show answer)p(1/3,1/3,1/3)q(1/3,1/3,1/3)4.3.2 22矩阵对策的解法矩阵对策的解法根据行列式解法,对于22的赢得矩阵可以这样做:将列相减后换位作为局中人将列相减后换位作为局中人I的混合策略中的混合比;的混合策略中的混合比;将行相减后换位作为局中人将行相减后换位作为局中人II的混合策略中的混合比。的混合策略中的混合比。相减时的差值只考虑绝对值不考虑正负号,同时注意约简相减时的差值只考虑绝对值不考虑正负号,同时注意约简。如,在曹操的去路曹操的去路曹操的去路曹操的去路问题中:对诸葛一方:100(90)190;|8080|=160 所以,诸葛一方二策略的混合比应为:16:19 对曹操一方:100(80)180;9080170 所以,曹操一方二策略的混合比应为:17:18 而对策的值对策的值则可以用局中人I的混合比对某一列或用局中人II的混合比对某一行进行加权平均取得。如在上例中:也还可以这样考虑。由于不存在最优的纯策略,因此每一个局中人合乎逻辑的考虑便是,我的最优混合策略的选择,应该使得对手不能从任何纯策略中获得额外利益,即使得对手只能从不同的纯策略中获得相等的利益。以例4.2为例。【解】设 p1=p,p2=1-p,则有:3p+5(1-p)=6p+4(1-p)解之 p1=p=1/4,p2=3/4 同理,设q1=q,q2=1-q,则有:3q+6(1-q)=5q+4(1-q)解之 q1=q=1/2,q2=1/2 对策的值为:对策的值也可以这样算,可以用局中人I的混合概率将某一列加权,或用局中人II的混合概率将某一行加权。但这样做需注意,被加权的某行或某列的混合概率必须大于0。2921214563)43,41(),(=qpE课堂练习课堂练习:试应用线性规划方法解下列赢得矩阵的博弈问题:(Click to show answer)求解后,p1=1/3,p2=2/3;q1=q2=1/2;VG=7 最后,需要讲一下最优混合策略的实现问题。由于混合策略具有随机性,因此,局中人在采用最优混合策略进行竞争时,通常需要借助于一个随机装置,假如最优混合策略是(0.3,0.7),即可在一个小罐子里装3 颗黑子,7颗白子,摸到黑子则出策略,摸到白子则出策略。若最优混合策略由三个或四个纯策略构成,随机装置则可以采用不同花色的扑克牌构造。本章应完成作业本章应完成作业本章应完成作业本章应完成作业 (熊义杰编著熊义杰编著熊义杰编著熊义杰编著220220页页页页)1.求解下列的矩阵对策,并明确回答它们分别是不是既约矩阵?有没有鞍点?(2)(3)6.用行列式解法求解下列矩阵对策:(1)(2)
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服