收藏 分销(赏)

经济博弈论第三讲混合博弈.ppt

上传人:xrp****65 文档编号:13052915 上传时间:2026-01-12 格式:PPT 页数:18 大小:55.50KB 下载积分:10 金币
下载 相关 举报
经济博弈论第三讲混合博弈.ppt_第1页
第1页 / 共18页
经济博弈论第三讲混合博弈.ppt_第2页
第2页 / 共18页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第三讲混合策略纳什均衡,我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的策略组合,即(,s,1,*,,,,,s,i,*,,,,,s,n,*,)是一个纳什均衡,当且仅当,(,u,i,(s,i,*,s,-i,*,),u,i,(s,i,s,-i,*,),。根据这一定义,有些博弈不存在纳什均衡的。,社会福利博弈,流浪汉,找工作 游荡,救济,3,,,2 -1,,,3,政府,不救济,-1,,,1 0,,,0,这个博弈不存在纳什均衡。给定政府救济,流浪汉的最优策略是游荡;给定流浪汉游荡,政府的最优策略是不救济;给定政府不救济,流浪汉的最优策略是找工作;给定流浪汉找工作,政府的最优战略是救济;如此等等,没有一个策略组合构成纳什均衡。,猜谜游戏(,A,决定,,B,来猜;,B,猜中,奖励;否则,惩罚),B,正面 反面,正面,-1,,,1 1,,,-1,A,反面,1,,,-1,-1,,,1,上述两个博弈的显著特征是,每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略。这样的情况出现在诸如体育比赛和战争等情况中都会出现。在这类博弈中,都不存在纳什均衡。,上述两个博弈不存在纯策略纳什均衡,但是存在下面将要定义的混合策略纳什均衡。这里的混合策略是指参与人以一定的概率选择某种策略,比如说,参与人以,0.3,概率选择第一种策略,以,0.2,的概率选择第二种策略,以,0.5,的概率选择第三种策略。如果一个采取混合策略,他的对手就不能准确猜出他实际上会选择的策略,但在均衡点可以知道对手不同策略的概率分布。,流浪汉,找工作 游荡,救济,3,,,2 -1,,,3,政府,不救济,-1,,,1 0,,,0,设想政府以,1/2,的概率选择救济,,1/2,的概率选择不救济。对流浪汉来说,选择寻找工作的期望效用是,1/22+1/21=1.5,,选择游荡带来的期望效用为,1/23+1/20=1.5,。所以流浪者的任何一种策略(纯的或混合)都是对政府所选择的混合策略的最优反应。,如果流浪汉以,0.2,的概率选择找工作,以,0.8,的概率选择游荡,政府的任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择,这一混合策略组合就是一个纳什均衡,混合策略的定义:在博弈,G=s,1,s,2,,,s,n,中,博弈方,i,的策略空间为,S,i,=(s,i1,s,i2,s,ik,),则博弈方以,p,i,=,(,p,i1,p,i2,p,ik,),随机选择,k,个可选策略称为一个混合策略。其中,,0p,ik,1,,,k=1,2,,,k,且,p,i1,+p,i2,+,p,ik,=1,相对于这种以一定概率分布在一些策略中随机选择,原来的确定性的具体的策略称为纯策略,原来的纳什均衡也称为纯策略纳什均衡。纯策略也可看作特殊的混合策略。,我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡。,混合策略纳什均衡的求法,可以通过计算各方的期望得益,寻求使自己期望得益最大化的最佳反应函数,求各博弈方的最佳反应函数的公共解。可以用求最佳反应函数交点的方法,也可以用解方程组得方法。还可以应用下面的原则来计算:任何博弈方的在混合策略纳什均衡中的所选策略,都必须使其他博弈方选择其任何策略的期望得益相同。即自己的选择要使对方无机可乘,不能通过有针对性的倾向是某一策略成为优势策略。再举一个例子。,例 某博弈的得益矩阵为,乙,C D,A 2,,,3 5,,,2,甲,B 3,,,1 1,,,5,这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡,设甲的混合策略为,(p,1-p),则甲的选择必须使乙选,C,和选,D,的期望得益相等,即:,p3+(1-p)1=p2+(1-p)5,解得,p=0.8,。即甲的混合策略是(,0.8,,,0.2,),同样,设乙的混合策略为(,q,1-q),,则乙的纳什均衡策略也必须使甲无论选,A,还是选,B,的期望收益相等。即:,q2+,(,1-q)5=q3+,(,1-q)1,解得,q=0.8,即乙的混合策略也是(,0.8,,,0.2,),容易算出在这个混合策略纳什均衡下,甲乙各自的得益都是,2.6.,它的意义是说,虽然在一次博弈中,其结果只能是得益矩阵中四个得益的一种,但多次独立重复进行,平均结果是双方各得,2.6.,1.,制式问题 彩电有不同的制式,采用相同的制式,则不同厂商间的零部件可以通用,相关设备可以相互匹配,对大家有一定的好处,但也有互相竞争的压力和损失。设两个厂商要引进生产线,面临,A,、,B,两个制式,其得益矩阵如下:,厂商,2,A B,A 1,,,3 0,,,0,厂商,1,B 0,,,0 2,,,2,容易看出,该博弈有两个纯策略纳什均衡:,(,A,,,A,)和(,B,,,B,),但会出现哪一个均衡呢?可以看出,厂商,1,喜欢后一个而厂商,2,喜欢前一个均衡。没有必然的结果,因此,双方的决策要进行混合策略决策。,不难算出厂商,1,的纳什均衡混合策略是,(0.4,0.6),厂商,2,的混合策略纳什均衡策略是,(0.67,,,0.33),在此均衡下,双方的期望得益分别为,0.664,和,1.926,,都小于任何一个纯策略纳什均衡的得益。,由此可见,政府或行业组织制定统一的标准或规定是非常重要的。这也是世界上各国甚至国际间对许多重要产品规定统一规格、标准的原因。,当然因为技术垄断等因素,也有相反的、各厂商间不统一的例证:如打印机墨盒、手机充电器等。,2.,市场机会 设两个厂商都发现了一个市场机会,但市场容量不大。若只有一家进入,能赚,100,,若同时进入,则各亏,50.,厂商,2,进 不进,进,-50,,,-50 100,,,0,厂商,1,不进,0,,,100 0,,,0,,,0,本博弈也有两个纯策略纳什均衡,(,不进,进),(进,不进)但它们分别有利于两个厂商,因此这两个均衡都不容易实现,都应采取混合策略。,请同学们自己计算混合策略纳什均衡及得益。,在包括混合策略的情况下,严格劣策略消去法有时仍然使用。因为严格劣策略消去法不会消去任何纳什均衡。如下面的例子:,乙,A B,C 3,,,1 0,,,2,甲,D 0,,,2 3,,,3,甲、乙的策略没有好坏之分。但若甲以混合策略(,0.5,,,0.5,,,0,)选择,C,、,D,、,E,,则博弈方乙选择纯策略,A,时,甲期望得益,0.53+0.50+01=1.5,乙选择纯策略,B,时,甲期望得益,0.50+0.53+01=1.5,乙选择混合策略(,q,1-q),时,甲期望得益,0.5q3+0.5(1-q)0+0.5q0,+0.5(1-q)3=1.5,可见,无论乙采用什么策略,甲采用混合策略都大于采用,E,的得益,1,,因此,,E,是甲的严格劣策略。因此去掉,E,,博弈就简化为:,乙,A B,C 3,,,1 0,,,2,甲,D 0,,,2 3,,,3,E 1,,,3 1,,,1,新的博弈中,在次应用劣策略消去法,可得(,D,,,B,)是唯一的纳什均衡。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 行业资料 > 医学/心理学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服