ImageVerifierCode 换一换
格式:DOC , 页数:21 ,大小:565.04KB ,
资源ID:4929220      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4929220.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(四章重复博弈.doc)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

四章重复博弈.doc

1、第四章节 重复博弈何为“重复博弈?l重复博弈是指根本博弈重复进展构成的博弈过程。重复博弈中每个阶段中的博弈方、可选策略、规那么和得益都是一样的-是特殊的动态博弈;形式上是根本博弈的重复进展,但博弈方的行为和博弈结果不一定是根本博弈的简单重复,因为博弈方对于博弈会重复进展的意识,会使他们对利益的判断发送变化,从而使他们在重复博弈过程不同阶段的行为选择受到影响。可信度:子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据4.1 引论4.1.1 为什么研究重复博弈4.1.2 根本概念分类:有限次重复博弈,无限次重复博弈给定一个根本博弈可以静态,也可以动态,重复进展了次,并且在每次重复之前,各博弈方都能

2、观察到以前博弈的结果,这样的博弈过程称为“的次重复博弈,记为。而称为的“原博弈。中的每次重复称为的一个“阶段。理论上,重复博弈可以无限制进展下去,不一定经过一定次数重复以后就必须完毕。如果一个根本博弈一直重复下去,这样的重复博弈就是“无限次重复博弈,记为。无限次重复博弈的根本博弈也称为“原博弈。无限次重复博弈是有无限个阶段的动态博弈。实用文档.重复博弈的次数虽然有限,但重复的次数或博弈完毕的时间不确定,这种重复博弈中博弈方的行为选择与确定完毕时间的有限次重复博弈很不同,与无限次重复博弈很相似,甚至可以通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机完毕的重复博弈。策略、子博弈和

3、均衡路径l策略:博弈方的一个策略就是在每个阶段即每次重复,针对每种情况以前阶段的结果如何行动的方案。l子博弈:重复博弈的子博弈就是从某个阶段不包括第一阶段开场,包括此后所有阶段的重复博弈局部。l路径:-子博弈完美纳什均衡,以逆推归纳法逆向归纳法为核心的子博弈完美纳什均衡分析及相关结论,可以推广到重复博弈中。-重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有种策略组合,那么重复两次就有条博弈路径,重复次就有条博弈路径。重复博弈的得益支付任何博弈中博弈方策略选择的依据都是得益的大小。计算重复博弈的“总得益

4、。计算各阶段的“平均得益。时间有先后,引入贴现系数实用文档.无限次重复博弈:无限次重复博弈有时也写作在考虑贴现因素的情况下,重复博弈的平均得益与不考虑贴现因素时的平均得益,必然也有所不同。通常可以用以下方式定义平均得益。如果一常数作为重复博弈有限次重复或无限次重复各个阶段的得益,能产生与得益序列,一样的现值,那么称为,的“平均得益。有限次重复博弈不一定考虑贴现问题。无限次重复博弈必然要考虑贴现问题。由于无限次重复博弈每阶段得益都是时,现值为,而每阶段得益为,时,无限次重复博弈的得益现值是,因此令这就是计算无限次重复博弈平均得益的公式。随机停顿和贴现率典型的随机完毕重复博弈可以理解为在进展一个重

5、复博弈时,每次都通过抽签来决定是否停顿重复,如果抽到停顿重复的概率为实用文档.,那么抽到重复下去的概率为。设某博弈方在此博弈中的阶段得益为,利率为,因为在每一次博弈以后能继续下一次重复的可能性是,因此第二阶段的期望得益为,进一步,第三阶段的期望得益为,故该博弈方在重复博弈中期望得益的现值为:其中最后一个等式是通过令得到的。把这个与前面纯粹考虑时间价值的贴现率统一起来,我们就把概率的随机停顿重复博弈与无限次重复博弈统一起来了。随机停顿重复博弈问题可以当作无限次重复博弈来进展分析。4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈重复零和博弈不会创造出新的利益。实用文档.合作的可能性根

6、本不存在。即使双方都知道还要重复进展许屡次根本博弈,也不会改变它们在当前阶段博弈中的行动方式,不可能变得哪怕是暂时的合作和顾及对方的利益。所有以零和博弈为原博弈的有限次重复博弈,博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。推广:非零和或多个博弈方,博弈方的利益严格对立,没有纯策略纳什均衡的其他严格竞争博弈中。在以这些博弈作为原博弈构成的有限次重复博弈中,惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。例:有限次重复猜硬币博弈l各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈在有惟一纯策略

7、纳什均衡的博弈中,博弈方之间的利益关系不再是始终对立的,而是有很大一致性甚至完全一致。在以这样的博弈为原博弈的有限次重复博弈中,博弈方的行动和博弈结果会不会发生质的变化?如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最正确策略组合,那么因为符合所有博弈方的利益,因此,有限次重复显然不会改变博弈方的行动方式。实用文档.分析:原博弈惟一的纳什均衡没有到达帕累托效率,因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式的博弈,在有限次重复博弈中能不能实现合作和提高效率呢?有限次重复博弈的囚徒困境两次实用文档.一般结论1在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什均衡策略组合,那么有限次

8、重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳什均衡; 2由于在这样的双方策略下,均衡路径中的每个阶段都不存在任何不可信的威胁或许诺,因此这种均衡是子博弈完美纳什均衡。3在一个博弈中的每个博弈方的所有得益上各自加上一样的数值不会改变博弈原来的均衡定理 设原博弈G有惟一的纯策略纳什均衡,那么对任意正整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。定理 设原博弈有惟一的纯策略纳什均衡,那么对任意正整数,重复博弈有惟一的子博弈完美纳什均衡,即各博弈方每个阶段都采用的

9、纳什均衡策略。各博弈方在中的总得益为在中得益的倍,平均得益等于原博弈中的得益。实用文档.有限次重复削价竞争博弈例:石油输出国组织的困境l1某些成员国的石油资源已趋枯竭;l2不少非石油输出国组织成员国参加石油市场;l3石油输出国组织成员之间地位的不平衡;l4有些国家由于政治、经济、军事等方面的原因造成资金、财政紧张;重复囚徒困境悖论和连锁店悖论1与直觉的差异2连锁店悖论Selten,1978泽尔腾一个在个市场都开设有连锁店的企业,对于各个市场的竞争者是否应该加以打击排斥?由于个市场的竞争者一般不会同时进入竞争,如果忽略各个市场环境、竞争者不同等方面的微小差异,这个问题对上述连锁企业来说相当于一个

10、次重复的重复博弈。实用文档.较多阶段的动态博弈总结:l第一类是由零和博弈构成的,不存在纯策略NE;第二类是唯一的纯策略纳什么均衡的静态博弈构成的。l共性:重复博弈本质上只不过是原博弈的简单重复,重复博弈每个阶段采取的策略就是原博弈中所采取的策略,在零和博弈的情况下是同样的混合策略NE,在后一种情况下那么是纯策略NE;l重复博弈并不能给博弈方带来比一次博弈更好的结果,每阶段的平均得益与一次性博弈的得益一样。例:如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?l特点:此博弈是混合博弈NE的严格竞争零和博弈,对一方有利的策略组合总是对另一方不利,没有一个策略组合双方同时愿意

11、承受。4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈三价博弈的重复博弈实用文档.触发策略trigger strategy:首先试探合作,一旦觉察对方不合作,那么也用不合作相报复的策略。冷酷策略grim strategy触发策略的进一步讨论不计前嫌担忧报复实用文档.两市场博弈的重复博弈轮换策略:双方轮流去两个不同市场的策略。实用文档.博弈论走向了“语言时代?经济学与语言4.2.4 有限次重复博弈的无名氏定理folk theorem民间定理,民歌定理首先,记为博弈方在一次性博弈中最差的均衡得益支付,用表示各博弈方的构成的得益数组。其次,不管其他博弈方的行为如何,一博弈方在某个博弈中只要自己采取

12、某种特定的策略,最低限度保证能获得的得益称为“个体理性得益individual rationality payoff或“保存得益reservation payoff。第三,博弈中所有纯策略组合得益的加权平均权数非负且总和为1数组称为实用文档.“可实现得益feasible payoff。有限重复博弈的无名氏定理设原博弈的一次性博弈有均衡得益数组优于,那么在该博弈的屡次重复中,所有不小于个人理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。无名氏定理的关键意义:保证这些得益有一定次数重复博弈的子博弈完美纳什均衡的平均得益可以实现或逼近它们。有助于在重复博弈中更好地把握

13、时机,设计和运用高效率的策略,建立相互的默契和信任,从而争取实现更好的博弈结果。实用文档.重复博弈往往也很难确定博弈结果终究是哪一个子博弈完美纳什均衡。现实博弈的结果很大程度上取决于博弈方对重复博弈构造和性质的了解,以及博弈方的分析能力和相互信任等因素,特别是博弈方是否具有设计和实行轮换策略、触发策略的能力和默契。冷酷策略grim strategy:以囚徒困境博弈为例。(1) 一开场选择抵赖(2) 一直选择抵赖,除非某些参与人选择了坦白;如果某些参与人已经选择了坦白,那么就永远选择坦白针锋相对策略tit-for-tat(1) 开场时选择否认。(2) 此后,在第n期选择其他参与人在第n-1期选择

14、的行动。4.3 无限次重复博弈异:有限次:1存在最后一次博弈正是破坏重复博弈中博弈方利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键。2不一定考虑贴现问题无限次:12对博弈方选择和博弈均衡的分析必须以平均得益或总得益的现值为依据。同:试图“合作,惩罚“不合作都是实现理想均衡的关键,是构造高效率均衡策略的核心构件。实用文档.4.3.1 两人零和博弈的无限次重复博弈没有最后一个阶段,逆推法。先讨论无限次重复博弈的第阶段。显然,该阶段博弈方面临的仍然是一个无限次重复博弈两人零和博弈,博弈方的利益关系不会因为第阶段或前阶段的结果而有任何改变,仍然是严格对立的,因此在第阶段不会合作。同理,

15、第、也都不会合作。从重复博弈的第一个阶段开场就不可能合作。推广到更多博弈方、非零和的其他严格竞争博弈的无限次重复博弈。4.3.2 惟一纯策略纳什均衡博弈的无限次重复博弈原博弈有惟一纯策略纳什均衡的无限次重复博弈帕累托意义上最正确策略组合存在前在合作利益的囚徒困境式博弈囚徒困境式的无限次重复在囚徒困境式博弈的无限次重复博弈中,对双方有利的合作在子博弈完美纳什均衡中有可能存在,博弈可能会出现较理想的结果。分析:L,L无限次:触发策略,第一阶段采用H,如果前阶段的结果都是H,H,那么继续采用H,否那么采用L。证明:在不同期得益的贴现因子较大时,双方采用上述策略构成无限次重复博弈的一个子博弈完美纳什均

16、衡。首先:双方采用上述触发策略是一个纳什均衡。假设博弈方1已采用了这种策略,然后证明在到达一定水平时,采用同样的触发策略是博弈方2的最正确反响策略。因为博弈方1和2是对称的,因此只要这个结论成立,就可以确定上述触发策略是两博弈方相互对对方策略的最正确反响,因此构成纳什均衡。实用文档.由于与在某个阶段出现与H,H不同的结果以后,博弈方1将永远采用L,此时博弈方2也只有一直选择L。因此,博弈方2对博弈方1触发策略的最正确反响策略的后半局部与触发策略的后半局部是一样的。现在关键是确定博弈方2在第一阶段的最优选择。如果博弈方2采用L,那么在第一阶段能得到5,但以后引气博弈方1一直采用L的报复,自己也只

17、能一直采用L,得益将永远为1,总得益的现值为如果博弈方2采用H,那么在第二阶段他将得到4,下一阶段又面临同样的选择。记为博弈方2在该重复博弈中每阶段都采用最正确选择的总得益现值,那么从第二阶段开场的无限次重复博弈因为与从第一阶段开场的只差一个阶段,因而在无限次重复时可看作一样的,其总得益的现值折算成第一阶段的得益为,因此第一阶段的最正确选择是H时,整个无限次重复博弈总得益的现值为或因此当即当时,博弈方会采用H,否那么用L。由于从第二阶段开场的无限次重复博弈,与从第一阶段开场的无限次重复博弈是完全一样的,因此,博弈方第二阶段的选择必然也是H。第三阶段也同样。依此类推,只要博弈方1采用前述触发策略

18、,那么2的最优选择就始终是H。当然,如果1偏离H,2也必须用L来报复。因此,博弈方2对博弈方1触发策略的完整反响策略是同样的触发策略。这就证明了双方都采用上述触发策略是一个纳什均衡。重复博弈的子博弈还是无限次重复博弈。其实,在该囚徒困境博弈构成的无限次重复博弈中,子博弈完美纳什均衡路径不止上述一条,如两博弈方始终都选择原博弈的纳什均衡L,L就是其中之一。但后者的得益要差得多,因此双方合理的选择是触发策略而不是坚持原博弈的纳什均衡。无限次重复博弈的无名氏定理无限次重复博弈无名氏定理:设是一个完全信息的静态博弈。用记的纳什均衡的得益,用表示的任意可实现得益。如果对任意博弈方都成立,而实用文档.足够

19、接近1,那么无限次重复博弈中一定存在一个子博弈完美的纳什均衡,各博弈方的平均得益就是。弗里德曼1971这个定理称为无名氏定理是因为有限次重复博弈无名氏定理的关系。无限次重复古诺模型有效工资率例1:l寡头的古诺产量博弈中,如果市场需求P=130-Q,边际本钱c=30且没有固定本钱,帖现因子。如果该市场有长期稳定性,问两个厂商能否维持垄断产量?例2:l如果上一题厂商1的边际本钱改为10,厂商2的边际本钱仍然是30.假设该市场仍然是长期稳定的,而且两个厂商之间已经达成厂商实用文档.1生产3/4,厂商2生产1/4的垄断产量分配协议,问这种协议是否能够长期维持?例3:两人合作开发一项产品,能否成功与两个人的工作态度有关。l得益矩阵如下: l B 努力 偷懒A 努力 9/4,9/4 3/2,5/2 偷懒 5/2,3/2 2,2问题:该博弈无限次重复博弈的均衡如有侵权请联系告知删除,感谢你们的配合!实用文档.

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服