收藏 分销(赏)

第0讲:博弈论简介.ppt

上传人:精**** 文档编号:12495274 上传时间:2025-10-20 格式:PPT 页数:41 大小:681.54KB 下载积分:12 金币
下载 相关 举报
第0讲:博弈论简介.ppt_第1页
第1页 / 共41页
第0讲:博弈论简介.ppt_第2页
第2页 / 共41页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,0,讲:博弈论简介,浙江工业大学 经贸管理学院,曹柬,jcao,了解博弈论的基本概念,能应用这些概念来解释和解决一些现实问题。,博弈论基本概念,博弈论相关概念,激励机制基本概念,参考书:,初级:谢识予的,经济博弈论,中级:张维迎教授的,博弈论和信息经济学,高级:,朱,.,弗登博格的,博弈论,:,Drew Fudenberg/Jean Tirole,拉丰的,激励理论,:,Jean-Jacques Laffont/David Martimort,笔记(公式推导),读文献,公共邮箱:,zjut_gt_2015,,密码:,zjut123456,game theory,:在西方,,game,是人们遵循一定规则下的活动,参与人的目的是使自己“赢”。,Olympic Games,,有竞赛的意思。,中文译为对策论或博弈论。,博弈论的简单概念,博弈的四种分类,一、博弈论基本概念,信息拥有程度,完全信息博弈,不完全信息博弈,决策时序,静态博弈,动态博弈,完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,博弈论分类简述,1,、囚徒困境(,prisoners dilemma,),两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审。警察告诉他们:如果两人都坦白,各判刑,8,年;如果两个都抵赖,各判,3,年(可能因证据不足);如果一人坦白一人抵赖,坦白的放出去,抵赖的判刑,10,年。,博弈矩阵,一、博弈论基本概念,应试教育的困境,父母的选择:减负、增负。纳什均衡,为都“增负”,。教育部的减负文件都是无效文件,。,在应试教育的前提下,即使原先所有的学生都是减负的,这种状态也是不均衡的,不长久的。,一、博弈论基本概念,(坦白,坦白)是双方决策的,均衡,结果,,我们称之为,纳什均衡,,但该结果不是双方的,帕累托最优,状态。,博弈矩阵,纳什均衡:各方从私人局部效用出发进行决策所导致的均衡结果。,帕累托最优:各方从整体全局效用出发进行决策所产生的结果。,均衡结果:是各方对博弈结果的一种“一致性预测”,如果各方均预测一个特定的均衡结果将出现,没有人有兴趣作该均衡结果之外的选择。,帕累托最优状态是不稳定的,纳什均衡才是稳定的结果。在现实问题中,决策各方为追求自身效用的最大化,往往难以实现整体的帕累托最优,决策的结果是纳什均衡。,一、博弈论基本概念,例,1,、,古诺(,Cournot,)模型,两个寡头企业,分别称为企业,1,和企业,2,,每个企业的策略是选择,产量,;效用是,利润,,利润是企业产量的函数。,例如:彩电联盟(联合维持价格)、,OPEC,(石油输出国组织联盟)、哥本哈根气候会议等;,多成员联盟内达成的协议如果不是纳什均衡的话,是不稳定的。,2,、关于诺贝尔经济学奖的几个案例,一、博弈论基本概念,例,2,、公共物品的私人自愿供给,考虑一个城市位于大江边上,正在集资建设一座防洪大堤。每个居民自愿提供沙袋,沙袋的总供给等于所有居民个人供给之和。沙袋的总供给越大,大堤越坚固,所有居民都收益。,设,g,i,为第,i,个居民贡献的沙袋数量,,G,为沙袋的总数量;,x,i,是第,i,个居民的私人物品,(,例如,:,大米,),消费量,居民,i,的效用函数为,u,i,(,x,i,G,),;,M,i,是第,i,个居民的个人总预算收入,,p,G,为沙袋的单价,,p,X,为大米的单价。每个居民面临的问题是:在给定,M,i,的情况下,如何选择自己的策略(,x,i,g,i,),使自己的效用最大。,问题的描述包括:求解帕累托最优下的,G*,和纳什均衡下的,G,NE,,比较两种的差异,并得出有益的结论。,一、博弈论基本概念,公共物品的纳什均衡供给小于帕累托最优供给;,二者之间的差距随着城市居民人数的增加而扩大;,也与,/,的比率有关,比例越大,(,自利性强,),,表示居民们更看重个人消费带给自己的效用,而导致公共物品供给严重不足;比例越小,(,利他性强,),,纳什均衡供给趋向于帕累托最优水平。,假设个人效用函数采用柯布道格拉斯形式:,表示利己性,,表示利他性。,(一)考虑所有居民,(共,n,人)的收入水平相同,均为,M,,,则,,,,,一、博弈论基本概念,公共物品的纳什均衡供给小于帕累托最优供给;,供给不足的程度会随着收入分配的差距的扩大而减弱;,收入平均分配下的纳什均衡总供给小于分配不均时的纳什均衡总供给。,(二),考虑所有居民(共,n,人)的收入水平不相同,一、博弈论基本概念,一个村庄有一片草地,有,n,个牧民,每个牧民都有在草地上放羊的自由。每年春天,每个牧民决定自己今年要养多少羊;,g,i,表示第,i,个牧民养羊的数量;,G,表示羊的总数量;,v,表示每只羊的价值;注意!我们认为羊的增多以破坏草地资源为代价,因此,可以认为,v,是,G,的函数,,G,越大,v,越小。,问题的描述包括:求解帕累托均衡下的,G,NE,和纳什均衡下的,G*,,比较两种的差异,并得出有益的结论。,例,3,、公共地悲剧,一、博弈论基本概念,计算可得,G,NE,G*,;,G*,是该草地的最优放牧量,此时,草地资源不会遭到不可逆转的破坏,草地资源恰好被充分利用;,G,NE,G*,表示在纳什均衡的情况下,草地被过度使用,由此逐年破坏后,最终会导致荒漠化;,这个例子证明,如果一种资源没有,排他性的所有权,,就会导致对这种资源的过度使用。公海捕鱼、山西小煤窑的过度发展都属于这类问题。,结论:,一、博弈论基本概念,沙尘暴和制度安排,从北京的“沙尘暴”说起;,草地没有明确归属,沙尘暴必然形成;,人的“私利”与制度安排的冲突;,土地分配制度与土地国有产权的冲突;,在以前的体制安排下,沙尘暴容易形成,社会资源浪费,社会效率下降,制度安排无法接近或达到帕累托最优状态。,一、博弈论基本概念,关于道德,道德难以成为一种有效的机制。,机制:体制、政策、法律、法规、道德、风俗、宗教、合同、协议、承诺等,机制从本质上而言是指导、协调、约束、规范个体与个体之间的行为和关系的。,3,、关于机制设计,一种机制设计,要产生效力,首先必须是一种合理的纳什均衡,否则,这种机制安排便不能成立。,利用人的利己性达到利他性。,帕累托最优和阿罗不确定性定理:任何一种机制都不可能是尽善尽美的。,如何使纳什均衡解尽可能接近或达到帕累托最优状态?,纳什均衡,帕累托最优,机制,一、博弈论基本概念,智猪博弈(,boxed pigs game,),猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按钮来控制猪食的供应。按一下按钮会有,10,个单位的猪食进槽,但谁按按钮谁就要付出,2,个单位的成本。如果大猪先到,大猪吃,9,个单位,小猪,1,个单位;如果小猪先到,大猪,6,个单位,小猪,4,个单位;如果同时到,大猪,7,个单位,小猪,3,个单位。,4,、除“囚徒困境”外的几类博弈,一、博弈论基本概念,智猪博弈中,双方决策的纳什均衡为(按,等待),多劳者不多得。,例如,大企业和小企业(新产品的研发、广告),公共产品提供(两户人家修路),股份公司中的大股东和小股东(大股东收集信息、监督经理,小股东搭便车),一、博弈论基本概念,恋爱博弈(,battle of the sexes,),两个人谈恋爱,周末要么一起去看足球比赛,要么一起去看芭蕾舞表演,男的偏好足球,女的偏好芭蕾,但两人都宁愿在一起,不愿分开。,这个博弈中有两个纳什均衡:(足球,足球),(芭蕾,芭蕾)。,一、博弈论基本概念,先动优势,聚点均衡,聚点均衡,个人的选择往往由“聚点”决定,人生之路往往是多个聚点均衡的产物;,人类社会的发展也是如此。,一、博弈论基本概念,斗鸡博弈(,chicken game,),若两个人举着棍子从独木桥的两端走向中央进行火拼,每个人都有两个策略:继续前进或退下阵来。若两个人都继续前进,则因势均力敌而坠入河中;若一人前进一人后退,前进者取得胜利,后退者丢了面子;若二人都胆怯不前,两人都丢面子。,一、博弈论基本概念,这个博弈中也有两个纳什均衡:,(,进,退,),,,(,退,进,),。,警察和游行队伍,夫妻吵架,美苏争霸(古巴导弹危机),有时候,退一步,反而能获得更大的个人效用。,博弈论研究的是决策主体的行为发生直接相互作用时的决策以及决策的,均衡,问题。,博弈论研究的主要内容是如何寻找,均衡,。,博弈论的主要研究内容:,均衡,败走麦城,空城计,5,、博弈论的核心:均衡与效用,一、博弈论基本概念,效用,效用:人所获得的身心上的满足感(快乐感),例如:,x,代表钱财,,y,权力,,z,婚姻,,r,子女,,s,健康,,t,安全感,,o,利他行为,,p,国家民族命运感等;,各个变量(因素)之间存在正相关、负相关或独立的关系;,一、博弈论基本概念,一个人面临各种选择时的决策,主要目的是使自己在给定的约束条件下最大化自己的效用(和谁结婚,经商还是走仕途,等等),理性,的人追求自身利益的最大化,(,正:做好事、恋爱,慈善事业;反:打架、危险国家,),决策结果可能不止一个,需要一个“聚点”,对我们绝大部分的人来说,最大化效用是“趋利避祸”,政府的职责:最大化国家的效用。贫富差距,一、博弈论基本概念,市场进入阻挠的动态博弈(博弈树),在动态博弈中,采用逆向归纳法,得到纳什均衡结果为(进入,默许)。,(40,50),静态,(,博弈,),:决策时点一致,动态,(,博弈,),:决策次序有先后,后决策者能观测到先决策者的行为,二、博弈论相关概念,在市场进入阻挠博弈中,我们知道其纳什均衡结果为(进入,默许)。现在考虑同样的市场有,20,个(可以理解为在位者有,20,个连锁店),进入者每次进入一个市场,博弈就变成了,20,次重复博弈。,1,、多阶段重复博弈,二、博弈论相关概念,我们可以得到这个重复博弈的纳什均衡是在位者在每一个市场上都选择默许,进入者在每一个市场上都选择进入。这就是大名鼎鼎的“连锁店悖论”。,在这个博弈中,在位者选择斗争的唯一原因是希望斗争能起到一种威慑作用,使进入者不敢再进入。但在有限次重复博弈中,斗争是一个不可置信的威胁,这可以采用逆向归纳法来证明。,二、博弈论相关概念,当博弈是,无穷多次,而不是有限次时,存在着完全不同于一次博弈的纳什均衡。,以下以囚徒困境为例来证明:,我们考虑如下的“冷酷战略”:(,1,)开始选择抵赖;(,2,)选择抵赖直到有一方选择了坦白,然后永远坦白。,根据这个战略,一旦一个囚徒在某个阶段博弈中自己选择了坦白,之后他将永远选择坦白。“冷酷战略”也被称为“触发战略”。,二、博弈论相关概念,解得:。即:如果 ,给定囚徒,1,坚持冷酷战略并且囚徒,2,不首先坦白,囚徒,1,不会首先选择坦白。,令,为贴现因子,如果满足下列条件,参与人将不会选择坦白:,即:,二、博弈论相关概念,由此我们证明,如果 (即参与人有足够的耐心,或将来收益也是重要的),冷酷战略是无限次囚徒博弈的一纳什均衡,帕累托最优(抵赖,抵赖)是每一个阶段的均衡结果。由此两个囚徒走出了一次性博弈时的困境。,在无限次重复的古诺模型中,如果 ,默契合作就是一个子博弈精炼纳什均衡;如果有,n,个企业而不是两个企业参与决策,默契合作要求 ,即:企业越多,合作越困难。,二、博弈论相关概念,无限次重复博弈的结论告诉我们:如果博弈重复无穷次并且每个人有足够的耐心(或者说,将来的收益在现在看来也是很重要的),任何短期的机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性去惩罚对方的机会主义行为。,2,、,KMRW,声誉模型,我们已经知道,在完全信息情况下,不论博弈重复多少次,只要重复的次数是有限的,唯一的均衡是每个参与人在每次博弈中选择单次静态的均衡策略,因而,有限次重复不可能导致参与人的合作行为。,这个结果似乎与人们的直观感觉不一致。实验结果表明:即使在确定的有限次重复博弈中,合作行为也频繁出现。,二、博弈论相关概念,进一步地,假若两个人都有,p0,的概率是非理性的,只要博弈重复的次数足够多,合作均衡就可以出现。,声誉模型的直观解释为:如果博弈的次数足够多,未来收益的损失就超过短期被出卖的损失,因此,在开始的时候,每一个参与人都想树立一个合作形象,即使他在本性上并不是合作型的;只有在博弈快结束的时候,参与人才会一次性地把自己的过去建立的声誉利用尽,合作才会停止(此时,短期收益很大而未来收益已没有了)。,二、博弈论相关概念,声誉模型说明:,参与人对其他参与人效用函数或策略空间的不完全信息对均衡结果有重要影响,在不完全信息情况下,只要博弈重复的次数足够多,合作行为在有限次博弈中是可以出现的(外来的和尚、喝酒),市场进入阻挠博弈(,entry deterrance,),这个博弈中有两个纳什均衡:,(,进入,默许,),,,(,不进入,斗争,),。,3,、威胁与承诺,二、博弈论相关概念,在上述,市场进入阻挠博弈中,,有两个纳什均衡:(进入,默许),(不进入,斗争)。,但在该博弈的动态表述中,可以,剔除纳什均衡中“,不可置信,的策略组合”。这个博弈中的(不进入,斗争)不构成纳什均衡,它是一种,不可置信的威胁策略,。,“女儿的婚事”中的不可置信的威胁。,二、博弈论相关概念,房地产开发博弈,采用博弈矩阵可以得到纳什均衡结果为,(,开发,不开发,),和,(,不开发,开发,),;采用逆向归纳法得到纳什均衡为(开发,不开发),可见,,(,不开发,开发,),是不可置信的威胁策略。,(1,0),(0,1),二、博弈论相关概念,有些纳什均衡之所以在动态博弈求解子博弈精炼纳什均衡的过程中被剔除,是由于它们包含了不可置信的威胁策略。如果相关参与人能够将这些不可置信的威胁变得可信,博弈的精炼均衡就会改变。我们将这些为改变博弈结果而采取的措施称为“,承诺行动,”。,如何变被动为主动,“承诺行动”在现实中具有广泛的应用。,例如,破釜沉舟、十面埋伏、要胁诉讼等,二、博弈论相关概念,思考题,1,、按照亚当,.,斯密的“看不见的手”(市场机制)理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但从“囚徒困境”来看,“看不见的手”的原理存在一个悖论:从利己的目的出发,结果往往是既不利己也不利他,很难达到帕累托均衡的状态。问:如何解释这一悖论?,2,、两动物(甲和乙)为某一食物而争斗。每只动物都能象鸽或鹰那样行动。对每只动物来说最坏的结果是两个都象鹰一样,此时的争斗使得双方都吃不到食物;如果两只动物合作起来象鸽一样行动,则每只动物都可吃到,3,个单位的食物;如果自己象鸽而对手象鹰,则自己只能吃到,1,个单位而对手可吃到,4,个单位。假设两只动物进行的是一次性完全信息静态博弈,请回答如下问题:,请求解此博弈的纳什均衡(根据博弈矩阵求解);,请举一个现实生活中的例子并用鹰,-,鸽,博弈进行解释。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服