资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论,教学课件,教材:,经济博弈论(第三版),复旦大学出版社,,2007,年,1,月,经济博弈论(第二版),复旦大学出版社,,2002,年,1,月,第一章 导论,本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,对教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。,本章分五节,1.1,什么是博弈论,1.2,几类经典博弈模型,1.3,博弈结构和博弈的分类,1.4,博弈论历史和发展的简要评述,1.5,博弈论在我国的应用,1.1,什么是博弈论,1.1.1,从游戏到博弈,1.1.2,一个非技术性定义,1.1.1,从游戏到博弈,博弈就是策略对抗,或策略有关键作用的游戏,博弈,Game,,博弈论,Game Theory,,,Game,即游戏、竞技,游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用,游戏,下棋、猜大小,经济,寡头产量决策、市场阻入、投标拍卖,政治、军事,美国和伊拉克、以色列和巴勒斯坦,1.1.2,一个非技术性定义,定义,:,博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。,四个核心方面,博弈的参加者,(Player),博弈方,各博弈方的策略,(Strategies),或行为,(Actions),博弈的次序,(Order),博弈方的得益,(Payoffs),1.2,几个经典博弈模型,1.2.1,囚徒的困境,1.2.2,赌胜博弈,1.2.3,产量决策的古诺模型,1.2.1,囚徒的困境,囚徒的困境是图克(,Tucker,),1950,年提出的,该博弈是博弈论最经典、著名的博弈,该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷,一、基本模型,-5,,,-5,0,,,-8,-8,,,0,-1,,,-1,坦 白,不坦白,坦 白,不坦白,两个罪犯的得益矩阵,囚徒,2,囚,徒,1,囚徒,1,:坦白,囚徒,2,:坦白,二、双寡头削价竞争,100,,,100,20,,,150,150,,,20,70,,,70,高 价,低 价,高 价,低 价,寡头,2,寡,头,1,双寡头的得益矩阵,政府组织协调的,必要性和重要性,寡头,1,:低价,(70),寡头,2,:低价,(70),1.2.2,赌胜博弈,赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示,赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于,“,零和博弈,”,一、田忌赛马,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,1,,,-1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,-1,,,1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,,,1,,,-1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,1,,,-1,1,,,-1,-1,,,1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,1,,,-1,3,,,-3,上中下,上下中,中上下,中下上,下上中,下中上,上,中,下,上,下,中,中,上,下,中,下,上,下,上,中,下,中,上,田 忌,齐,威,王,得益矩阵,取胜关键,:不让对方猜到自己策略,尽可能猜出对方策略,二、猜硬币博弈,-1,,,1,1,,,-1,1,,,-1,-1,,,1,正 面,反 面,猜硬币方,盖,硬,币,方,正 面,反 面,三、石头、剪子、布,0,,,0,1,,,-1,-1,,,1,-1,,,1,1,,,-1,0,,,0,1,,,-1,-1,,,1,0,,,0,石 头,剪 子,布,博弈方,2,石 头,剪 子,布,博,弈,方,1,1.2.3,产量决策的古诺模型,古诺模型是寡头产量竞争,是市场经济中最常见的问题之一,古诺,1838,年提出,直到现在还是经常使用,古诺模型有很多扩展,古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值,一、三厂商离散产量,0,P,4,4,5,5,3,7,6,2,8,16,12,8,5,6,5,20,25,30,5,6,4,20,20,24,5,5,5,25,25,25,4,3,11,33,33,33,3,7,3,49,21,21,3,1.3,博弈结构和博弈分类,1.3.1,博弈中的博弈方,1.3.2,博弈中的策略,1.3.3,博弈中的得益,1.3.4,博弈的过程,1.3.5,博弈的信息结构,1.3.6,博弈方的能力和理性,1.3.7,博弈的分类和博弈理论的结构,1.3.1,博弈中的博弈方,博弈方,:独立决策、独立承担博弈结果的个人或组织,博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变,博弈方数量对博弈结果和分析有影响,根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,一、单人博弈,只有一个博弈方的博弈,例一:单人迷宫,入口,A,B,出口,(,奖金,M),A,1,B,1,右,左,右,左,M,0,0,扩展形,例二:运输路线,-7000,-16000,-10000,-10000,好天气,(75%),坏天气,(25%),自 然,商,人,水 路,陆 路,运输路线得益矩阵,0,1,-7000,-10000,-16000,-10000,运输路线扩展形,好天气,(75%),坏天气,(25%),单人博弈实质,个体最优化问题,二、两人博弈,两人博弈即有两个博弈方的博弈,两人博弈最常见,研究最多,是最基本和有用的博弈类型,囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈,两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致,三、多人博弈,三个博弈方之间的博弈,可能存在,“,破坏者,”,:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。,申办奥运会是典型例子。,多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法,1.3.2,博弈中的策略,策略,:博弈中各博弈方的选择内容,策略有定性定量、简单复杂之分,不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同,有限博弈:每个博弈方的策略数都是有限的,无限博弈:至少有某些博弈方的策略有无限多个,1.3.3,博弈中的得益,得益,:各博弈方从博弈中所获得的利益,得益对应博弈的结果,也就是各博弈方策略的组合,得益是各博弈方追求的根本目标及行为和判断的主要依据,根据得益的博弈分类:零和博弈、常和博弈、变和博弈,零和博弈,:也称,“,严格竞争博弈,”,。博弈方之间利益始终对立,偏好通常不同,猜硬币,田忌赛马,石头,-,剪刀,-,布,常和博弈,:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系,分配固定数额的奖金、利润,遗产官司,变和博弈,:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。,囚徒困境、产量博弈、制式问题等,1.3.4,博弈的过程,博弈过程,:博弈方选择、行为的次序,包括是否多次重复选择、行为。,博弈过程对博弈结果也有重要影响。,根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。,静态博弈,:所有博弈方同时或可看作同时选择策略的博弈,田忌赛马、猜硬币、古诺模型,动态博弈,:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动,弈棋、市场进入、领导,追随型市场结构,重复博弈,:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能,长期客户、长期合同、信誉问题,有限次重复博弈,无限次重复博弈,1.3.5,博弈的信息结构,完全信息博弈,:各博弈方都完全了解所有博弈方各种情况下的得益,不完全信息博弈,:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为,“,不对称信息博弈,”,完美信息博弈,:每个轮到行为的博弈方对博弈的进程完全了解的博弈,不完美信息博弈,:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,1.3.6,博弈方的能力和理性,完全理性和有限理性,完全理性:有完美的分析判断能力和不会犯选择行为的错误,有限理性:博弈方的判断选择能力有缺陷,个体理性和集体理性,个体理性:一个体利益最大为目标,集体理性:追求集体利益最大化,合作博弈:允许存在有约束力协议的博弈,非合作博弈:不允许存在有约束力协议的博弈,圣,彼得堡悖论,然而,在许多风险决策情景下人们的决策并不符合期望货币值最大这一准则,最早发现这一问题的是瑞士的伯努利兄弟,他们提出了著名的“圣,彼得堡悖论”。早在,1713,年,大学教授,N,伯努利就提出一个有趣的问题,假定在彼得和保罗之间进行一场赌博,彼得掷一枚硬币直到硬币出现正面,如果掷一次就出现正面,则彼得给保罗,2,元钱,如果掷两次才出现正面,则彼得给保罗,4,元钱,如果掷三次才出现正面,则彼得给保罗,8,元钱,如此进行下去,每多掷一次,彼得支付给保罗的赌金就翻一番,一个人,(,这个可以迅速取得大量赌金的人,),应给保罗多少钱来取代他在这场赌博中的角色呢?若按期望值计算,收入为,2,,,4,,,8,,,2,的概率相应为,1/2,、,1/4,、,1/8(l/2)n,,赌博显然存在一种,n,为无穷大的方案,其期望值为无穷大。因此人们理应付给保罗很多的钱来代替他在赌局中的角色。然而,绝大多数人愿意付出的钱是很少的,几乎都不超过,10,元,于是这一问题便成为一个无法解释的悖论。为什么人们不愿意出很多的钱来争取一个无穷大的期望回报呢?,1.3.7,博弈的分类和博弈理论的结构,非合作博弈和合作博弈,非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈),静态博弈,动态博弈,重复博弈,完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈,零和博弈和非零和博弈,单人博弈和多人博弈,1.4,博弈论历史和发展简述,1.4.1,博弈论的早期研究,1.4.2,博弈论的形成,1.4.3,博弈论的成长和发展,1.4.4,博弈论的成熟及与主流经济学的融合,1.4.1,博弈论的早期研究,博弈论历史没有公认答案,对具有策略依存特点决策问题的研究可上溯到,18,世纪初甚至更早,博弈论真正的发展在,20,世纪,博弈论总体上仍然是发展中的学科,2000,年前我国古代的,“,齐威王田忌赛马,”,1500,年前巴比伦犹太教法典,“,婚姻合同问题,”,等。,1838,年古诺寡头模型。,1883,年伯特兰德寡头竞争模型。,1913,年齐默罗象棋博弈定理,、,“,逆推归纳法,”,1921-1927,年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解,1928,年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果,1.4.2,博弈论的形成,冯,.,诺伊曼和摩根斯坦,博弈论和经济行为,Theory of Games and Economic Behavior,1944,引进扩展形(,extensive form,)表示和正规形(,normal form,)或称策略形(,strategy form,)、矩阵形(,matrix form,)表示,提出稳定集(,stable sets,)解概念,正式提出创造博弈论一般理论的主意,给出博弈论研究的一般框架、概念术语和表述方法,1.4.3,博弈论的成长和发展,一、第一个研究高潮,本世纪,40,年代末和,50,年代初,1950,年纳什提出,“,纳什均衡,”,(,Nash equilibrium,)概念和证明纳什定理,发展非合作博弈的基础理论。,1950,年,Melvin Dresher,和,Merrill Flood,在兰德公司(美国空军),“,囚徒的困境,”,(,Prison,s dilemma,)博弈实验,(,Howard Raiffa,)独立进行这个博弈实验;,1952-1953,年期间(,L.S.Shapley,)和(,D.B.Gillies,)提出,“,核,”,(,Core,)作为合作博弈的一般解概念,Shapley,提出了合作博弈的,“,Shapley,值,”,(,Shapley value,)概念等。,奥曼(,R.J.Aumann,),“,40,年代末,50,年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。,”,二、,50,年代中后期一直到,70,年代博弈论发展的青年期,1954-1955,年提出了,“,微分博弈,”,(,Differential games,)的概念。,奥曼则在,1959,年提出了,“,强均衡,”,(,Strong equilibrium,)的概念。,“,重复博弈,”,(,Repeated games,)也是在,50,年代末开始研究的,这自然引出了关于重复博弈的,“,民间定理,”,(,Folk theorem,)。,1960,年(,Thomas C.Schelling,)引进了,“,焦点,”,(,Focal point,)的概念。,博弈论在进化生物学(,Evolutionary Biology,)中的公开应用也是在,60,年代初出现的。,塞尔腾,(,Selten,),1965,提出,“,子博弈完美纳什均衡,”,(,subgame perfect Nash equilibrium,),1975,年提出的,“,颤抖手均衡,”,(,Trembling hand perfect equilibrium,),海萨尼,(,Harsanyi,),1967-1968,三篇构造不完全信息博弈理论的系列论文,,“,贝叶斯纳什均衡,”,(,Bayesian Nash equilibrium,),。,海萨尼,1973,年提出关于,“,混合策略,”,的不完全信息解释,以及,“,严格纳什均衡,”,(,Strict Nash equilibrium,),。,70,年代,“,进化博弈论,”,(,Evolutionary game theory,)的重要发展,(,John Maynard Smith,),1972,年引进,“,进化稳定策略,”,(,Evolutionarily stable strategy,,,ESS,)等。,“,共同知识,”,(,Common knowledge,)的重要性,因为奥曼,1976,年的文章引起广泛的重视。,三、,40,年代末到,70,年代末是博弈论发展的重要阶段,这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。,对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有,80,、,90,年代博弈论的成熟和对经济学的博弈论革命。,1.4.4,博弈论的成熟及与主流经济学的融合,一、,80,、,90,年代是博弈论走向成熟的时期,1981,(,Elon Kohlberg,),“,顺推归纳法,”,(,Forward induction,),克瑞泼斯(,David M.kreps,)和威尔孙(,Robert Wilson,),1982,年提出,“,序列均衡,”,(,Sequential equilibria,),1982,年斯密(,John Maynard Smith,)出版了,进化和博弈论,(,),1984,年由伯恩海姆(,B.D.Bernheim,)和皮尔斯(,D.G.Pearce,)提出,“,可理性化性,”,(,Rationalizability,),海萨尼和塞尔腾,1988,年提出了在非合作和合作博弈中均衡选择的一般理论和标准,,1991,年弗得伯格(,D.Fudenberg,)和泰勒尔(,J.Tirole,)首先提出了,“,完美贝叶斯均衡,”,(,Perfext Bayesian equilibrium,)的概念,二、博弈论和经济学诺贝尔奖,1994,:非合作博弈:纳什,(,Nash,),、海萨尼(,Harsanyi,)、塞尔顿(,Selten,),1996,:不对称信息激励理论:莫里斯(,Mirrlees,)和维克瑞(,Vickrey,),2001,:,不完全信息市场博弈:阿克罗夫(,Akerlof,)(商品市场)、斯潘塞(,Spence,)(教育市场)、斯蒂格里兹(,Stiglitze,)(保险市场),2002,:,实验经济学:史密斯(,Smith,),,心理经济学:卡尼曼(,Kahneman,),1.5,博弈论在我国的应用,企业经营者的决策思路和工具。,政府的政策和管理思路,与个人、企业和地方博弈的意识。,社会经济问题的理论分析工具,解释经济中许多低效率现象的根源,找出各种经济问题的制度性、环境性原因,揭示各种经济行为和政策的效率意义等。,
展开阅读全文