收藏 分销(赏)

囚徒困境纵深谈.ppt

上传人:丰**** 文档编号:12812745 上传时间:2025-12-09 格式:PPT 页数:52 大小:7.85MB 下载积分:8 金币
下载 相关 举报
囚徒困境纵深谈.ppt_第1页
第1页 / 共52页
囚徒困境纵深谈.ppt_第2页
第2页 / 共52页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,囚徒困境纵深谈,1,.,囚徒的困境,(利益是什么?理性悖论等),2,-5,,,-5,0,,,-8,-8,,,0,-1,,,-1,坦,白,不坦白,坦,白,不坦白,两个罪犯的得益矩阵,囚徒,2,囚,徒,1,囚徒,1,:坦白,囚徒,2,:坦白,不谈囚徒困境就无法谈博弈论,囚徒困境的本质,个体理性与集体理性之间存在冲突,合作优于不合作,合作不具有约束性,100,,,100,20,,,150,150,,,20,70,,,70,高,价,低,价,高,价,低,价,寡头,2,寡,头,1,双寡头的得益矩阵,政府组织协调的,必要性和重要性,寡头,1,:低价,(70),寡头,2,:低价,(70),双寡头削价竞争,博弈,不讲诚信,讲诚信,不讲诚信,0,,,0,5,,,-5,讲诚信,-5,,,5,3,,,3,一次博弈时的策略选择,重复博弈中的策略选择,博弈诚信(,trust,),博弈,博弈方,2,博弈方,1,不讲诚信,讲诚信,不讲诚信,0,,,0,-5,,,5,讲诚信,5,,,-5,3,,,3,第三方强制(法律),信誉机制,如何让人们讲诚信?,博弈方,2,博弈方,1,联横,合纵,联横,1,,,1,0,,,0,合纵,0,,,0,1,,,1,弱者的智慧,齐国,秦国,合纵就是弱国联合起来阻止强国进行兼并,苏秦;,联横就是强国迫使弱国帮助它进行兼并,张仪。,安内,攘外,安内,1,,,1,2,,,1,攘外,1,,,2,1,,,1,弱者的智慧,抗战中的国共两党,共产党,国民党,两个均衡点,不确定;,共同选择攘外是不可能的,蒋介石没有学博弈论;,张学良民族罪人。,合作,不合作,合作,2,,,2,2,,,1,不合作,1,,,2,1,,,1,弱者的智慧,李斯与赵高,赵高,李斯,合作是李斯与赵高严格最优策略;,赵高是怎样说服李斯的?,乙,修,不修,甲,修,1,1,-1,3,不修,3,-1,0,0,修路博弈,为什么是政府与富人负责修路建公共设施,因为私人没有积极性?,比如修要,4,个成本,收益,3,个,个人修,1,收益,合修,3,-2,1,个得益。最后都不修。,交通博弈,司机,2,缓行,抢行,司机,1,缓行,8,8,1,9,抢行,9,1,2,2,(,3,,,3,),蜀,蜀,吴,(,3,,,3,),(,1,,,1,),合作,不合作,(,1,,,1,),合作,不合作,不合作,合作,三国博弈,在荷兰召开了一次,“,合作及社会两难困境研讨会,”,,与会者都是博弈论的专家。当大会结束后,有两个学者,麦息克和路特提议大家玩一个游戏。,他们将一个大信封拿出来,请在场的,43,位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过,250,元,麦息克和路特将自己掏腰包,退还每人,10,元。不过,如果信封内的钱不足,250,元,就统统没收,大家拿不到半毛钱。,请问,你会出多少钱呢,?,1,请问,你会出多少钱呢,?,2,每个人应该要放入的数目:,250/43=5.81,。,如果每人放进去,7,元钱,应该就可以超过目标,250,元了。等到最后退还,10,元钱时,每人都还可以净赚,3,元呢。,不过,这游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。,最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是,245.59,元,离目标,250,元就差那么一点点。,请问,你会出多少钱呢,?,3,看到这种结果,这些学者们群情哗然,一副不敢相信的样子。,这种事情怎么可能发生?他们统统都是德高望重的学者,而且才刚刚结束了两天的,“,合作研讨会,”,啊!他们的合作结果居然比目标还少了近,5,元钱,这下子,大家统统拿不回来半毛钱了。,请问,你会出多少钱呢,?,4,有些人抱怨只要再多一个有良心的人放进去,7,块钱就好了;,有些人后悔自己应该再多放一点点的;,更有一些人说:,“,早知道这样,我宁可那时候放十几块钱,最后让每个人有钱赚,让主持人付账。,”,请问,你会出多少钱呢,?,5,但问题是:事先根本不可能有人真的奉献超过,10,元,因为我们都预期别人会拿出他们所该奉献的那部分。,如果真是那样,那么我就没有必要比别人多出一点,反正拿出来的部分就是浪费。,另一方面,如果我一个人少付一点点,最后也会超过目标嘛,让自己多赚一点点大概没啥关系吧。,请问,你会出多少钱呢,?,6,如果每人都付,7,元,而你不付钱,你可以不冒风险就白白赚,10,元,如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。,因此你的优势策略就是:根本不要放进去半毛钱。,请问,你会出多少钱呢,?,7,每个人都基于这样想法的话,最后的结果总是令人失望的。,造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多,“,捞,”,一点,因此才会产生每个人都那不回钱的结果。,请问,你会出多少钱呢,?,8,囚徒困境的破解,不合作,合作,许诺,奖励,惩罚,可信性,启示,1,:,在,“,囚徒困境,”,中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。,启示,2,:,“,囚徒困境,”,是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。,囚徒困境博弈分析,任何一人单方面改变选择,他只会得到较差的结果。,这一点就是,纳什均衡,(Nash Equilibrium)。,在博弈达到纳什均衡时,博弈不是最好,而是僵局,谁也不愿意改变,谁改变谁吃亏。,纳什均衡的思想,如何走出,“,囚徒困境,”,合作是否成为可能,促进双方合作可以从三个方面着手:,使得未来相对于现在更重要些,重复博弈,;,改变对策者的四个可能的结果的收益值;,教给对策者那些促进合作的准则、事实和技能。,走出囚徒困境的三大途径,地摊、车站、旅游点,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间,“,没有明天,”,一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚。,未来是否重要?一次博弈与重复博弈,在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。为什么?,在相互社会联系紧密的人际关系中,人们普遍比较注意礼节、道德,。,未来是否重要?一次博弈与重复博弈,两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有。,如果他们的见面是偶然的,结果会如何?,如果他们都知道对方生活在附近又会如何?,偶然见面,可能相互抢劫;,生活在附近,选择合作,以物易物,交易就这样产生了,所有权就这样产生了;,从消极的层面看,我们互不侵犯,是为了避免没完没了、两败俱伤的循环报应。,道德、法律、权力利益的划分,都与,“,还要见面,”,有关。,未来是否重要?,相邻的人互相敌对,只会两败俱伤。,如巴以、印巴、两伊以及伊拉克和科威特。希腊和土耳其也曾经是这样的世仇,现在关系虽已缓和,但是它们之间的不信任感还是长久不能消除。,未来是否重要?,中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。,现在两国关系改善,互信增加,边境军事力量大大减弱,可以说是一个双赢。从这个意义上说,,“,面向未来,”,不仅仅是一句外交辞令。,未来是否重要?,1858,年至,1915,年,沙俄通过一系列不平等条约割去中国领土,150,多万平方公里,并违约侵占了数万平方公里的中国领土。,增大未来影响的另一方法是使接触更加频繁。在下一步接触很快就会发生的情况下,这一次合作通常更为重要。经常接触有助于促进稳定的合作。,在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁。,增大未来的影响,走出,“,囚徒困境,”,智能手机三大巨头,在小城镇比在大城市容易出现合作便是因为人与人的接触更频繁。,接触更频繁也是婚姻比恋爱相对来说更稳定的原因之一。,婚礼就是一个用来庆祝和促进持续关系的公共行为,对婚姻的稳定有促进作用。,增大未来的影响,走出,“,囚徒困境,”,增大未来的影响,走出,“,囚徒困境,”,分解(问题分解成若干的部分)是促进稳定的合作的一种有效方法。因为分解会增加接触的频率。,比如,将军备控制和裁军条约分解成许多阶段,这样就允许双方有更多让步的机遇而不只是一两个让步。这样可以使回报更有效。,增大未来的影响,走出,“,囚徒困境,”,如果双方都知道对方的一步不合作的策略可以通过下一步的回报来补偿,那么双方对整个过程可以按所期望的进行就更有信心。,而且,如果双方对自己识别欺骗的能力缺乏信心,那么,有许多小的步骤比只有少数大的步骤更有助于促进合作。,增大未来的影响,走出,“,囚徒困境,”,在商业上,商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。,使得当前步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好方法。,增大未来的影响,走出,“,囚徒困境,”,决定合作与否其实取决于一次博弈还是多次博弈,.,在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是稳固的。,如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益,增大未来的影响,走出,“,囚徒困境,”,决定合作与否其实取决于一次博弈还是多次博弈,.,但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。,当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况。,决定合作与否其实取决于一次博弈还是多次博弈,.,为什么恋爱中的男人小气?,因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。,素不相识一对男女的一夜情是一次性囚徒困境博弈。,改变对策者的四个可能的结果的收益值,决定合作与否其实取决于一次博弈还是多次博弈,.,生活中多人博弈的现象比两人博弈更为普遍。,在多人博弈中,只有其它所有参与者在第,k,1,次博弈中都是合作的,某个参与者才会在第,k,次博弈中采取合作策略。,增大未来的影响,走出,“,囚徒困境,”,然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。,更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的。,增大未来的影响,走出,“,囚徒困境,”,某城市政府采购办公用品,每年招标,只挑选两个供应商。,政府每个月采购一次,两个供应商每个月就当月采购商品报价。,实行,“,价低者得,”,原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得,50%,。如报价不同,则全部订单给价低者。,这两个供应商应如何报价?,供应商合作还是背叛?,1,两供应商相互合作,共同报一相同高价,获取最大利润,自是双方的最优策略。,两供应商共同合作了,11,个月,但在第,12,个月,两供应商知道这是今年最后一次,对方很有可能背叛。与其对方背叛,不如自己背叛。,两供应商知道第,12,次对方会背叛,那么第,11,次不如我就背叛,因为第,11,次采用合作的态度并不会促使对方在第,12,次时合作。,同理,第,10,次、第,9,次,第,1,次,每一次都应该背叛。,因此双方不可能合作共同报高价,而是相互竞争地报低价。,供应商合作还是背叛?,2,(,100,,,100,),(2,,,2),R,(,1,,,1,),1,D,1,(,0,,,3,),2,r,d,D,R,(,98,98,),1,D,(,97,100,),2,r,d,(,99,99,),1,D,(,98,,,101,),2,r,d,蜈蚣博弈,R,R,蜈蚣博弈问题,如何利用,“,囚徒困境,”,如果没有外部强制力,这时囚徒困境中两个参与者采取什么样的策略才可以更好的维持合作的稳定性呢?,如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为,触发策略,(,Trigger strategy,),或称冷酷策略。,如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。,触发策略,针锋相对(,tit-for-tat,)策略:以牙还牙,圣经,旧约,:以眼还眼、以牙还牙,我们对待自己的恋人,/,爱人是否可以用“以牙还牙”的策略?,触发策略,好的策略必须具有的一个特点是,“,清晰性,”,,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。,针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择善,只因为合作是自我利益最大化的一种必要手段。,善意而不是恶意地对待恋人;,宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;,强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。,爱情中的博弈原则,比如对恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁地回报;简单明了而不是山环水绕地对待恋人。,在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。,爱情中的博弈原则,人生发誓最多的莫过于恋爱时期。非你不娶,非你不嫁,海枯石烂情不变之类的誓言。为什么向恋人发誓呢?,无非是一报还一报的触发策略。希望对方也这样对待自己,换来一个好的博弈结果。,触发策略是一个不怕曝光的策略,而且恰恰需要别人知道你的基本原则,这样才能更好地实现合作双赢。,恋爱时期的誓言,触发策略,触发策略的局限性:如果双方存在误解,不管出现误会的几率怎样微乎其微(即使万亿分之一),只要有可能出现误会,长期而言,一报还一报策略会有一半时间合作,一半时间背叛。,理由是,一旦出现误会,双方是将问题复杂化,还是澄清误会,其机率是一样的。这样一来,选择合作或背叛的机率便是一半对一半。,合伙者为什么多以拆伙告终?,合伙者为什么多以拆伙告终?,对方偶然背叛了你,你通过行动或者不行动来显示你对此介意,你自己觉得是相称的,“,警告,”,,但对方很可能认为你反应过度,小题大做。,因而,哪怕是微不足道的误解一旦发生,合作便有了危机。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服