1、 博弈论中的海盗分金问题
摘要:博弈,本是游戏、竞赛的意思。所要解决的核心问题是:参与博弈的其他人员会怎么做?我应采取怎样的对策来取得最佳效果?博弈的例子到处可见:讨价还价、划拳、小下棋、“田忌赛马”等。本文将通过海盗分金这一个著名的案例略微分析。
关键词:博弈论,海盗分金,数学,哲学
历史上很多知名的数学家也是有影响的哲学家。例如:毕达哥拉斯、、笛卡尔、莱
布尼兹、等人;“没有数学,我们无法看穿哲学的深度;没有哲学,人们也无法看穿数学的深度;而若没有这两者,人们就什么也看不透。”可见数学的重要性
2、博弈论(Game Theory),应用数学的一个分支,预测个人和群体行为,并研究它们的优化策略。在经济学、国际关系、政治学、军事战略和其他很多学科都有广泛的应用,而海盗分金分金问题正是它的一个经典例子。
5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。假
3、定“每人海盗都是绝顶聪明且很理智”,那么第一个海盗提出怎样的分配方案才能够使自己的收益最大化?
美国曾经统计过,做出这道题的人平均年薪是8万美金的极端优秀人才(当然这是N多年前的),当时美国平均年薪也就1万(当然美国是个相对比较均衡的国家,排除去超级富豪,8万美金在美国那时绝对是打工中的超高收入了)。下面使用倒推法推理:
一、假设1、2、3号已被扔入海中,则4号的方案必为100、0,且必定通过。故5号在得到3号1个宝石的情况下会坚决支持3号的方案。
二、3号的方案必为99、0、1,且必定通过。故4号在得到2号1个宝石的情况下会坚决支持2号的方案。
三、2号的方案必为9
4、9、0、1、0,且必定通过。2号不能把给4号的1个宝石给5号,5号未必坚定地支持2号的方案,因为3号必定通过的方案也能让他得到1个宝石。为了万无一失的保命,2号必须选4号,且必定通过。故3号、5号在各得到1号1个宝石的情况下会坚决支持1号的方案。
四、1号的方案必为98、0、1、0、1,且必定通过。
故答案是:98,0,1,0,1。在海盗分金游戏当中其实这个结果很有趣:在整个游戏当中,原本看起来五个海盗的机会是“均等”的,实力也是均等的,而且规则看起来是“公平的”,但是按照规则执行的结果呢?结果是“赢家接近通吃”,它能独得98%的利益,而“潜在损失”最大的则是2号海盗,他不但失去了
5、可能得道更多的“金子”这样的利益,更主要的是他失去了选择权。这说明了什么问题呢?说明在面对利益分配的时候,即便规则看起来是公平的,“作为既得利益最大者(或者是目前的先发且已然最强者),所有其他人都是潜在敌人,但是其最大敌人永远都是实力最接近他的潜在利益分割者,这是主要矛盾;而作为任何位置的海盗,要想获得最大的利益,他优先考虑、不可绕过的都是‘1号海盗’”。我把这种规律叫做“利益分割中的相近相斥原则”,当然这个“相近”是指在利益威胁上的相近,往往出现在争夺“第一选择权”的时候。争夺“先发优势”、利用“先发优势”是在此类博弈中的永恒的关键所在……尽管题目本身没有说明一号占了便宜。
如果五个海盗的
6、先后顺序是由抽签决定,也就是说他们都有可能是1号,那么只要他们抽签的结果确定下来,那么他们的所得金币也就确定了,因为他们都是足够聪明和理智的。1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。
不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会
7、被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。
海盗分金这个问题体现了多方博弈情况下的生存哲学:
1、没有永恒的朋友,只有永恒的利益。
2、在临界点之下,以决策者的身份出场,冒最大的风险,得到最大的利益。正如海盗中的1号,看起来最有可能被丢下海,结果却获得了最大的利益。
3、在接近临界点的地方,是收益分配最接近公平的地方。半数的人均匀地受益,另半数的人均匀地不受益。正如所述的分配方案,两个海盗获得了一个金币,还有两个海盗一个金币都没有,但是至少保住了性命,不至于人财两失。
4、越过临界点之后,以决策者的身份出现,风险极大,甚至会将老本赔进去,而收益却为零,这是最糟的情况,因为大家的收益都不高。这是一种不稳定的状态,系统会通过自我调整向临界点靠拢。
5、永远都不可能发生所有人都有收益的情况,任何时候都有至少 一半或者接近一半人无收益,除非只有1个人。
参考文献:1 《从海盗分金币说博弈论》
2 《经典题目赏析——海盗分金》
3《写给中国人的经济学》 作者:王福重 出版社:机械工业出版社华章分公司
经典题目赏析——海盗分金