2022年博弈树与逆向归纳法.docx

资源描述

动态博弈与逆向归纳法如果欺负她人可以获得快乐，那你会欺负她人吗？大多数人回答是不会，因素正如她们所指出，欺负她人会紧张她人报复，这抵消了从欺负她人行为中所能得到快乐。这个答案至少表白，你之因此目前没有欺负她人，并不由于不想欺负她人，而是由于你懂得欺负她人会在将来给自己导致麻烦。同样，当我们面临某些博弈对局时候，我们应如何采用目前行动，常常取决于每个行动在将来会产生什么后果，或者说在将来别人将如何反映。在前面各章内容中，博弈是静态——或者说是同步行动。而现实中博弈常常是动态、依序行动，这就规定我们必要考虑人们在将来对我们行动反映。分析序贯行动博弈一种重要思路就是：向前展望，向后推理(looking forward and reasoning backward)，即面向将来，思考目前，站在将来立场来拟定目前最优行动。本章我们将通过某些例子来阐明这一分析思路，其中有些例子很有趣，也很有挑战性。 §5-1 逆向归纳法 1、美中军事政治博弈我们通过一种简朴例子来阐明序贯博弈（离散方略）扩展式体现和逆向归纳法求解措施。这个例子可以称做美中军事政治博弈，或者叫“毛泽东对外军事政治战略”。故事模型在国内解放初期，美国始终试图对国内实行打击。此时，国内必要对美国采用应对之策。就国内对美国可以采用行动而言，无非是回击或不回击。用更符合毛泽东话来说，美国可以“犯我”或“不犯我”，而我们可以“犯人”或“不犯人”。由此我们可以刻画出一种动态博弈： ●博弈方：美国、中华人民共和国； ●行动空间：美国可选用行动是“犯我”或“不犯我”；中华人民共和国选用是“犯人”或“不犯人”； ●行动顺序：美国先行动；中华人民共和国观测到美国行动后再选用自己行动； ●获利：我们这样假设获利状况（数字是虚拟）； ●如果美国“犯我”，中华人民共和国“犯人”，恶战再所难免，则美国亏损2，中华人民共和国亏损2； ●如果美国“犯我”，中华人民共和国“不犯人”，那么中华人民共和国沦为美国附庸，丧失国家主权，则美国获得2，中华人民共和国亏损4； ●如果美国“不犯我”，中华人民共和国“犯人”，那么就是中华人民共和国挑起战事，美国正好有借口纠合国际力量打击中华人民共和国，则美国得3，中华人民共和国亏损5； ●如果美国“不犯我”，中华人民共和国“不犯人”，各自和平地发展经济，则美国得1，中华人民共和国得1。 2、博弈树对于上述动态博弈，我们可以用博弈树(game tree)体现如下（图5-1）：美国犯我不犯我中华人民共和国中华人民共和国犯人不犯人犯人不犯人（－2，－2）（2,-4）（3,-5）（1,1）图5-1 美中军事政治博弈图5-1博弈树是这样解读：美国先选用“犯我”或“不犯我”，然后中华人民共和国观测美国选用后选用“犯人”或“不犯人”；最右边括号内数字是多种状况下双方获利状况，前一种数字代表第一种行动人（美国）获利，第二个数字代表第二个行动人（中华人民共和国）获利。依此类推，如果有更多参与人序贯行动，则获利排列顺序与行动顺序一致。 3、逆向归纳法究竟什么是图5-1博弈均衡呢？在完美信息动态博弈中，我们要找均衡事实上是一条途径，即从第一种行动人决策结点出发，始终到某一种终点之间途径。所谓均衡途径就是在每一种决策阶段，没有人会偏离这条途径。这条途径所代表方略均衡被称做子博弈完美均衡。下面我们简介如何用逆向归纳法来求解博弈均衡。逆向归纳环节是这样： ● 一方面，从最后阶段行动参与人决策开始考虑。在图5-1博弈中，最后行动是中华人民共和国，因而我们先考虑中华人民共和国怎么决策。在考虑中华人民共和国决策时，我们假定美国已经选了“犯我”或“不犯我”； ◆ 如果美国选用了“犯我”，在图5-1中可发现，中华人民共和国选用“犯人”会得到-2，选用“不犯人”会得到-4；因而中华人民共和国必然选用“犯人”——我们就在中华人民共和国“犯人”分枝上画上一种短短横线标记； ◆ 如果美国选用了“不犯我”，从图5-1中可发现，中华人民共和国选用“犯人”会得到-5，选用“不犯人”会得到1，因而中华人民共和国必然选用“不犯人”——我们就在中华人民共和国“不犯人”分枝上画上一种短短横线标记。 ● 然后，考虑次后阶段行动人（例子中只有两个阶段，因而事实上就是第一阶段行动人）——美国。美国决策时会考虑中华人民共和国反映，而目前它已预见到中华人民共和国将选用行动就是两条划了双横线分枝。因此，它很容易推出自己面临状况是： ◆ 若选用“犯我。，则必然导致中华人民共和国“犯人”，则美国得到-2； ◆ 若选用“不犯我”，则中华人民共和国必选用“不犯人”，则美国得到1； ◆ 成果美国宁愿选用“不犯我”。照规矩，我们在美国“不犯我”一种分枝上画上横线。 ● 如果存在一种途径，其每个分枝都画上了横线，那么这条途径就是均衡途径。可发现，在图5-1例子中，均衡途径将是美国选用“不犯我”，而中华人民共和国选用“不犯人”。因而，美中博弈子博弈完美均衡成果是：美国不侵犯中华人民共和国，而中华人民共和国也不侵犯美国。逆向归纳法对于求解子博弈完美均衡之因此合用，其因素就在于它解过程较好地体现了子博弈完美均衡定义：一种方略组合只有在其路．既满足是整个博弈均衡又满足该途径上每一种子博弈均衡时候，‘才是子博弈完美均衡。 §5-2 逆向归纳法应用掌握了逆向归纳措施，目前我们就可以来看某些序贯行动博弈例子。这些例子既布满趣味，也是对人们使用逆向归纳技术一种训练，同步也也许是一种智力上测试。 1、私奔博弈故事模型在国内汉代，有个青年作家叫司马相如，有个年轻寡妇叫卓文君。卓文君爸爸喜欢附庸风雅，常常请某些所谓才子到家里吟诗作赋，其中就波及司马相如。日情，并打算结婚。但是，这门亲事遭到文君爸爸反对。爸爸对文君说，你若跟司马结婚，那么就将脱离父女关系。目前，卓文君应当如何选用？是屈从爸爸，还是跟心上人结婚？我们可用如下一种博弈（图5-3）来体现卓文君与她爸爸博弈。跟司马结婚默认文君爸爸（2,－1）与司马断绝父女断绝关系关系（－1,1）（0,-2）图5-3 私奔博弈图5-3博弈中，卓文君先选用“与司马断绝关系”或者“结婚”。若与司马断绝关系，则她失去一种心爱人，得到-1获利（她爸爸则得到获利1，由于她终于如愿以偿让女儿没能跟司马结婚）；若选用结婚，则由文君爸爸做出反映。她可以选用真断绝父女关系——这种状况下，文君得到0（由于她虽然跟爱人结婚得到1，但是却因而失去了爸爸得到-1，总计得到0），爸爸得到是-2（由于看到文君与司马结婚心中不快得到-1，又失去了一种女儿其所得再增长-1）；固然，既然生米煮成了熟饭，爸爸可以默认——此时文君既得到爱人又没有失去爸爸故获得获利2，而爸爸心中不快得到-1，但毕竟没有失去女儿。使用逆向归纳法不难得到，第二阶段爸爸将选用默认（由于默认获利为-1，而断绝父女关系获利为-2）；给定第二阶段爸爸会默认，第一阶段文君将选用结婚（结婚获利为2，与司马断绝关系获利为—1）。因此，私奔博弈均衡成果是，文君选用结婚，而文君爸爸选用默认。历史上故事正是如此。卓文君不顾爸爸反对和司马相如私奔。两个人在成都靠开酒吧为生。文君爸爸不忍女儿受苦，最后还是接纳了她们婚姻。私奔博弈刻画了一种很重要道理，那就是有些时候威胁并不可怕，由于那些威胁仅仅是威胁而已。就像父妈妈反对子女婚姻时常常摆出一副要断绝父子（女）关系样子，但一旦木已成舟，她们也只得默认，并不会真跟子女断绝关系。学习了博弈论人，更容易看出这些威胁是不可置信。 2、海盗分赃再来看一种逆向归纳法典型例子，其原型来自I．Stewart在《科学美国人》杂志上一篇文章《凶残海盗逻辑》。这个例子曾经被作为微软公司招募员工面试题目，你也可以尝试着可以在几分钟之内求解出对旳答案。故事模型话说有5个海盗ABCDE抢来了100枚金币，人们决定分赃方式是：依次由海盗ABCD提出一种分派方案，如果批准这种方案人达到半数，那么该建议就通过并付诸实行；若批准这种方案人未达半数，则建议不能通过且建议人将被扔进大海喂鲨鱼，然后由接下来海盗继续反复建议过程。假设每个海盗都绝顶聪颖，也不互相合伙，并且每个海盗都想尽量多得到金币，那么，第一种建议海盗将如何建议既可以使得建议被通过又可以最大限度得到金币呢？我曾好几次在学生中做过调查，如果她们就是第一种海盗会提出怎么分？答案五花八门，但是大多数是体现平均分（每人20颗）——这也许是现实中状况，公平观念在博弈中发挥着作用。但是原则博弈论是研究人们完全理性状况下极端复杂方略互动后果，这里平均分派并不符合原则博弈论逻辑。那么答案究竟是什么呢？使用边向归纳法可以求解如下： ★一方面，考虑只剩余最后海盗E，显然她会分给自己100枚并赞成自己。 ★再回溯到只剩余海盗D和海盗E决策，海盗D可以分给自己100枚并赞成自己；海盗E被分得0枚，虽然反对也无用。 ★回到海盗C。海盗C可以分给海盗E 1枚金币得到海盗E批准；分给自己99枚，自己也批准；分给海盗D 0枚，海盗D反对但无用。 ★回到海盗B。海盗B可以分给海盗D 1枚得到海盗D批准；分给自己99枚，自己也批准；海盗C、E各分得0枚，她们会反对但反对没有用。 ★回到海盗A。她可以分给海盗C、E各1枚，获得海盗C、E批准；分给自己98，自己也批准；分给海盗B、D各0枚，她们会反对但反对不起作用。因而，这个海盗分赃问题答案是(98，0，1，0，1)：海盗A提出分给自己98枚，分给海盗B、D各O，分给C、E各1枚，该建议会被通过。由于海盗A、C、E会投赞成票。我们可以把这个逆向决策过程用如下矩阵体现出来（如图5-4，其中画下划线数字体现海盗对该方案投了赞成票，未加下划线相应于反对票）。如果你是海盗A，你会这样提方案吗？对于上述海盗分赃问题，我们还可以演化出不同版本。例如说：(1)如果规定波及建议海盗在内所有海盗过半数（超过1/2）批准才干使建议通过，那么海盗A应当怎么提方案？ (2)如果规定建议海盗之外海盗过半数批准才干通过，那么海盗A又该怎么提方案？ (3)或者海盗数目增长到10个、100个，海盗A又怎么提方案？人们可以把这个当做练习题来做一做。分派给各位海盗金币数目分派者海盗A B C D E 海盗E 100 D 100 0 C 99 0 1 B 99 0 1 0 A 98 0 1 0 1 图5-4 海盗分赃逆向推理过程（所有海盗半数批准即可通过）答案：变种问题(1)中，海盗A提出分派方案是(97，0，1，2，O)或(97，0，1，0，2)；变种问题(2)中，海盗A提出分派方案应是(97，0，1，1，1)；变种问题(3)中，人们可尝试逐渐增长海盗数量，将会发现答案是有规律可循。 §5-3 理性局限与非理性行为逆向归纳措施是一种非常美妙思想，但是它对人们理性规定也许会太高。然而，也也许正由于人们理性限度是不同样，才有了博弈高下之分。有关参与人理性不对称下博弈理论研究，至今仍是博弈论研究一种努力方向。按照博弈论人们鲁宾斯坦( A.Rubinstein)说法：“对不同参与人能力及形势洞察力不对称性建模在将来研究中将是一种吸引人挑战。” 1、序贯理性所谓序贯理性，通俗地说就是每个参与人在其每一种行动时点上都将重新优化自己选用，并且会把自己将来会重新优化其选用这一点也纳入目前优化决策当中。换句话说，一种具有序贯理性参与人很清晰自己在每一种需要做出决定期刻都需要重新对已有决策进行优化，并且在做这种优化时候必要把将来需要重新优化这一事实考虑在既有优化决策当中。显然，序贯理性下将不会有“懊悔浮现”——由于满足序贯理性所形成途径，无论从后向前看，还是从前向后看，都将是一条最优道路。那么，只凭我们在寻常生活决策中有那么多“悔不该当时”，我们就懂得其实人们常常难以达到序贯理性规定。为什么人们常常难以达到序贯理性规定呢？至少有两个因素：一是人们算计能力是有限；二是人们理性自身也是有限（例如感情用事、冲动行事、冒险倾向等）。 2、算计能力与方略技巧从臥理论上来说，有限离散方略，只要其也许成果状态是有限，我们就可以通过逆向归纳措施，来求解出均衡途径上方略。按照这样一种想法，我们在下下象棋、围棋等时也许就分不出高下。由于，每个人都通过逆向归纳法已经懂得如何应对每一步棋，最后人们也许永远只会下成平手。但现实中，下棋胜负是很常用成果。并且，我们明显发现更有经验棋手显然更能“老谋深算”，一种新手常常目光短浅、漏洞百出，老手下赢新手是最普遍成果。为什么会这样呢？下棋之因此能分出胜负，其实就在于对手之间序贯理性是不同样，她们对于局势洞察力是不同样。有经验老手，眼光显然比一种新手强上不止几百倍。读者也许会问，下象棋但是32颗棋子，为什么人们算计能力会如此有限呢？这里事实上波及到序贯博弈中方略数量是成几何级数增长。当你下象棋时候，32颗棋子，第一阶段你就至少有32种行动选用（其实还不止，由于某些棋子可行环节不止一种），那么，哪怕是只规定进行几种回合厮杀，其方略组合都远远超越了人脑通过逆向归纳来进行算计能力。存在众多可选行动和行动阶段博弈中，方略组合数量之巨大、状况之复杂似乎会给人一种悲观结论：既然如此，我们还研究博弈论干什么呢？对此我想说是，这并不悲观，反而有趣。人与人之间理性限度差别造就了胜负之分，才使得棋艺对抗如此令人着迷，难道不是这样吗？并且新老棋手棋艺高下，不正是阐明了理性限度提高方略技巧改善是可以通过学习和训练来达到吗？难道这不正是一种应当学习和研究博弈论最佳理由吗？此外，尚有一种更为乐观事实是，由于计算机技术发展，过去许多以人脑难以完毕算计并分析博弈，目前已经可以通过电脑辅助计算来完毕。可以想像，随着人类计算技术发展，人类算计能力也会迅速得到发展，并日益可以分析更为复杂博弈。 3、操纵理性博弈现实博弈与原则博弈理论存在差距此外一种事实是，现实中博弈参与人很清晰各个参与人理性限度和对现实洞察力是有差别，从而她们完全有也许方略性地使用“理性”。例如，如下一种博弈（图5-5）：图5-5博弈中，人们使用逆向归纳法很容易发现，第三阶段，甲将选用“左”（获得100）；但是在第二阶段乙宁愿选“上”（获得1）；回到博弈之初，甲将选用“前”直接结束博弈（获得2）。这是原则逆向归纳解。甲前后（2,0）乙上下（1,1）甲左右（100,0）（0,100）图5-5 非理性博弈但是在现实中，这个均衡成果会浮现吗？很也许不会，特别是当两个参与人对对方理性有所质疑时候。例如说，甲也许会想：我如果选“后”，那么即便乙选用了“上”，我也得到1个单位，只比我选“前”少得到1个；但是，如果她觉得我是个傻瓜，而要冒一次险选用“下”（如果甲真是傻瓜，“下”对乙是有诱惑力，地选用“右”而使得乙得到100），那么我就赚了。这样，不管是由于侥幸心理，或是真使用装傻方略，甲也许真会选“后”。同样，乙看到甲选了“后”，也许乙不久乐地觉得甲是个傻瓜（完全理性人不会这样选嘛），那么乙侥幸心理也被诱导出来了，既然她是傻瓜，那我为什么不冒险选下呢——这样，要么我只比选“上”少得到1个单位，但也有也许多得到100-1 = 99个单位呢。于是乙也许真会选“下”。正由于乙也许有上述心理和行为，因此甲在第一阶段就更有也许会选用“后”。只要乙敢于冒险选“下”，那么甲就可以毫不费力地得到100单位收入了。固然，甲选用“后”是有风险，由于如果乙理性限度很高，没有侥幸心理，或者可以洞悉甲企图，那么甲就会“偷鸡不成反而蚀把米”。在现实中，这样运用对手理性局限性博弈还少见吗？一点也不！有些博弈高手，就是抓住对手侥幸心理（完全理性人是不会有侥幸心理）故意卖一种破绽，从而诱对方上钩，大获其利。故事模型譬如元朝末年朱元璋灭陈友谅就是一种典型博弈战例。其时，各地起义军已混战近年，最后只剩余了朱元璋、陈友谅等几支大队伍。陈友谅为了吞掉朱元璋，勾结朝廷太尉张士诚，向朱元璋占据建康（今江苏南京）攻打。但陈友谅与朱元璋打过近年交道，深知朱元璋足智多谋，手下兵多将广，故小心翼翼，步步为营，慢慢推动。消息传到建康，朱元璋思谋破敌之策，觉得想灭陈友谅，必要诱敌进一步，然后围歼之。这样一步步地打消耗战，久了必会腹背受敌，被陈友谅和张士诚两面夹击就危险了。但如何引陈友谅孤军进一步呢？朱元璋想起了黄盖降曹赤壁之战，觉得可以仿效办理，以诱惑敌人。于是朱找到过去与陈友谅交情甚厚属将康茂才，问她与否有把握诱陈友谅来攻。康茂才说：“陈友谅胸无大志，缺少战略眼光，急功近利，可以诱其前来。”于是她修书一封，说自己在元璋手下干得很不痛快，出力不少，不得重用，今将军前来攻打，愿投降。并说：自己负责防守建康西边大桥，是水路攻建康必经之路，若将军到来，愿献桥投降。陈友谅虽然紧张有诈，但觉得自己力量雄厚，带大兵前来，虽然有诈也不用太紧张。成果，她一来就未能回去，被朱元璋所灭。在这个例子中，朱元璋等人就是运用了陈友谅侥幸心理，故事中核心词“可以诱其前来”和“愿献桥投降”，深刻地阐明了朱元璋如何用尽心计试图运用对方侥幸心理。固然，这种试图运用对方理性局限性而操纵对方谋略也也许被对方识破而不能得逞。一般，这种方略性运用“理性”失败与低估对方理性有关。三国演义 “东吴招亲”故事中，孙权和周瑜就是低估了诸葛亮理性，成果被诸葛亮将计就计，赔了夫人又折兵。总之，“理性”自身也许就是现实中人们进行博弈时一种可操纵方略变量。但是，博弈理论在这一方面并没有多大进展。下一节我们还会谈到某些非理性博弈，例如非理性报复——我们会发现“非理性”有时也会给参与人带来好处。也许正由于如此，物竞天择——大自然才让人类在演化中保存了非理性吧。 §5-4 威胁、承诺与报复 §5-4－1威胁和承诺在博弈中，威胁、承诺与报复，都是常用手段，这些内容也是本节要探讨主题。人们会发现，博弈论思维确有助于我们洞悉某些局势中不可置信威胁、不可置信承诺等。 1、威胁与空洞威胁在生活中，人们常用威胁和吓唬来达到自己目。但是，理性参与者会发现某些博弈中威胁是不可置信，即塞尔顿（Selton，1994年经济学诺贝尔奖得主）所谓“空洞威胁”(empty threat)。威胁不可置信一种重要因素是：将威胁所声称方略付诸实践对于威胁者本人来说比实行非威胁声称方略更不利。既然如此，我们就没有理由相信威胁者会选其威胁所声称方略。例如有一种垄断市场，唯一垄断者独占市场每年可获得100万利润。目前有一种新公司准备进入这个市场，如果垄断者对进入者采用打击政策，那么进入者就将每年亏损10万元，同步垄断者利润也下降为30万元；如果垄断者对进入者实行默认政策，那么进入者和垄断者将各自得50万元利润。目前，为了避免进入者进入，在位垄断公司宣称：如果进入者进入，那么它就会选用打击政策。但是，如果我们把这个市场进入博弈博弈树画出来，再用逆向归纳措施求出均衡途径，就会发现这是一种“空洞威胁”。进入打击进入者在位者（－10,30）不进入默认（0,100）（50,50）图5-6 市场进入博弈中空洞威胁我们会发现均衡途径是进入者进入，而在位者默认。在位者威胁将是不可置信，由于给定进入者真进入了，在位者选用默认而不是打击将更符合其利益，因此在位者宣称要实行打击，也只是说说而已。事实上，在诸多时候，威胁都是不可置信，特别是口头威胁。例如在第4章“私奔博弈”中，卓文君爸爸以脱离父女关系威胁文君与司马相如分手也是一种空洞威胁例子。在家庭里，常常浮现不可置信威胁。由于家庭成员彼此利害有关，惩罚一种家庭成员也会给惩罚者带来负效用，成果就使得惩罚常常并不是很可信。在公司里，员工常常会方略性地提出加薪，而威胁老板加薪一种常用版本就是“如果不给我加薪，那我就将离职”。问题是，老板会不会理踩员工威胁呢？一种显然事实是，老板可不像小孩那样缺少理性。如果员工并没有其她去处，老板就不会理睬员工加薪规定。只有老板相信员工会拜别，并且她觉得多花点钱留住员工是值得时候，她才会给员工加薪。在师生之间，有时也会存在不可置信威胁。教师为了让学生更加努力学习，有时会故意夸张命题和阅卷严格限度。但是，学生很清晰问题是教师不也许让大面积学生不及格，因此她们就不会理睬试题难度。如果她们预测95%学生会及格，那么她们就只需要让自己进入那95%就行了，并不会紧张绝对分数与否会达到60分。如果教师真想通过考试压力来迫使学生努力学习，那么她应当发布更低相对及格原则，例如无论考多少分，都只有70%同窗才算作及格。但是，几乎没有教师会这样发布，由于如果她真发布了这样一种过低相对及格率，那么学生会向校方投诉教师强行规定了不合理及格率。 2、通过承诺行动使威胁变得可信为了使威胁变得可信，人们可以采用承诺行动。承诺行动基本思想是：通过限制自己某些方略选用，从而使得其选用特定方略宣称或意图变得可信。或者说，承诺行动是局中人通过减少自己在博弈中可选行动来迫使对手选用自己所但愿行动。其中道理在于：既然对方最优反映行动依赖于我行动，那么限制我自己某些行动事实上也就限制了对方采用某些行动。如果某些承诺行动只是增长了选用某些行动成本，而不是使该行动完全不也许被选用，则被称为不完全承诺。虽然语言也可以作为一种承诺，但我们这里讲承诺行动更注重要贯彻在“行动”上。“行胜于言”是博弈论基本教条。一种人嘴巴上可以说得天花乱坠，而理性人却只看她行动。 §5-4－2现实中威胁与承诺 1、爱承诺故事模型有一位小伙子在给心爱姑娘信中写道：“爱你爱得如此之深，以至愿为你赴汤蹈火；我是那么地想见到你，任凭艰难险阻也挡不住我脚步。本周六如不下雨，我一定来找你！” 这个女孩子能相信这个男青年誓言吗？“我会爱你毕生一世”这句话，太容易说了。因而，这样承诺，难以置信。那么，如何才可以让你对她爱是可以置信？为了表白你心迹，你需要付出代价。并且代价越沉重，才干表白你越爱她。但是，这代价并不一定是金钱，由于金钱对于某些人来说也是便宜。一种百万富翁为一种女孩子一掷千金，为另一种女孩子则不惜生意代价付出大量时间来陪伴她，你说她更爱哪一种女孩子呢？在高度情感化领域，人们博弈仍然布满了理性。为什么婚前要送昂贵彩礼？为什么要举办高档婚宴？过去，人们习惯于批评这是讲排场，面子风光。而在博弈论看来，这是一种承诺行动。昂贵彩礼和高档婚宴一方面表白了乐意为对方做出牺牲，另一方面事实上也是向外界传递了她们把这段感情看得有多重信号，而排斥了潜在婚姻竞争者，从而限制了自己选用以承诺对爱情忠贞。或者可以这样理解，男青年高额下聘，事实上使得其财富减少不也许再去找此外一种婚姻对象，这就是典型承诺行动了。也许有人会不赞同这样见解，但是如果我们把婚姻看做是婚姻市场上交易产品，那么下聘礼与其她产品市场交易中交纳订金或抵押物在本质上其实并无不同，都是承诺而已。同样道理，为什么恋人会乐于把彼此简介给自己父妈妈朋？这也是一种承诺。一种人将恋人简介给自己父妈妈朋时，事实上就对自己再选用其她婚恋对象做出了限制。这样一种放弃潜在婚恋机会做法是向对方做出了一种感情上承诺。确，如果你谈了好久恋人始终回绝让你进入她家人和朋友圈子，这只能阐明她感情仍处在游弋不定之中。 2、商业中承诺商业界承诺更多。刚刚讲到订金、抵押物都是常用承诺行动。先发制人使市场达到饱和也是一种承诺行动。为了避免竞争者进入，在位公司可以通过过度投资和生产来占据市场，尽管这会使得其利润下降，但是比竞争者进入状况要好，那么公司就也许采用提前使市场饱和方略来制止竞争者进入。生产耐用消费品公司常常推出最惠条款，这也是一种承诺。耐用消费品因其使用时限较长，生产耐用品公司会常常被“降价预期”所困扰：如果消费者预期公司将降价，她们便会等待，成果，公司只能降价。例如国内汽车行业，入世之后人们觉得汽车必然降价，成果就持币待购，汽车就真只有降价（固然，这里只是说汽车价格受到了价格预期影响，并不是说降价完全来自预期。汽车价格下降因素并不止此）。而最惠条款则可以起到承诺作用：公司不会降价了。公司所有权也是一种承诺。人们都懂得，公司事实上是资本与劳动缔结合约。但是为什么公司中是资本雇用劳动而不是劳动雇用资本呢？一种可行解释在于，资本所有者承诺比劳动力所有者承诺更值得信赖，更不易采用机会主义行为。如果非人力资本所有者不能兑现自己承诺，其她人可以将她资本拿走，甚至以毀灭相威胁。对比之下，如果人力资本所有者违约，其她人对她实在没有什么好措施。常言道“跑得了和尚跑不了庙”，没庙和尚谁能信任？而资本所有者投入资本就是修建了一座庙，以此承诺获取信任。 3、名誉与承诺前面我们始终在体现一种观点：仅仅留于口头承诺是非常便宜。现实中却有某些困境——没有什么其她行动可以使其承诺变得坚实，虽然其承诺变得坚实成本很高。这个时候，建立名誉将是增强其承诺可信性好手段。例如绑架事件中，绑匪和人质家属之间博弈是非常微妙：绑匪规定拿到赎金才乐意释放人质；对于家属来说，如果给出赎金能换回人质话是不错成果，但问题是，家属如何能相信绑匪拿到赎金后就会释放人质呢？要懂得，绑匪们可都是铤而走险之辈，她们也完全可以在拿到赎金后将人质干掉，让人质家属人财两空。因而，绑匪们说见钱放人承诺是很便宜，难以让人们产生足够信任。既然家属不相信绑匪，那么是不是可以倒过来解决问题呢？例如，绑匪先释放人质，然后家属按照承诺将赎金交给绑匪。聪颖你其实立即也会意识到，家属支付赎金口头承诺是便宜，绑匪们也不会幼稚得相信人质家属，由于人质家属在取回人质后完全可以不支付赎金，反而报警对付绑匪。正由于绑匪和家属之间信任是那么脆弱，因而撕票事情在现实中也旳确有所发生。那么如何避免呢？在现实中，职业绑匪将有动力树立起遵守诺言“名誉”。她们通过这样方式告诉人质家属，只要你付钱，我就一定会放人。因此常常浮现状况是，—旦遭遇职业绑匪，家属将乐意先交钱然后绑匪也会放人。撕票事件其实常常发生于那些非职业绑匪身上。这其中因素，仅仅是由于职业绑匪要长期从事这个有“钱”图职业，因此她们更看重“江湖规矩，一诺千金”。用绑匪来讨论博弈论，也许会令人不快。但是，现实就是如此，例如某些公司公司，事实上也就像一种个绑匪，她们把持在手中“人质”是产品质量。消费者好比人质家属，她们付出钱去买一件产品，但是购买时候并不懂得产品质量高下（人质死活）。于是理性消费者会去选用那些类似于职业绑匪公司（有些公司花巨额金钱宣传自己商标，事实上就是告诉消费者自己是一种“职业绑匪”）并跟她们交易，由于这些公司但愿从长期名誉中获取好处，它们将不乐意为了目前一点蝇头小利而砸掉自己招牌。 §5-4－3 报复作用 1、报复能力重要性故事模型谢林在《冲突战略》中曾提到一种窃贼故事：一天，一种持枪窃贼潜入一所房子行窃，房主听到楼下响动之后，同样持枪一步步向楼下走来。于是，危机和冲突发生了。不排除一种也许成果是窃贼成功逃逸，双方均没有伤亡和财产损失。但是，也有也许浮现这样成果：主人紧张窃贼会先开抢而率先向窃贼射击，致使窃贼身亡；另一种也许成果是，窃贼紧张主人会开枪射击，而一方面射杀主人。但是，尚有一种一般形势是双方拔枪对峙，互相探测着对方意图，谁也没有先开枪。毕竟，主人只是想赶走窃贼而不是要其性命，只要她相信窃贼不会对她下毒手，那么她就没有必要把窃贼推上绝路——要懂得，窃贼行为正好是跟她对主人意图判断联系在一起：如果她发现主人试图置其于死地，那么她就会尝试先置主人于死地；而如果她发现主人仅仅是想赶走她，那么她一般就并不会想射杀主人，毕竟盗窃未遂罪名比杀人抢劫罪名要轻得多，何况她可以安全离开呢。即便主人想要窃賊性命，那么她也必要对自己枪法布满自信（确信可以一枪打死窃贼），她才也许体现出射杀窃贼意图，否则一旦她体现出这种意图（即先开枪），那么窃贼也有机会对主人进行报复性射杀。同样逻辑推理过程也合用于窃贼。在这样对峙中，除非一方确有把握一招制敌，否则谁也不想先动——没有一种人先动，那么危机就不会升级，这对双方都是相对较好成果。任何一方都很清晰，一旦自己先动而又未能一招制敌，那么随后就会遭到对方疯狂反扑，危机就此升级。此时不管谁胜谁负，成果其实都比人们不动状态要糟糕。在这样拔枪对峙中，对枪法自信一方率先开枪也许性确是有，但这对其本人来说事实上增长了危险，由于对方也许也会由于紧张她会开枪而率先开枪。相比较而言，如果双方只是手中持刀，那么对峙就更容易形成，由于谁都明白自己难以一刀令对方毙命，只要一方先挥刀，那么成果就是双方都会受伤。还不如在对峙下逐渐缓和，而窃贼慢慢退向门外并逃逸。在这个例子中，对峙危机常常并不会演化成血案，因素在于每个局中人都懂得对方具有报复能力，从而谁也不肯去加剧危机。正由于如此，因此谢林觉得，在博弈中，报复能力常常比袭击能力更重要。由于报复能力所形成震慑往往约束了局中人，使其不会去采用袭击行为来恶化对峙危机。例如，在幼儿园中，力气大小朋友也许会欺负力气小小朋友，但是，如果力气小小朋友有一种能力更大哥哥会在她受欺负时出来为她出头，那么力气大小朋友事实上就不会去欺负力气小小朋友，由于她懂得这样做无异于找揍。在影视作品中常常可以看到借助于报复能力来增长谈判筹码状况。例如两个人，其中叫张三人掌握着叫李四人某些不可告人秘密证据，足以令李四终身入狱。然后张三提出一笔交易，若李四给她100万，她就会销毁证据。然而李四在约见张三时常常会设下圈套，试图杀人灭口。电影中常用成果是，聪颖张三并不会带去证据，而是把它保管在第三方，并且她告诉李四，如果自己死在她手上，那么秘密证据立即就会出目前警察局——这就是一种报复力量。由于这种报复威胁存在，李四将无法处置张三，而只得将钱给张三，让她销毁证据。固然，你也许会问，她怎么可以轻信张三会销毁证据而将钱付给张三呢？因素在于，一方面张三要在道上长期混，就有动机实践自己诺言而保住其在江湖上诚信；更重要是另一方面，李四也会告诉张三，如果张三拿了钱但是又没销毁证据话，那么她会将张三碎尸万段——这也是一种报复力量。 2、为什么不宽恕人们在教导孩子时候常常告诉她们要学会容忍和宽恕。由于，当一种人伤害了你时候，你即便报复了她也不能消除她已经对你形成伤害。如果你还但愿两个人关系可以继续，那么最佳是宽恕她。但是，从博弈论角度来说，这并不是一种好解决问题方略，更好方略应当是不宽恕。其中因素，一方面在于宽恕某个对手等于向其她人宣布你“报复”是不可置信，由于你不会采用它；另一方面在于，这个被宽恕对手在后来就会得寸进尺，也许始终故意无意地、不断地伤害你。为了使你报复可信，为了使你避免遭受无休止伤害，因而你应当学会不宽恕。有许多专家始终被学生觉得“心太狠”——由于专家常对学生说没有准时交作业或参与考试，那就铁定不及格了。事实上，绝大多数专家其实是宅心仁厚、宽阔为怀。那么，究竟是什么让专家变得铁石心肠呢？因素在于，聪颖专家懂得，如果她原谅了一种迟交作业学生，那么这个学生下一次作业也也许迟交，并且其她学生均有也许仿效这个学生，不断编造美丽借口来获取专家原谅。既然专家无法区别哪些理由是事实、哪些理由只是借口，因此“概不留情”成为专家避免麻烦一种最佳方略。就像我们在某些影片中看到某些心地善良却遇人不淑女子，她们一次又一次原谅胡作非为丈夫，丈夫反而得寸进尺，由于她懂得无论如何只要某些花言巧语扮可怜就会获得宽恕。因此有时候，人们会对伤害选用报复。当别人打你一拳，你若打回一拳，这自身并不能减轻你已挨那一拳疼痛，并且用力打回一拳一般也得不到快感。那为什么还要回击呢？因素在于，你懂得打不还手只会让对手更加猖狂，而选用回击是遏制对方进一步侵犯方式。有人曾经主张废除死刑，理由是处死一种杀人犯并不能挽回被害者性命，即犯罪后果已经无法事后补救，因而这个杀人犯不必也去死。若是为了这样理由，我是反对。死刑对犯罪后果确于事无补，但作为对犯罪行为报复力量，至少让那些犯罪念头会多权衡几次。作为一种震慑力量，它至少在一定限度上遏制了潜在犯罪。虽然宽恕是一种美德，但是人们有时采用绝不原谅对其确是更有利——固然，这并不绝对如此，由于有时绝不原谅也有麻烦时候。例如说：××大学对博土生教导规定是：但凡有一门学位课不及格就自动退学。诸多人觉得这样规定太过度，并且对学生压力也太大了。但事实是，学生压力反而轻了，由于不及格足以让学生退学，因此教师在评判时一般就更为宽松。相反，倒是那些容许补考学校，看来规定宽松，但教师评判正考成绩时往往并不留情。因此，有些时

展开阅读全文