策略博弈习题部分解答.docx

资源描述

博弈论和政治第三小组作业第二章名词解释： 1、理性行为（）：参和人精于算计并严格按照其最优策略行事。其中理性有两个重要的内涵：一个人对自己的利益完全了解，并能完美地计算出何种行动可以最大化其利益。 2、不完美信息( )：在博弈的每一个行动时点上，参和人可能无法获悉决策所需的全部信息。这包括相关的外部环境——比如天气——的不确定性，以及对方先前或当前的行动。这类情况称为不完美信息。 3、不完全信息( ):当一个参和人比另一个参和人了解更多信息时，阴谋诡计就会产生。这类情况称为不完全信息。 4、合作博弈( )：博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。若协议对参和人行为具有强制力，则称此类博弈为合作博弈。 5、非合作博弈( ):个体参和人可根据其利益采取行动，则称此类博弈为非合作博弈。第三章名词解释： 1、中间评估函数( )：赋予非终点结支付的规则被称为中间评估函数。 2、先动优势( )：在博弈的过程中先做决策带来的优势。先动优势来自于将其自身置于一个优势地位以及迫使其他参和人接受它的承诺能力。后动优势( )：在博弈的过程中后做决策带来的优势。后动优势源于自己可对他人选择做出的灵活性。第四章名词解释： 1、占优策略( )、劣策略( ): 每一个博弈中的参和者通常都拥有不止一个竞争策略，其所有策略的集合构成了该企业的策略集。在参和者各自的策略集中，如果存在一个和其他竞争对手可能采取的策略无关的最优选择，则称其为占优策略( )，和之相对的其他策略则为劣势策略。占优策略是博弈论（）中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。 2、占优可解( ): 在规模较大的博弈中，或许没有单个策略占优于其他所有的策略，但可能也存在一些策略劣于其他某些策略。如果参和人发现自己处于这样一种博弈中，他们可以通过将劣策略从可选策略中剔除的办法求得均衡。剔除劣策略缩小了博弈的规模，得到的“新”的博弈又可能出现对于同一个参和人或其他参和人而言的另外一些劣策略，进而又可以继续剔除这些劣策略；或者在“新”的博弈中，某个参和人存在占优策略。重复剔除劣策略的过程可以剔除劣策略或缩小博弈的规模，直到不能进一步剔除为止。如果这个过程最后只剩下一个唯一的结果，那么这个博弈就被称为占优可解。 3、聚点( )：参和人得以成功协调所依赖的这种共同预期策略称为聚点。 4、预期收敛( )：如果参和人在博弈中具备的共同认识，那么他们关于行动的预期会收敛到一个平衡点，即预期收敛。 5、零和博弈( ) 在一些博弈中，博弈双方的利益是完全相对的。对参和人的每个策略组合而言，一个参和人的支付就是另一个人支付的相反数，我们称这种博弈为零和博弈。 6、纳什均衡( ) 纳什均衡可以定义为这昂的一种策略组合：其中每个参和人的策略都是对其他人的策略的最优反应。或者有这样一个策略组合，每个参和人都选择了一个相应的策略，并且具备如下性质：（1）每个参和人都对其他参和人的策略有正确的信念；（2）给定每个参和人关于其他参和人策略的信念，自己所选择的策略是最优的。第五章名词解释： 1、最优反应曲线（）：列出收益函数后，求导得到的函数所对应的曲线即为最优反应曲线。 2、最优反应原则（）：最大化其支付的最优定价的集合就是最优反应原则。 5. 第二章作业题 1 （a）这是一个博弈。因为不同口味的酸乳酪可能会给这些杂货店老板带来不同的收益。（b）这是一个博弈。因为如果这两个少女考虑到对方在舞会时要穿的衣服来选择自己要穿什么衣服才会让自己更加有利。比如避免出现两个人穿同样衣服的情况出现。（c）这是一个决策。因为这位大学生在做出选择的时候不用考虑到他人的反应。（d）这是一个博弈。因为微软和网景公司在作出定价的时候都要考虑到对方的反应对自己的影响。（e）这是一个决策。因为这位州长候选人只需按照自己的意愿去选择自己的竞选搭档即可，不必考虑到其他人的反应对自己的决策带来的影响。 4 （a）预期支付=0.5*20+0.1*50+0.4*0=15（元）（b）预期支付=0.5*50+0.5*0=25（元）（c）预期支付=0.8*0+0.1*50+0.1*20=7（元）第三章作业题 B 1 A 解：（a）决策结：2个终点结：6个 B （b） A 决策结：3个终点结：9个 B （c） A 决策结：4个终点结：8个 2 解：（a）s方向，即（1,0）（b）方向，即（3,3,3,）（c）方向，即（4,5） 4 解：错，在序贯行动博弈中，先手不一定会获胜。因为在序贯行动博弈中，不单会有先动优势，使得对手被迫做出次一级的选择；同时也存在后动优势，即可以依据别人的选择做出相应的反应，具有灵活性。比如，如果猜拳变成序贯行动博弈的话，那么，一定是后动的人有绝对优势。 5 解：有博弈树得到均衡点为（3,3），即波音公司采用和平竞争，而空中客车参和竞争。 7．此题为必胜策略题：先手占优势，只要先手第一轮出“1”，之后每轮保证和对方说的之和为11即可获胜；后手在先手未说“1”时，和对方说的凑成12，然后之后每轮和对方凑成11即可获胜。 7. 第四章作业题 1,这句话不对，因为虽然某个参和人有一个占优策略，但是在这个占优策略的前提下，另外一个参和人可能会做出不同的选择，使得有占优策略的人不能得到对他来说最好的结果。例如下面的这个博弈过程（教材75页）联邦储备银行低利率高利率国会预算平衡 3,4 1,3 预算赤字 4,1 2,2 我们来分析这个博弈中的占优策略：如果联邦储备银行认为国会会选择“预算平衡”，那么它自己则会选择“低利率”（因为这样它可以得到支付4而不是支付3）；但如果它认为国会会选择“预算赤字”,则它选择“高利率”将会更好些（这样可以得到支付2而不是支付1）。由此可见，联邦储备银行不存在占优策略，而国会却有占优策略。如果国会认为联邦储备银行会选择“低利率”，国会最优选择是“预算赤字”而不是“预算平衡”；如果国会认为联邦储备银行会选择“高利率”，它的最优选择仍是“预算赤字”而不是“预算平衡”。因此，“预算赤字”是国会的占优策略。但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”；并不是对国会的最好结果，这是因为当国会选择“预算赤字”这个最优策略的时候，联邦储备银行可以预见到它的这一选择，从而选择“高利率”。 2. (a) 列左右行上 1 4 1 下 2 3 2 2 3 （2,2）根据占优策略原则，对于“列“，“左”是占优策略，而当“列”选择“左”的时候，行会选择“下”，纳什平衡点是（，）=（2,2）。根据最大最小值也可以验证，如上面的表格。（b）列左右行上 1 2 1 下 4 3 3 4 3 （3,3）根据占优策略原则，对于“行”，占优策略是“下”，而当“行”选择“下”的时候，列会选择“右”，所以纳什平衡点是（，）=（3,3）。根据最大最小值也可以验证，如上面的表格。（c）列左中右行上 5 3 1 1 直 6 2 1 1 下 1 0 0 0 6 3 1 （1,1）根据最大最小值方法，这个博弈有两个纳什平衡点。如上图所示。 3, （a）列左右行上 2,4 1,0 下 6,5 4,2 “行”的占优策略是选择“下”，当“行”选择“下”的时候，“列”会选择“左”来得到更多的支付，纳什平衡点是（6,5）（b）列左右行上 1,1 0,1 下 1,0 1,1 “行”的占优策略是选择“下”，当“行”选择“下”的时候，“列”会选择“右”来得到更多的支付，纳什平衡点是右下方的（1,1）；同样“列”的占优策略是选择“右”，当“列”选择“右”的时候，“行”会选择“下”来得到更多的支付，纳什平衡点是右下方的（1,1）（c）列左中右行上 0,1 9,0 2,3 直 5,9 7,3 1,7 下 7,5 10,10 3,5 对于“行”，最优策略是“下”，当“行”选择“下”的时候，“列”会选择“中”来获得最大的支付。(10,10)为纳什平衡点，表格中红色的部分表示被划掉过。或者用逐格检查的方法也可以实现。（d）列西中东行北 2,3 8,2 10,6 上 3,0 4,5 6,4 下 5,4 6,1 2,5 南 4,5 2,3 5,2 此题采用逐格检查法，（10,6）为纳什平衡点。 5 列左中右行上 1,2 2,1 1,0 水平 0,5 1,2 7,4 下 -1,1 3，0 3,2 此题采用逐格检查法，（1,2）为纳什均衡点。寻找过程，对于“列”在每一行中划掉对“列”来说支付最小的两个策略组合，对于“行”在每一列中划掉对“行”来说支付最小的两个策略。最后看哪个策略组合没有被划掉过，就是纳什平衡点。因为支付最大的组合并不一定是纳什均衡点所在的地方，这个博弈中(1,2)是平衡点，但是这个平衡点对应的不是支付最大的点，所以要使用参和人的策略而不知识均衡时的支付来描述均衡。 4.7．表格如图所示：红色的字和数字对应所获利益，此处默认快乐和时间的单位相同且有等价值。帮助不帮帮助 2,2 2,3 不帮 3,2 0,0 此时没有均衡点，A帮助时B会选择不帮，而A不帮时B会帮助。但是由于同时决策，所以没有均衡点。 4.11 A 不买时：其中按排列 B C 0元票 15元票 30元票 0元票 0,0,0 0,0,15 0,0,0 15元票 0,15,0 0,0,0 015,0 30元票 0,0,0， 0,015 01515 A买 15元票时： B C 0元票 15元票 30元票 0元票 15,0,0 0,0,0 -15,0,0 15元票 0,0,0 -5，-5，-5 -15，-15，0 30元票 -15,0,0 -15,0，-15 -15，-15，-15 A买30元票时： B C 0元票 15元票 30元票 0元票 0,0,0 0,015 -15,015 15元票 015,0 0，-15，-15 -15，-15，-15 30元票 -1515,0 -1515，-15 -20，-20，-20 其中经过简单的连续删除分析（由于其实两人对称），可知其中的考虑B，C两人时的均衡点为红字所示！而对于A来说没有重合的，所以没有均衡点。第五章第2题 Qx=44-2Px+Py; Qy=44-2Py+Px. 泽维尔每周的利润：Bx=Px-8Qx=Px-844-2Px+Py 为使最大，可让对求导数，使得导数值为0；即： =44-2Px+Py-2Px-8=Py-4Px+60=0 Py-4Px+60=0为泽维尔的最优反应规则。伊冯娜每周的利润：为使最大，可让对求导数，使得导数值为0；即：；；这就是伊冯娜的最优反应规则。解出交点即为纳什平衡点： 19.73 18.93 (b)泽维尔的最优反应曲线没有变化，而伊冯娜的最优反应曲线产生变化，伊冯娜的最优反应曲线向下移动了一个单位。产生这种变化的原因是伊冯娜通过重新安排工作和裁掉一些员工将服务每个顾客的成本降低到了6美元。所以伊冯娜的最优反应曲线方程产生了变化。

展开阅读全文