您好,欢迎访问三七文档
2019/12/20经济博弈论张卫国教授1第四章重复博弈本章主要内容:1重复博弈的概念;2作为一种特殊的动态博弈,有限次和无限次重复博弈的子博弈完美纳什均衡的求解方法;3无限次重复博弈古诺模型和效率工资模型。本章主要结论(民间定理):由于参与者在重复博弈中具有了长期利益,可以通过在后面阶段中采取的报复策略使得威胁变得可信,从而摆脱静态博弈中“追求自身利益最大化”导致的囚徒困境,实现长期合作的结局。2019/12/20经济博弈论张卫国教授24.1几个概念重复博弈的概念有限次重复博弈的概念2019/12/20经济博弈论张卫国教授34.1.1重复博弈的概念1由简单的静态博弈(或动态博弈)的有限次(或无限次)重复进行构成的。2每一阶段博弈方、策略集合、规则和得益都相同。但是整个博弈过程中每个阶段的策略选择行为和最后的得益将受到影响。3包括:有限次重复博弈和无限次重复博弈4例子:多场决胜负的体育比赛(有限次)两寡头市场上两个厂商之间的竞争(无限次)商业中的回头客;长期合同;长期合作关系等。2019/12/20经济博弈论张卫国教授4定义:给定一个博弈G,重复进行T次G,并且在每次重复之前各博弈方都能观察到以前博弈的结果,称为G的一个“T次重复博弈”,记为G(T)。其中,G成为G(T)的原博弈。每次重复称为G(T)的一个阶段。每个阶段都是一个博弈,因此与一般动态博弈有区别。4.1.2有限次重复博弈的概念2019/12/20经济博弈论张卫国教授54.1.2有限次重复博弈的概念几个概念:1子博弈:从某一阶段(不包括第一阶段)开始,包含以后所有阶段的原重复博弈的一部分。2策略:博弈方在每个阶段针对每种情况如何行动的计划(注:在每一阶段之前,博弈方是可以观察到以前博弈的结果的)。2019/12/20经济博弈论张卫国教授63路径:是每个阶段博弈结果(原博弈的一个策略组合)连接而成。对于具有n个策略组合的原博弈,重复T次的路径数为nT,重复博弈的求解即找出具有稳定性的均衡路径。4得益:不同于一般的动态博弈,重复博弈的得益为各个阶段得益的加总。考虑到时间的价值,需要引进“贴现系数”将未来的得益折算成当期得益的价值。4.1.2有限次重复博弈的概念2019/12/20经济博弈论张卫国教授7贴现系数:δ=1/(1+γ),其中γ为以一阶段为期限的市场利率。给定贴现系数δ,若无限次重复博弈一路径的某博弈方各阶段的收益为,则该博弈方在该无限次重复博弈中的总收益为各阶段博弈中得益的“现在值”:12,,,n11121nntntt4.1.2有限次重复博弈的概念2019/12/20经济博弈论张卫国教授84.2有限次重复博弈有限次重复的猜硬币博弈——原博弈为零和博弈有限次重复的囚徒困境博弈——原博弈有唯一的纯策略纳什均衡有多个纳什均衡的重复博弈的策略设计——触发策略有多个纳什均衡重复博弈的得益范围——民间定理2019/12/20经济博弈论张卫国教授9在零和博弈中,双方不存在合作的可能性,因此在长期进行的重复博弈中,子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成(例,在猜硬币博弈中以0.5的概率选择正面或者反面,即采取混合策略)。实际上,所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重复博弈一样,各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。4.2.1有限次重复的猜硬币博弈2019/12/20经济博弈论张卫国教授104.2.2有限次重复的囚徒困境博弈图4-1囚徒困境求解思路:对于有限次重复囚徒困境博弈,根据动态博弈的逆推归纳法可以求解。-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白2019/12/20经济博弈论张卫国教授114.2.2有限次重复的囚徒困境博弈以两阶段(以该博弈作为原博弈G重复两次)为例:分析最后一阶段,子博弈即为原博弈,唯一的均衡为(-5,-5);分析第一阶段,将最后阶段的收益(-5)添加到第一阶段的矩阵中,即:此时,博弈的纳什均衡仍是(坦白,坦白)。坦白不坦白坦白不坦白-10,-10-5,-13-13,-5-6,-62019/12/20经济博弈论张卫国教授12结论:在有限次重复博弈G(T)中,如果原博弈G存在唯一的纯策略纳什均衡组合,则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采取的原博弈纳什均衡策略。含义:在原博弈具有唯一均衡的有限次重复博弈中,由于完全理性的博弈方具有“共同知识”的分析推理能力,因此在从最后阶段开始的逆推过程中,仍然无法摆脱囚徒困境。4.2.2有限次重复的囚徒困境博弈2019/12/20经济博弈论张卫国教授134.2.2有限次重复的囚徒困境博弈如果原博弈存在唯一的纯策略纳什均衡组合,则有限次重复博弈的唯一的均衡解即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。由于在这样的双方策略下,均衡路径中的每个阶段都不存在不可信的威胁或许诺,因此这种均衡是子博弈完美纳什均衡。2019/12/20经济博弈论张卫国教授144.2.2有限次重复的囚徒困境博弈定理设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有唯一的子博弈完美的解,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均每阶段得益等于原博弈G中的得益。2019/12/20经济博弈论张卫国教授15重复囚徒困境博弈悖论和连锁店悖论如果重复囚徒困境博弈次数较多时,理论结论与现实中的结果会出现不一致的情况.经常会出现合作的现象.主要是假设存在不符合问题.塞尔顿1978年提出了连锁店悖论.在n个市场都开设连锁店的企业,对于各个市场的竞争者是否应该选择加以打击排斥的策略.如果忽略市场和竞争者的差异,可以认为是先来后到的重复原博弈.理论结果是在每个市场后来者选择进入,先到者不打击.但是现实中企业先对开头几个市场不计成本打击,已保持其他市场独占。2019/12/20经济博弈论张卫国教授164.2.3有两个纳什均衡的重复博弈例两个厂商1和2,同时面临两个市场机会A和B。假设每个厂商都只有能力选择一市场发展,即他们的可选择策略都是A或B,其得益矩阵如图所示。此博弈具有2个纯策略纳什均衡(1,4)、(4,1)和混合策略纳什均衡概率(0.5,0.5)。ABAB3,31,44,10,0图4-2两厂商差别市场博弈2019/12/20经济博弈论张卫国教授17考虑三次重复博弈各策略组合子博弈纳什均衡路径:1.由原博弈的纳什均衡组合而成的路径,如采取轮换策略(在上述的协调博弈中,双方轮换采取纯纳什均衡策略,路径为(A,B),(B,A),(A,B)…..不考虑时间的价值(贴现系数),每阶段的平均得益为(4+1)/2=2.5,高于混合策略的得益2。2.触发策略,博弈方首先采取合作行为,如果发现对方没有进行合作,那么在后续阶段的博弈中采取不合作策略进行惩罚。4.2.3有两个纳什均衡的重复博弈2019/12/20经济博弈论张卫国教授18在图4-2中,触发策略的设计为:(1)博弈方1的策略是第一阶段合作A,如果发现对方采取B不合作,则第二阶段采取不合作的B策略惩罚,否则第二阶段继续合作;第三阶段无条件采取B策略。(2)博弈方2的策略是第一阶段合作A,如果发现对方采取B不合作,则后续两个阶段一直采取不合作的B策略;如果发现对方采取合作A,则第二阶段采取不合作B,第三阶段采取合作A。4.2.3有两个纳什均衡的重复博弈2019/12/20经济博弈论张卫国教授19策略设计分析:(1)在博弈方1和2中,在第一阶段都采取了合作行为A,并针对对方的不合作行为B,都设计了在后续2个阶段采取不合作B的相应惩罚措施;(2)如果对方在第一阶段中采取了合作行为,在后续阶段的策略设计中要保证博弈结局具有稳健性。因此,针对第一阶段的合作行为,后续阶段的策略设计是为了实现双方的行动协调,以保证实现纳什均衡(B,A)或(A,B)。4.2.3有两个纳什均衡的重复博弈2019/12/20经济博弈论张卫国教授20结果分析:子博弈路径(A,A),(A,B),(B,A)为子博弈纳什均衡。因为后续两阶段的结局(A,B)和(B,A)为纳什均衡,而第一阶段的合作结局(A,A)是由于触发策略针对对方偏离合作的行为设计了后续两阶段都不合作的惩罚措施,其单方面偏离的路径(B,A)(B,B)(B,B)收益并不增加,因此不存在偏离的动机。4.2.3有两个纳什均衡的重复博弈2019/12/20经济博弈论张卫国教授21问题的提出:由于具有多个纳什均衡的重复博弈可以设计多种策略,有许多效率差异很大的子博弈完美纳什均衡,在双方缺乏沟通的情况下,结局具有不确定性。可以通过设计包含报复机制的触发策略,实现效率较高的均衡。因此,这里讨论具有多个纳什均衡的重复博弈可以实现的收益范围。个体理性得益:不管对方采取何种行动,只要自己的行为合理就可以保证实现的收益。可实现得益:各纯策略组合得益的加权平均数组。注意:并非一定是均衡策略的组合得益,因此在图4-2中,(3,3)也是可实现得益。4.2.4民间定理2019/12/20经济博弈论张卫国教授224.2.4民间定理用wi记博弈方i在一次性博弈中最差的均衡得益,用w记各博弈方的wi构成的得益数组。结合“个体理性得益”和“可实现得益”,则有限但次数很多的重复博弈有如下民间定理:定理:将一次性博弈中最差的均衡得益数组记为w,如果原博弈G的一次性博弈有得益数组优于w,那么在有限次重复博弈G(T)中,所有不小于个体理性得益的可实现得益都至少有一个子博弈完美纳什均衡来实现。2019/12/20经济博弈论张卫国教授23在图4-2一次性博弈中,博弈方均衡得益分别为纯策略的得益(1,4)、(4,1)和混合策略的得益(2,2),最差的均衡得益数组为w=(1,1)。图4-3民间定理4.2.4民间定理(1,4)(3,3)(1,1)(4,1)厂商2得益厂商1得益2019/12/20经济博弈论张卫国教授24在图4-3中,通过不同得益的组合,阴影部分(包括连线)的得益都是可实现得益。民间定理揭示出:在有限次重复博弈中,可以通过设计触发策略来实现(或者逼近)阴影部分的得益。4.2.4民间定理2019/12/20经济博弈论张卫国教授25定理分析:民间定理表明,在具有多个纳什均衡的有限次重复博弈中,通过设计具有可信威胁的触发策略(即在第一阶段采取合作行为,当对方不合作时通过在后续阶段采取相应的不合作策略进行惩罚;当对方合作时,在最后阶段采取一次性原博弈的纳什均衡策略作为稳定的结局。),可以使得博弈方在重复博弈的过程中具有了一定学习能力,从而达到博弈的帕累托前沿得益。4.2.4民间定理2019/12/20经济博弈论张卫国教授26例(两人各三种可选策略):LMRLMR图4-4多种策略博弈的重复博弈该博弈具有两个纯策略纳什均衡和一个混合策略纳什均衡,但是双方存在一个更好的得益(4,4)。对于二次重复博弈,根据民间定理可以设计一个触发策略来实现这个得益。1,15,00,00,54,40,00,00,03,34.2.4民间定理2019/12/20经济博弈论张卫国教授27触发策略:博弈方1在第一阶段采取M策略,如果对方合作,则第二阶段采取R策略作为奖励;否则第二阶段采取L策略进行惩罚(注意(L,L)也是纳什均衡,因此具有稳定性)。博弈方2也采取同样策略。策略分析:如果任何一方在第一阶段偏离,仅仅多获得5-4=1单位得益,而在第二阶段的得益(L,L)仅仅为1;如果在第一阶段合作,第二阶段的得益为3。因此双方不存在偏离该策略的动机。4.2.4民间定理2019/12/20经济博弈论张卫国教授28例(双方各五种可选策略重复博弈):LMRPQLMRPQ图4-5双方各五种可选策略重复博弈1,15,00,00,00,00,54,40,00,00,00,00,03,30,00,00,00,00,04,1/20,00,00,00,00,01/2,44.2.4民间定理2019/12/20经济博弈论张卫国教授
本文标题:第四章-重复博弈
链接地址:https://www.777doc.com/doc-2175810 .html