您好,欢迎访问三七文档
4不完全信息动态博弈4.1精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。例简单的非完全信息动态博弈Nt1(p)t2(1–p)11LRLR22LRLRLRLRu1u1u1u1u1u1u1u1u2u2u2u2u2u2u2u2参与人1的类型t为个人信息。参与人2不知道t,但知道t的概率分布。博弈的时序:(1)参与人1选择行动a1A1;(2)参与人2观察a1,选择a2A2博弈的收益:u1(a1,a2,t),u2(a1,a2,t)精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。显然,这里还需要附加一个条件,即给定一参与人对其他参与人的类型分布的先验概率密度,否则他将无法对选择的“最优性”加以判断。这种概率分布或密度来自于博弈开始之前参与人所拥有的信息,故称为“先验”信息或“先验”概率。定义一个n人不完全信息动态博弈的参与人类型空间nHH,,1,条件概率niPiii,,1),|(,其中i是参与人i的类型,iiH,i的确定是通过Harsanyi转换实现的,因而参与人i知道i而其他除参与人i之外的参与人不一定知道i。一个类型依存的战略组合))(,),(,),((**1*1*nniiSSSS是一个纳什均衡,当且仅当有条件概率)|(iiiP是先验的,因为它是博弈所给定的条件,来自博弈开始之前参与人i关于其他参与人类型的相关信息。当然,“自然”这个“参与人”并不包括在由下标i标记的n个参与人之中,但由Harsanyi转换所假定的参与人“自然”首先行动,它决定每一个参与人的类型,但除每个参与人自己能“观察”到自己的类型外,对于其他参与人的类型,他是只具有不完全信息的。按照上式定义的纳什均衡被称为贝叶斯纳什均衡,它在本质上并未体现出不完全信息静态博弈与不完全信息动态博弈的区别。动态博弈与静态博弈的本质区别在于动态博弈均衡中存在对“序贯理性”的要求。这样,我们需要对上式给出的纳什均衡加以精炼,以剔除含有不可置信承诺和威胁的均衡,这就是下面将要引入的“精炼贝叶斯纳什均衡”。序贯理性在完全信息动态博弈中指的是参与人在任一子博弈上都选择最优的行动计划,而精炼均衡要求所有参与人的战略在任一子博弈上都是其在给定其他参与人战略选择下的该子博弈上的最优战略,即纳什均衡战略。在不完全信息动态博弈中,信息集不一定是单结的,因而真子博弈可能不存在。此时,序贯理性指的是任一参与人在从其任一信息集开始的随后的博弈中(后续博弈)所选择的行动计划都是最优的。对于任一参与人来说,当他处于某一信息集h上时,他对其他的每一个参与人的类型有一个概率判断。在不完全信息动态博弈中,他在此时并不准确知道其他参与人的类型是什么,但知道其他参与人的类型为每一种特定的类型组合的概率是多少。于是,假定所有参与人都是风险中性的,则他将根据这种概率分布来选择使他的期望支付最大化的行动计划。例:市场进入博弈例:不完美信息博弈的精炼贝叶斯均衡1RLM13p21-pLRLR20001021标准式表示参与人2LRL2,10,0参与人1M0,20,1R1,31,3纯战略纳什均衡:(L,L),(R,R)均为子博弈精炼纳什均衡(唯一的子博弈是原博弈本身)。但是(R,R)不可信。排除不可信的纳什均衡:要求1参与人的战略必须满足序贯理性(sequentiallyrational).要求2参与人必须有一个推断(belief).定义处于均衡路径上(ontheequilibriumpath)的信息集:在均衡战略下,博弈以正的概率到达该集.处于均衡路径之外(offtheequilibriumpath)的信息集:在均衡战略下,博弈不会到达此集.要求3在处于均衡路径上的信息集上,推断由贝叶斯法则和参与人的均衡战略决定。例要求3的说明参与人1的类型空间:{t1,t2,t3,t4}行动空间:A={L,R}Nt1(0.2)t2(0.3)t3(0.2)t4(0.3)1111LRLRLRLRp1p2p3p4q1q2q3q422LR推断pi:观察到L后,参与人1的类型是ti的概率。推断qi:观察到R后,参与人1的类型是ti的概率。p1+p2+p3+p4=1q1+q2+q3+q4=1如果参与人1的战略:t1选L,t2选L,t3选R,t4选R。参与人2对pi与qi的推断:p1=3.02.02.0=0.4,p2=3.02.03.0=0.6,p3=0,p4=0;q1=0,q2=0,q3=3.02.02.0=0.4,q4=3.02.03.0=0.6,要求4在处于均衡路径之外的信息集上,可能情况下,推断由贝叶斯法则和参与人的均衡战略决定。原文:Atinformationsetsofftheequilibriumpath,beliefsaredeterminedbyBayes’ruleandtheplayers’equilibriumstrategieswherepossible.例T={t1,t2,t3,t4},M={m1,m2,m3}如果在均衡中,信号发送者的战略:m*(t1)=m1,m*(t2)=m1,m*(t3)=m2,m*(t4)=m2则m3处于均衡路径以外,若用贝叶斯公式,分母为0。精炼贝叶斯均衡(perfectBayesianequilibrium):在一个非完全信息的动态博弈中,满足要求1–4的战略与推断构成的均衡。精炼贝叶斯均衡的正式定义如下:在不完全信息动态博弈nnnHHPPuuG,,,~,,~,,,111中,精炼贝叶斯纳什均衡是一个类型依存战略组合))(,),((),,(*1*11*nnnSSS及一个信念组合)~,,~(~1nPPP,满足如下条件:(1)P~是先验概率)|(iiiP的集合,即),,(~1nPPP,)|(iiiiPP,iP~是第i个参与人在其进行行动选择的信息集上所有信念组成的组合,记ihP~为他在其第h个信息集上的信念;若参与人在信息集h上观察到的行动为hia,则记)|(~~hiiiihaPP,ni,,1。(2)iH是参与人i的类型空间,iiH是他的一个类型;ni,,1(3)),),()((**1iinniissuu是参与人i的类型依存支付(效用)函数;ni,,1(4)在第i个参与人的每一个信息集h上,有(5)在均衡路径上,ihP~是按照贝叶斯法则从先验概率)|(iiiP,参与人i在信息集h上观察到的行动hia和)(*iiS导出的。例:在下图中给出的一个不完全信息动态博弈中,“自然”N首先选择参与人1的两种类型1211,中的某一种,但参与人2对N的选择具有不完全信息,他只知道先验概率为5.0)|()|(21222112PP,参与人2的类型是对称的。N0.50.51)(111)(12LRLR22一个不完全信息动态博弈如果参与人1的类型依存战略)(1*1S为试找出与此战略相对应的参与人2的一个类型依存战略)(2*2S,使))(),((2*21*1*ssS成为一个精炼贝叶斯均衡。解:参与人2的类型只有一个。给定)(1*1S,参与人2的2个信息集h和f都是均衡路径上的。根据贝叶斯法则,在信息集h上,参与人的后验概率为0)|(~112hLP,1)|(~122hLP;同样,在信息集f上,有1)|(~112fRP,0)|(~122fRP。给定这种信念,参与人2在h上的最优行动是a,在f上的最优行动是a。给定参与人2在其信息集h、f上的上述信念及最优行动选择,类型为11的参与人1将选择R,类型为12的参与人1将选L,所以,)(1*1S和)(2*2S构成一个精炼贝叶斯纳什均衡。我们用)]0,1(),1,0(),,(),,[(aaLR表示这一均衡。其中,),()(1*1LRS,),()(2*2aaS,)1,0(~2hP,)0,1(~2fP。4.2信号博弈在经济学的研究文献中,信号博弈作为一种特殊的不完全信息动态博弈得到了最为广泛的应用。正是信号博弈以一种十分特别的视角去理解很多令人感到迷惑的经济现象,信号博弈以及博弈论作为一种方法论才在主流经济学中产生了巨大影响。信号博弈通常描绘的是二个参与人之间的二阶段不完全信息动态博弈,其中,第一顺序行动的22abababab(4,0)(2,1)(0,0)(2,4)(0,1)(1,0)(1,2)hf(1,3)参与人的类型不为第二行动的参与人所知,他只知道第一顺序行动参与人的不同类型的先验概率分布。第二顺序参与人试图从他所观察到的第一顺序行动参与人所选择的行动中对其类型作出概率判断,从而选择自己的最优行动。在这种博弈中,后行动者主要关心的是先行动者的类型可能是什么,而先行动者也知道这一点。因而他有动机或者试图告诉后行动者他的真实类型,或者相反,他可能会试图欺骗后行动者,而努力将其有关他的类型的虚假信息告诉后行动者。当然,先行动者可以直接告诉后行动者他的类型是什么,但仅凭这种口头的承诺并不能使后行动者真正相信他所说的。如果他要后行动者相信他的话,他就必须作出一种努力,这种努力会使他蒙受一定的损失或存在一种成本。这种成本是当他仅是这种类型时才能支付的,而如果他的类型不是这种类型,他不能承担这种成本。我们称这种成本支付是一种信号。通过它,先行动者能告诉后行动者他的真实类型。当然,说谎者也可以发出信号,并让后行动者难以准确判断其真实类型,如果这样做对先行动者是有利的话。譬如,文凭就是需要支付成本的一种信号,因为读书取得文凭是需要支付机会成本的一种活动,不同能力的人对这种成本的承受力是不同的。所以,雇主就可通过文凭去判断雇员的能力情况并据此支付不同的薪水。在金融市场上,如果一个企业需要在金融市场上融资,但投资者的对其真实的盈利能力具有不完全信息。于是,真正有高盈利能力的企业就可以通过向投资者支付较高的权益份额来将自己区别于低盈利能力的企业,从而让投资者识别出自己的真实类型而投资,而低盈利能力的企业由于对自己的真实盈利能力心知肚明,所以不敢模仿高盈利能力企业,它承诺的权益份额就较低,投资者不会将资金投入该企业。4.2.A信号博弈中的精炼贝叶斯均衡信号博弈的参与人:信号发送者S,接收者R。信号博弈的时间顺序自然按照概率分布为S产生一个tTS观察t,并选择mjMR观察m并选择akA收益US(ti,mj,ak)和UR(ti,mj,ak)信号博弈T={t1,t2},M={m1,m2},A={a1,a2},Pr{t1}=p,Pr{t2}=1-p。发送者战略:在类型为t1
本文标题:不完全信息动态博弈
链接地址:https://www.777doc.com/doc-7268917 .html