您好,欢迎访问三七文档
经济博弈论一、博弈论基本定义(一)博弈论是什么•博弈论关注的是意识到其行动将相互影响的决策者们的行为。也就是说博弈论涉及那些真实生活中的情形——当理性的人们彼此相互作用的时候,即当某个人的行动依赖于他人如何行动的时候。•要理解何种情形适宜用博弈来模型化,考察以下几个例子:•1OPEC成员国选择其年产量•2GM向USX(美国最大的钢材商)购买钢材•3中石油在全国招聘工人•4一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。•1OPEC成员国的产量都会影响世界油价•2双方的产量或需求量会影响价格•3每个工人对中石油的影响微乎其微•4电力公司决策的复杂性并非来自另一个理性的主体•如何改变重要的经济变量使3和4转化成博弈?(二)经济学与博弈论的契合•20世纪80年代以来,博弈论迅速成为主流经济的重要组成部分,几乎吞没了整个微观经济学,就如同计量经济学吞没了“经验经济学”一样。为什么?•博弈论的研究范式:建模者对players规定pay-offfunctions和strategysets,观察当参与人选择策略以最大化其支付时会产生什么结果。•原因一,博弈论的研究范式是“MaximizationSubjecttoConstraints”和“NoFreeLunch”经济学思想的结合。•原因二,主流经济学对寡头垄断的束手无策。•博弈论是建模的工具,它依赖于ideas。•运用博弈论建模的方式通常称为“无脂建模”(no-fatmodeling)或者实例建模(modelingbyexample)或者实例化理论。•Fisher“实例化理论并不告诉我们什么是必将发生的,而只告诉我们什么是可以发生的。”(三)几点说明•1非合作博弈和合作博弈•若参与人能够达成有约束力的协议(bindingagreement),则为合作博弈;非合作博弈则达不成此种协议。•“非合作”并不是总是拒绝合作,“合作”也不是总是合作。•内生与外生•非合作博弈的参与者仅由私利驱使,参与者之间的协议、威胁和许诺之类,是无法实施的。合作的产生是内生决定的。•合作博弈假定参与者之间的协义是有约束力的并能实施,即合作是外生的。合作博弈可以看做非合作博弈的特例,意即串谋和约束过程可以从外部引入产生。•非合作博弈强调的重点主要在个人行为:每个理性的参与者实际上是怎样选择行动的,博弈最可能的结果是什么等等。•合作博弈强调的重点在于参与者联盟会形成什么样的联盟,他们之间如何瓜分合作的收益等。•如果合作带来的收益分配不足以使所有参与者接受,那么就应假定存在一些能使协议实话的外在“机制”。因此必须在关于理性的观点中加入一些关于公平的观点。因此合作博弈是公理性的,常常诉诸于帕累托最优、公平与公正等。•非合作博弈是建立在参与人在给定约束的条件下最大化的基础上的。2博弈论与对策论的区别•某种意义上,博弈论可看作是决策论的一般化。决策论是关于单一参与者决策的分析。决策论也可看成是双人博弈,只不过其中一方是虚拟人-自然。•两者之间一个重大的区别就是在决策论中,不确定性只来源于自然的行动。博弈论还要考虑其他参与者的行动。(四)博弈的要素•博弈的要素包括:参与人(players)、行动(actions)、信息(information)、策略(strategies)、支付(payoffs)、结果(outcome)和均衡(equilibria)。对一个博弈的描述至少必须包括参与人、策略和支付;而行动和信息则是建筑材料。1参与人•参与人是独立决策和独立承担结果的个人或组织。每个参与人的目标都是通过选择来最大化自身的效用。•假设我们构造一个“OPEC模型Ⅰ”,我们将参与人设定为沙特阿拉伯(S)和其他生产者(O),消费者只是被动的个体不是参与人,只是环境参数。•自然是一种虚拟的参与人,它在博弈的特定时点上以特定的概率随机选择行动。•在“OPEC模型Ⅰ”中,我们用D来表示石油的需求。我们还可以假定需求只分“强”和“弱”。假设前者的概率为70%,后者为30%。一个博弈会因随机变动的结果不同而有着不同的结果。2行动•参与人i的行动以ai表示,是他能做的某一选择。•参与人的行动集(actionset),Ai={ai},是其可以采用的全部行动的集合。一个行动组合(actionprofile)是一个由博弈中的n个参与人每人选择一个行动所组成的有序集,a={ai},i=1,2,…,n•就我们的模型而言,将沙特和其他生产者的行动集设定为相同的:要么高产量水平(H),要么低产量水平(L),用Q国家,年份=水平来表示它们的选择。•除了设定对于参与人来说何种行动是可行的之外,还必须设定何时这种行动是可行的。这就是行动顺序(orderofplay)•若石油生产要求提前计划,则一国在博弈之初就选择两年的产量,OPEC模型Ⅰ的行动顺序可以是:•第一步,自然选择需求D,强或弱•第二步,S从如下行动集中选择其1998和1999的产量:•(Qs,8=L,Qs,9=L),(Qs,8=L,Qs,9=H)•(Qs,8=H,Qs,9=L),(Qs,8=H,Qs,9=H)3信息•信息是以信息集的概念来模型化的。可以将参与人的信息集看做是他在特定时点对于不同变量的取值的了解。信息集的要素包括参与人认为可能的不同值。若有很多元素,则表明存在参与人无法排除的许多取值。若只有一个元素,则表明他准确知道这些变量的取值。•我们假定,在自然行动后,沙特知道世界石油需求是强还是弱,但其他生产者无法排除任何一种可能,因此模型的信息集为:•其他生产者:{D=强,D=弱}•沙特:{D=强}或{D=弱},视需求而定。•参与人的信息集不仅包括如石油需求强度等变量取值的差别,还包括对已采取过什么行动的了解。因此信息集是变化的。4策略•参与人的策略si是如下一项规则:给定其信息集,该策略决定在博弈的每一时点他选择何种行动。•参与人的策略集或策略空间Si={si}是其可行策略的集合。•策略组合(strategyprofile)s=(s1,…,sn)是由博弈的n个参与人每人选择一个策略组成的策略集。•既然信息集包括了参与人对于其他参与人过去行动所知的一切,那么策略就使参与人明确了如何对别人的行动做出反应。OPEC模型Ⅰ中,行动是1998和1999年中多生产或少生产。沙特策略集中的一个策略是:•H,如果D=强•Qs,8(D)=L,如果D=弱•Qs,9(D,Qs,8,Qo,8)=L,如果D=弱,Qs,8=•Qo,8=L•H,如果其他情况发生•策略仅仅是一个关于观察到的历史情况的函数,而不是关于当前行动或是关于别的参与人的策略的函数。我们只有在极少的时候才能无条件地预测参与人的行动,但通常我们能够预测他应对外部世界的策略。•策略与行动的区别•参与人的策略是一个关于其行动程序的完备集合(completeset),它告诉参与人在每一种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。•这一描述的完备性也意味着策略与行动的不同之处在于它是不可观测的,行动是物质上的,但策略仅是意识上的。5支付•在所有参与人和自然都选择了各自策略且博弈已经完成之后,参与人i获得的效用或期望效用。•在OPEC模型Ⅰ中,可以将沙特和其他生产者的支付设为两个生产年份中石油收入的总和。6结果•一个博弈的结果是指在博弈结束之后,建模者从行动、支付和其他变量的取值中所挑选出来的他感兴趣的要素的集合。结果的定义取决于建模者所感兴趣的是什么。•OPEC模型Ⅰ的一个结果是:•Qs,8=L,Qs,9=H,Qo,8=H,Qo,9=L,D=L,Rs=100,Ro=80•结果可以狭义地定义为仅仅是支付或产量水平的集合。选择何种定义取决于建模者认为对OPEC而言什么是最有意义的。7均衡•均衡s*=(s1*,…,sn*)是指由博弈的n个参与人每人选取的最佳策略所组成的一个策略组合。•策略组合是一组策略的集合,而结果指的是感兴趣的一组变量的取值集合。•不同的策略组合有时会导致不同的结果•(Qs,8=L,Qs,9=H,Qo,8=H,Qo,9=L,D=L,Rs=100,Ro=80)这一结果可以由下述任一策略产生。•黄金规则:无论如何都选择低产量。•沙特:(Qs,8=L,Qs,9=L)•其他生产者:(Qo,8=L,Qo,9=L)••白银规则:针锋相对•沙特阿拉伯:(Qs,8=L;若Qo,8=L,则Qs,9=L,否则Qs,9=H)•其他生产者:(Qo,8=L;若Qs,8=L,则Qo,9=L,否则Qo,9=H)•要记住的是:行动与策略、结果与均衡之间是存在严格区别的。8均衡概念•仅仅规定参与人、策略与支付还不足以找到均衡,因为建模者还必须决定“最优策略”到底是什么意思。这一点可以通过定义一个均衡概念来实现。•只有几种均衡概念被普遍接受,如优势策略均衡(dominantstrategyequilibrium)和纳什均衡(Nashequilibrium)。
本文标题:第一讲经济博弈论
链接地址:https://www.777doc.com/doc-3364438 .html