您好,欢迎访问三七文档
问题导入:1.出门带伞问题晴雨未卜,出门是否带雨伞。2.火灾保险问题一个商店经理考虑是否购买火灾保险。在保险期内,商店可能遇上火灾,假设商店在保险期内发生火灾的概率未p,也可能不发生火灾,可能性为1-p,买火灾保险要花一笔费用,通常占总资产G一定的比例为r,不买保险若一旦发生火灾损失非常大。3.进货问题某个零售商准备进一批易腐农产品,进了货若不能在当天售完,商品就会腐烂变质,造成经济损失。零售商并不知道当天顾客对这种产品的需求量,进货多了卖不掉是损失,进货太少满足不了顾客的需求,不但钱赚少了,还影响顾客的回头率。但无论如何必须事先确定进货的数量。4.加工方法问题机械零件制造商承接一份加工新产品的订单,为此,要安排加工工具。新产品的加工有两种方法,一种是用现成的通用设备,加工能力较差,且成本较高;一种是购置通用设备,加工能力较强,且劳动成本较低。若今后新产品的需求量大,购置通用设备比采用通用设备好,需求量小则采用通用设备比购置通用设备经济。问题是新产品今后的加工量还不清楚,但制造商需要在选择加工方式完成订单。从以上的例子可以看出,在随机决策问题,也就是存在不确定性的决策问题中,决策人可以在各种可能的行动中进行选择,但是有些因素是决策人无法控制的。我们把决策人无法控制的因素,即凡是能够引起决策问题的不确定性因素,统称作自然状态。如下不下雨,是否发生火灾,新产品加工数量的多少等。由于未来自然状态的不确定性,决策人无论采取什么行动,都会因自然状态的不同而出现不同的后果。这时的决策人实际上是被迫赌博,只要他采取行动,就已经处于参与赌博的位置上。他希望能赢,也可能会输。随机决策问题具有如下特点:(1)决策人面临选择,决策方案(备选方案)不唯一;(2)自然状态存在不确定性,自然状态的不确定性会导致后果的不确定性;(3)后果的价值待定。二、不确定性决策不确定性决策指决策者对未知事件的自然状态有两种理解:一是决策者面临着多种可能的自然状态,可选方案在不同的自然状态下的结果不同,未来会出现哪一种自然状态,虽然难以确定,但却可以预测其出现的概率,在这种状况下所做出的决策称为风险型决策。二是基本情况与风险决策一致,只是不能预测未来自然状态出现的概率,因而不确定因素更多,决策风险更大,在在这种状况下所做出的决策称为不确定性决策。不确定决策应满足以下四个条件:(1)存在一个明确的决策目标;(2)存在着两个或两个以上随机的自然状态;(3)存在着可供决策者选择的两个或两个以上的行动方案;(4)可求得个方案在各状态下的益损矩阵(函数)。决策矩阵的构成(决策表):气温在300C以下s1气温介于300C—350C之间s2气温在350C以上s3购进西瓜2000kga1600800800购进西瓜5000kga215020002000购进西瓜8000kga3-30015503200方案收益矩阵状态非确定型决策数学描述),,;,,(11nnppTnpp,,1对于一个事态体(方案)已知,风险型决策问题;完全未知,非确定型决策问题;知其大小顺序,概率排序型决策问题。例1.西瓜进货方案表2-1决策表气温在300C以下气温介于300C—350C之间气温在350C以上购进西瓜2000kg600800800购进西瓜5000kg15020002000购进西瓜8000kg-30015503200方案收益矩阵状态1.乐观准则(最大最大准则)12()max{,,,},1,2,iiiingAimiA设想采取任何一个方案,都是收益最大的状态发生,然后比较各方案的结果,哪一个方案的收益最大,哪一个方案就是最大最大原则下的最优方案。又称“好中求好”准则。若用表示采取方案Ai时的最大收益,则满足)(max)(1*imiAgAg的方案A*为最优。表2-1乐观决策表气温在300C以下气温介于300C—350C之间气温在350C以上最大方案购进西瓜2000kg600800800800购进西瓜5000kg150200020002000购进西瓜8000kg-300155032003200最优收益值3200方案收益矩阵状态与此相对——悲观准则4.等可能性(等概率)准则等概率准则:既然不确定型决策问题对每个自然状态出现的可能性一无所知,只好假定各状态发生的概率都彼此相等,再求各方案的期望收益值。具有最大期望收益值的方案,便是等概率原则下的最优方案。计算步骤:(1)计算各方案的收益平均值平均值=该方案在各种自然状态下收益值的和/自然状态数(2)在所有收益平均值中,选最大值对应的方案为备选方案。表2-2等概率决策表气温在300C以下气温介于300C—350C之间气温在350C以上各方案收益平均值购进西瓜2000kg600800800733.3购进西瓜5000kg150200020001383.3购进西瓜8000kg-300155032001483.3最优收益值1483.3方案收益矩阵状态等概率准则克服了赫威兹准则没有充分利用收益函数所提供的全部信息这一缺点,但也有明显的不足,即按此原则决策,决策结果受到自然状态的分类的影响。请看下例:例2某公司考虑是否建造一个工厂生产某种产品。这种产品的销路如何,决定于另外A、B、C三家公司是否生产该种产品。据经验估计,这三家公司至多有一家生产这种产品。如果这三家公司都不生产该种产品,则该公司可获利润20万元;否则,由于竞争力不如这三家公司,该公司将亏损10万元。那么,按等概率原则,该公司应如何决策?分别用A1,A2表示该公司生产、不生产该种产品这两个方案。如果状态S1表示这三家公司都不生产该种产品,S2表示这三家公司中有一家生产该种产品,则收益矩阵为如何构造收益矩阵?自然状态SS1S2A120-10A200但如果把状态分为4个:S1仍表示这三家公司都不生产该种产品,S2表示A公司生产该种产品,S3表示B公司生产该种产品,S4表示C公司生产该种产品,则收益矩阵为:自然状态SS1S2S3S4A120-10-10-10A200003.悲观准则(最小最大准则)问题:自然状态:,,……,方案:其中可以是实际后果值,也可以是后果值的效用值。试对各方案排序。1S2SnS),,,(21iniiiAmi,,2,1ij设想采取任何一个方案都是收益最小的状态发生,然后比较各方案的结果,哪一个方案的收益最大,哪一个方案便是最优方案。一般地,若用)(iAf表示采取方案iA时的最小收益,即miAfiniii,2,1},,,,min{)(21则满足)(max)(1*imiAfAf的方案*A为最优。表2-3悲观准则下的决策表气温在300C以下气温介于300C—350C之间气温在350C以上各方案收益平均值购进西瓜2000kg600800800600购进西瓜5000kg15020002000150购进西瓜8000kg-30015503200-300最优收益值600方案收益矩阵状态介于二者之间的准则赫威兹准则是介于乐观与悲观准则之间的一种判别方案优劣的准则。表述:首先指定一个决策者乐观程度的所谓乐观系数,用表示,0≤≤1。决策者对状态的估计越乐观,就越接近于1;越悲观就越接近于0。如果认定情况完全乐观,则为1;如果认为情况完全悲观,则为0。其决策方法如下:4.折衷准则(赫威兹准则)令)min)(1()max()(ijjijjiAH其中0≤≤1.则满足)(max)(1*imiAHAH的方案*A为赫威兹准则下的最优方案。缺点:不易确定乐观系数;只注意到最好和最坏这两个状态,而没有用到其它各值。表2-4折衷准则收益气温在300C以下气温介于300C—350C之间气温在350C以上各方案折衷收益值H,(α=0.4)购进西瓜2000kg600800800680购进西瓜5000kg15020002000890购进西瓜8000kg-300155032001100最优收益值1100方案收益矩阵状态计算折衷损益值:H1=800*0.4+0.6*600=680H2=2000*0.4+150*0.6=890H3=3200*0.4+(-300)*0.6=11005.后悔值准则(沙万奇准则)(最小机会损失决策)沙万奇(Savage)准则的原理:大多数人在做出决策之后,如遇到不利情况,常会产生后悔情绪。如果我们认识到没有选择那个事实上在当时的环境下最好的选择方案,那么,我们的遗憾会有多少?定义:每个方案ai在状态sj下最大可能的收益与现实收益的差为机会损失,又称为后悔值或遗憾值。决策步骤:(1)首先计算出各方案在不同自然状态下的后悔值;后悔值=同一自然状态下的最大收益值-该状态下收益值(2)分别找出各方案对应不同自然状态下后悔值的最大值;(3)从最大后悔值中找出最小者,并以此为最优方案.设在自然状态Sj下各方案的最大收益值为ijmij1*max(j=1,2,…,n)于是,第i个方案Ai在各自然状态下的后悔值为:1*1i2*2i……inn*每一个方案在不同的自然状态下有不同的后悔值,其最大者称为该方案的最大后悔值,即}{max)(*ijjjiARm个最大后悔值中的最小者,即)(miniiAR就是“最小的最大后悔值”决策的最优方案。所对应的方案,气温在300C以下气温介于300C—350C之间气温在350C以上各方案的最大后悔值购进西瓜2000kg0120024002400购进西瓜5000kg450012001200购进西瓜8000kg9004500900最小后悔值900方案收益矩阵状态气温在300C以下气温介于300C—350C之间气温在350C以上各方案的最大后悔值购进西瓜2000kg600800800购进西瓜5000kg15020002000购进西瓜8000kg-30015503200最优收益值方案收益矩阵状态各方案选择结果:乐观准则等可能性悲观准则折衷后悔值方案a1√方案a2方案a3√√√√(六)不同决策准则的选择与比较总结:前述各决策准则,对于同一问题,采取不同的策略,得到的方案不同。在理论上,不能证明哪种方案更合理,在实际中,方案的选择还要根据决策者对自然状态的看法而定。悲观决策法:适合企业规模小,承担风险的能力小,对未来信心不足,比较保守的决策者。乐观决策法:适合对未来发展形势很乐观,有充分的信心取得理想的结果。乐观系数决策法:对未来的形势保持中性的看法时采用。后悔值准则:多用于那些对决策失误的后果看得比较重的决策者。小结:不确定性决策1.定义:2.决策准则:乐观准则:MaxMax悲观准则:MaxMin折衷准则:等可能性准则:平均值=s1+s2+…+sn)/(a1+a2+…am)后悔值准则(最小机会损失决策):Min(Max后悔值)=同一自然状态下的最大收益值-该状态下收益值))min)(1()max()(ijjijjiAH不确定性决策Excel应用决策准则:乐观准则:MaxMax悲观准则:MaxMin折衷准则:等可能性准则:平均值=s1+s2+…+sn)/(a1+a2+…am)后悔值准则(最小机会损失决策):Min(Max后悔值)=同一自然状态下的最大收益值-该状态下收益值)=IF(E4=MAX(E4:E6),--max,)
本文标题:3-2非确定型决策
链接地址:https://www.777doc.com/doc-609142 .html