您好,欢迎访问三七文档
决策分析模型一、概述在决策问题中,每个可供选择的方案称之为行动,记为a,而所有4可能行动a的集合称为行动空间,记为A。行动是决策系统的自变量,它可以是连续的,也可以是离散的。例如,某地要创建出租车公司,制定了三种购车方案:100辆、150辆、200辆,这里的行动就是一个离散变量。又如,某食品销售公司考虑购进一批食用油,要制定一个利润大、库存积压少的购入量方案,这时的行动就是一个边疆的理。数学模型方案确定以后,所产生的后果是否唯一确定,有时还领带于一些决策者无法控制的因素。在决策中,把行动确定以后,目标值所领带的参数称为状态,让为θ的集合称作状态空间,记为Ω。状态取值可以是连续的,也可以是离散的。例如,某企业经营是否盈利可以分为盈利、盈亏平衡、亏损三种离散状态。企业经营状况也可以使用量化指标表示成连续值。行动在状态下产生的后果,可以用收益或损失表示,在决策中,收益函数、损失函数均称为决策函数,记为F(θ,a)。决策函数是决策的依据,它与行动空间、状态空间一直构成了决策系统,记为(Ω,A,F)。数学模型在不确定而唯一确定。在风险决策中,状态是随机变量,它的概率分布已经为决策者所掌握。显然,不确定性决策问题状态的概率分布一旦确定,它便成为风险决策问题。当状态空间Ω中只有一个元素时,这介决策系统是确定型的,即一旦行动确定,行动的结果使被唯一确定了,如果状态空间Ω中至少有两个元素,该决策系统对应的决策便是不确定性决策或风险决策。决策问题的研究目标是在行动空间A中找到一个行动a,使决策函数F在一定状态下达到最大或最小,这一行动a称为最佳行动。数学模型二、确定性决策方法根据行动的性质,确定性决策问题可以划分为礅散型和连续型两种,由于同一问题往往有多种处理方法,因此,这里只能简单介绍几种常用方法。1、加权评分法在行动方案有限且离散的情况下,加权评分法是确定性问题的一种简便决策方法,该方法把方案涉及到的因素用指标表示,同时考虑不同指标在不同方案下的不同作用(指标值)及各指标重要性(指标权重)的差异,指标权重和指标值经算术合,综合成一个可比量值,来实现方案选优。这种方法能从主观和客观两方面反映问题,所产生的结果一般比较符合实际。数学模型方案指标ABCDE外形0.2香气0.4滋味0.3汤色0.05叶底0.0583928771869088808281858384778485969080748490788672加权评分法表1某商店要购进一批茶叶,有同一品种五品牌A、B、C、D、E可供选择,它们的单价茶叶质量,它们是:外形、香气、滋味、汤色、叶底,各指标的权得系数及其在不同方案下的指标值见表1。【问题】数学模型kiiixF1kii11100,1ix如果设第I个指标的权重系数是ωi,该指标在某方案下的分值是x那么,该方案的最后得分F可表示为:其中,k是指标总数于是,根据上述公式及表中数据,可计算出方案A的总得分:FA=0.2×83+0.4×92+0.3×87+0.05×71+0.05×86=87.35同理可得:FB=85.35FC=83.45FD=90.10FE=84.10显然,最佳行动是购买品牌为D的茶叶。【问题分析与求解】数学模型2、微分法当行动是连续变量,或者行动虽是离散变量,但其取值个数很多,甚至是无穷多,行动的取什多一个或少一个数量间接对行动结局基本没有影响,可彩微分法求最佳行动。微分法的理论依据是极值理论,其决策准则是;使收益函数达到最大或使损失函数达到最小的行动就是最佳行动,因此,求最佳行动就是求函数的最大值(或最小值)。显然,当行动是连续变量时,如果在行动窨上取出有限个行动的结局逐个比较,以择其优。某厂电视机的生产成本由两部分组成,一中分明不变成本,每天100万元,不管工厂是否生产,这部分费用不变;另一部分是可变成本,这部分成本又包括两个内空,一是每台电视机的单位成本1000元,二是与间理成正比的成本,工厂每多生产一台电视机成本就增加4元。现在该工厂要制定一个最优日产量,使每台电视机的成本最低。【问题】数学模型【模型构成与求解】根据问题,构造损失函数:aaR100000041000由于日产量多一台或少一台对工厂几乎没有什么影响,所以,a可以近似地看作是连续变量,于是,最佳行动可以通过求损失函数的最小值得到。对损失函数求微分可得:210000004aDAdR令解得a=5000dadR该工厂的最佳行动是每天生产500台电视机数学模型3、数学规划法上面介绍的加权评分法和微分法是确定性决策方法中的两种古典方法,其出发点在于求收益函数的最大值和损失函数的最小值。这两种方法通常适用于变量不多的决策问题,随着变量增加共适用性越来越差。近几十年来,随着运筹学等数学理论的发展,以数学规划理论为基础的一整套最优化方法在决策方面起着越来越重要的作用。例如,处理多变量决策问题的线性规划法,处理离散变量决策问题的整数规划法等。由于这些方法所覆盖的内容过于庞大,这里不再作进一步介绍。数学模型三、不确定型决策方法在不确定性决策中,每种运行因状态不同而结果各异,而每种状态的概率分布又事先未知。因此,决策者选择的最佳行动与其行动原则密切相关。1、常用决策方法为讨论方便,设决策行动是有限的离散变量,其收益矩阵为:mxmFgF)(除了客观因素的作用,主观因素(例如决策者的偏好)也将对行动原则产生很大的影响,对同一问题不同的决策者往往会作出不同的决策,所以,不能离开行动原则去研究不确定性决策问题。其中,),(jiFFij;i=1,2,……,m,m是状态的个数;j=1,2,……,m,m是可行行动(方案)的个数;分别表示某个状态,行动。a,数学模型表2下面,以表2中的收益矩阵为例说明不同的行动原则及其具体计算方法。〔1〕小中取大原则及算法小中取大原则反映了决策者的悲观情绪,是一种保守的决策方法。例如,企业承受风险的能力较差,或最坏的状态很可能发生时,常采用这种决策原则。数学模型的行动a是最佳行动,由表2及小中取大算法可得最佳行动是a2。),(),(minaFaFMaxjiij在该行动原则下,满足〔2〕大中取大原则及算法与小中取大原则相反,大中取大原则是一种冒险的决策模式,它反映了决策者的乐观情绪和风险意识。这种模式适用于最好状态发生的可能性很大,或研究对象承受风险能力强的情况。在大中取大原则下,满足),(),(minaFaFMaxjiij的行动a*是最佳行动。由表2及大中取大算法可得最佳行动是a1。数学模型〔3〕等概率原则及算法在缺乏准确信息的情况下,各行动状态是未知的。因此,有理由认为每一状态出现的概率是相同的,均为1/m,在等概率原则下1),(ijijaFMax等价于mijijaFMax1),(所以,满足),(),(11aFaFMaximimijij的行动a*是最佳行动。由表2及等概率原则可得最佳行动是a4。数学模型〔4〕最小后悔值原则及算法该原则与小中取大原则相似,也带有保守性质,反映了决策者的悲观情绪。但最小后悔值原则与小中取大原则又有所不同,其一是它从损失的角度考虑问题,其二它又不是过分保守。在该原则下,满足),(),(minaRaRMaxjiij其中,),(),(),(jijiIjiaFaFMaxaR的行动a*是最佳行动。表3由表2的收益矩阵构造损失矩阵,见表3。),(jiaR数学模型由表3及最小后悔值原则可得最佳运行是a3。〔5〕乐观系数法)()(aHaHMaxjj小中取大原则显得过于悲观保守,而大中取大原则又显得太冒险,这种情况下可采用乐观系数法。这种方法要求决策者首先提出一个系数(用表示,0≤≤1)来表示其乐观程度。决策者越乐观,值越接近于1;越悲观,值越接近于0。因此,这种方法叫乐观系数法。这种方法尽管避免了两种极端情况,但也没有利用全部可用信息,而且,乐观系数的恰当确定也是一个难点。使用该方法决策,满足数学模型其中,),()1(),()(jiijiiiaFMinaFMaxaH是乐观系数,0≤≤1的行为a*是最佳行动。由表2及乐观系数法可得显然,乐观系数的取值不同,决策结果也会不同,例如,=0.1时,最佳行动是a2,=0.3时,最佳行动是a4;=0.9时,最佳行动是a1。数学模型表42、结果分析上面介绍了五种常用的决策原则及算法,并以表2的收益矩阵为例得出了最佳行动,所有结果如表4所示。数学模型很显然,由于信息的不充分与不确定性,不确定性决策的结局很大程度上是由决策者所左右的。这样,对同一问题,不同的决策者可能会作出完全不同甚至是相反的决策,这些不同的决策不可能都符合实际,这种现象只能归究于不确定性决策问题本身。因为没有充分、可靠、准确的信息,期望作出准确可靠的决策是不科学的。由表4可以看出,五种行动原则的前四种对表2收益矩阵进行操作所得到的结果是完全不同的,而乐观系数法又由于的不同取值也导出了三种结局。数学模型目前,已经有一些通过对客观信息的充分利用以改进不确定性决策的方法。例如,引进PERT技术中的状态估计方法,对未来状态作出三种估计,即最乐观估计、最悲观估计、最可能估计,综合这三种估计得到期望值,并扰此进行比选。又如二维决策问题的转折概率法,又知客观状态发生先后次序时的等级概率法以及重复型不确定性决策问题的对策解法等等。近来,对不确定决策又有了新的认识,认为不确定性决策与风险决策之间不应存在绝对清晰的边界。因为,实际上很少有百分之百准确的概率数字的风险决策,也很少有对客观状态百分之百无知的所谓不确定性。关键问题是通过什么方法来充分利用已知无知的所谓不确定性。关键问题是通过什么方法来充分利用已知的客观信息,并通过决策者的经验来提高不确定性决策的可靠性。数学模型四、风险决策方法在风险决策问题中,尽管已知各种行动发生的概率,其不确定性比完全不确定性决策问题要少些,但由于信息不充分等原因,仍存在一定的风险,所以,风险决策是介于确定性与不确定性之间的一种决策方式。下面,就介绍几种风险条件下常用的决策方法。风险决策通常也受主客观两方面因素的影响,这就要求决策者把概率统计理论与其智慧和经验融合贯通,既尊重客观规律,又发挥人的主观能动性。例如,对于重复性风险型决策问题,各种行动的概率容易通过统计得到,因而,用概率统计方法处理比较合理;但对于一次性或者重复性较少的决策问题,则需要比较多地依靠决策者的经验和智慧,这时,可以用效用理论进行处理。数学模型1、期望值法期望值决策方法既克服了各种不确定性决策方法的缺点,同时又保留了这些方法的优点,它用准确的数学语言描述状态的信息,利用参数的概率分布求出每个行动的收益(或损失)期望值。具有最大收益期望值或最小损失期望值的行动是最佳行动。在现实生活中,也不难理解期望值决策方法的合理性。例如,根据大数定理,当某个公司的经营次数趋向充分大时,平均损益的极限就是损益期望值,这就是为什么一个公司的成功,不能急功近利,必须坚持从长期经营中获利的原因。数学模型有期望值进行决策分析的基本步骤是:(1)明确决策问题;(2)写出损益矩阵或绘出决策树;(3)计算各行动的损益期望值Ej;miijijFpE1(收益期望值)或miijijRpE1(损失期望值)j=1,2,……,n;m、n分别是状态和行动的个数;pi是i发生的概率;Fij是行动aj在状态i下的收益值;Rij是行动aj在状态i下的损失值;Ej是行动aj的损益期望值。数学模型(4)选择最佳行动a*。现在,就通过一个实例说明期望值决策的具体操作过程。某厂在生产过程中,一关键设备突破发生故障,为了保证履行加工合同,必须在7天内恢复正常生产,否则,将被罚以100万元的违约金。工厂面临两种选择,一是修复设备,7天内修复的概率是0.5,费用为20万元;二是购置新设备,7天内完成的概率是0.8,费用为60万元。那么,工厂选择哪一种行动最佳。【问题】这是一例风险型的期望值决策问题,如果用a1表示修复行动,a2表示购置新设备,12表示7
本文标题:决策分析模型
链接地址:https://www.777doc.com/doc-613258 .html