第九章序贯决策分析.ppt
文本预览下载声明
第九章 序贯决策分析 第一节 多阶段决策 第二节 序贯决策 第三节 马尔科夫决策 第四节 群决策简介 第一节 多阶段决策 一、多阶段决策问题 在经济活动中,常常遇到这样的决策问题,由于它的特殊性,需要将过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。当各个阶段决策确定后,就组成了一个决策序列,因而也就决定了整个过程的一条活动路线,这种把一个问题可看作是一个前后关联的具有链状结构的多阶段过程就称为多阶段决策过程。 第一节 多阶段决策 二、多阶段决策方法 解决多阶段决策问题的主要方法是决策树方法和动态规划方法,决策树由节点和分支组成,每一条由树根通往树梢的路线都表示一种决策方案及可能遇到的一种情况。 进行决策分析时,要由树梢往树根依次计算。这种从后到前进行决策分析的方法叫做逆序归纳法。 第一节 多阶段决策 多阶段决策分析的步骤: (1)根据具体问题适当划分阶段; (2)确定各阶段的状态变量,寻找各阶段之间的联系; (3)由后到前用逆序归纳法进行决策分析。 第一节 多阶段决策 三、应用举例 例9-1 离散情况决策分析。某企业考虑是否花费4000元钱从某科研机关购买某项技术然后产销新产品。如果买技术,可以进行大批生产(a1),中批生产(a2),或小批生产(a3),可能出现的市场销售情况也分为畅销(θ1)一般(θ2)和滞销( θ3 )三种。 其收益(利润,元)矩阵如表9-1 第一节 多阶段决策 第一节 多阶段决策 为了更正确地了解市场情况,正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因,试销费需要600元。由于试销前未作广告,顾客对产品不太了解,加之试销量较小,试销结果不很准确。假设试销结果分为产品受欢迎(H1),一般(H2)和不受欢迎(H3)三种,其准确度(似然分布矩阵)见表9-2所示。 第一节 多阶段决策 第一节 多阶段决策 如不买此项技术,把这笔费用用在其他方面,在同样的时期可获利8000元。那么,该公司应该如何决策? (1)是否买技术? (2)如果买技术,是否采取试销办法? (3)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动? 第一节 多阶段决策 第一节 多阶段决策 第一节 多阶段决策 第一节 多阶段决策 第一节 多阶段决策 第一节 多阶段决策 第一节 多阶段决策 决策:不试销 购买技术总期望收益 15000-4000=11000(元) 不购买技术,另作它用收益8000元 决策:购买技术 决策树如图9-1 第二节 序贯决策 有些决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接着又有一些新的情况,又需要进行新的决策。这样决策、情况、决策…,就构成一个序列,这就是序列决策。解决序列问题的有利办法仍然是决策树。 第二节 序贯决策 例9-3 设有某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用每次30000元,钻井费用为10000元。若钻井后出油,这井队可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图9-2上。问钻井队的决策者如何做出决策使收入的期望值为最大。 第二节 序贯决策 第三节 马尔可夫决策 一、马尔可夫决策问题 决策问题采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际所处状态的影响。。其中一种最简单、最基本的情形,是每一时期状态参数的概率分布只与这一时期的前一时期实际所处的状态有关,而与更早的状态无关,这就是所谓的马尔可夫链。 利用马氏过程分析系统当前状态并预测未来状态的决策方法,称为马尔可夫决策。 第三节 马尔可夫决策 二、马尔可夫链与转移概率矩阵 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 例9-7 我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别为如表9-5、表9-6所示。 第三节 马尔可夫决策 第三节 马尔可夫决策 第三节 马尔可夫决策 第四节 群决策简介 一、群决策概念 在现实生活中,决策往往是群体行为,是由多人参加进行行动方案的选择活动。这些组织的成员、代表就是群体决策者中的一员。作为群体决策,其
显示全部