资源描述
山 东 理 工 大 学 教 案
√
第 31 次课
教学课型:理论课□ 实验课□ 习题课□ 实践课□ 技能课□ 其它□
主要教学内容(注明:* 重点 # 难点 ):
第11章:决策分析
11.6 情报的价值与贝叶斯决策
11.7 效用理论及应用
* 重点:贝叶斯决策、效用理论与应用系统决策的方法
# 难点:贝叶斯决策、效用的概念及其应用
教学目的要求:
根据实际问题,分析贝叶斯决策的应用
教学方法和教学手段:
讲解、案例教学、ppt课件
讨论、思考题、作业:
参考资料:
注:教师讲稿附后
11.6 情报的价值
由前面的分析可知,正确的决策来源于可靠的情报或信息,情报资料越可靠,对状态发生的概率估计就越准确,据此作出的决策也就越合理。但是,获取情报或信息,需要进行必要的调查、试验、统计等工作,或从别人手中购买,不管怎样,都要花费一定的代价。如果决策者支付的费用过低,则难以得到要求的情报资料;如果支付的费用过高,则可能不合算,那么支付多少费用对决策者才算合算呢?由此就出现了如何评价情报的价值这个问题。
决策所需的情报资料一般分为两类,一类是完全情报,即完全可以肯定某一状态发生的情报,一类是非完全情报或抽样情报,即不能完全肯定某一状态发生的情报。下面分别讨论这两类情报的价值问题。
11.6.1 完全情报的价值
有了完全情报,决策者就可以准确地预料到即将出现什么状态,从而可以把风险型决策问题变为确定型决策问题。但是,在得到完全情报之前,并不知道哪个状态发生,因而就无法准确算出这一情报会给决策者带来多大的收益。因此,为了在得到情报之前决定是否值得去采集这项情报,就必须先估计出该情报的价值。基本思路是设法计算出由于获得这项情报而使决策者的期望收益提高的数额。如果该数额大于采集情报所花费的费用,则收集这一情报是有利的,否则就不值得为收集这一情报花那么大的代价。
下面通过一个例子加以说明。
假定在上例11-3中,可以得到关于产品销路好坏的完全情报,问花费60万元购买这一情报是否合算?
假定完全情报指出销路好,就采取建大厂这一策略,每年可获100万元收益,如果完全情报指出销路差,就采用建小厂这一策略,每年可获利10万元。由于在决定是否购买这一情报时还不知道完全情报的内容,故在决策时,无法算出确切的收益,只能算出在完全情报下的期望收益,即
0.7×(100万元×10-300万元)+0.3×(10万元×10-140万元)=478 万元
原期望收益(采用建大厂方案)为340万元,可知由于得到了完全情报而使期望收益增加了478万元-340万元=138 万元。
这个值就是完全情报的期望值,通常称为完全情报的价值,由于138万元大于采集完全情报的费用60万元,故值得购买这一情报。
需要指出的是完全情报在一般情况下是很难得到的,因此算出的完全情报的期望值常常只能作为支付情报费用的一个上限。
11.6.2 非完全情报和贝叶斯决策
在决策分析过程中,如果得不到完全情报,或者采集完全情报所花代价太大,这时为得到更好的决策结果,可以采用非完全情报作为补充信息对原来的状态概率进行修正。把原有的状态概率称为先验概率,而修正后的状态概率称为后验概率。由于取得了新的情报,从而提高了决策的效果。为了估计由于获取情报而改善的决策效果即情报的价值,常采用贝叶斯(Bayes)公式来分析,这样的决策称为贝叶斯决策。
1.贝叶斯公式
在概率论中,若事件B能且只能与两两互不相容事件之一同时发生,由条件概率的定义有
(11-3)
又由全概率公式有
(11-4)
因此得
(11-5)
这个公式就称为贝叶斯(Bayes)公式。
2.贝叶斯决策
它是利用贝叶斯公式进行决策的一种决策方法。这时,贝叶斯公式中的称为状态的先验概率,称为状态的后验概率。称为状态发生的条件下事件发生的条件概率,称为联合概率。称为边际概率。下面通过一个例子说明贝叶斯决策的步骤。
假如在例11-3中,若某咨询机构可以对10年内产品销路好坏提供进一步的情报,所提供情报的准确度为80%。也就是说,如果产品销路好,而咨询机构预报销路好(记为)的条件概率为0.8,预报销路差(记为)的条件概率为0.2;如果产品销路差,而咨询机构预报销路差的条件概率为0.8,预报销路好的条件概率为0.2。
由此可以写出下列条件概率
又知先验概率为,故联合概率为
边际概率为
后验概率为
在计算出边际概率和后验概率之后,按决策树法画出图11-4所示的贝叶斯决策树。
预报产品销路好时,两方案的期望益损值为
因,故方案a1较优。也就是说,如果预报产品销路好时,则应采取建大厂小
大
小
大
70.52
-57.92
230.96
583.84
70.52
P(B1)=0.38
P(B1)=0.62
388.78
P(q2/B1)=0.0968
P(q1/B1)=0.9032
P(q2/B1)=0.0968
P(q1/B2)=0.3684
P(q2/B2)=0.6316
P(q1/B2)=0.3684
P(q2/B2)=0.6316
P(q1/B1)=0.9032
1
2
4
5
3
6
7
D 100
D -20
D 40
D 10
D 100
D -20
D 40
D 10
方案。
图11-4 决策树
预报产品销路差时,两方案的期望益损值为
因,则较优。也就是说,如果预报产品销路差时,则应采用建小厂方案。
3.非完全情报的价值
在获得新的情报之前,并不知道咨询机构的预报结果是产品销路好还是销路差。为了估算非完全情报的价值,可先计算出在非完全情报条件下的期望益损值,即
583.84万元×0.62+70.52万元×0.38=388.78万元
然后再从中减去在没有非完全情报条件下的期望值340万元,即
388.78万元-340万元=48.78万元
则这个差值就是非完全情报的价值。
如果该咨询机构要求的情报费用小于48.78万元,则购买这样的非完全情报是有利的。否则,就没有必要购买这样的情报,而应该采用在没有得到任何新的情报条件下所确定的建大厂方案。
11.7 效用理论及其在系统效能决策中的应用
18世纪克拉默(Gabriel Gramer)和伯努利(Danial Bernoulli)两位学者提出了效用值的概念,所谓效用是反映决策者价值观念的准则。按照效用理论,他们认为人们财产的效用值将随财富的增加而增加,但增加的幅度递减。目前效用理论已成为决策理论和决策分析的基础。
在11.3节中分析了以货币为单位的期望益损值作决策准则的决策方法,但此方法在实际决策过程中可能会出现一定的弊病。例如,某人买5元的彩券,有0.5的概率中奖,除本外还可赢得5元,有0.5的概率不能中奖,连本也失去。按照期望值准则,期望益损值为零,就是说,可买可不买,两者都一样。这时购买者也可能抱着无所谓的心理买一张试试。另一种情况如果购买彩券需花500元,盈亏机会仍相等,且收益和亏损都是500元,其期望益损值仍为零,但这时购买者就不是无所谓的态度,因为有0.5 的概率亏500元,而不敢轻易取买。因为按照一般人的价值观,损失500元的效用值要比赢500元的效用值大。
11.7.1 效用值函数
先研究以货币为单位的财富的效用值。假定为决策者的财富,为效用值函数。按照上述效用值的改变,不难理解效用值函数应具备的两个基本性质:
1.为负值的效用值不成立。这就是说,一个人的财富不能是负的。当然,个人或组织可能负债,但要在偿还能力之内,正常的社会不容许人们去冒超出其偿还能力的风险。
2.是非递减函数。效用函数用来表达决策者对所拥有财富的满意程度,如果效用值函数不是非递减函数,意味着决策者在已达到一定数量的财富后希望放弃一些财富。很少有人会这么做。
实际上,不难推测出效用函数的一些特征:非负;起点;曲线形状随着财富值增加而趋于扁平,就是说,随着财富增加,附加财富带来的满足程度逐渐下降,曲线形式如图11-5,此曲线是凹的(即从上面看曲线存不住水,反之则为凸,呈碗状)。
图11-5 效用曲线
现进一步分析此效用曲线的性质。设甲和乙有同样的效用曲线,甲具有财富,乙具有财富(),两人接受同样的附加收益。甲所增加效用为,而乙为,显然,因为附加收益对财富较少的人来说,其效用较高(见图11-5)。进一步看,如果甲要参与某项打赌(或做出某项决策方案),其输、赢额为的概率各为和,如采纳此决策则需要满足
(11-6)
求解(11-6),则可得的最小容许值为(图11-6)
(11-7)
式(11-7)中,为通过点和弦相交而形成的线段。对于式(11-7)表示的曲线,此线段在点的右边,因此,总是大于1/2。这就是说,对于一种盈亏额相等的决策方案,只要赢的概率大于1/2,甲才肯采纳。像甲这样一定要才能采纳此决策方案的人,称作稳重者。设乙系同样的效用曲线,也同样属于稳重者,但其现有财富较多,处于曲率较小部分,其值较甲要小,说明乙并不要像甲那样大的概率就同意接受此决策方案。若处于效用曲线尾部的直线部分,则就可以接受。可以说,对待同样的决策方案,财富越多的人,稳重的程度就不那么严格。
另一类是凸的曲线,属于冒进型,如图11-7,线段处于点的左边,最小可接受的概率。持这样态度的人,能够接受的赢、亏额相等的决策方案。这种情况并不少见,当一个人处于较为窘迫的情况时,总是想摆脱其相对贫困的境况,不惜冒较大风险。当然,这些人一旦机遇好,获得成功,会逐渐转向保守态度。像有些小企业主,创业阶段愿意冒风险,而具有一定规模后有变得反风险,这种人的效用曲线可概括成图11-8所示的曲线。
图11-6 稳重型效用曲线 图11-7 冒进型效用曲线
图11-8 混合型效用曲线
11.7.2 效用值函数在某防空系统(简称A系统)效能决策中的应用
系统的使用,能使防空作战能力大幅度提高,由于系统使一个庞大复杂的系统,包含多种技术因素和不确定性,这给系统作战效能的评价带来巨大困难,而通过效用值函数能够对该系统进行较为客观、可信的描述与决策。
1.系统效能评估指标的选取
影响系统效能的因素多达上百个,将各种因素全部选作评估指标进行效能评价,显然不合适且造成评估结果的不可靠。通过使用主因素分析法对各种可能的影响因素进行分析,并结合有关专家的经验,选取的系统效能评估指标如表11-8所示。
2.指标对效能的影响分析
在A系统设计过程中,必须要考虑费用,而费用又会直接影响性能指标的确定,若一味地追求高性能指标,必然会导致费用的大幅度增加:在系统装备决策时,性能好、费用低的系统必然会作为首选系统。因此,在进行系统效能评估决策时,必须考虑费用因此,据此将表11-8中的指标分为3类:正影响指标、负影响指标和正负影响指标。
正影响指标是指系统的效能随指标数值的增大而增高的指标,如雷达工作可靠性、网络通信可靠性、计算机可靠性、无线通信设备可靠性、雷达抗干扰性、无线通信抗干扰性、计算机抗干扰性、通信保密、软件加密、网络安全、显示设备兼容性、计算机兼容性、通信网兼容性、电磁兼容性、工作方式兼容性等指标。
负影响指标是指系统的效能随着指标数值的最大而降低的指标,如战备等级转换时延、信息传递时延、信息处理时延、对人工干预响应时延、对控制反应时延、数据表示误差、数据错漏率。
正负影响指标是指系统的效能先随指标数值的增大而增高,当达到一定数值后效能则随指标数值的增加而降低的指标,如信息传输容量、目标容量、数据存储容量、降阶运行、超负荷运行。
表11-8 A系统效能评估指标体系
总指标
第一层指标
第二层指标
系统效用
系统容量
信息传输容量
目标容量
数据存储容量
系统时延
战时等级转换时延
信息传输时延
信息处理时延
对人工干预响应时延
对控制反应时延
系统精确度
数据表示误差
数据错漏率
系统非正常运行能力
降阶运行
超负荷运行
系统可靠性
雷达工作可靠性
网络通信可靠性
计算机可靠性
无线通信设备可靠性
系统抗干扰性
雷达抗干扰性
计算机抗干扰性
无线通信抗干扰性
系统兼容性
显示设备兼容性
计算机兼容性
通信网兼容性
电磁兼容性
工作方式兼容性
系统安全性
通信保密
软件加密
网络安全
3.指标的效用函数确定
通过引入效用函数,能有效地考虑费用对系统效能的影响,对于前面讨论的3类指标可相应选取3类效用函数:增长型效用函数、减弱型效用函数和增减型效用函数,其形式如下:
增长型效用函数
减弱型效用函数
增减型效用函数
式中:――第个指标的值;――第个指标的允许最小值;――第个指标的允许最大值;――第个指标的满意值。
通过专家群组决策方法来确定各指标的、和值,并通过测试和评定方法来获取各指标的数值,由相应的效用函数表达可计算出各指标的效用值。
4.综合评估决策
按照下面的步骤可以完成对系统各方案效能的综合评价决策:
(1)对同层各指标按其对上层指标的相对重要度,由大到小进行排序;
(2)将前一指标的重要度作为1,用后一指标与其进行比较,确定后一指标的相对重要度;
(3)计算各指标的重要度;
(4)按各指标的重要度赋权值,并进行归一化处理。
设按上述步骤计算的中间层各指标权值为:;底层各指标相对中间层指标的权值依次为:;并设中间层各指标的效用值为:;系统的效能为:,其中,为与中间层第个指标相对应的底层指标数,则
(11-8)
这样,对于具体的系统,在取得各项指标数据后,即可按式(11-8)计算其效能。
假设某系统的各项指标值已取得,并确定了各指标的最大值、最小值和满意值,则可计算出其相应的效用值(计算过程略),且各指标的权重已确定,则可按上面的方法和步骤得到系统各方案的效能如表11-9。
表11-9 系统效能计算结果
中间层指标效用值
底层指标效用值
指标及权重
方案1
方案2
指标
权重
方案1
方案2
系统容量
(0.13)
0.887
0.907
信息传输容量
0.40
0.93
0.90
目标容量
0.35
0.90
0.92
数据存储容量
0.25
0.80
0.90
系统时延
(0.11)
0.8795
0.889
战时等级转换时延
0.10
0.85
0.88
信息传输时延
0.25
0.86
0.91
信息处理时延
0.30
0.92
0.90
对人工干预响应时延
0.15
0.87
0.85
对控制反应时延
0.20
0.86
0.88
系统精确度
(0.10)
0.9365
0.918
数据表示误差
0.45
0.92
0.94
数据错漏率
0.55
0.95
0.90
非正常运行能力
(0.09)
0.8635
0.8225
降阶运行
0.55
0.85
0.80
超负荷运行
0.45
0.88
0.85
系统可靠性
(0.17)
0.9495
0.944
雷达工作可靠性
0.20
0.95
0.92
网络通信可靠性
0.30
0.94
0.96
计算机可靠性
0.35
0.97
0.95
无线通信设备可靠性
0.15
0.92
0.93
系统抗干扰性
(0.15)
0.830
0.8185
雷达抗干扰性
0.45
0.85
0.80
计算机抗干扰性
0.25
0.83
0.85
无线通信抗干扰性
0.30
0.80
0.82
系统兼容性
(0.11)
0.881
0.8825
显示设备兼容性
0.10
0.85
0.85
计算机兼容性
0.30
0.90
0.85
通信网兼容性
0.25
0.90
0.92
电磁兼容性
0.20
0.83
0.85
工作方式兼容性
0.15
0.90
0.95
系统安全性
(0.14)
0.9205
0.9195
通信保密
0.40
0.92
0.90
软件加密
0.25
0.95
0.95
网络安全
0.35
0.90
0.92
由表中的结果可得方案1和方案2的效能分别是0.881和0.831,显然方案1的效能高于方案2的效能。
在此案例中,通过引入效用函数,对评价系统进行了较为客观、可信的描述,有效地解决了风险型决策的方案选优问题。
展开阅读全文