3、理性行为公理与效用函数.ppt

资源描述

1、框架单目标决策多属性决策个体决策群组决策不确定型决策风险型决策贝叶斯决策简单线性加权法理想解方法及改进层次分析法等冲突分析集体决策社会选择理论专家咨询方法博弈分析谈判决策理性行为公理效用函数理性行为公理与效用函数决策表决策函数决策问题构成要素，为了表述决策问题收益函数、损失函数和效用函数统称为决策函数记作 f=F（a，）收益矩阵、损失矩阵和效用矩阵统称为决策矩阵记作收益函数把收益值作为决策方案的评价指标，最满意方案就是收益值最大的方案。设决策问题的收益值为q，状态变量为，决策变量（方案或策略）为a。当决策变量a和状态变量确定后，收益值q随之确定。收益值q是a和的函数，称为收益函数

2、，记作 q=Q(a,)收益函数如果决策变量和状态变量是离散的，即 a a=a ai i (i i=1,2,=1,2,m m)=j j (j j=1,2,=1,2,n n)，则收益函数可以表示为：则收益函数可以表示为：q qij ij =Q Q(a ai i,j j)，(i i=1,2,=1,2,m m；j j=1,2,=1,2,n n)收益矩阵损失函数损失值又称为遗憾值（机会损失），表示没有采取最满意方案或策略时所造成的损失。当决策变量a和状态变量确定后，损失值r是a和的函数，称为损失函数，记作 r=R(a,)在离散情况下，损失值可以表示为在离散情况下，损失值可以表示为 r rij ij

3、=R R(a ai i,j j)(i i=1,2,=1,2,m m；j j=1,2,=1,2,n n)损失函数损失函数可以表示为损失矩阵，即损失值可以通过收益值计算出来，计算公式为 (i i=1,2,=1,2,m m；j j=1,2,=1,2,n n)损失函数损失值rij表示在状态j的条件下，没有采取收益值最大方案，“舍优取劣”给决策带来的损失或遗憾。一般地，损失函数和收益函数有如下关系：随机决策决策问题包含有许多随机因素或不稳定因素。随机决策的特点状态的随机性状态的随机性决策结果值的效用特性决策结果值的效用特性随机决策分析的基础：效用及效用函数事态体的定义在系统决策中，常用事态体表示

4、在随机性状态空间中的行动方案，方案的比较表示为事态体的比较。定义具有两种或两种以上有限个可能结果的方案具有两种或两种以上有限个可能结果的方案（或事情），称为事态体。（或事情），称为事态体。例如：前面例子中方案例如：前面例子中方案“投产投产”就有两者结果就有两者结果2020和和-3-3。事态体的性质和表示事态体中各可能结果出现的概率是已知的。设事态体的n个可能结果值为o1,o2,on，相应出现的概率为p1,p2,pn，并且则事态体记作 T=(p1,o1;p2,o2;pn;on)事态体的性质和表示事态体T=(p1,o1;p2,o2;pn;on)可以用树形图表示简单事态体特别地，当n=2时，称

5、T为简单事态体，即：T=(p,o1;1-p,o2)。简单事态体T的树形图举例某公司研究试制一种新产品，投入市场有一定风险。根据市场预测，该产品在市场看好的情况下，可以获利20万；在市场前景较差时，将亏损5万元。市场较好和较差的概率分别为0.6和0.4。该公司试制新产品方案在决策分析中，可以表示为一个简单的事态体，即T=(0.6，20；0.4，-5)。前例中的两个事态体投产：T T1 1=（0.50.5，2020；0.50.5，-3-3）不投产：T T2 2=（1 1，0 0）以上称为以上称为“退化事态体退化事态体”。方案方案状态状态好（好（0.50.5）坏（坏（0.50.5）投产投产a

6、a1 12020-3-3不投产不投产a a2 20 00 0事态体集合的性质在凸线性组合下，(伽马)是闭集。即若T1,T2,当01时，有 T1+(1-)T2 解释和举例：两种方案均作一点，这种情况仍然属于两种方案均作一点，这种情况仍然属于。可以理解为闭区间中两点的线性组合仍然属于可以理解为闭区间中两点的线性组合仍然属于该区间（连续情况）该区间（连续情况）离散：需五台设备，有离散：需五台设备，有A A、B B两种型号的组合两种型号的组合解释和举例a：5Ab：5Ba+(1-)b：4AB；A4Bba0a+(1-)b;01连续离散事态体集合的性质退化事态体仍属于事态体集合。退化事态体退化事态体 T

7、 T=(0,=(0,o o1 1;0,;0,o o2 2;1,;1,o oj j;0,;0,o on n)退化的事态体实质上是一个结果值，仍是一个退化的事态体实质上是一个结果值，仍是一个事态体，只是结果值事态体，只是结果值o oj j以以1 1的概率出现，其他结的概率出现，其他结果值出现的概率为果值出现的概率为0 0。事态体的比较决策的最终结果，是将行动方案依据某种准则作出合理的排序，从而选择最满意的方案。方案的排序就是事态体的比较。事态体比较的有关定义设o1,o2是事态体T任意两个结果值，根据决策目标和决策者的偏好，o1和o2有：若偏好结果值若偏好结果值o o1 1,则称则称o o1 1优

8、于优于o o2 2,记做记做o o1 1 o o2 2 ；反之，称反之，称o o1 1劣于劣于o o2 2,记做记做o o1 1 o o2 2。若对结果值若对结果值o o1 1,o o2 2无所偏好，则称无所偏好，则称o o1 1无差异于无差异于o o2,2,记做记做o o1 1 o o2 2。若不偏好结果值若不偏好结果值o o1,1,则称则称o o1 1不优于不优于o o2 2,记做记做o o1 1|o o2 2；反之，称反之，称o o1 1不劣于不劣于o o2 2,记做记做o o1 1|o o2 2。事态体比较的有关定义设两个简单事态体T1,T2具有相同的结果值o1,o2,即T1=(p1,

9、o1;1-p1,o2),T2=(p2,o1;1-p2,o2),并假定o1 o2 若若p p1 1=p p2 2,则称事态体则称事态体T T1 1无差异于无差异于T T2 2,记作记作T T1 1 T T2 2。若若p p1 1 p p2 2,则称事态体则称事态体T T1 1优于优于T T2 2,记作记作T T1 1 T T2 2；反反之，称事态体之，称事态体T T1 1劣于劣于T T2 2，记，记作作T T1 1 T T2 2。举例某公司试制新产品方案 T1=(0.6,20;0.4,-5)另一新产品方案为 T2=(0.7,20;0.3,-5)。显然，T2 T1。事态体比较的有关定义设有两个简单

10、事态体T1,T2仅具有一个相同结果值，另一个结果值不相同，即 T1=(p1,o1;1-p1,o0),T2=(p2,o2;1-p2,o0),其中若p1p2，则称事态体T2优于T1，记作若T2 T1，则一定有p1p2 举例新产品方案T1=(p1,10;1-p1,-5)新产品方案T2=(p2,20;1-p2,-5)如果p1=p2 则：如果两个方案T1和T2无差异，则：p1p2 理性行为公理理性行为所遵循的一般规律，并且无需证明，为人们普遍接受，称之为理性行为公理。理性行为公理是效用函数的基础。只有满足理性行为公理的事态体集合，其元素之间的优劣关系和它的效用才具有一致性。（优的元素，其效用一定大

11、）连通性公理上事态体的优劣关系是连通的。即：若T1,T2，则或者，或者，或者T1 T2，三者必居其一。说明：上的所有元素，其优劣关系都具有可比性。传递性公理上事态体的优劣关系是传递的。即：若T1,T2,T3，且，则则 T T1 1 T T2 2,T T2 2 T T3 3,则则T T1 1 T T3 3 说明上元素优劣关系比较是可传递。全序集满足以下两个公理的事态体集合，称为全序集。连通性公理连通性公理传递性公理传递性公理即：事态体集合上事态体的优劣关系是可比的，并且该关系是具有传递性的。复合保序性公理若T1,T2,Q,且01，则当且仅当 T1+(1-)Q T2+(1-)Q 有说

12、说明明：事事态态体体的的优优劣劣关关系系是是可可以以复复合合的的，复复合合之之后的事态体保持原有的优劣关系不变。后的事态体保持原有的优劣关系不变。举例T1：投资股票A5万T2：投资股票B5万Q：银行存款5万若0.8T1+(1-)Q：股票A4万，银行存款1万T1+(1-)Q：股票B4万，银行存款1万显然：组合后的关系不变。相对有序性公理若T1,T2,T3，并且则：存在数p,q 0 p 1,0 q 1,使得 pT1+(1-p)T3 T2 qT1+(1-q)T3 说明：上事态体的优劣关系都是相对的，T1不是无限优。T3也不是无限劣，否则上述关系式是不能成立的。举例T1：产品A（0.5，10；0.

13、5，0）T2：产品B（0.5，6；0.5，0）T3：产品C（0.5，2；0.5，0）显然：若：p=0.8；q0.1则：pT1+(1-p)T3 T2 qT1+(1-q)T3 事态体的基本性质（一）设事态体 T1=(p,o1;1-p,o0),T2=(x,o2;1-x,o0)，且o1 o0，o2 o0。若o2 o1，则：存在x=p p，使得T1T2。其中，x称为可调概率值。基本性质（一）举例某公司的新产品开发方案 T1=(0.6,20;0.4,-5),T2=(x,25;1-x,-5)。当x=0.6时，显然T2 T1。如果逐渐减少可调概率值x，决策者对T2的偏好程度也随之降低。当x减少到某一适当程度x

14、=p0.6时，决策者认为对方案T1、T2无所偏好。此时，T1T2。事态体的基本性质（二）确定当量和无差异概率设事态体T=(x,o1;1-x,o2)，且o1 o2,若对于满足优劣关系的任意结果值o3，则必存在x=p(0p u(o2)o1,o2O，且01，则 uo1+(1-)o2=u(o1)+(1-)u(o2)条件的含义定义在集合O上的效用函数其取值为0u(o)1 效用值与结果值需要满足优劣关系一致性要求对于结果值的凸线性组合满足线性关系举例举例举例效用函数u(o)，0.3。若：u(20)0.9；u(10)0.1则要使得uo1+(1-)o2=u(o1)+(1-)u(o2)有：左边u(0.3

15、200.710)u(13)右边0.3u(20)0.7 u(10)0.34故，应有：u(13)0.34。否则不成立。效用函数的基本思路对于决策问题的结果值集合，先用标准效用测定法找出一个基准效用值，这就是效用值等于0.5的结果值，称之为确定当量。即：构造简单事态体(0.5,o*；0.5,o0)其余效用值无须测定，而是按比例用线性内插的方法，用同一个标准计算得到。效用函数的构造方法效用曲线u=u(x)线性内插法按照比例关系：(x0.25x0)/(x0.5x0)(x0.5x0)/(x*x0)(x0.75x0.5)/(x*x0.5)(x0.5x0)/(x*x0)符合效用函数的性质uo1+(1-)o2=

16、u(o1)+(1-)u(o2)效用与风险的关系不同的决策者对风险的态度是有区别的不同的决策者对风险的态度是有区别的效用表示了决策者对决策方案各结果值的偏好程效用表示了决策者对决策方案各结果值的偏好程度，可以用不同类型的效用函数表征决策者对风度，可以用不同类型的效用函数表征决策者对风险的不同态度。险的不同态度。效用函数的类型效用函数的类型中立型中立型保守型保守型冒险型冒险型中立型效用函数设有效用函数u=u(x)，若x1 x2,有则称为中立型效用函数，对应的效用曲线是一条直线。效用值与结果值增长成正比例关系。通常可以用结果值直接评选方案。中立型效用曲线当结果值增加时，当结果值增加时，效用值

17、按相同比例效用值按相同比例增加，决策者效用增加，决策者效用值增加的速度稳定，值增加的速度稳定，表明对风险的态度表明对风险的态度平和，既不对有利平和，既不对有利结果特别追求，也结果特别追求，也不对不利结果谨慎不对不利结果谨慎从事。从事。中立型效用函数举例某厂商试制一种新产品要承担一定风险，有0.5的概率获利x1=3（万元），有0.5的概率亏损x2=-1（万元）。该风险方案可表示为简单事态体 T=(0.5,x1;0.5,x2)。此风险方案的期望收益值为中立型效用函数举例假设该厂商认为此风险方案的效益与另一项不冒风险可稳获利x3=1（万元）的方案是等价的，即成立无差异关系：T=(0.5,x1;0.

18、5,x2)x3于是，确定当量x3与事态体T的效用值相等，即 u(x3)=0.5u(x1)+0.5u(x2)又则态度中立。保守型效用函数设有效用函数u=u(x)，若x1x2，有则称为冒险型效用函数，对应的效用曲线是一条下凸曲线。效用值随结果值增加而增加，但增加的速度随之逐渐加快。冒险型效用曲线反映决策者喜欢冒险，乐于大胆尝试的个性。随着结果值增加，对市场变化充满信心，敢于冒险追求高额利润。效用曲线下凸越厉害，表示决策者越富冒险性。冒险型效用函数举例在前例中，假设该厂商对风险持追求态度，认为该风险方案与另一项不冒风险可稳获利x3=1.5（万元）的方案等价，即无差异关系T=(0.5,x1;0

19、.5,x2)x3确定当量x3与事态体T效用值相等，又故效用函数的说明以上是最基本的效用函数。在实际中，为了更加以上是最基本的效用函数。在实际中，为了更加准确地反映决策者对风险地的态度，可以用三种准确地反映决策者对风险地的态度，可以用三种基本效用函数构造混合型效用函数来表示。基本效用函数构造混合型效用函数来表示。如：根据实际分析，确定结果值如：根据实际分析，确定结果值x x0 00,10,1，当，当x x x x0 0时，即结果时，即结果值较大时，决策者对风险转而持谨慎态度，可用值较大时，决策者对风险转而持谨慎态度，可用上凸效用曲线表示。上凸效用曲线表示。三种基本效用函数效用函数的曲线拟合效用函数构造方法，是通过效用函数表,求得某效用函数u=u(x)上有限个点的坐标，将它们连结成一条光滑曲线，得到该函数的效用曲线。两个问题效用曲线的函数表达式效用曲线的函数表达式得到的曲线与客观存在的决策者的效用曲线存得到的曲线与客观存在的决策者的效用曲线存在一定误差，如何使误差尽量地小。在一定误差，如何使误差尽量地小。曲线拟合方法线性函数型指数函数型双指数函数型指数加线性函数型幂函数型对数函数型

展开阅读全文