效用函数-哈尔滨工业大学.docx

资源描述

第三章效用函数 §3—1 效用的定义和公理系统一、引言 ·为什么要引入效用决策问题的特点：自然状态不确定——以主观概率表示；后果价值待定——以效用度量。 1. 无形后果，非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量； 2. 即使是数值量(例如货币)表示的后果，其价值仍有待确定，后果的价值因人而异。例一：同是100元钱，对穷人和百万富翁的价值绝然不同；对同一个人，身无分文时的100元，与已有10000元再增加100元的作用不同，这是钱的边际价值问题。例二：上图作为商业、经营中实际问题的数学模型有普遍意义。有人认为打赌不如礼品，即 *由上面两个例子可知：在进行决策分析时，存在如何描述(表达)后果的实际价值，以便反映决策人偏好次序(preference order)的问题 *偏好次序是决策人的个性与价值观的反映，与决策人所处的社会、经济地位，文化素养，心理和生理(身体)状态有关。如工资/工作时间权衡，年龄对带伞与否的影响。 * 除风险偏好之外，还有时间偏好。i. 折扣率；ii. 其他。而效用(Utility)就是偏好的量化，是数(实值函数)。 Daniel Bernoulli 在1738年指出： “若一个人面临从给定行动集(风险性展望集)中作选择的决策问题，如果他知道与给定行动有关的将来的自然状态，且这些状态出现的概率已知或可以估计，则他应选择各种可能后果中偏好期望值最高的行动。” 二、效用的定义 1.符号 i. afb (即aPb)读作“a优于b”(a is preferred to b)。f：严格序 a≧b (即aRb) “a不劣于b”。≧：弱序 a～b (即aIb) “a无差别于b”(I: indifference)。～：无差异 ii. 展望 (prospect): 或称“预期”，可能的前景即各种后果及后果出现概率的组合 P=(…… ) 既考虑各种后果 (consequence) 又考虑了各种后果的概率 (probability or likelihood) 分布复合展望所有P的集合记作p iii. 抽奖 (lottery) 与确定当量（certainty equivalent）抽奖L2=< ; >。若 ~ L2 则称确定性后果为抽奖 L2 的确定当量 2. 效用的定义(A) 在集合p上的实值函数u，若它和p上的优先关系≥一致，即: 若 p , ≥ 当且仅当 u()≥u() 则称u为效用函数效用函数定义在展望集上，而非后果集上。三、效用存在性公理（理性行为公理） Von Neumann-Morgenstern, 1944 ·公理1 连通性 (Connectivity)又称可比性 p, 则 or ~ or ·公理2 传递性 (Transitivity) p, 若, 则 ·公理3 替代性公理 ( 加等量时优先关系不变) 若p, 且 0 < a < 1 则对任何∈p ,必有 a+(1-a)a+(1-a) 或者表达成：,a>b 则 a+(1-a)b+(1-b) 即二种后果中，决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。 ·公理4 连续性公理 ---- 偏好的有界性若则存在 0<a<1, 0<b<1, a>b 使 a+(1-a)b+(1-b) 由 a+(1-a) 可知不是无穷劣,即 u()>-¥ 由 b+(1-b) 可知不是无穷优, 即 u()< ¥ 即使是死亡，亦不至于无穷劣例：i, 过马路若死亡为无穷劣，则不能过马路 ii, 狂犬病疫苗上述公理看来是合乎理性的，事实上并不尽然. 例：Allais 悖论（Paradox 〕例如，1953年Allais在一次学术会议上提出如下问题，请效用理论权威Savage回答 Savage的回答是A组宁择i， B组宁择ii， Allais指出：B组的i, ii, 均以0.89的$500,000 取代0.89的 $0，即与A组的i, ii相对应，照公理3、A、B两组中i,ii,的优先关系应当不变。 Savage当时语塞。 ·效用的公理化定义在上述公理系统中，若p上存在实值函数u，使 i. f 当且仅当 u() ＞u() ii. u(α, ; 1-α, )= αu() +(1-α)u()——线性性 iii. 对满足上述条件的、，必有 () =b( )+c , 其中 b, c ∈, b＞0 则u(P)称为(基数)效用函数 *关于线性：将ii. u(α, ; 1-α, )= αu() +(1-α)u() 推广到一般, 若∈p ;≥0 , i=1,2,…m; =1; 则 u( )= u() 四、基数效用与序数效用 (Cardinal & Ordinal Utility) 基数：实数：2，2.01, 100…… 序数：第1，2，… ·区别： 1. 基数效用定义在展望集p上(考虑后果及其概率分布), 是实数; 序数效用定义在后果集C上，不涉及概率，可以是自然数 2. 基数效用反映偏好强度：(正线性变换下唯一) 原数列可变换为: b+c, 2b+c, 3b+c, πb+c; 其中 b, c ∈, b＞0. 而序数效用不反映偏好强度，(保序变换下唯一), 原序数列可变换为 16,9,4,1;或 8,6,4,2,或10,7,6,1等. ·序数效用的存在性公理 1.连通性(可比) 2.传递性 3.连续性：对任何确定的后果x，优势集与劣势集均为闭集。(教材：P29 §3.1) §3.2 效用函数的构造一、离散型的概率分布后果元素有限 ·各后果效用设定的步骤 NM法（von Neumann-Morgenstern），也称概率当量法由公理4: 若ff ,则可找到 0<α<1, 使~α+(1-α) 第一步：选定 , Î C , 使f 令 u()=0, u()=1 所选择的、应使比较易于进行. 第二步：对ff ,求α(0<α<1), 使~α+(1-α) 则 u()=u(α+(1-α))= αu()+(1-α)u() \ u()=α 第三步：若pp, 求α(0<α<1), 使~α+(1-α) 则u()=u(α+(1-α))=αu()+(1-α)u() \ u()=α/(α-1) 第四步：若 ff, 求α(0<α<1), 使~α+(1-α) 则u()=u(α+(1-α))= αu() \ u()=1/α 第五步：一致性校验设 ff 且 ,, 已知，（ffff）由 ~α+(1-α) 求得u’() 若 u’() 与已知的 u() 不符，则反复进行二、三、四步，直到一致性校验通过. 例设 fff 一、u()=0, u()=1 二、~0.7+0.3 u()=0.7 三、~0.4+0.6 u ()=0.4 校验设~0.4+0.6 u’()=0.64≠0.7 重复二、三、若u () 不变 u ()=0.5 则通过校验. 二、连续型后果集 ·当C为连续变量时,u(c)是光滑的，因此可分段构造，求特征点的效用，再连成光滑曲线例1.每天学习时间的效用曲线在10～12小时／日处效用最大 8小时／日处效率最高(效用／小时) ·注意：效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴，而不必限于[0,1] §3.3 风险与效用一、效用函数包含的内容 1.对风险的态度风险厌恶(Risk Aversion) 风险中立(Risk Neutrality) 风险追求(Risk Proneness/Seeking) 即有冒险倾向以上是初期对风险的解释(Pratt C.,1964) 2.对后果的偏好强度钱的边缘价值：设某人现有积蓄为0，增加1000地的作用(价值)与有了1000元后再加1500元相等,则此人的财富的价值函数是凹函数。若他认为1000元~(0.5,0; 0.5,2500), 则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。 3.效用表示时间偏好十分复杂，我们在第八章再介绍。二、可测价值函数 ——确定性后果偏好强度的量化定义：在后果空间X上的实值函数v，对ω, x, y, z∈X有 i, (ω®x) f (y®z)当且仅当υ(ω)-υ(x)≥υ(y)-υ(z), 且 ii, υ对正线性变换是唯一确定的。则称υ为可测价值函数说明：i，(ω®x) f (y®z)表示ω,x之间偏好强度之差超过y, z之间偏好强度之差, ii. 由定义之ii，可测价值函数具有基数性质但与基数效用不同：VF不反映决策人的风险态度。 iii. 它定在后果空间上，能起序数效用的作用但又与OUF不同：能反映后果的偏好强度. 三、相对风险态度设效用函数u和可测价值函数v在X上都是单调递增，且连续二次可微。 1.风险的局部测度 ì > 0 u在x 处凹, 风险厌恶 r(x)=-u”(x)/u’(x) í = 0 u在x 处线性, 风险中立 î < 0 u在x 处凸, 风险追求 2.偏好强度的局部测度 >0 在x处有递减的边际价值 m(x)=-v”(x)/v’(x)= 0 在x处有不变的边际价值 <0 在x处有递增的边际价值 3.真正的(相对)风险态度的定义若m(x)＜r(x)称为在X'区内相对风险厌恶 m(x)=r(x)称为在X'内相对风险中立 m(x) >r(x)称为在X'内相对风险追求四、风险酬金 k=E(x)-S 这是决策人为了避免风险而愿意损失的金额五、货币的效用 1. 性质 i. 单调递增：愈多愈好有界：全世界财富总量不足$, u()与u()几乎无差异 ii. x较小(相对于决策人资产而言)时, u(x)近乎线性 iii. x>0时u(x)通常是凹的递减的边际价值风险厌恶 x>0与x<0的形状不同, 负债较多有追求风险的倾向. 2. 钱的效用曲线的构成设某人现有1000元存款(某商店有资产10万，企业有1000万等等) i. NM法(见§3.2) 利用～α+(1-α) ii. 修正的NM法利用～0.5+0.5 例: 设u(0)=0, u(1000)=1 有300～0.5<0>+0.5<1000> u(300)=0.5 又125～0.5<0>+0.5<300> u(125)=0.25 550～0.5<300>+0.5<1000> u(550)=0.75 由0～0.5<a>+0.5<500> 设 a=-250 则u(-250)=-u(500)=-0.72 -250～0.5<b>+0.5<0> 原因：i,价值函数是S型 ii,在一定范围内相对风险态度不变 iii,负债到一定程度以上有冒险倾向 Friedmann-Savage 效用曲线(1948): §3.4 损失、风险和贝叶斯风险一、损失函数L 有些文献采用损失函数进行分析 ∵u(c)=u(θ,a) ∴l(θ,a)=-u(θ,a) 则损失函数与效用作用相同为了使损失值非负，可取 l(θ,a)= u(θ,a)-u(θ,a) 二、风险函数自然状态集 Θ -----参数空间行动集 A -----决策空间观察值集 X -----测度空间决策规则 δ:x→a , , Δ为策略空间损失l(θ,a)=l(θ,δ(x)) 由于X是随机变量，对给定的θ，采用决策规则δ时定义风险函数 R(θ,δ)=[ l(θ,δ(x))] =l(θ,δ(x)) ] f (x |θ) dx 或 l(θ,δ(x)) p (x |θ) 三、贝叶斯风险 r(π，δ) = Eπ R(θ,δ) 含义：θ的先验分布为π，决策规则为δ时风险函数的期望值叫贝叶斯风险即: r(π，δ)= R(θ,δ) = l(θ,δ(x)) f (x |θ) dx ] π(θ) dθ 或 l(θ,δ(x)) p (x |θ)π(θ)

展开阅读全文