资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第 8 章 不确定性知识的表示与推理,第 8 章 不确定性知识的表示与推理,8.1,不确定性处理概述,8.2,几种经典的不确定性推理模型,8.3,基于贝叶斯网络的概率推理,8.4,基于模糊集合与模糊逻辑的模糊推理,习题八,8.1,不确定性处理概述,8.1.1,不确定性及其类型,1.(狭义)不确定性,不确定性(uncertainty)就是一个命题(亦即所表示的事件)的真实性不能完全肯定,而只能对其为真的可能性给出某种估计。,例如,:,如果乌云密布并且电闪雷鸣,则很可能要下暴雨。,如果头痛发烧,则大概是患了感冒。,就是两个含有不确定性的命题。,当然,它们描述的是人们的经验性知识。,2.不确切性(模糊性),不确切性(imprecision)就是一个命题中所出现的某些言词其涵义不够确切,从概念角度讲,也就是其代表的概念的内涵没有硬性的标准或条件,其外延没有硬性的边界,即边界是软的或者说是不明确的。例如,小王是个高个子。,张三和李四是好朋友。,如果向左转,则身体就向左稍倾。,这几个命题中就含有不确切性,因为其中的言词“高”、“好朋友”、“稍倾”等的涵义都是不确切的。我们无妨称这种涵义不确切的言词所代表的概念为软概念(soft concept)。,(注:在模糊集合(fuzzy set)的概念出现以后,有些文献中(包括本书的第一、二版)将这里的不确切性称为模糊性(fuzziness),将含义不确切的言词所代表的概念称为模糊概念,但笔者认为将这种概念称为软概念似乎更为合理和贴切。,),3.不完全性,不完全性就是对某事物来说,关于它的信息或知识还不全面、不完整、不充分。例如,在破案的过程中,警方所掌握的关于罪犯的有关信息,往往就是不完全的。但就是在这种情况下,办案人员仍能通过分析、,推理等手段而最终破案。,4.不一致性,不一致性就是在推理过程中发生了前后不相容的结论;或者随着时间的推移或者范围的扩大,原来一些成立的命题变得不成立、不适合了。例如,牛顿定律对于宏观世界是正确的,但对于微观世界和宇观世界却是不适合的。,一般地,我们将不确定性产生式规则表示为,A,(B,C(B|A),(8-1),其中,C,(,B,|,A,)表示规则的结论,B,在前提,A,为真的情况下为真的信度。例如,对上节中给出的两个不确定性命题,若采用,(8-1),式,则可表示为,如果乌云密布并且电闪雷鸣,则天要下暴雨(0.95)。,如果头痛发烧,则患了感冒,(0.8),。,这里的0.95和0.8就是对应规则结论的信度。它们代替了原命题中的“很可能”和“大概”,可视为规则前提与结论之间的一种关系强度。,信度一般是基于概率的一种度量,或者就直接以概率作为信度。例如,在著名的专家系统MYCIN中的信度就是基于概率而定义的(详见8.2.1确定性理论),而在贝叶斯网络中就是直接以概率作为信度的。对于上面的(8-1)式,要直接以概率作为信度则只需取C(B|A)=P(B|A)(P(B|A)为A真时B真的条件概率)即可。,基于不确定性知识的推理一般称为不确定性推理。由于不确定性推理是基于不确定性知识的推理,因此其结果仍然是不确定性的。但对于不确定性知识,我们是用信度即量化不确定性的方法表示的(实际是把它变成确定性的了),所以,不确定性推理的结果仍然应含有信度。这就是说,在进行不确定性推理时,除了要进行符号推演操作外,还要进行信度计算,因此不确定性推理的一般模式可简单地表示为,不确定性推理符号推演信度计算,可以看出,不确定性推理与通常的确定性推理相比,区别在于多了个信度计算过程。然而,正是因为含有信度及其计算,所以不确定性推理与通常的确定性推理就存在显著差别。,(1)不确定性推理中规则的前件要与证据事实匹配成功,不但要求两者的符号模式能够匹配(合一),而且要求证据事实所含的信度必须达“标”,即必须达到一定的限度。这个限度一般称为“阈值”。,(2)不确定性推理中一个规则的触发,不仅要求其前提能匹配成功,而且前提条件的总信度还必须至少达到阈值。,(3)不确定性推理中所推得的结论是否有效,也取决于其信度是否达到阈值。,(4)不确定性推理还要求有一套关于信度的计算方法,包括“与”关系的信度计算、“或”关系的信度计算、“非”关系的信度计算和推理结果信度的计算等等。这些计算也就是在推理过程中要反复进行的计算。,总之,不确定性推理要涉及信度、阈值以及信度的各种计算和传播方法的定义和选取。所有这些就构成了所谓的不确定性推理模型。,8.1.3 不确切性知识的表示及推理,关于不确切性知识,现在一般用模糊集合与模糊逻辑的理论和方法来处理。这种方法一般是用模糊集合给相关的概念或者说语言值(主要是软概念或者软语言值)建模。然而,我们发现,对于有些问题也可用程度化的方法来处理。本节就先简单介绍这种程度化方法,而将模糊集合与模糊逻辑安排在8.4一节专门介绍。,所谓程度就是一个命题中所描述事物的特征(包括属性、状态或关系等)的强度。程度化方法就是给相关语言特征值(简称语言值)附一个称为程度的参数,以确切刻画对象的特征。例如,我们用,刻画一个人“胖”的程度。,(,胖,0.9),我们把这种附有程度的语言值称为程度语言值。,其一般形式为,(,LV,d,),其中,LV,为语言值,d,为程度,即,(,),可以看出,程度语言值实际是通常语言值的细化,其中的一项是对对象所具有的属性值的精确刻画。至于程度如何取值,可因具体属性和属性值而定。例如可先确定一个标准对象,规定其具有相关属性值的程度为1,然后再以此标准来确定其他对象所具有该属性值的程度。这样,一般来说,程度的取值范围就是实数区间,(,0,1,),。,1.程度元组,一般形式如下:,(,(,),例8.1,我们用程度元组将命题“这个苹果比较甜”表示为,(这个苹果,味道,(甜,0.95),其中的,0.95,就代替“比较”而刻画了苹果“甜”的程度。,2.程度谓词,谓词也就是语言值。按照前面程度语言值的做法,我们给谓词也附以程度,即细化为程度谓词,以精确刻画相应个体对象的特征。,根据谓词的形式特点,我们将程度谓词书写为,P,d,或,dP,其中,P,表示谓词,d,表示程度,;,P,d,为下标表示法,dP,为乘法表示法。,例8.2,采用程度谓词,则,(1)命题“雪是白的”可表示为,white1.0(雪)或 1.0white(雪),(2)命题“张三和李四是好朋友”可表示为,friends1.15(,张三,李四,),或,1.15 friends(,张三,李四,),3.程度框架,含有程度语言值的框架称为程度框架。,例8.3,下面是一个描述大枣的程度框架。,框架名:,类属:(,0.8),形状:(圆,0.7),颜色:(红,1.0),味道:(甘,1.1),用途:范围:(食用,药用),缺省,:,食用,4.程度语义网,含有程度语言值的语义网称为程度语义网。,例,8.4,图,8-1,所示是一个描述狗的程度语义网。,图,8-1,程度语义网示例,5.程度规则,含有程度语言值的规则称为程度规则。,其一般形式为,(,O,i,F,i,(,LV,i,x,i,),(,O,F,(,LV,D,(,x,1,x,2,x,n,),(8-2),其中,,O,i,O,表示对象,,F,i,F,表示特征,,LV,i,LV,表示语言特征值,,x,D,(,x,1,x,2,x,n,),表示程度,,D,(,x,1,x,2,x,n,),为,x,1,x,2,x,n,的函数。我们称其为规则的程度函数。,例8.5,设有规则:如果某人鼻塞、头疼并且发高烧,则该人患了重感冒。我们用程度规则描述如下:,(某人,症状,(鼻塞,x,)(某人,症状,(头疼,y)(患者,症状,(发烧,z,),(该人,患病,(感冒,1.2(0.3x+0.2y+0.5z),程度规则的关键是程度函数。一个基本的方法就是采用机器学习(如神经网络学习)。这需要事先给出一些含有具体程度值的实例规则,学习作为样本。,由上述程度化知识表示方法可以看出,基于这种知识表示的推理,同一般的确切推理相比,多了一个程度计算的手续。就是说,推理时,除了要进行符号推演操作外,还要进行程度计算。,我们称这种附有程度计算的推理为程度推理。程度推理的一般模式为,程度推理符号推演程度计算,这一模式类似于前面的信度推理模式。所以,程度推理也应该有程度阈值,从而在推理过程中,规则的前件要与证据事实匹配成功,不但要求两者的符号模式能够匹配(合一),而且要求证据事实所含的程度必须达到阈值;所推得的结论是否有效,也取决于其程度是否达到阈值。,需要指出的是,程度语言值中的程度也可以转化为命题的真度。例如,我们可以把命题“小明个子比较高”用程度元组表示为,(,小明,身高,(,高,0.9),这里的,0.9,是小明高的程度。,但也可以表示为,(,小明,身高,高,),真实性,(,真,0.9),这里的0.9是命题“小明个子高”的真实程度,即真度。这样,我们就把小明的个子高的程度,转化为命题“小明个子高”的真度,而且二者在数值上是相等的。,8.1.4多值逻辑,我们知道,人们通常所使用的逻辑是二值逻辑。即对一个命题来说,它必须是非真即假,反之亦然。但现实中一句话的真假却并非一定如此,而可能是半真半假,或不真不假,或者真假一时还不能确定等等。这样,仅靠二值逻辑有些事情就无法处理,有些推理就无法进行。于是,人们就提出了三值逻辑、四值逻辑、多值逻辑乃至无穷值逻辑。例如,模糊逻辑就是一种无穷值逻辑。下面我们介绍一种三值逻辑,称为,Kleene,三值逻辑。,在这种三值逻辑中,命题的真值,除了“真”、“假”外,还可以是“不能判定”。,其逻辑运算定义如下:,T F U,T,F,U,T F U,F F F,U F U,T F U,T,F,U,T T T,T F U,T T U,P,P,T,F,U,T,T,U,其中的第三个真值,U,的语义为“不可判定”,即不知道。显然,遵循这种逻辑,就可在证据不完全不充分的情况下进行推理。,8.1.5非单调逻辑,所谓“单调”,是指一个逻辑系统中的定理随着推理的进行而总是递增的。那么,非单调就是逻辑系统中的定理随着推理的进行而并非总是递增的,就是说也可能有时要减少。传统的逻辑系统都是单调逻辑。但事实上,现实世界却是非单调的。例如,人们在对某事物的信息和知识不足的情况下,往往是先按假设或默认的情况进行处理,但后来发现得到了错误的或者矛盾的结果,则就又要撤消原来的假设以及由此得到的一切结论。这种例子不论在日常生活中还是在科学研究中都是屡见不鲜的。这就说明,人工智能系统中就必须引入非单调逻辑。,在非单调逻辑中,若由某假设出发进行的推理中一旦出现不一致,即出现与假设矛盾的命题,那么允许撤消原来的假设及由它推出的全部结论。基于非单调逻辑的推理称为非单调逻辑推理,或非单调推理。,非单调推理至少在以下场合适用:,(1)在问题求解之前,因信息缺乏先作一些临时假设,而在问题求解过程中根据实际情况再对假设进行修正。,(2)非完全知识库。随着知识的不断获取,知识数目渐增,则可能出现非单调现象。例如,设初始知识库有规则:,x,(bird(,x,)fly(,x,),即“所有的鸟都能飞”。后来得到了事实:,bird(ostrich),即“驼鸟是一种鸟”。如果再将这条知识加入知识库则就出现了矛盾,因为驼鸟不会飞。这就需要对原来的知识进行修改。,(3)动态变化的知识库。常见的非单调推理有缺省推理(reasoning by default)和界限推理。由于篇幅所限,这两种推理不再详细介绍,有兴趣的读者可参阅有关专著。,8.1.6时序逻辑,对于时变性,人们提出了时序逻辑。时序逻辑也称时态逻辑,它将时间词(称为时态算子,如“过去”,“将来”,“有时”,“一直”等)或时间参数引入逻辑表达式,使其在不同的时间有不同的真值。从而可描述和解决时变性问题。时序逻辑在程序规范(specifications)、程序验证以及程序语义形式化方面有重要应用,因而它现已成为计算机和人工智能科学理论的一个重要研究课题。,8.2,几种经典的不确定性推理模型,8.2.1 确定性理论,确定性理论是肖特里菲(E.H.Shortliffe)等于1975年提出的一种不精确推理模型,它在专家系统MYCIN中得到了应用。,1.不确定性度量,CF(Certainty Factor),称为确定性因子,(,一般亦称可信度,),其定义为,当P(H|E)P(H),当P(H|E)=P(H),当P(H|E)0,表示由于证据E的出现增加了对,H,的信任程度。当,MD,(,H,E,)0,表示由于证据E的出现增加了对,H,的不信任程度。由于对同一个证据E,它不可能既增加对H的信任程度又增加对,H,的不信任程度,因此,MB,(,H,E,)与,MD,(,H,E,)是互斥的,即,当,MB,(,H,E,)0时,MD,(,H,E,)0;,当,MD,(,H,E,)0时,MB,(,H,E,)0。,下面是,MYCIN,中的一条规则:,如果,细菌的染色斑呈革兰氏阳性,且,形状为球状,且,生长结构为链形,则,该细菌是链球菌,(0.7),。,这里的0.7就是规则结论的CF值。,最后需说明的是,一个命题的信度可由有关统计规律、概率计算或由专家凭经验主观给出。,2.前提证据事实总CF值计算,CF(E,1,E,2,E,n,)minCF(E,1,),CF(E,2,),CF(E,n,),CF(E,1,E,2,E,n,)maxCF(E,1,),CF(E,2,),CF(E,n,),其中E,1,,E,2,,E,n,是与规则前提各条件匹配的事实。,3.推理结论CF值计算,CF,(,H,),CF,(,H,,,E,)max0,,CF,(,E,),其中E是与规则前提对应的各事实,CF(H,E)是规则中结论的可信度,即规则强度。,4.重复结论的CF值计算,若同一结论H分别被不同的两条规则推出,而得到两个可信度,CF,(,H,),1,和,CF,(,H,),2,则最终的,CF,(,H,)为,CF(H),1,CF(H),2,CF(H),1,CF(H),2,当CF(H),1,0,且CF(H),2,0,CF(H)=CF(H),1,CF(H),2,CF(H),1,CF(H),2,当CF(H),1,0,且CF(H),2,0,CF(H),1,CF(H),2,否则,(8-7),例8.6,设有如下一组产生式规则和证据事实,试用确定性理论求出由每一个规则推出的结论及其可信度。,规则:,if At hen B(0.9),if B and C then D(0.8),if A and C then D(0.7),if B or D then E(0.6),事实:,A,,CF(A)=0.8;C,CF(C)=0.9,解,规则得:CF(B)0.90.80.72,由规则得:CF(D),1,0.8min0.72,0.9)0.80.720.576,由规则得:CF(D),2,0.7min0.8,0.9)0.70.80.56,从而 CF(D)CF(D),1,CF(D),2,CF(D),1,CF(D),2,0.5760.560.5760.560.32256,由规则得:,CF(E)0.6max0.72,0.322560.60.720.432,8.2.2 主观贝叶斯方法,主观贝叶斯方法是R.O.Duda等人于1976年提出的一种不确定性推理模型,并成功地应用于地质勘探专家系统PROSPECTOR。主观贝叶斯方法是以概率统计理论为基础,将贝叶斯(Bayesian)公式与专家及用户的主观经验相结合而建立的一种不确定性推理模型。,1.不确定性度量,主观贝叶斯方法的不确定性度量为概率,P,(,x,),另外还有三个辅助度量:,LS,LN,和,O,(,x,),分别称充分似然性因子、必要似然性因子和几率函数。,在,PROSPECTOR,中,规则一般表示为,if E,then,(,LS,LN,),H,(,P,(,H,),或者图示为,其中,E,为前提(称为证据);,H,为结论(称为假设);,P,(,H,)为,H,为真的先验概率;,LS,LN,分别为充分似然性因子和必要似然性因子,其定义为,(8-8),(8-9),前者刻画,E,为真时对,H,的影响程度,后者刻画,E,为假时对,H,的影响程度。另外,几率函数,O,(,x,)的定义为,(8-10),它反映了一个命题为真的概率(或假设的似然性(likelihood)与其否定命题为真的概率之比,其取值范围为,0,+,。,下面我们介绍,LS,LN,的来历并讨论其取值范围和意义。,由概率论中的贝叶斯公式,有,两式相除得,即,亦即,O,(,H,|,E,)=,O,(,H,),LS,从而,由此式不难看出:,LS1 当且仅当O(H|E)O(H),说明E以某种程度支持H;,LS1 当且仅当O(H|E)1当且仅当O(H|,E,)O(,H,),说明 E以某种程度支持H;,LN,1当且仅当O(H|,E,)1,且,LN,1;,LS,1;,LS,LN,1,。,需说明的是,在概率论中,一个事件的概率是在统计数据的基础上计算出来的,这通常需要大量的统计工作。为了避免大量的统计工作,在主观贝叶斯方法中,一个命题的概率可由领域专家根据经验直接给出,这种概率称为主观概率。推理网络中每个陈述H的先验概率,P,(,H,)都是由专家直接给出的主观概率。同时,推理网络中每条规则的,LS,、,LN,也需由专家指定。这就是说,虽然前面已有,LS,、,LN,的计算公式,但实际上领域专家并不一定真按公式计算规则的,LS,、,LN,而往往是凭经验给出。所以,领域专家根据经验所提供的,LS,、,LN,通常不满足这一理论上的限制,它们常常在承认,E,支持,H,(即,LS,1)的同时却否认E反对,H,(即,LN,1时,LN,1。这种主观概率与理论值不一致的情况称为主观概率不一致。当出现这种情况时,并不是要求专家修改他提供的,LS,、,LN,使之与理论模型一致(这样做通常比较困难),而是使似然推理模型符合专家的意愿。,2.推理中后验概率的计算,推理中后验概率的计算有以下几个公式,:,(8-11),这是当证据E肯定存在即为真时,求假设,H,的后验概率的计算公式。其中的,LS,和,P,(,H,)由专家主观给出。,(8-12),这是当证据,E,肯定不存在即为假时,求假设H的后验概率的计算公式。其中的,LN,和,P,(,H,)由专家主观给出。,由上面介绍的,LS,LN,的来历,有,由此式即可推得公式,(8-11),。,类似地也可得到公式,(8-12),。,(8-13),这是当证据,E,自身也不确定时,求假设H的后验概率的计算公式。其中的,S,为与,E,有关的观察,即能够影响E的事件。公式(8-13)是一个线性插值函数,其中,P,(,H,|,E,),P,(,H,|,E,),P,(,E,),P(H)为公式中的已知值(前两个由公式(8-11)、(8-12)计算而得,后两个由专家直接给出);,P,(,E,|,S,)为公式中的变量(其值由用户给出或由前一个规则,S,E,求得)。这个插值函数的几何解释如图8-2所示。,图,8-2,线性插值函数的几何解释,由公式(8-13)和图8-2可以看出,当证据E自身也不确定时,假设,H,的后验概率是通过已知的,P,(H|,E,),P,(,E,),P,(,H,)和用户给出的概率,P,(,E,|,S,)或前一个规则,S,E,的中间结果而计算的。这也就是把原来的后验概率,P,(,H,|,E,)用后验概率,P,(,H,|,S,)来代替了。这相当于把,S,对,E,的影响沿规则的弧传给了,H,。,公式(8-13)是这样得来的:起初,Duda,等人证明了在某种合理的假定下,P(H|S),是,P(E|S),的线性函数,并且满足,:,P,(,H,|,E,)当,P,(,H,|,S,)=1时;,P,(,H,|,S,)=,当,P,(,H,|,S,)=0时;,P,(,H,),当,P,(,H,|,S,)=,P,(,E,),时,但由于,P,(,E,),P,(,H,)都是专家给出的主观概率,它们常常是不一致的,因此当P(E|S)P(E)时,按线性函数计算出的理论值,P,(,H,|,S,),P,c,(,H,)通常并不是专家给出的先验概率,P,(,H,)。当,P,(,E,),P,(,E,|,S,),P,(,H,),但按线性函数计算却是,P,(,H,|,S,),P,(,E,1,)=0.5,所以应采用公式,即,其中,P,(,H,1,),、,P,(,E,1,),已知,还需要计算,E,1,肯定存在的情况下的,P,(,H,1,|,E,1,),,我们直接采用前面例,1,的结果,于是有,例,8.10,设有规则,R,1,:if,E,1,then (200,0.02),H,R,2,:if,E,2,then (300,1),H,已知证据,E,1,和,E,2,必然发生,并且,P,(,H,)=0.04,,求,H,的后验概率,P,(,H,|,E,1,E,2,),。,解,由,P,(,H,)=0.04,,有,O(,H,)=0.04/(1-0.04)0.04,由,R,1,有,O(,H,|,E,1,)=,LS,1,O(,H,)=2000.04=8,由,R,2,有,O(,H,|,E,2,)=,LS,2,O(,H,)=3000.04=12,于是,从而,8.2.3,证,据理论,1.基本概念,1)识别框架,识别框架就是所考察判断的事物或对象的集合,记为。例如下面的集合都是识别框架:,1,晴天,多云,刮风,下雨,2,感冒,支气管炎,鼻炎,3,红,黄,蓝,4,80,90,100,识别框架的子集就构成求解问题的各种解答。这些子集也都可以表示为命题。证据理论就是通过定义在这些子集上的几种信度函数,来计算识别框架中诸子集为真的可信度。例如,在医疗诊断中,病人的所有可能的疾病集合构成识别框架,证据理论就从该病人的种种症状出发,计算病人患某类疾病(含多种病症并发)的可信程度。,2)基本概率分配函数,定义4给定识别框架,A2,,称m(A):2,0,1是2,上的一个基本概率分配函数(Function of Basic Probability Assignment),若它满足,(1),m,(,)0;,例8.11,设,a,b,c,其基本概率分配函数为,m,(a)0.4,m,(a,b)0,m,(a,c)0.4,m,(a,b,c)0.2,m,(b)0,m,(b,c)0,m,(c)0,可以看出,基本概率分配函数之值并非概率。如,m,(a),m,(b),m,(c)0.41,3.信任函数,定义2,给定识别框架,,称为2,上的信任函数(Function of Belief)。,信任函数表示对A为真的信任程度。所以,它就是证据理论的信度函数。信任函数也称为下限函数。,可以证明,信任函数有如下性质:,(1)Bel()0,Bel()1,且对于2中的任意元素A,有0Bel(A)1。,(2)信任函数为递增函数。即若 ,则Bel(A,1,)Bel(A,2,)。,(3)Bel(A)Bel(A)1(A为A的补集),例8.12 由例8.11可知,Bel(,a,,b)m(a)m(b)m(a,b)0.4000.4,4)似真函数,定义3,Pl,(,A,)1Bel(,A,)(,A,2,,A为A的补集)称为A的似真函数(Plausible function),函数值称为似真度。,似真函数又称为上限函数,它表示对A非假的信任程度。,例,8.13,由例,8.11,、例,8.12,可知,Pl,(,a,,,b,)1-Bel(,a,,,b,)1-(,c,)1-01,5)信任区间,定义4,设Bel(,A,)和,Pl,(,A,)分别表示,A,的信任度和似真度,称二元组,Bel(,A,),Pl,(,A,),为,A,的一个信任区间。,信任区间刻划了对A所持信任程度的上下限。如:,(1)1,1表示,A,为真(Bel(,A,),Pl,(,A,)1)。,(2)0,0表示,A,为假(Bel(,A,),Pl,(,A,)0)。,(3)0,1表示对A完全无知。因为Bel(A)0,说明对A不信任;而Bel(A)1-Pl(A)0,说明对A也不信任。,(4)1/2,1/2表示,A,是否为真是完全不确定的。,(5)0.25,0.85表示对,A,为真信任的程度为0.25;由Bel(,A,)=1-0.85=0.15表示对,A,也有一定程度的信任。,由上面的讨论,Pl,(,A,)-Bel(,A,)表示对,A,不知道的程度,即既非对A 信任又非不信任的那部分。,似真函数,Pl,具有下述性质:,(1),Pl,(,A,);,(2),Pl,(,A,),Pl,(,A,)1;,(3),Pl,(,A,),Bel,(,A,)。,这里,性质(1)指出似真函数也可以由基本概率分配函数构造,性质(2)指出A 的似真度与,A,的似真度之和不小于,1,性质,(3),指出,A,的似真度一定不小于,A,的信任度。,6)Dempster 组合规则,1)基本的组合规则。设,m,1,(,A,)和,m,2,(,A,)(,A,2,)是识别框架基于不同证据的两个基本概率分配函数,则将二者可按下面的 Dempster组合规则合并:,该表达式一般称为,m,1,与,m,2,的正交和,并记为,m,m,1,+,m,2,。不难证明,组合后的,m,(,A,)满足,例8.14,设识别框架a,b,c,若基于两组不同证据而导出的基本概率分配函数分别为:,m,1,(a)0.4,m,1,(a,c)0.4,m,1,(a,b,c)0.2,m,2,(a)0.6,m,2,(a,b,c)0.4,将,m,1,和,m,2,合并,m,1,(a)m,2,(a)m,1,(a)m,2,(a,b,c)m,1,(a,c)m,2,(a),m,1,(a,b,c)m,2,(a)0.76,m(a,c)m,1,(a,c)m,2,(a,b,c)0.16,m(a,b,c)m,1,(a,b,c)m,2,(a,b,c)0.08,2)含冲突修正的组合规则,上述组合规则在某些情况下会有问题。考察两个不同的基本概率分配函数,m,1,和,m,2,,若存在集合,B,、,C,,,B,C,,且,m,1,(,A,)0,,m,2,(,B,)0,这时使用 Dempster组合规则将导出,这与概率分配函数的定义冲突。这时,需将Dempster 组合规则进行如下修正,:,其中,K,为规范数,且,规范数K的引入,实际上是把空集所丢弃的正交和按比例地补到非空集上,使,m,(,A,)仍然满足,如果所有交集均为空集,则出现,K,,显然,Dempster组合规则在这种情况下将失去意义。,2.基于证据理论的不确定性推理,基于证据理论的不确定性推理,大体可分为以下步骤:,(1)建立问题的识别框架;,(2)给幂集2,定义基本概率分配函数;,(3)计算所关心的子集A2,(即的子集)的信任函数值Bel(,A,)、似真函数值,Pl,(,A,);,(4)由Bel(A)、,Pl,(,A,)得出结论。,例8.15 设有规则:,(1)如果流鼻涕则感冒但非过敏性鼻炎(0.9)或过敏性鼻炎但非感冒(0.1),(2)如果眼发炎则感冒但非过敏性鼻炎(0.8)或过敏性鼻炎但非感冒(0.05)括号中的数字表示规则前提对结论的支持程度。又有事实:,小王流鼻涕(0.9),小王眼发炎(0.4),括号中的数字表示事实的可信程度。,我们用证据理论求解这一医疗诊断问题。,首先,取识别框架,h,1,,,h,2,,,h,3,其中,,h,1,表示“感冒但非过敏性鼻炎”,,h,2,表示“过敏性鼻炎但非感冒”,,h,3,表示“同时得了两种病”。,再取下面的基本概率分配函数:,m,1,(h,1,)规则前提事实可信度规则结论可信度,0.90.90.81,m,1,(h,2,)0.90.10.09,m,1,(h,1,,h,2,,h,3,)1-m,1,(h,1,)-m,1,(h,2,)1-0.81-0.090.1 m,1,(A)0(A为的其他子集),m,2,(h,1,)0.40.80.32m,2,(h,2,)0.40.050.02m,2,(h,1,,h,,h,3,)1-m,2,(h,1,)-m,2,(h,2,)1-0.32-0.020.66,m,2,(A)0(A为的其他子集),将两个概率分配函数合并,K1/1-m,1,(h,1,)m,2,(h,2,)m,1,(h,2,)m,2,(h,1,),1/1-0.810.02+0.090.32 1/1-0.045,1/0.955,1.05,m(h,1,)Km,1,(h,1,)m,2,(h,1,)m,1,(h,1,)m,2,(h,1,,h,2,,h,3,m,1,(h,1,,h,2,,h,3,)m,2,(h,1,),1.050.82580.87,m(h,2,)Km,1,(h,2,)m,2,(h,2,)m,1,(h,2,)m,2,(h,1,,h,2,,h,3,m,1,(h,1,,h,2,,h,3,)m,2,(h,2,),1.050.06320.066,m(h,1,,h,2,,h,3,)1-m(h,1,)-m(h,2,),1-0.87-0.0660.064,由信任函数求信任度,Bel(h,1,)m(h,1,)0.87,Bel(h,2,)m(h,2,)0.066,由似真函数求似真度,P,l,(,h,1,)1-Bel(,h,1,)1-Bel(,h,2,,,h,3,),1-,m,(,h,2,m,(,h,3,),1-0.06600.934,Pl,(,h,2,)1-Bel(,h,2,)1-Bel(,h,1,,,h,3,),1-m(,h,1,)m(,h,3,),1-0.8700.13,于是,最后得到:,“感冒但非过敏性鼻炎”为真的信任度为0.87,非假的信任度为0.934;,“过敏性鼻炎但非感冒”为真的信任度为0.066,非假的信任度为0.13。,所以,看来该患者是感冒了。,证据理论是被推崇的处理随机性不确定性的好方法,受到人工智能特别是专家系统领域的广泛重视,并且已为许多专家系统所采用。,8.3 基于贝叶斯网络的概率推理,8.3.1 什么是贝叶斯网络,贝叶斯网络是一种以随机变量为节点,以条件概率为节点间关系强度的有向无环图(Directed Acyclic Graph,DAG)。具体来讲就是,贝叶斯网络的拓扑结构为一个不含回路的有向图,图中的节点表示随机变量,有向边描述了相关节点或变量之间的某种依赖关系,而且每个节点附一个条件概率表(Condition Probability Table,CPT),以刻画相关节点对该节点的影响,条件概率可视为节点之间的关系强度。有向边的发出端节点称为因节点(或父节点,),指向端节点称为果节点,(,或子节点,),。,例如,图8-3就是一个贝叶斯网络。其中A,B,C,D,E,F为随机变量;5条有向边描述了相关节点或变量之间的关系,;,每个节点的条件概率表如表,1,表,6,所示。,图,8-3,贝叶斯网络示意图,贝叶斯网络中的节点一般可代表事件、对象、属性或状态;有向边一般表示节点间的因果关系。贝叶斯网络也称因果网络(causal network)、信念网络(belief network)、概率网络(probability network)、知识图(knowledge map)等。它是描述事物之间因果关系或依赖关系的一种直观图形。所以,贝叶斯网络可作为一种不确定性知识的表示形式和方法。,8.3.2 用贝叶斯网络表示不确定性知识,下面我们举例说明如何用贝叶斯网络表示不确定性知识。,医学告诉我们:吸烟可能会患气管炎;感冒也会引起气管发炎,并还有发烧、头痛等症状;气管炎又会有咳嗽或气喘等症状。我们把这些知识表示为一个贝叶斯网络(如图8 4所示)。,图,8-4,用贝叶斯网络表示医学知识,为了便于叙述,我们将吸烟、感冒、气管炎、咳嗽、气喘分别记为:S,C,T,O,A。并将这几个变量的条件概率表用下面的概率表达式表示,:,P,(,S,)=0.4,,P,(,S,)=0.6;,P,(,C,)=0.8,,P,(,C,)=0.2;,P,(,T,|,S,C,)=0.35,,P,(,T,|,S,C,)=0.25,,P,(,T,|,S,C,)=0.011,,P,(,T,|,S,C,)=0.002;,P,(,O,|,T,)=0.85,,P,(,O,|,T,)=0.15;,P,(,A,|,T,)=0.50,,,P,(,A,|,T,)=0.10,。,8.3.3 基于贝叶斯网络的概率推理,根据贝叶斯网络的结构特征和语义特征,对于网络中的一些已知节点(称为证据变量),利用这种概率网络就可以推算出网络中另外一些节点(称为查询变量)的概率,即实现概率推理。具体来讲,基于贝叶斯网络可以进行因果推理、诊断推理、辩解和混合推理。,这几种概率推理过程将涉及到联合概率,(,即乘法公式,),和条件独立关系等概念。,联合概率,:设一个贝叶斯网络中全体变量的集合为,X,=,x,1,x,2,x,n,则这些变量的联合概率为,P,(,x,1,x,2,x,n,)=,P,(,x,1,),P,(,x,2,x,1,),P,(,x,3,x,1,x,2,),P,(,x,n,x,1,x,2,x,n-1,),(8-21),条件独立,:贝叶斯网络中任一节点与它的非祖先节点和非后代节点都是条件独立的。,下面我们就以图,8-4,所示的贝叶斯网络为例,介绍因果推理和诊断推理的一般方法。,1.因果推理,因果推理就是由原因到结果的推理,即已知网络中的祖先节点而计算后代节点的条件概率。,这种推理是一种自上而下的推理。,以图8-4所示的贝叶斯网络为例,假设已知某人吸烟(S),计算他患气管炎(T)的概率P(T|S)。首先,由于,T,还有另一个因节点感冒,(C),因此我们可以对概率,P(T|S),进行扩展,得,P,(,T,|,S,)=,P,(,T,C,|,S,)+,P,(,T,C,|,S,),(8-22),这是两个联合概率的和。意思是因吸烟而得气管炎的概率P(T|S)等于因吸烟而得气管炎且患感冒的概率,P(T,C|S),与因吸烟而得气管炎且未患感冒的概率,P,(,T,C,|S),之和。,接着,对(,8-22),式中的第一项,P,(,T,C,|,S,),作如下变形:,P,(,T,C,|,S,)=,P,(,T,C,S,)/,P,(,S,)(对,P,(,T,C,|,S,)逆向使用概率的乘法公式),=,P,(,T,|,C,S,),P,(,C,S,)/,P,(,S,)(对,P,(,T,C,S,)使用乘法公式),=,P,(,T,|,C,S,),P,(,C,|,S,)(对,P,(,C,S,)/,P,(,S,)使用乘法公式),=,P,(,T,|,C,S,),P,(,C,)(,因为,C,与,S,条件独立,),同理可得,(8-22),式中的第二项,P,(,T,C,|,S,)=,P,(,T,|,C,S,),P,(,C,),于是,P,(,T,|,S,)=,P,(,T,|,C,S,),P,(,C,)+,P,(,T,|,C,S,),P,(,C,),(8-23),可以看出,这个等式右端的概率值在图8-4中的CPT中已给出,即都为已知。,现在,将这些概率值代入,(8-23),式右端便得,P,(,T,|,S,)=0.350.8+0.0110.2=0.2822,即吸烟可引起气管炎的概率为,0.2822,。,由这个例子我们给出因果推理的一个种思路和方法:,(1)首先,对于所求的询问节点的条件概率,用所给证据节点和询问节点的所有因节点的联合概率进行重新表达。,(2)然后,对所得表达式进行适当变形,直到其中的所有概率值都可以从问题贝叶斯网络的CPT中得到。,(3),最后,将相关概率值代入概率表达式进行计算即得所求询问节点的条件概率。,2.诊断推理,诊断推理就是由结果到原因的推理,即已知网络中的后代节点而计算祖先节点的条件概率。这种推理是一种自下而上的推理。,诊断推理的一般思路和方法是,先利用贝叶斯公式将诊断推理问题转化为因果推理问题;再用因果推理的结果,导出诊断推理的结果。,我们仍以图8-4所示的贝叶斯网络为例,介绍诊断推理。假设已知某人患了气管炎(,T,),计算他吸烟(,S,)的后验概率,P,(,S,|,T,)。,由贝叶斯公式,有,
展开阅读全文