1、第第 2 章章含糊聚类分析含糊聚类分析第1页2.1 含糊矩阵含糊矩阵 定义定义1 设设R=(rij)mn,若,若0rij1,则称,则称R为为含含糊矩阵糊矩阵.当当rij只取只取0或或1时,称时,称R为为布尔布尔(Boole)矩矩阵阵.当含糊方阵当含糊方阵R=(rij)nn对角线上元素对角线上元素rii都为都为1时,称时,称R为为含糊自反矩阵含糊自反矩阵.定义定义2 设设A=(aij)mn,B=(bij)mn都都是含糊矩阵,是含糊矩阵,相等相等:A=B aij=bij;包含包含:AB aijbij;并并:AB=(aijbij)mn;交交:AB=(aijbij)mn;余余:Ac=(1-aij)mn
2、.第2页含糊矩阵并、交、余运算性质含糊矩阵并、交、余运算性质幂等律:幂等律:AA=A,AA=A;交换律:交换律:AB=BA,AB=BA;结合律:结合律:(AB)C=A(BC),(AB)C=A(BC);吸收律:吸收律:A(AB)=A,A(AB)=A;分配律:分配律:(AB)C=(AC)(BC);(AB)C=(AC)(BC);0-10-1律:律:AO=A,AO=O;AE=E,AE=A;还原律:还原律:(Ac)c=A;对偶律:对偶律:(AB)c=AcBc,(AB)c=AcBc.第3页含糊矩阵合成运算与含糊方阵幂含糊矩阵合成运算与含糊方阵幂 设设A=(aik)ms,B=(bkj)sn,定义含糊矩阵,定
3、义含糊矩阵A 与与B 合成为:合成为:A B=(cij)mn,其中其中cij=(aikbkj)|1ks.含糊方阵幂含糊方阵幂 定义:若定义:若A为为 n 阶方阵,定义阶方阵,定义A2=A A,A3=A2 A,Ak=Ak-1 A.第4页合成合成()运算性质:运算性质:性质性质1:(A B)C=A (B C);性质性质2:Ak Al=Ak+l,(Am)n=Amn;性质性质3:A (BC)=(A B)(A C);(BC)A=(B A)(C A);性质性质4:O A=A O=O,I A=A I=A;性质性质5:AB,CD A C B D.注:合成注:合成()运算关于运算关于()分配律不成立,即分配律不
4、成立,即(AB)C (A C)(B C)第5页(AB)C(A C)(B C)(AB)C (A C)(B C)第6页含糊矩阵转置含糊矩阵转置 定义定义 设设A=(aij)mn,称称AT=(aijT)nm为为A转置转置矩阵,其中矩阵,其中aijT=aji.转置运算性质:转置运算性质:性质性质1:(AT)T=A;性质性质2:(AB)T=ATBT,(AB)T=ATBT;性质性质3:(A B)T=BT AT;(An)T=(AT)n;性质性质4:(Ac)T=(AT)c;性质性质5:AB AT BT.第7页证实性质证实性质3:(A B)T=BT AT;(An)T=(AT)n.证实证实:设:设A=(aij)m
5、s,B=(bij)sn,A B=C=(cij)mn,记记(A B)T=(cijT)nm,AT=(aijT)sm,BT=(bijT)ns,由转置定义知由转置定义知,cijT=cji,aijT=aji,bijT=bji.BT AT=(bikTakjT)nm =(bkiajk)nm =(ajkbki)nm=(cji)nm =(cijT)nm=(A B)T.第8页含糊矩阵含糊矩阵 -截矩阵截矩阵 定义定义7 设设A=(aij)mn,对任意对任意 0,1,称,称A=(aij()mn,为含糊矩阵为含糊矩阵A -截矩阵截矩阵,其中其中 当当aij 时,时,aij()=1;当;当aij 时,时,aij()=0
6、.显然,显然,A -截矩阵为布尔矩阵截矩阵为布尔矩阵.第9页对任意对任意 0,1,有,有性质性质1:AB A B;性质性质2:(AB)=A B,(AB)=A B;性质性质3:(A B)=A B;性质性质4:(AT)=(A )T.下面证实性质下面证实性质1:AB A B 和性质和性质3.性质性质1证实:证实:AB aijbij;当当 aijbij时,时,aij()=bij()=1;当当aij bij时,时,aij()=0,bij()=1;当当aijbij 时,时,aij()=bij()=0;总而言之总而言之aij()bij()时,时,故故A B .第10页性质性质3证实:证实:设设A=(aij)
7、ms,B=(bij)sn,A B=C=(cij)mn,cij()=1 cij (aikbkj)k,(aikbkj)k,aik ,bkj k,aik()=bkj()=1 (aik()bkj()=1cij()=0 cij (aikbkj)k,(aikbkj)k,aik 或或 bkj k,aik()=0或或bkj()=0(aik()bkj()=0所以所以,cij()=(aik()bkj().(A B)=A B .第11页2.2 含糊关系含糊关系 与含糊子集是经典集合推广一样,含糊关系与含糊子集是经典集合推广一样,含糊关系是普通关系推广是普通关系推广.设有论域设有论域X,Y,X Y 一个含糊子集一个含
8、糊子集 R 称为称为从从 X 到到 Y 含糊关系含糊关系.含糊子集含糊子集 R 隶属函数为映射隶属函数为映射R:X Y 0,1.并称隶属度并称隶属度R(x,y)为为(x,y)关于含糊关系关于含糊关系 R 相关程度相关程度.尤其地,当尤其地,当 X=Y 时,时,称之为称之为 X 上各元素之上各元素之间间含糊关系含糊关系.第12页含糊关系运算含糊关系运算 因为因为含糊关系含糊关系 R就是就是X Y 一个含糊子集,所一个含糊子集,所以含糊关系一样含有含糊子集以含糊关系一样含有含糊子集运算及性质运算及性质.设设R,R1,R2均为从均为从 X 到到 Y 含糊关系含糊关系.相等相等:R1=R2 R1(x,
9、y)=R2(x,y);包含包含:R1 R2 R1(x,y)R2(x,y);并并:R1R2 隶属函数为隶属函数为(R1R2)(x,y)=R1(x,y)R2(x,y);交交:R1R2 隶属函数为隶属函数为(R1R2)(x,y)=R1(x,y)R2(x,y);余余:Rc 隶属函数为隶属函数为Rc(x,y)=1-R(x,y).第13页 (R1R2)(x,y)表示表示(x,y)对含糊关系对含糊关系“R1或或者者R2”相关程度,相关程度,(R1R2)(x,y)表示表示(x,y)对含对含糊关系糊关系“R1且且R2”相关程度,相关程度,Rc(x,y)表示表示(x,y)对含糊关系对含糊关系“非非R”相关程度相关
10、程度.含糊关系矩阵表示含糊关系矩阵表示 对于有限论域对于有限论域 X=x1,x2,xm和和Y=y1,y2,yn,则,则X 到到Y 含糊关系含糊关系R可用可用mn 阶阶含糊矩阵表示,即含糊矩阵表示,即R=(rij)mn,其中其中rij=R(xi,yj)0,1表示表示(xi,yj)关于含糊关于含糊关系关系R 相关程度相关程度.又若又若R为布尔矩阵时为布尔矩阵时,则关系则关系R为普通关系为普通关系,即即xi 与与 yj 之间要么相关系之间要么相关系(rij=1),要么没相关系要么没相关系(rij=0).第14页 例例 设身高论域设身高论域X=140,150,160,170,180(单位:单位:cm)
11、,体重论域体重论域Y=40,50,60,70,80(单位:单位:kg),下表给出了身高与体重含糊关系下表给出了身高与体重含糊关系.405060708014010.80.20.101500.810.80.20.11600.20.810.80.21700.10.20.810.818000.10.20.81第15页含糊关系合成含糊关系合成 设设 R1 是是 X 到到 Y 关系关系,R2 是是 Y 到到 Z 关系关系,则则R1与与 R2合成合成 R1 R2是是 X 到到 Z 上一个关系上一个关系.(R1R2)(x,z)=R1(x,y)R2(y,z)|yY 当论域为有限时,含糊关系合成化为含糊矩当论域为
12、有限时,含糊关系合成化为含糊矩阵合成阵合成.设设X=x1,x2,xm,Y=y1,y2,ys,Z=z1,z2,zn,且,且X 到到Y 含糊含糊关系关系R1=(aik)ms,Y 到到Z 含糊含糊关系关系R2=(bkj)sn,则,则X 到到Z 含含糊糊关系可表示为关系可表示为含糊含糊矩阵合成:矩阵合成:R1 R2=(cij)mn,其中其中cij=(aikbkj)|1ks.第16页含糊关系合成运算性质含糊关系合成运算性质性质性质1:(A B)C=A (B C);性质性质2:A (BC)=(A B)(A C);(BC)A=(B A)(C A);性质性质3:(A B)T=BT AT;性质性质4:A B,C
13、 D A C B D.注:注:(1)合成合成()运算关于运算关于()分配律不成立分配律不成立,即即(AB)C (A C)(B C)(2)这些性质在有限论域情况下这些性质在有限论域情况下,就是含糊矩就是含糊矩阵合成运算性质阵合成运算性质.第17页2.3 含糊等价矩阵含糊等价矩阵含糊等价关系含糊等价关系 若含糊关系若含糊关系R是是X上上各元素之间各元素之间含糊关系,且含糊关系,且满足:满足:(1)(1)自反性:自反性:R(x,x)=1;(2)(2)对称性:对称性:R(x,y)=R(y,x);(3)(3)传递性:传递性:R2 R,则称则称含糊关系含糊关系R是是X上上一个一个含糊等价关系含糊等价关系.
14、当论域当论域X=x1,x2,xn为有限时为有限时,X 上一上一个个含糊等价关系含糊等价关系R就是含糊等价矩阵就是含糊等价矩阵,即即R满足:满足:I R(rii=1)RT=R(rij=rji)R2R.R2R(rikrkj)|1kn rij).第18页含糊等价矩阵基本定理含糊等价矩阵基本定理 定理定理1 若若R含有自反性含有自反性(IR)和传递性和传递性(R2R),则则 R2=R.定理定理2 若若R是含糊等价矩阵是含糊等价矩阵,则则对任意对任意 0,1,R 是等价是等价Boole矩阵矩阵.0,1,ABA B;(AB)=A B;(AT)=(A)T 证实以下:证实以下:(1)(1)自反性:自反性:IR
15、 0,1,I R 0,1,I R,即,即R 含有含有自反性;自反性;(2)(2)对称性对称性:RT=R(RT)=R (R)T=R,即,即R 含有含有对称性;对称性;(3)(3)传递性传递性:R2R(R)2R,即,即R 含有含有传传递性递性.第19页 定理定理3 若若R是含糊等价矩阵是含糊等价矩阵,则对任意则对任意0 1,R 所决定分类中每一个类是所决定分类中每一个类是R 决定分类中某个类子类决定分类中某个类子类.证实:对于论域证实:对于论域 X=x1,x2,xn,若,若 xi,xj 按按R 分在一类,则有分在一类,则有rij()=1 rij rij rij()=1,即若即若 xi,xj 按按R
16、 也分在一类也分在一类.所以,所以,R 所决定分类中每一个类是所决定分类中每一个类是R 决定分决定分类中某个类子类类中某个类子类.第20页含糊相同关系含糊相同关系 若含糊关系若含糊关系 R 是是 X 上各元素之间上各元素之间含糊关系,含糊关系,且满足:且满足:(1)自反性:自反性:R(x,x)=1;(2)对称性:对称性:R(x,y)=R(y,x);则称则称含糊关系含糊关系 R 是是 X 上一个上一个含糊相同关系含糊相同关系.当论域当论域X=x1,x2,xn为有限时,为有限时,X 上一上一个个含糊相同关系含糊相同关系 R 就是含糊相同矩阵,即就是含糊相同矩阵,即R满足:满足:(1)自反性:自反性
17、:I R(rii=1);(2)对称性:对称性:RT=R(rij=rji).第21页含糊相同矩阵性质含糊相同矩阵性质 定理定理1 若若R 是含糊相同矩阵,则对任意自然是含糊相同矩阵,则对任意自然数数 k,Rk 也是含糊相同矩阵也是含糊相同矩阵.定理定理2 若若R 是是n阶含糊相同矩阵,则存在一阶含糊相同矩阵,则存在一个最小自然数个最小自然数 k(kn),对于一切大于,对于一切大于k 自然数自然数 l,恒有,恒有Rl=Rk,即,即Rk 是含糊等价矩阵是含糊等价矩阵(R2k=Rk).此时称此时称Rk为为R传递闭包,记作传递闭包,记作 t(R)=Rk.上述定理表明,任一个含糊相同矩阵可诱导上述定理表明
18、,任一个含糊相同矩阵可诱导出一个含糊等价矩阵出一个含糊等价矩阵.平方法求传递闭包平方法求传递闭包 t(R):RR2R4R8R16第22页2.4 含糊聚类分析含糊聚类分析数据标准化数据标准化 设论域设论域X=x1,x2,xn为被分类对象为被分类对象,每每个对象又由个对象又由m个指标表示其形状个指标表示其形状:xi=xi1,xi2,xim,i=1,2,n于是于是,得到原始数据矩阵为得到原始数据矩阵为第23页平移平移 标准差变换标准差变换其中其中平移平移 极差变换极差变换第24页含糊相同矩阵建立方法含糊相同矩阵建立方法相同系数法相同系数法-夹角余弦法夹角余弦法第25页相同系数法相同系数法-相关系数法
19、相关系数法其中其中第26页距离法距离法rij=1 c d(xi,xj)其中其中c为适当选取参数为适当选取参数.海明距离海明距离欧氏距离欧氏距离切比雪夫距离切比雪夫距离d(xi,xj)=|xik-xjk|,1km第27页Boole矩阵法:矩阵法:定理:设定理:设 R 是论域是论域 X=x1,x2,xn上一上一个相同个相同 Boole 矩阵,则矩阵,则 R 含有传递性含有传递性(当当R是等是等价价Boole矩阵时矩阵时)矩阵矩阵 R 在任一排列下矩阵都在任一排列下矩阵都没有形如没有形如特殊子矩阵特殊子矩阵.第28页Boole矩阵法步骤以下:矩阵法步骤以下:(1)求含糊相同矩阵求含糊相同矩阵 -截矩
20、阵截矩阵R ;(2)若若R 在某一排列下矩阵有形如在某一排列下矩阵有形如特殊子矩阵特殊子矩阵,则将则将R 中上述特殊形式子矩阵中上述特殊形式子矩阵0改为改为1,直到在任一排列下,直到在任一排列下R 中不再产生上述特殊形式中不再产生上述特殊形式子矩阵为止子矩阵为止.第29页最佳分类确定 在含糊聚类分析中,对于各个不一样在含糊聚类分析中,对于各个不一样 0,10,1,可得到不一样分类,从而形成,可得到不一样分类,从而形成一个动态聚类图,这对全方面了解样本分一个动态聚类图,这对全方面了解样本分类情况是比较形象和直观类情况是比较形象和直观.但在许多实际问题中,需要给出样本但在许多实际问题中,需要给出样
21、本一个详细分类,这就提出了怎样确定最正一个详细分类,这就提出了怎样确定最正确分类问题确分类问题.第30页 设设X=(xij)nm为为n个元素个元素m个指标原始数据矩个指标原始数据矩阵阵.为总体样本中心向量为总体样本中心向量.对应于对应于 值分类数为值分类数为r,第,第 j 类样本数为类样本数为nj,第第 j 类样本标识为类样本标识为第第 j 类样本中心向量为类样本中心向量为作作F-统计量:统计量:第31页 假如满足不等式假如满足不等式FF (r-1,n-r)F值不止值不止一个,则可依据实际情况选择一个满意分类,或一个,则可依据实际情况选择一个满意分类,或者深入考查差者深入考查差(F-F )/F 大小,从较大者中找大小,从较大者中找一个满意一个满意F值即可值即可.实际上,最正确分类确实定方法与聚类方法实际上,最正确分类确实定方法与聚类方法无关,不过选择很好聚类方法,能够较快地找到无关,不过选择很好聚类方法,能够较快地找到比较满意分类比较满意分类.第32页第33页