1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,应用多元统计分析,第六章部分习题解答,1,2,第六章 聚类分析,6-1,证明下列结论,:,(1),两个距离的和所组成的函数仍是距离,;,(2),一个正常数乘上一个距离所组成的函数仍是距离,;,(3),设,d,为一个距离,c,0,为常数,则,仍是一个距离,;,(4),两个距离的乘积所组成的函数不一定是距离,;,3,第六章 聚类分析,(2),设,d,是,距离,a,0,为,正常数,.,令,d*=ad,显然有,4,第六章 聚类分析,故,d*=ad,是一个距离,.,(3),设,d,为一个距离,c,0,为常数,显然有,
2、5,第六章 聚类分析,故,d*,是一个距离,.,6,第六章 聚类分析,7,第六章 聚类分析,6-2,试证明二值变量的相关系数为,(6.2.2),式,夹角余弦为,(6.2.3),式,.,证明:,设变量,X,i,和,X,j,是二值变量,它们的,n,次观测值记为,x,ti,x,tj,(,t,=1,n,).,x,ti,x,tj,的值或为,0,,或为,1.,由二值变量的列联表(表,6.5,)可知:变量,X,i,取值,1,的观测次数为,a,+,b,取值,0,的观测次数为,c,+,d,;,变量,X,i,和,X,j,取值均为,1,的观测次数为,a,取值均为,0,的观测次数为,d,等等。利用两定量变量相关系数的
3、公式:,8,第六章 聚类分析,9,第六章 聚类分析,故二值变量的相关系数为:,(6.2.2),10,第六章 聚类分析,利用两定量变量夹角余弦的公式:,其中,故有,11,第六章 聚类分析,6-3,下面是,5,个样品两两间的距离阵,试用最长距离法、类平均法作系统聚类,并画出谱系聚类图,.,解,:,用最长距离法,:,合并,X,(1),X,(4),=CL4,并类距离,D,1,=1.,12,第六章 聚类分析,合并,X,(2),X,(5),=CL3,并类距离,D,2,=3.,合并,CL3,CL4=CL2,并类距离,D,3,=8.,所有样品合并为一类,CL1,并类距离,D,4,=10.,13,第六章 聚类分
4、析,最长距离法的谱系聚类图如下,:,14,第六章 聚类分析,合并,X,(1),X,(4),=CL4,并类距离,D,1,=1.,用类平均法,:,15,第六章 聚类分析,合并,X,(2),X,(5),=CL3,并类距离,D,2,=3.,合并,CL3,CL4=CL2,并类距离,D,3,=(165/4),1/2,.,所有样品合并为一类,CL1,并类距离,D,4,=(121/2),1/2,.,16,第六章 聚类分析,类平均法的谱系聚类图如下,:,17,第六章 聚类分析,6-4,利用距离平方的递推公式,来证明当,0,p,0,q,0,p,+,q,+,1,时,系统聚类中的类平均法、可变类平均法、可变法、,Wa
5、rd,法的单调性,.,证明:,设第,L,次合并,G,p,和,G,q,为新类,G,r,后,并类距离,D,L,D,pq,且必有,D,pq,2,D,ij,2,.,新类,G,r,与其它类,G,k,的距离平方的递推公式,当,0,p,0,q,0,p,+,q,+,1,时,这表明新的距离矩阵中类间的距离均,D,pq,D,L,,故有,D,L,1,D,L,,即相应的聚类法有单调性,.,18,第六章 聚类分析,对于类平均法,因,故类平均法具有单调性。,对于可变类平均法,因,故可变类平均法具有单调性。,19,第六章 聚类分析,对于可变法,因,故可变法具有单调性。,对于离差平方和法,因,故离差平方和法具有单调性。,20
6、,第六章 聚类分析,6-5,试从定义直接证明最长和最短距离法的单调性,.,证明:,先考虑最短距离法:,设第,L,步从类间距离矩阵,出发,假设,故合并,G,p,和,G,q,为一新类,G,r,,这时第,L,步的并类距离,:,且新类,G,r,与其它类,G,k,的距离由递推公式可知,设第,L+,1,步从类间距离矩阵,出发,,21,第六章 聚类分析,故第,L,1,步的并类距离,:,即最短距离法具有单调性,.,类似地,可以证明最长距离法也具有单调性,.,22,第六章 聚类分析,6-6,设,A,B,C,为平面上三个点,它们之间的距离为,将三个点看成三个二维样品,试用此例说明中间距离法和重心法不具有单调性,.
7、,解,:,按中间距离法,取,=-1/4,将,B,和,C,合并为一类后,并类距离,D,1,=1,而,A,与新类,G,r,=B,C,的类间平方距离为,23,第六章 聚类分析,故中间距离法不具有单调性。,按重心法,将,B,和,C,合并为一类后,并类距离,D,1,=1,而,A,与新类,G,r,=B,C,的类间平方距离为,当把,A,与,B,,,C,并为一类时,并类距离,24,第六章 聚类分析,故,重心法,法不具有单调性。,并类过程如下:,当把,A,与,B,,,C,并为一类时,并类距离,A,B,C,25,第六章 聚类分析,解一,:,利用,如果样品间的距离定义为欧氏距离,则有,6-7,试推导重心法的距离递推
8、公式,(6.3.2);,26,第六章 聚类分析,27,第六章 聚类分析,28,第六章 聚类分析,解二,:,因样品间的距离定义为欧氏距离,利用,29,第六章 聚类分析,利用,30,第六章 聚类分析,故有,31,第六章 聚类分析,6-8,试推导,Ward,法的距离递推公式,(6.3.3);,解:,Ward,法把两类合并后增加的离差平方和看成类间的平方距离,即把类,G,p,和,G,q,的平方距离定义为,利用,W,r,的定义,:,32,第六章 聚类分析,33,第六章 聚类分析,34,第六章 聚类分析,(,当样品间的距离定义为欧氏距离时),记,G,r,G,p,G,q,则新类,G,r,与其它类,G,k,的
9、平方距离为,利用重心法的递推公式,(6-7,题已证明,),可得:,35,第六章 聚类分析,36,第六章 聚类分析,6-9,设有,5,个样品,对每个样品考察一个指标得数据为,1,,,2,5,7,10.,试用离差平方和法求,5,个样品分为,k,类,(,k,5,4,3,,,2,1),的分类法,b,k,及相应的总离差平方和,W,(,k,).,解:,计算样品间的欧氏平方距离阵,合并,1,2,CL4,并类距离,D,1,=(0.5),1/2,=0.707,,并利用递推公式计算新类与其它类的平方距离得,37,第六章 聚类分析,合并,5,7,CL3,并类距离,D,2,=(2),1/2,=1.414,,并利用递推
10、公式计算新类与其它类的平方距离得,合并,CL3,10=5,7,10,CL2,并类距离,D,3,=(32/3),1/2,=3.266,,并利用递推公式计算新类与其它类的平方距离得,38,第六章 聚类分析,合并,CL4,CL2=1,2,5,7,10,CL1,并类距离,D,4,=(245/6),1/2,=,6.39,,并利用递推公式计算新类与其它类的平方距离得,分类法,b,k,及相应的总离差平方和,W,(,k,):,k,=5,1,2,5,7,10,W(5)=0,k,=4,1,2,5,7,10,W(4)=0.5,k,=3,1,2,5,7,10,W(3)=2.5,k,=2,1,2,5,7,10,W(2)=13.666,k,=1,1,2,5,7,10,W(1)=54,