资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,应用多元统计分析,第二章部分习题解答,1,第1页,第1页,第二章 多元正态分布及参数预计,2-1 设3维随机向量,X,N,3,(,2,I,3,),已知,试求,Y,=,AX+d,分布.,解:,利用性质2,即得二维随机向量,YN,2,(,y,y,),其中:,2,第2页,第2页,第二章 多元正态分布及参数预计,2-2 设,X,=(,X,1,X,2,)N,2,(,),其中,(1)试证实,X,1,+,X,2,和,X,1,-,X,2,互相独立.,(2)试求,X,1,+,X,2,和,X,1,-,X,2,分布.,解,:,(1),记,Y,1,X,1,+,X,2,(1,1),X,Y,2,X,1,-,X,2,(1,-1),X,,,利用性质2可知,Y,1,Y,2,为正态随机变量。又,故,X,1,+,X,2,和,X,1,-,X,2,互相独立.,3,第3页,第3页,第二章 多元正态分布及参数预计,或者记,由定理2.3.1可知,X,1,+,X,2,和,X,1,-,X,2,互相独立.,4,第4页,第4页,第二章 多元正态分布及参数预计,(2)因,5,第5页,第5页,第二章 多元正态分布及参数预计,2-3 设,X,(1),和,X,(2),均为,p,维随机向量,已知,其中,(,i,),(,i,1,2)为,p,维向量,i,(,i,1,2)为,p,阶矩阵,,(1)试证实,X,(1),+,X,(2),和,X,(1),-,X,(2),互相独立.,(2)试求,X,(1),+,X,(2),和,X,(1),-,X,(2),分布.,解,:(1),令,6,第6页,第6页,第二章 多元正态分布及参数预计,由定理2.3.1可知,X,(1),+,X,(2),和,X,(1),-,X,(2),互相独立.,7,第7页,第7页,第二章 多元正态分布及参数预计,(2)因,因此,注意:由D(,X,)0,可知(,1,-,2,)0.,8,第8页,第8页,第二章 多元正态分布及参数预计,2-11 已知,X,=(,X,1,X,2,)密度函数为,试求,X,均值和协方差阵.,解一,:求边沿分布及Cov(,X,1,X,2,)=,12,9,第9页,第9页,第二章 多元正态分布及参数预计,类似地有,10,第10页,第10页,第二章 多元正态分布及参数预计,0,11,第11页,第11页,第二章 多元正态分布及参数预计,因此,故,X,=(,X,1,X,2,),为二元正态分布.,12,第12页,第12页,第二章 多元正态分布及参数预计,解二,:比较系数法,设,比较上下式相应系数,可得:,13,第13页,第13页,第二章 多元正态分布及参数预计,故,X,=(,X,1,X,2,),为二元正态随机向量.且,解三,:两次配办法,14,第14页,第14页,第二章 多元正态分布及参数预计,即,设函数 是随机向量,Y,密度函数.,15,第15页,第15页,第二章 多元正态分布及参数预计,(4)由于,故,(3)随机向量,16,第16页,第16页,第二章 多元正态分布及参数预计,2-12 设,X,1,N(0,1),令,证实,X,2,N(0,1);,证实(,X,1,X,2,)不是二元正态分布.,证实,(1):任给,x,当,x,-1时,当,x,1时,17,第17页,第17页,第二章 多元正态分布及参数预计,当-1,x,1时,(2)考虑随机变量,Y=X,1,-,X,2,显然有,18,第18页,第18页,第二章 多元正态分布及参数预计,若,(,X,1,X,2,)是二元正态分布,则由性质4可知,它任意线性组合必为一元正态.但,Y=X,1,-,X,2,不是正态分布,故(,X,1,X,2,)不是二元正态分布.,19,第19页,第19页,第二章 多元正态分布及参数预计,2-17 设,X,N,p,(,),0,X,密度函数记为,f,(,x,;,).(1)任给,a,0,试证实概率密度等高面,f,(,x,;,)=,a,是一个椭球面.,(2)当,p,=2且,(,0)时,,概率密度等高面就是平面上一个椭圆,试求该椭圆方程式,长轴和短轴.,证实(1):,任给,a,0,记,20,第20页,第20页,第二章 多元正态分布及参数预计,令 ,则概率密度等高面为,(见附录5 P390),21,第21页,第21页,第二章 多元正态分布及参数预计,故概率密度等高面,f,(,x,;,)=,a,是一个椭球面.,(2),当,p,=2且,(,0)时,由,可得,特性值,22,第22页,第22页,第二章 多元正态分布及参数预计,i,(,i,=1,2)相应特性向量为,由(1)可得椭圆方程为,长轴半径为 方向沿着,l,1,方向(,b,0);,短轴半径为 方向沿着,l,2,方向.,23,第23页,第23页,第二章 多元正态分布及参数预计,2-19 为了理解某种橡胶性能,今抽了十个样品,每个测量了三项指标:硬度、变形和弹性,其数据见表。试计算样本均值,样本离差阵,样本协差阵和样本相关阵.,解:,24,第24页,第24页,第二章 多元正态分布及参数预计,25,第25页,第25页,应用多元统计分析,第三章习题解答,26,第26页,第26页,第三章 多元正态总体参数假设检查,3-1 设,X,N,n,(,2,I,n,),A,为对称幂等阵,且,rk(,A,)=,r,(,rn,),证实,证实,因,A,为对称幂等阵,而对称幂等阵特性值非0即1,且只有,r,个非0特性值,即存在正交阵,(,其列向量,r,i,为相应特性向量),使,27,第27页,第27页,第三章 多元正态总体参数检查,28,第28页,第28页,其中非中心参数为,第三章 多元正态总体参数检查,29,第29页,第29页,3-2 设,X,N,n,(,2,I,n,),A,B,为,n,阶对称阵.若,AB,0,证实,XAX,与,XBX,互相独立.,证实思绪:,记,rk(,A,)=,r,.,因,A,为,n,阶对称阵,存在正交阵,使得,A,=,diag(,1,r,0,.,0),令,Y,X,,,则,Y,N,n,(,2,I,n,),第三章 多元正态总体参数检查,且,30,第30页,第30页,又由于,X,BX,=,Y,B,Y,=,Y,HY,其中,H,=,B,。假如能够证实,X,BX,可表示为,Y,r,+1,,,Y,n,函数,即,H,只是右下子块为非0矩阵。,则,X,AX,与,X,BX,互相独立。,第三章 多元正态总体参数检查,31,第31页,第31页,证实,记,rk(,A,)=,r,.,若,r=n,由,AB,O,知,B,O,nn,于是,XAX,与,XBX,独立;,若,r,=0,时,则,A,0,则两个二次型也是独立.,下列设0,r,n.,因,A,为,n,阶对称阵,存在正交阵,使得,第三章 多元正态总体参数检查,32,第32页,第32页,其中,i,0,为,A,特性值(,i,=1,r,).,于是,令,r,第三章 多元正态总体参数检查,由,AB,O,可得,D,r,H,11,O,,,D,r,H,12,O,.,因,D,r,为满秩阵,故有,H,11,O,rr,,,H,12,O,r(n-r),.,由于,H,为对称阵,因此,H,21,O,(n-r)r,.,于是,33,第33页,第33页,由于,Y,1,,,Y,r,Y,r+1,Y,n,互相独立,故,XAX,与,XBX,互相独立.,第三章 多元正态总体参数检查,令,Y,X,,,则,Y,N,n,(,2,I,n,),且,34,第34页,第34页,设,X,N,p,(,),0,A,和,B,为,p,阶对称阵,试证实,(,X,-,),A,(,X,-,),与(,X,-,),B,(,X,-),互相,独立,A,B,0,pp,.,第三章 多元正态总体参数检查,3-3,35,第35页,第35页,由“1.结论6”知,与,互相独立,第三章 多元正态总体参数检查,36,第36页,第36页,性质,4,分块Wishart矩阵分布:设,X,(,),N,p,(0,)(,1,n,)互相独立,其中,又已知随机矩阵,则,第三章 多元正态总体参数检查,试证实Wishart分布性质(4)和T,2,分布性质(5).,3-4,37,第37页,第37页,第三章 多元正态总体参数检查,证实,:设,记,则,即,38,第38页,第38页,第三章 多元正态总体参数检查,当,12,=,O,时,对,1,2,n,互相 独立.故有,W,11,与,W,22,互相独立.,由定义3.1.4可知,39,第39页,第39页,性质5,在非退化线性变换下,T,2,统计量保持不变.,证实:,设,X,(,),(,1,n,),是来自,p,元总体N,p,(,)随机样本,X,和,A,x,分别表示正态总体,X,样本均值向量和离差阵,则由性质1有,第三章 多元正态总体参数检查,令,其中,C,是,p,p,非退化常数矩阵,,d,是,p,1,常向量。则,40,第40页,第40页,第三章 多元正态总体参数检查,因此,41,第41页,第41页,第三章 多元正态总体参数检查,3-5,对单个,p,维正态总体N,p,(,)均值向量检查问题,试用似然比原理导出检查H,0,:=,0,(=,0,已知)似然比统计量及分布.,解:,总体,X,N,p,(,0,)(,0,0),设,X,(,),(=1,n,)(,n,p,)为来自,p,维正态总体,X,样本.,似然比统计量为,P66当,=,0,已知,检查,42,第42页,第42页,第三章 多元正态总体参数检查,43,第43页,第43页,第三章 多元正态总体参数检查,44,第44页,第44页,第三章 多元正态总体参数检查,因,因此由3,“,一2.结论1,”,可知,45,第45页,第45页,第三章 多元正态总体参数检查,3-6,(均值向量各分量间结构关系检查)设总体,X,N,p,(,)(0),X,(,),(1,n,)(,n,p,)为来自,p,维正态总体X样本,记(,1,p,).,C,为,k,p,常数(,k,p,),rank(,C,)=,k,r,为已知,k,维向量.试给出检查H,0,:C,r,检查统计量及分布.,解:,令,则,Y,(,),(1,n,),为来自,k,维正态总体,Y,样本,且,46,第46页,第46页,第三章 多元正态总体参数检查,检查,这是单个,k,维正态总体均值向量检查问题.利用3.2当,y,=,C,C,未知时均值向量检查给出结论,取检查统计量:,47,第47页,第47页,第三章 多元正态总体参数检查,3-7,设总体XNp(,)(0),X,(,),(1,n,)(,n,p,)为来自,p,维正态总体X样本,样本均值为X,样本离差阵为A.记(,1,p,).为检查H,0,:,1,=,2,=,p,H,1,:,1,2,p,至少有一对不相等.令,则上面假设等价于H,0,:C=0,p,-1,H,1,:C 0,p,-1,试求检查H,0,似然比统计量和分布.,解:,至少有一对不相等,.,48,第48页,第48页,第三章 多元正态总体参数检查,利用3-6结果知,检查H,0,似然比统计量及分布为:,其中,(注意:3-6中,k,在这里为,p,-1),49,第49页,第49页,第三章 多元正态总体参数检查,3-8,假定人体尺寸有这样普通规律:身高(,X,1,),胸围(,X,2,)和上半臂围(,X,3,)平均尺寸百分比是641.假设,X,(),(1,n,)为来自总体,X,=(,X,1,X,2,X,3,)随机样本.并设,X,N,3,(,),试利用表3.5中男婴这一组数据检查三个尺寸(变量)是否符合这一规律(写出假设H,0,并导出检查统计量).,解:,检查三个尺寸(变量)是否符合这一规律问题可分成假设检查问题.由于,其中,注意:,50,第50页,第50页,第三章 多元正态总体参数检查,检查假设H,0,为,利用3-6结论,取检查统计量为:,由男婴测量数据(,p,=3,n,=6)计算可得,T,2,=47.1434,F,=18.8574,p,值=0.0091950未知.检查H,0,似然比统计量为,记,其中,55,第55页,第55页,第三章 多元正态总体参数检查,其中,A=A,1,+A,2,称为组内离差阵.,B,称为组间离差阵.,56,第56页,第56页,第三章 多元正态总体参数检查,由于,似然比统计量,57,第57页,第57页,第三章 多元正态总体参数检查,因此,58,第58页,第58页,第三章 多元正态总体参数检查,由定义3.1.5可知,由,或,由于,59,第59页,第59页,第三章 多元正态总体参数检查,可取检查统计量为,检查假设H,0,否认域为,60,第60页,第60页,第三章 多元正态总体参数检查,3-11,表3.5给出15名2周岁婴儿身高(,X,1,),胸围(,X,2,)和上半臂围(,X,3,)测量数据.假设男婴测量数据,X,(),(1,6)为来自总体N,3,(,(1),,)随机样本.女婴测量数据,Y,(),(1,9)为来自总体N,3,(,(2),,)随机样本.试利用表3.5中数据检查H,0,:,(1),=,(2),(=0.05).,解:,这是两总体均值向量检查问题.检查统计量取为(,p,=3,n,=6,m,=9):,61,第61页,第61页,第三章 多元正态总体参数检查,其中,故检查统计量为,用观测数据代入计算可得:,故H,0,相容.,明显性概率值,62,第62页,第62页,第三章 多元正态总体参数检查,3-12,在地质勘探中,在A、B、C三个地域采集了一些岩石,测其部分化学成份见表3.6.假定这三个地域岩石成份遵从N,3,(,(,i,),,,i,)(,i,1,2,3)(=0.05).,(1)检查H0:,1,2,3,;H1:,1,2,3,不全等;,(2)检查H0:,(1),(2),H1:,(1),(2),;,(3)检查H0:,(1),(2),(3),H1:存在ij,使,(i),(j),;,(4)检查三种化学成份互相独立.,解:(4),设来自三个总体样本为(,p,=3,k,=3),检查H,0,似然比统计量为,63,第63页,第63页,第三章 多元正态总体参数检查,似然比统计量分子为,64,第64页,第64页,第三章 多元正态总体参数检查,称为合并组内离差阵.,65,第65页,第65页,第三章 多元正态总体参数检查,66,第66页,第66页,第三章 多元正态总体参数检查,似然比统计量分母为,67,第67页,第67页,第三章 多元正态总体参数检查,检查H,0,似然比统计量可化为:,68,第68页,第68页,第三章 多元正态总体参数检查,Box证实了,在H,0,成立下当,n,时,,=,-,b,ln,V,2,(,f,),,其中,V,=0.7253,=-,b,ln,V=,3.2650,因,p=,0.35250.05.,故H,0,相容,即随机向量三个分量(三种化学成份)互相独立.,69,第69页,第69页,第三章 多元正态总体参数检查,或者利用定理3.2.1,当,n,充足大时,,=,-2ln,2,(,f,),,其中,f,=,p+p,(,p+1),/2-(,p+p,)=3,V,=0.7253,=0.1240,=-2ln,=-,n,ln,V=,4.1750,因,p=,0.24320.05.,故H,0,相容,即随机向量三个分量(三种化学成份)互相独立.,70,第70页,第70页,第三章 多元正态总体参数检查,3-13,对表3.3给出三组观测数据分别检查是否来自4维正态分布.,(1)对每个分量检查是否一维正态?,(2)利用,2,图检查法对三组观测数据分别检查是否来自4维正态分布.,71,第71页,第71页,应用多元统计分析,第四章部分习题解答,72,第72页,第72页,第四章,回归分析,4-1 设,(1)试求参数,a,b,最小二乘预计;,解,:用矩阵表示以上模型:,则,73,第73页,第73页,第四章,回归分析,(2)试导出检查H,0,:,a,=,b,似然比统计量,并指出当假,设成立时,这个统计量分布是什么?,解,:样本似然函数为,74,第74页,第74页,第四章,回归分析,令,可得,似然比统计量分母为,当H,0,:,a,=,b=a,0,成立时,样本似然函数为,75,第75页,第75页,第四章,回归分析,令,可得,令,可得,似然比统计量分子为,76,第76页,第76页,第四章,回归分析,似然比统计量为,下列来讨论与,V,等价统计量分布:,77,第77页,第77页,第四章,回归分析,因,当H,0,:,a,=,b=a,0,成立时,回归模型,为,78,第78页,第78页,第四章,回归分析,考虑,经验证:,B-A,是对称幂等阵;,rank(,B-A,)=tr(,B-A,)=2-1=1;,79,第79页,第79页,第四章,回归分析,A,(,B-A,)=,O,33,.由第三章3.1结论6知,由第三章3.1结论4知(,H,0,:,a,=,b,成立时),80,第80页,第80页,第四章,回归分析,因此,否认域为,81,第81页,第81页,第四章,回归分析,4-2 在多元线性回归模型(4.1.3)中(,p,=1),试求出参数向量,和,2,最大似然预计.,解:模型(4.1.3)为,样本似然函数为,82,第82页,第82页,第四章,回归分析,令,可得参数向量,和,2,最大似然预计为,:,83,第83页,第83页,第四章,回归分析,4-6 称观测向量,Y,和预计向量,Y,相关系数,R,为全相关系数.即,试证实:,84,第84页,第84页,第四章,回归分析,证实:,(1)预计向量为,(2)因,85,第85页,第85页,第四章,回归分析,上式第一项为:,86,第86页,第86页,第四章,回归分析,因此,(3)残差平方和,Q,为,87,第87页,第87页,第四章,回归分析,4-7,在多对多多元线性回归模型中,给定,Y,n,p,X,n,m,且rank(,X,)=,m,C=(1,n,|,X,).则,其中,(,CC,),-1,C,Y.,证实:,故交叉项=,O,.,88,第88页,第88页,第四章,回归分析,4-8,在多对多回归模型中,令,Q,(,),=,(,Y-C,),(,Y-C,),.,试证实,(,C,C,),-1,C,Y,是在下列四种意义下达最小:,(1)tr,Q,(,)tr,Q,(,);,(2),Q,(,),Q,(,);,(3)|,Q,(,)|,Q,(,)|;,(4),ch,1,(,Q,(,),ch,1,(,Q,(,),,其中ch,1,(,A,)表示,A,最大特性值.,以上,是(,m,+1),p,任意矩阵.,89,第89页,第89页,第四章 回归分析,90,第90页,第90页,第四章 回归分析,等号成立,91,第91页,第91页,第四章 回归分析,92,第92页,第92页,第四章 回归分析,93,第93页,第93页,第四章 回归分析,见附录P394定理7.2(7.5)式,94,第94页,第94页,应用多元统计分析,第五章部分习题解答,95,第95页,第95页,第五章 判别分析,5-1,已知总体,G,i,(,m,=1)分布为:(,i,=1,2),按距离判别准则为(不妨设,(1),(2),1,2,),其中,试求错判概率,P,(2|1)和,P,(1|2).,解:,96,第96页,第96页,第五章 判别分析,记,97,第97页,第97页,第五章 判别分析,98,第98页,第98页,第五章 判别分析,5-2,设三个总体分布分别为:G1为N(2,0.5,2,),G2为N(0,2,2,),G3为N(3,1,2,).试问样品,x,=2.5应判归哪一类?,(1)按距离准则;,(2)按Bayes准则,解:,(1),按距离准则,当样品,x,=2.5时,因0.2510.11740.0304,因此样品,x,=2.5判归G,1,.,101,第101页,第101页,第五章 判别分析,解三:后验概率判别法,计算样品,x,已知,属,G,t,后验概率:,当样品,x,=2.5时,经计算可得,因0.52180.37980.0984,因此样品,x,=2.5判归G,1,.,102,第102页,第102页,第五章 判别分析,103,第103页,第103页,第五章 判别分析,由此题结论可得出判别法:,104,第104页,第104页,第五章 判别分析,5-4 设有两个正态总体,G,1,和,G,2,已知(,m,=2),105,第105页,第105页,第五章 判别分析,类似于例5.3.1解法,A,-1,B,特性根就等于,106,第106页,第106页,第五章 判别分析,107,第107页,第107页,第五章 判别分析,108,第108页,第108页,第五章 判别分析,109,第109页,第109页,第五章 判别分析,110,第110页,第110页,第五章 判别分析,111,第111页,第111页,第五章 判别分析,112,第112页,第112页,第五章 判别分析,113,第113页,第113页,第五章 判别分析,114,第114页,第114页,第五章 判别分析,115,第115页,第115页,第五章 判别分析,116,第116页,第116页,应用多元统计分析,第六章部分习题解答,117,第117页,第117页,第六章 聚类分析,6-1,证实下列结论:,(1)两个距离和所构成函数仍是距离;,(2)一个正常数乘上一个距离所构成函数仍是距离;,(3)设,d,为一个距离,c,0为常数,则,仍是一个距离;,(4)两个距离乘积所构成函数不一定是距离;,118,第118页,第118页,第六章 聚类分析,(2),设,d,是,距离,a,0为,正常数.令,d*=ad,显然有,119,第119页,第119页,第六章 聚类分析,故,d*=ad,是一个距离.,(3),设,d,为一个距离,c,0为常数,显然有,120,第120页,第120页,第六章 聚类分析,故,d*,是一个距离.,121,第121页,第121页,第六章 聚类分析,122,第122页,第122页,第六章 聚类分析,6-2,试证实二值变量相关系数为(6.2.2)式,夹角余弦为(6.2.3)式.,证实:,设变量,X,i,和,X,j,是二值变量,它们,n,次观测值记为,x,ti,x,tj,(,t,=1,n,).,x,ti,x,tj,值或为0,或为1.由二值变量列联表(表6.5)可知:变量,X,i,取值1观测次数为,a,+,b,取值0观测次数为,c,+,d,;变量,X,i,和,X,j,取值均为1观测次数为,a,取值均为0观测次数为,d,等等。利用两定量变量相关系数公式:,123,第123页,第123页,第六章 聚类分析,124,第124页,第124页,第六章 聚类分析,故二值变量相关系数为:,(6.2.2),125,第125页,第125页,第六章 聚类分析,利用两定量变量夹角余弦公式:,其中,故有,126,第126页,第126页,第六章 聚类分析,6-3,下面是5个样品两两间距离阵,试用最长距离法、类平均法作系统聚类,并画出谱系聚类图.,解:,用最长距离法:,合并,X,(1),X,(4),=CL4,并类距离,D,1,=1.,127,第127页,第127页,第六章 聚类分析,合并,X,(2),X,(5),=CL3,并类距离,D,2,=3.,合并CL3,CL4=CL2,并类距离,D,3,=8.,所有样品合并为一类CL1,并类距离,D,4,=10.,128,第128页,第128页,第六章 聚类分析,最长距离法谱系聚类图下列:,129,第129页,第129页,第六章 聚类分析,合并,X,(1),X,(4),=CL4,并类距离,D,1,=1.,用类平均法:,130,第130页,第130页,第六章 聚类分析,合并,X,(2),X,(5),=CL3,并类距离,D,2,=3.,合并CL3,CL4=CL2,并类距离,D,3,=(165/4),1/2,.,所有样品合并为一类CL1,并类距离,D,4,=(121/2),1/2,.,131,第131页,第131页,第六章 聚类分析,类平均法谱系聚类图下列:,132,第132页,第132页,第六章 聚类分析,6-4,利用距离平方递推公式,来证实当,0,p,0,q,0,p,+,q,+,1时,系统聚类中类平均法、可变类平均法、可变法、Ward法单调性.,证实:,设第,L,次合并G,p,和G,q,为新类G,r,后,并类距离,D,L,D,pq,且必有,D,pq,2,D,ij,2,.,新类G,r,与其它类G,k,距离平方递推公式,当,0,p,0,q,0,p,+,q,+,1 时,这表明新距离矩阵中类间距离均,D,pq,D,L,,故有,D,L,1,D,L,,即相应聚类法有单调性.,133,第133页,第133页,第六章 聚类分析,对于类平均法,因,故类平均法含有单调性。,对于可变类平均法,因,故可变类平均法含有单调性。,134,第134页,第134页,第六章 聚类分析,对于可变法,因,故可变法含有单调性。,对于离差平方和法,因,故离差平方和法含有单调性。,135,第135页,第135页,第六章 聚类分析,6-5,试从定义直接证实最长和最短距离法单调性.,证实:,先考虑最短距离法:,设第,L,步从类间距离矩阵,出发,假设,故合并G,p,和G,q,为一新类G,r,,这时第L步并类距离:,且新类G,r,与其它类G,k,距离由递推公式可知,设第,L+,1步从类间距离矩阵,出发,,136,第136页,第136页,第六章 聚类分析,故第L1步并类距离:,即最短距离法含有单调性.,类似地,能够证实最长距离法也含有单调性.,137,第137页,第137页,第六章 聚类分析,6-6,设A,B,C为平面上三个点,它们之间距离为,将三个点当作三个二维样品,试用此例阐明中间距离法和重心法不含有单调性.,解:,按中间距离法,取,=-1/4,将B和C合并为一类后,并类距离,D,1,=1,而A与新类,G,r,=B,C类间平方距离为,138,第138页,第138页,第六章 聚类分析,故中间距离法不含有单调性。,按重心法,将B和C合并为一类后,并类距离,D,1,=1,而,A,与新类,G,r,=B,C类间平方距离为,当把A与B,C并为一类时,并类距离,139,第139页,第139页,第六章 聚类分析,故,重心法,法不含有单调性。,并类过程下列:,当把A与B,C并为一类时,并类距离,A,B,C,140,第140页,第140页,第六章 聚类分析,解一:,利用,假如样品间距离定义为欧氏距离,则有,6-7,试推导重心法距离递推公式(6.3.2);,141,第141页,第141页,第六章 聚类分析,142,第142页,第142页,第六章 聚类分析,143,第143页,第143页,第六章 聚类分析,解二:,因样品间距离定义为欧氏距离,利用,144,第144页,第144页,第六章 聚类分析,利用,145,第145页,第145页,第六章 聚类分析,故有,146,第146页,第146页,第六章 聚类分析,6-8,试推导Ward法距离递推公式(6.3.3);,解:,Ward法把两类合并后增长离差平方和当作类间平方距离,即把类,G,p,和,G,q,平方距离定义为,利用,W,r,定义:,147,第147页,第147页,第六章 聚类分析,148,第148页,第148页,第六章 聚类分析,149,第149页,第149页,第六章 聚类分析,(当样品间距离定义为欧氏距离时),记,G,r,G,p,G,q,则新类,G,r,与其它类G,k,平方距离为,利用重心法递推公式(6-7题已证实)可得:,150,第150页,第150页,第六章 聚类分析,151,第151页,第151页,第六章 聚类分析,6-9,设有5个样品,对每个样品考察一个指标得数据为1,2,5,7,10.试用离差平方和法求5个样品分为,k,类(,k,5,4,3,2,1)分类法,b,k,及相应总离差平方和,W,(,k,).,解:,计算样品间欧氏平方距离阵,合并 1,2 CL4,并类距离,D,1,=(0.5),1/2,=0.707,并利用递推公式计算新类与其它类平方距离得,152,第152页,第152页,第六章 聚类分析,合并 5,7 CL3,并类距离,D,2,=(2),1/2,=1.414,,并利用递推公式计算新类与其它类平方距离得,合并 CL3,10=5,7,10 CL2,并类距离,D,3,=(32/3),1/2,=3.266,并利用递推公式计算新类与其它类平方距离得,153,第153页,第153页,第六章 聚类分析,合并 CL4,CL2=1,2,5,7,10 CL1,并类距离,D,4,=(245/6),1/2,=,6.39,并利用递推公式计算新类与其它类平方距离得,分类法,b,k,及相应总离差平方和,W,(,k,):,k,=5,1,2,5,7,10,W(5)=0,k,=4,1,2,5,7,10,W(4)=0.5,k,=3,1,2,5,7,10,W(3)=2.5,k,=2,1,2,5,7,10,W(2)=13.666,k,=1,1,2,5,7,10,W(1)=54,154,第154页,第154页,应用多元统计分析,第七章习题解答,155,第155页,第155页,7-1,第七章 主成份分析,设X=(,X,1,X,2,)协方差阵,试从和相关阵R出发求出总体主成份,,并加以比较.,解:,156,第156页,第156页,第七章 主成份分析,157,第157页,第157页,第七章 主成份分析,158,第158页,第158页,第七章 主成份分析,7-2,设X=(,X,1,X,2,)N,2,(0,),协方差,其中为,X,1,和,X,2,相关系数(0).,(1)试从出发求X两个总体主成份;,(2)求X等概密度椭园主轴方向;,(3)试问当取多大时才干使第一主成份奉献率达95%以上.,解:,159,第159页,第159页,第七章 主成份分析,160,第160页,第160页,7-3,第七章 主成份分析,设,p,维总体,X,协差阵为,(1)试证实总体第一主成份,(2)试求第一主成份奉献率.,161,第161页,第161页,第七章 主成份分析,解:,1,162,第162页,第162页,7-4,第七章 主成份分析,解:,设总体,X,(,X,1,X,p,)N,p,(,)(0),等概率密度,椭球为 (,X,-),-1,(,X,-)=,C,2,(,C,为常数).,试问椭球主轴方向是什么?,163,第163页,第163页,7-5,第七章 主成份分析,设3维总体X协差阵为,试求总体主成份.,解:,总体主成份为,主成份向量为,三个主成份方差分别为4,4,2.,164,第164页,第164页,第七章 主成份分析,7-6,设3维总体X协差阵为,试求总体主成份,并计算每个主成份解释方差百分比,解:,165,第165页,第165页,7-7,第七章 主成份分析,设4维随机向量,X,协差阵是,试求X主成份.,其中,166,第166页,第166页,第七章 主成份分析,解:,167,第167页,第167页,7-8,第七章 主成份分析,168,第168页,第168页,第七章 主成份分析,169,第169页,第169页,7-9,第七章 主成份分析,170,第170页,第170页,第七章 主成份分析,171,第171页,第171页,7-10,第七章 主成份分析,172,第172页,第172页,7-11,7-12,第七章 主成份分析,173,第173页,第173页,
展开阅读全文