资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/10/3,#,聚类分析,&,主成份分析实例,分析某地域,35,个城市,年,7,项经济统计指标数据,(,1,)试用最短距离法对,35,个城市综合实力进行,系统聚类分析,并画出聚类谱系图,a.,软件操作及原理,b.,数据结果及分析,1/20,a.,软件操作及原理,操作,2/20,a.,软件操作及原理,操作,3/20,a.,软件操作及原理,标准差标准化原理,4/20,a.,软件操作及原理,欧氏距离原理,5/20,凝聚状态表第一列表示聚类分析第几步;第二列、第三列表示本步骤聚类中那两个样本或小类聚成一类;第四列是对应样本距离或小类距离;第五列、第六列表明本步骤聚类中,参加聚类是样本还是小类。0表示样本,数字n(非0)表示由第n部聚类产生小类参加本步骤聚类;第七列表示本步骤聚类结果将在下面聚类第几部中用到。,a.,软件操作及原理,最短距离聚类法原理,聚类表,阶 群集组合系数首次出现阶群集下一阶,群集 1群集 2群集 1群集 2,11725.060006,2529.065006,33334.0850012,42635.0890028,53031.104008,6517.108219,7818.1080017,82030.1150510,9516.1236010,10520.1279811,11532.12810012,12533.12911313,13514.13612015,14621.1500016,15522.16013017,16611.16614027,1758.18215718,18519.19017020,191315.1960024,2057.19718021,2145.19802022,22428.19921023,23412.20122024,24413.204231925,2534.23502426,2639.24025027,2736.255261628,28326.27027429,2923.39102830,30223.41829031,31224.55130032,3212.63203133,33110.77032034,34127.8183300,6/20,在不一样聚类标准(距离)下,聚类结果不一样,当距离标准逐步放大时,,35,个区域单元被依次聚类。,当距离为,0,时,每个样本为单独一类;当距离为,5,,则,35,个区域单元被聚为,11,类;当距离为,10,,则,35,个区域单元被聚为,7,类;当距离为,15,,则,35,个区域单元被聚为,5,类;当距离为,20,,则,35,个区域单元被聚为,3,类;最终,当聚类标准(距离)扩大到,25,时,,35,个区域单元被聚为,1,类。,b.,数据结果及分析,7/20,聚类分析,&,主成份分析实例,分析某地域,35,个城市,年,7,项经济统计指标数据,(,2,)试用主成份分析法对,35,个城市,7,项经济指标进行主成份分析,并分析其综合实力。,a.,软件操作,b.,数据结果及分析,8/20,a.,软件操作,9/20,a.,软件操作,10/20,b.,数据结果及分析,Bartlett,验证,因子分析前,首先进行KMO检验和巴特利球体检验。KMO检验用于检验变量间偏相关性,取值在01之前。KMO统计量越靠近于1,变量间偏相关性越强,因子分析效果越好。实际分析中,KMO统计量在0.7以上时效果比很好;当KMO统计量在0.5以下,此时不适合应用因子分析法,应考虑重新设计变量结构或者采取其它统计分析方法。,11/20,b.,数据结果及分析,主成份因子,普通取,累计贡献率达,85%95%,特征值所对应第,1,、第,2,、,、第,m,(,m,p,)个主成份。,12/20,b.,数据结果及分析,变量与因子联络系数,变量与某一因子联络系数绝对值越大,则该因子与变量关系越近。,将第一因子代替,x4,x5,x6,x7;,将第二因子代替,x1,x2,x3,即可得到旋转矩阵,使复杂矩阵变得简练。,13/20,b.,数据结果及分析,变量与因子联络系数,变量与某一因子联络系数绝对值越大,则该因子与变量关系越近。,将第一因子代替,x4,x5,x6,x7;,将第二因子代替,x1,x2,x3,即可得到旋转矩阵,使复杂矩阵变得简练。,14/20,b.,数据结果及分析,变量与因子联络系数,第,1,主成份与全部变量成正相关,与,x4,x5,x6,x7,展现出较强正相关,所以能够认为第,1,主成份是,年城市经济结构代表。,第,2,主成份与,x1,x3,展现出较强正相关,,x2,展现出较强负相关,所以能够认为第,2,主成份是,年农业经济代表。,15/20,聚类分析,&,主成份分析实例,分析某地域,35,个城市,年,7,项经济统计指标数据,(,3,)以第一、二、三主成份为变量,进行聚类分析,结果又怎样呢?,a.,软件操作,b.,数据结果与对比,16/20,a.,软件操作,17/20,a.,数据结果与对比,聚类表,阶 群集组合系数首次出现阶群集下一阶,群集 1群集 2群集 1群集 2,11725.060006,2529.065006,33334.0850012,42635.0890028,53031.104008,6517.108219,7818.1080017,82030.1150510,9516.1236010,10520.1279811,11532.12810012,12533.12911313,13514.13612015,14621.1500016,15522.16013017,16611.16614027,1758.18215718,18519.19017020,191315.1960024,2057.19718021,2145.19802022,22428.19921023,23412.20122024,24413.204231925,2534.23502426,2639.24025027,2736.255261628,28326.27027429,2923.39102830,30223.41829031,31224.55130032,3212.63203133,33110.77032034,34127.8183300,聚类表,阶 群集组合系数首次出现阶群集下一阶,群集 1群集 2群集 1群集 2,11725.024005,22635.0450031,31831.0470015,4529.052005,5517.055417,63234.0630011,7530.067509,8621.0690025,9520.0697010,10522.0709013,113233.0726019,121928.0760018,13512.07710014,14514.08013016,15818.0840316,1658.085141517,17516.08616018,18519.093171219,19532.096181120,2057.09919021,21511.10720022,22515.12021023,2335.13602224,24313.15123027,2546.1700828,26223.1770027,2723.177262428,2824.190272529,2912.21502830,3019.21729031,31126.25830232,32124.30131033,33110.33432034,34127.5713300,18/20,a.,数据结果与对比,19/20,Thank,you for your listening,20/20,
展开阅读全文