收藏 分销(赏)

聚类分析实验.ppt

上传人:快乐****生活 文档编号:1866449 上传时间:2024-05-10 格式:PPT 页数:16 大小:616KB
下载 相关 举报
聚类分析实验.ppt_第1页
第1页 / 共16页
聚类分析实验.ppt_第2页
第2页 / 共16页
聚类分析实验.ppt_第3页
第3页 / 共16页
聚类分析实验.ppt_第4页
第4页 / 共16页
聚类分析实验.ppt_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、1234变量的测度类型有哪些?系统聚类法的思想是什么?短距离法是不是一种优良的系统聚类方法,为什么?它适合于什么形态类的聚类?组间联结法和组内联结法都是计算所有样本对的平均距离,请说明其区别?.变量的测度类型有间隔尺度、顺序尺度、名义尺度基本思想:设有n个样本,每个样本有m个指标。首先定义样本间的距离。先将这n个样本看成n类,然后将距离最近的两类合并成为新类,并计算新类与其他类的距离,再按最小距离准则并类。这样每次缩小一类,直到并成一类为止。第一第二.第三第四因为最短距离法的缺点是有链接聚合的趋势,合并之后,新类与其他类的距离缩短,会形成聚类延伸的情况。最短距离法适用于样品散点图(即将每个样品

2、看成m维空间中的点所形成的图形)是条形图,甚至是S形的类。组间联结法定义两个小类之间的距离为所有样本对间的平均距离,利用了所有样本对距离的信息,克服了最短距离和最长距离中的距离易受极端值影响的弱点。组内联结法是对所有样本对的距离求平均值,包括小类之间的样本对、小类内的样本对,它与组间联结法相比,它在聚类的每一步都考虑了小类内部相似性的变化。.内容一内容一内容二内容二根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据,对世界20个国家和地区进行聚类分析对聚类分析的结果进行判断12根据2008年全国各省市居民消费结构,进行聚类分析。对聚类结果进行分析判断实验实验6聚类分析聚类分析

3、.将 数 据 粘 贴 到 SPSS中,选 择 菜 单AnalyzeClassifyHierarchical Cluster;.将call,movecall,fee,computer,mips,net 6个变量选到Variable(s)框中;再将gj-国家作为标记变量,选到Label Cases by框中;在Cluster框中,选择Cases进行Q型聚类,在Display框中,选择Statistics、Plots单 击 Method按 钮,聚 类 方 法 选 择 组 间 连 接 法(within-group linkage),计算距离选择平方欧氏距离,将原始变量标准化,在Transform Va

4、lues的Standardize空白框内,选择Z-Scores;步骤一步骤一步骤二步骤二步骤三步骤三步骤四步骤四.输出的树状图输出的树状图.第三类第三类第二类第二类第一类第一类墨西哥,波兰,泰国,智利,巴西,俄罗斯,印度,匈牙利,马来西亚,中国台湾,韩国为一类,它们大部分都是当时的转型国家和亚洲、拉美的发展中国家,属于信息基础设施比较落后的国家美国为一类,作为世界第一强国,它是信息基础设施很发达的国家。瑞士,丹麦,瑞典,新加坡,英国,德国,法国,日本为一类,它们大部分是欧洲发达国家,还有一些是亚洲经济比较发达的国家,所以它们的信息基础设施相对发达一些;.between group法法withi

5、n group法法ward method法法系统聚类法系统聚类法系统聚类法系统聚类法考虑到分类与实际情况的考虑到分类与实际情况的出入和分类最优问题,这出入和分类最优问题,这里通过分别用系统聚类法里通过分别用系统聚类法和和K均值聚类分析,其中后均值聚类分析,其中后者也分别分为两类,三类,者也分别分为两类,三类,四类进行比较。根据四类进行比较。根据2008年全国各地区居民消费数年全国各地区居民消费数据,将食品,衣着,居住,据,将食品,衣着,居住,家庭设备用品及服务,医家庭设备用品及服务,医疗保健,交通和通讯,教疗保健,交通和通讯,教育文化娱乐服务,杂项商育文化娱乐服务,杂项商品和服务着八个项目选为

6、品和服务着八个项目选为指标指标.说明一说明一说明二说明二实验内容二实验内容二利用系统聚类方法的步骤与上题相似,这里重点说一下K均值聚类分析的步骤另外,上题中已有相似的已经有相似的利用系统聚类分析方法的树状图及结果,这里也重点展示K均值聚类分析的结果及其分析.操作步骤操作步骤步骤三步骤三点 击 Save按 钮,选 择Cluster membership和Distance from cluster center,单击Continue按钮返回步骤一步骤一将数据粘贴到SPSS中,选 择 菜 单 AnalyzeClassifyK-Means Cluster;步骤四步骤四点击Options按钮,选中Ini

7、tial cluster centers和Cluster from cluster center,单击Continue按钮返回步骤二步骤二将这八个变量移入Variables框中,将 标 志 变 量 地 区 移 入Label Case by框 中,在Method框 中 选 择 Iterate classify,在Number of Cluster实验内容二.结果及分析.结果及分析.结果及分析.结果及分析.分为三类:上海单独为一类;天津,福建,北京,浙江,广东为分为三类:上海单独为一类;天津,福建,北京,浙江,广东为一类;剩下的省直辖市为一类。一类;剩下的省直辖市为一类。分为三类:上海单独为一类;

8、北京,浙江,广东为一类;剩下的分为三类:上海单独为一类;北京,浙江,广东为一类;剩下的省市直辖市为一类。省市直辖市为一类。分为三类:北京,浙江,广东,上海为一类;安徽,湖北,湖南,广西,分为三类:北京,浙江,广东,上海为一类;安徽,湖北,湖南,广西,海南,四川,云南,西藏,天津,福建,辽宁,重庆,江苏为一类;剩海南,四川,云南,西藏,天津,福建,辽宁,重庆,江苏为一类;剩下的省市直辖市为一类。下的省市直辖市为一类。Between groupBetween group法法法法Within groupWithin group法法法法ward methodward method.BetweenGroup法法WithinGroup法法Wardmethod综合以上各种方法和实际情况用综合以上各种方法和实际情况用K均值聚均值聚类分析方法分的类最为合理,类分析方法分的类最为合理,K均值聚类分析法.

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服