收藏 分销(赏)

spss聚类分析教程课件.ppt

上传人:a199****6536 文档编号:13217442 上传时间:2026-02-04 格式:PPT 页数:25 大小:1.95MB 下载积分:8 金币
下载 相关 举报
spss聚类分析教程课件.ppt_第1页
第1页 / 共25页
spss聚类分析教程课件.ppt_第2页
第2页 / 共25页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,中国人民大学六西格玛质量管理研究中心,*,2026/2/4 周三,1,基本统计分析,有了数据,可以利用,SPSS,的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键,SPSS,有数字分析和作图分析两类方法,2026/2/4 周三,2,基本统计分析概述,目录 上页 下页 返回 结束,基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究,。,在,SPSS,的,Analyze,菜单中包括了一系列统计分析过程。其中,Reports,和,Descriptive Statistics,命令项中包括的功能是对单变量的描述统计分析,Descriptive Statistics,包括的统计功能有:,Frequencies,:频数分析,Descriptives,:描述统计量分析,Explore,:探索分析,Crosstabs,:多维频数分布交叉表(列联表),2026/2/4 周三,5,目录 上页 下页 返回 结束,SPSS,数值统计分析过程均在,Analyze,菜单中,基本统计分析:,Reports,Descriptive Statistics,b,、均值比较与检验:,Compare Means,d,、方差分析:,ANOVA Models,b,、相关分析:,Correlate,e,、,回归分析,:,Regression,f,、,聚类与判别,:,Classify,g,、,因子分析,:,Data Reduction,h,、,非参数检验,:,Nonparametric Tests,等等,2026/2/4 周三,6,第一章 聚类分析,聚类分析的基本思想,聚类分析上机实现,2026/2/4 周三,7,1.1,聚类分析的思想,目录 上页 下页 返回 结束,我们认为,所研究的样品或指标(变量)之间是存在着程度不同的相似性(亲疏关系)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另外一类,,。关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏关系表示出来。,2026/2/4 周三,8,目录 上页 下页 返回 结束,对样品的分类常称为,Q,型聚类分析,对变量的分类常称为,R,型聚类分析,2026/2/4 周三,10,目录 上页 下页 返回 结束,2026/2/4 周三,12,目录 上页 下页 返回 结束,第一位重要的问题是“什么是类”?粗糙地讲,相似样品(或指标)的集合称作类。,聚类分析给人们提供了丰富多采的方法进行分类,这些方法大致可归纳为:,(1),系统聚类法。,(2),模糊聚类法。,(3)K-,均值法。,(4),有序样品的聚类。,(5),分解法。,(6),加入法。,2026/2/4 周三,14,目录 上页 下页 返回 结束,(2),最长距离法(,farthest neighbor,或,complete linkage method,)。,2026/2/4 周三,15,目录 上页 下页 返回 结束,(3),类平均法,(group average method),。,2026/2/4 周三,16,目录 上页 下页 返回 结束,(4),重心法,(Centroid method),。,(5),离差平方和法(,Sum of Squares method,)。,2026/2/4 周三,中国人民大学六西格玛质量管理研究中心,17,1.3,系统聚类法,目录 上页 下页 返回 结束,系统聚类法,(hierarchical clustering method),在聚类分析中诸方法中用的最多,包含下列步骤:,2026/2/4 周三,18,目录 上页 下页 返回 结束,注:不同的距离定义方式用到系统聚类程序中,得到不同的系统聚类法。我们现在通过一个简单的例子,来说明各种系统聚类法。,2026/2/4 周三,20,1.5,案例研究,目录 上页 下页 返回 结束,例,3,我们以,2005,年,31,个省、市、自治区的城镇居民月平均消费支出数据为例,在,SPSS,中利用,K-,均值法对,31,个省、市、自治区的城镇居民消费水平进行聚类分析。,在,SPSS,中依次点击,“,Analyze,”,“,Classify,”,“,K-Means Cluster,”,,打开,K-Means Cluster Analysis,对话框,将,8,个变量选入,Variable,框中,将表示地区的变量选入,Label Cases By,栏中,将分类数(,Number of clusters,)定为,3,。另外,点击,Iterate,按钮可以在其中输入最大迭代次数(,Maximum iterations,)和收敛标准(,Convergence criterion,);在,Save,按钮中可以选择保存样本的聚类结果(,Cluster membership,)和各样本距各自中心点的距离(,Distance from cluster center,);在,Options,按钮中可以选择输出初始类中心点、方差分析表等结果,读者可以根据实际情况来选择。点击,“,OK,”,得到聚类结果如下:,2026/2/4 周三,中国人民大学六西格玛质量管理研究中心,21,目录 上页 下页 返回 结束,2026/2/4 周三,23,目录 上页 下页 返回 结束,上面介绍的几种系统聚类方法,并类的原则和步骤基本一致,所不同的是类与类的距离有不同的定义。其实可以把这几种方法统一起来,有利于在计算机上灵活地选择更有意义的谱系图。,2026/2/4 周三,24,目录 上页 下页 返回 结束,当然,也可以采用欧氏距离分别用类平均法、最短距离法、最长距离法把,31,个省市分类。,类平均法聚类在,SPSS,中的操作为:点选,“,Analyze,”,“,Classify,”,“,Hierarchical Cluster,”,,打开,Hierarchical Cluster Analysis,对话框,将八个聚类指标选入,Variables,栏中,将表示地区的变量选入,Label Cases By,栏中,按,“,Plots,”,按钮,在弹出的窗口中选中,Dendrogram,(谱系图)选项,按,“,Continue,”,返回主对话框,在按,“,Method,”,按钮,在,Cluster Method,下拉菜单中选择,Between-groups linkage,(组间连接法,即类平均法)选项,返回主对话框后按,“,OK,”,即可得到聚类结果。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服