你正在下载：《

利用Matlab软件实现聚类分析.doc

》 [预览]

格式：DOC ，页数：7 ，大小：51.50KB ,
资源ID：7598028 下载积分：10 金币

快捷注册下载

登录下载

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

开通VIP

温馨提示：由于个人手机设置不同，如果发现不能下载，请复制以下地址【https://www.zixin.com.cn/docdown/7598028.html】到电脑端继续下载（重复下载【60天内】不扣币）。

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

三方登录：

1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

本文（利用Matlab软件实现聚类分析.doc）为本站上传会员【pc****0】主动上传，咨信网仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知咨信网（发送邮件至1219186828@qq.com、拔打电话4009-655-100或【微信客服】、【 QQ客服】），核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载【60天内】不扣币。【服务填表】

利用Matlab软件实现聚类分析.doc

1、§8.利用Matlab和SPSS软件实现聚类分析 1. 用Matlab编程实现运用Matlab中的一些基本矩阵计算方法，通过自己编程实现聚类算法，在此只讨论根据最短距离规则聚类的方法。调用函数： min1.m——求矩阵最小值，返回最小值所在行和列以及值的大小 min2.m——比较两数大小，返回较小值 std1.m——用极差标准化法标准化矩阵 ds1.m——用绝对值距离法求距离矩阵 cluster.m——应用最短距离聚类法进行聚类分析 print1.m——调用各子函数，显示聚类结果聚类分析算法假设距离矩阵为vector， a阶，矩阵中最大值为max，令矩阵上三角元素

2、等于max 聚类次数=a-1,以下步骤作a-1次循环: 求改变后矩阵的阶数,计作c 求矩阵最小值，返回最小值所在行e和列f以及值的大小g for l=1:c,为vector(c+1,l)赋值，产生新类令第c+1列元素，第e行和第f行所有元素为，第e列和第f列所有元素为max 源程序如下： %std1.m,用极差标准化法标准化矩阵 function std=std1(vector) max=max(vector); %对列求最大值 min=min(vector); [a,b]=size(vector); %矩阵大小,a为行数,b为列数 fo

3、r i=1:a for j=1:b std(i,j)= (vector(i,j)-min(j))/(max(j)-min(j)); end end %ds1.m,用绝对值法求距离 function d=ds1(vector); [a,b]=size(vector); d=zeros(a); for i=1:a for j=1:a for k=1:b d(i,j)=d(i,j)+abs(vector(i,k)-vector(j,k)); end end

4、end fprintf('绝对值距离矩阵如下：\n'); disp(d) %min1.m,求矩阵中最小值，并返回行列数及其值 function [v1,v2,v3]=min1(vector);%v1为行数，v2为列数，v3为其值 [v,v2]=min(min(vector')); [v,v1]=min(min(vector)); v3=min(min(vector)); %min2.m，比较两数大小，返回较小的值 function v1=min(v2,v3); if v2>v3 v1=v3; else v1=v2; end %cluste

5、r.m,最短距离聚类法 function result=cluster(vector); [a,b]=size(vector); max=max(max(vector)); for i=1:a for j=i:b vector(i,j)=max; end end; for k=1:(b-1) [c,d]=size(vector); fprintf('第%g次聚类:\n',k); [e,f,g]=min1(vector); fprintf('最小值=%g,将第%g区和第%g区并为

6、一类，记作G%g\n\n',g,e,f,c+1); for l=1:c if l<=min2(e,f) vector(c+1,l)=min2(vector(e,l),vector(f,l)); else vector(c+1,l)=min2(vector(l,e),vector(l,f)); end end; vector(1:c+1,c+1)=max; vector(1:c+1,e)=max; vector(1:c+1,f)=max;

7、 vector(e,1:c+1)=max; vector(f,1:c+1)=max; end %print1,调用各子函数 function print=print1(filename,a,b); %a为地区个数，b为指标数 fid=fopen(filename,'r') vector=fscanf(fid,'%g',[a b]); fprintf('标准化结果如下：\n') v1=std1(vector) v2=ds1(v1); cluster(v2); %输出结果 print1('fname',9,7) 2.直接调用Matlab

8、函数实现 2.1调用函数层次聚类法（Hierarchical Clustering）的计算步骤： ①计算n个样本两两间的距离{dij}，记D ②构造n个类，每个类只包含一个样本； ③合并距离最近的两类为一新类； ④计算新类与当前各类的距离；若类的个数等于1，转到5）；否则回3）； ⑤画聚类图； ⑥决定类的个数和类； Matlab软件对系统聚类法的实现（调用函数说明）： cluster 从连接输出(linkage)中创建聚类 clusterdata 从数据集合(x)中创建聚类 dendrogram

9、画系统树状图 linkage 连接数据集中的目标为二元群的层次树 pdist 计算数据集合中两两元素间的距离(向量) squareform 将距离的输出向量形式定格为矩阵形式 zscore 对数据矩阵 X 进行标准化处理各种命令解释 ⑴ T = clusterdata(X, cutoff) 其中X为数据矩阵，cutoff是创建聚类的临界值。即表示欲分成几类。以上语句等价与以下几句命令： Y

10、pdist(X,’euclid’) Z=linkage(Y,’single’) T=cluster(Z,cutoff) 以上三组命令调用灵活，可以自由选择组合方法！ ⑵ T = cluster(Z, cutoff) 从逐级聚类树中构造聚类，其中Z是由语句likage产生的(n-1)×3阶矩阵，cutoff是创建聚类的临界值。 ⑶ Z = linkage(Y) Z = linkage(Y, 'method') 创建逐级聚类树，其中Y是由语句pdist产生的n(n-1)/2 阶向量，’method’表示用何方法，默认值是欧氏距离（s

11、ingle)。有’complete’——最长距离法；‘average’——类平均距离；‘centroid’——重心法；‘ward‘——递增平方和等。 ⑷ Y = pdist(X) Y = pdist(X, 'metric') 计算数据集X中两两元素间的距离， ‘metric’表示使用特定的方法，有欧氏距离‘euclid’ 、标准欧氏距离‘SEuclid’ 、马氏距离‘mahal’、明可夫斯基距离‘Minkowski‘ 等。 ⑸ H = dendrogram(Z) H = dendrogram(Z, p) 由likage产生的数据矩阵z画聚类

12、树状图。P是结点数，默认值是30。 2.2举例说明设某地区有八个观测点的数据，样本距离矩阵如表1所示，根据最短距离法聚类分析。 %最短距离法系统聚类分析 X=[7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29; 7.68 50.37 11.35 13.3 19.25 14.59 2.75 14.87; 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76; 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35; 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81]; BX=zscore(X); % 标准化数据矩阵 Y=pdist(X) % 用欧氏距离计算两两之间的距离 D=squareform(Y) % 欧氏距离矩阵 Z = linkage(Y) % 最短距离法 T = cluster(Z,3) 等价于 { T=clusterdata(X,3) } find(T==3) % 第3类集合中的元素 [H,T]=dendrogram(Z) % 画聚类图聚类谱系图如图1所示：图1 聚类谱系图