收藏 分销(赏)

kmeans算法算法数据代码.pptx

上传人:人****来 文档编号:10187551 上传时间:2025-04-25 格式:PPTX 页数:17 大小:1.18MB
下载 相关 举报
kmeans算法算法数据代码.pptx_第1页
第1页 / 共17页
kmeans算法算法数据代码.pptx_第2页
第2页 / 共17页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,#,单击此处编辑母版标题样式,K-means,聚类算法,聚类分析概念,1,K-means,算法,2,K-means,实验,-,国民健康,3,K-means,实验,-,图像分割,4,K-means,实验,-,商户评级,5,目 录,1.,聚类分析概念,聚类与分类的不同在于:,分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。,聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。,2.K-means,算法,Q1,:,K,是什么?,A1,:,k,是聚类算法当中类的个数。,Summary,:,Kmeans,是用均值算法把数据分成,K,个类的算法!,Q2,:,means,是什么?,A2,:,means,是均值算法。,2.K-means,算法,距离的定义,欧式距离:,N,维空间点或向量的距离,曼哈顿距离:城市街区距离,夹角余弦:向量方向的差异,相关系数:,信息熵:,2.K-means,算法,K-means,算法详解,步骤一:取得,k,个初始中心点,从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类,2.K-means,算法,K-means,算法详解,Min of three,due to the EuclidDistance,步骤二:把每个点划分进相应的簇,根据欧氏距离最小原则,把每个点划分进相应的簇,2.K-means,算法,K-means,算法详解,Min of three,due to the EuclidDistance,步骤三:重新计算中心点,根据均值等方法,重新计算每个类的中心点,2.K-means,算法,K-means,算法详解,步骤四:迭代计算中心点,重复第二步和第三步,2.K-means,算法,K-means,算法详解,步骤五:收敛,聚类中心不再发生移动,3.K-means,实验,-,国民健康,数据示意图,国家和地区,婴儿死亡率(,),出生时平均预期寿命,/,岁,1990,年,2000,年,2006,年,1990,年,2000,年,2006,年,中国,36.3,29.9,20.1,68.9,70.3,72,中国香港,77.4,80.9,81.6,孟加拉国,100,66,51.6,54.8,61,63.7,文莱,10,8,8,74.2,76.2,77.1,柬埔寨,84.5,78,64.8,54.9,56.5,58.9,印度,80,68,57.4,59.1,62.9,64.5,印度尼西亚,60,36,26.4,61.7,65.8,68.2,伊朗,54,36,30,64.8,68.9,70.7,以色列,10,5.6,4.2,76.6,79,80,日 本,4.6,3.2,2.6,78.8,81.1,82.3,哈萨克斯坦,50.5,37.1,25.8,68.3,65.5,66.2,朝鲜,42,42,42,69.9,66.8,67,韩 国,8,5,4.5,71.3,75.9,78.5,老 挝,120,77,59,54.6,60.9,63.9,马来西亚,16,11,9.8,70.3,72.6,74,蒙 古,78.5,47.6,34.2,62.7,65.1,67.2,缅 甸,91,78,74.4,59,60.1,61.6,巴基斯坦,100,85,77.8,59.1,63,65.2,菲 律 宾,41,30,24,65.6,69.6,71.4,新 加 坡,6.7,2.9,2.3,74.3,78.1,79.9,斯里兰卡,25.6,16.1,11.2,71.2,73.6,75,泰 国,25.7,11.7,7.2,67,68.3,70.2,越 南,38,23,14.6,64.8,69.1,70.8,埃 及,66.7,40,28.9,62.2,68.8,71,尼日利亚,120,107,98.6,47.2,46.9,46.8,南 非,45,50,56,61.9,48.5,50.7,加 拿 大,6.8,4.9,77.4,79.2,80.4,墨 西 哥,41.5,31.6,29.1,70.9,74,74.5,美 国,9.4,6.9,6.5,75.2,77,77.8,X,textdata=xlsread(examp09_04.xls);,row=any(isnan(X),2);,X=X(row,:);,countryname=textdata(3:end,1);,countryname=countryname(row);,X=zscore(X);,startdata=X(8,27,42,:);,idx=kmeans(X,3,Start,startdata);,S,H=silhouette(X,idx);,代码,轮廓图,聚类结果,3.K-means,实验,-,国民健康,4.K-means,实验,-,图像分割,灰度图,代码,分割后二值图像,4.K-means,实验,-,图像分割,真彩图,4.K-means,实验,-,商户评价,数据示意图,代码,大众点评网上,1000,家商户的评分,4.K-means,实验,-,商户评价,聚类结果,MIN,MAX,6,7.466667,7.966667,5,6.366667,6.9,4,5.3,6.333333,3,6.833333,7.433333,2,7.966667,8.466667,1,8.433333,9.333333,谢谢,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服