收藏 分销(赏)

机器学习-聚类PPT.ppt

上传人:精*** 文档编号:10010518 上传时间:2025-04-17 格式:PPT 页数:36 大小:4.96MB
下载 相关 举报
机器学习-聚类PPT.ppt_第1页
第1页 / 共36页
机器学习-聚类PPT.ppt_第2页
第2页 / 共36页
机器学习-聚类PPT.ppt_第3页
第3页 / 共36页
机器学习-聚类PPT.ppt_第4页
第4页 / 共36页
机器学习-聚类PPT.ppt_第5页
第5页 / 共36页
点击查看更多>>
资源描述

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2,*,机器学习,聚类,汇报人:杨光,1,2025/4/17 周四,1.,聚类任务,有一天老板给你一堆数据,然后他说,你给我分类(聚类)出来,2,2,2025/4/17 周四,1.,聚类任务,聚类算法是一种无监督学习,我们区分监督学习和无监督学习的方法是看,IN,数据有无标签(,Label,)。,3,3,2025/4/17 周四,1.,聚类任务,4,在实际工作中,我们需要处理很多数据,标签获取需要极大的人工工作量。,4,2025/4/17 周四,1.,聚类任务,引言,聚类算法会将数据集中的样本划分成为若干个通常

2、不相交的子集,每一个子集我们称之为,“,簇,”,。在聚类过程自动形成簇结构后,我们会发现每个簇里会存在一些潜在的概念,比如,“,黄种人,”,、,“,白种人,”,,,“,女性,”,、,“,男性,”,,这些是我们事先未知的,这些概念也是由使用者来把握和命名的。,5,5,2025/4/17 周四,1.,聚类任务,引言,6,6,2025/4/17 周四,2.,性能度量,引言,目标:,尽量使聚类结果的,“,簇内相似度高,”,且,“,簇间相似度低,”,两类指标:,7,外部指标:与某个“参考模型”比较,内部指标:直接考察聚类结果(不利用参考模型),7,2025/4/17 周四,2.,性能度量,引言,外部指标

3、8,8,2025/4/17 周四,2.,性能度量,引言,9,9,2025/4/17 周四,2.,性能度量,引言,10,内部指标:,10,2025/4/17 周四,2.,性能度量,引言,11,11,2025/4/17 周四,3.,距离计算,引言,距离度量,dist(.,.),需要满足一些性质:,12,非负性:,dist(xi,xj),0,同一性:,dist(xi,xj)=0,当且仅当,xi=xj,对称性:,dist(xi,xj)=dist(xj,xi),直递性:,dist(xi,xj),dist(xi,xk)+dist(xk,xj),12,2025/4/17 周四,3.,距离计算,引言,闵可

4、夫斯基距离:,当给定样本,我们最常用的是,“,闵可夫斯基距离,”,p,1,时,,“,闵可夫斯基距离,”,公式满足上述,4,个性质。,p=1,时,,“,闵可夫斯基距离,”,即,“,曼哈顿距离,”,。,p=2,时,,“,闵可夫斯基距离,”,即,“,欧氏距离,”,。,13,13,2025/4/17 周四,3.,距离计算,引言,有序属性:,1,2,3,闵可夫斯基距离,无序属性:,飞机,火车,轮船,VDM,14,14,2025/4/17 周四,3.,距离计算,引言,15,15,2025/4/17 周四,3.,距离计算,引言,16,16,2025/4/17 周四,4.,原型聚类,k-means,引言,17

5、17,2025/4/17 周四,4.,原型聚类,k-means,引言,18,18,2025/4/17 周四,4.,原型聚类,k-means,引言,19,19,2025/4/17 周四,4.,原型聚类,k-means,引言,20,20,2025/4/17 周四,4.,原型聚类,LVQ,引言,21,21,2025/4/17 周四,4.,原型聚类,LVQ,引言,22,22,2025/4/17 周四,4.,原型聚类,LVQ,引言,23,23,2025/4/17 周四,4.,原型聚类,LVQ,引言,24,24,2025/4/17 周四,4.,原型聚类,LVQ,引言,25,25,2025/4/17 周四

6、5.,密度聚类,引言,26,26,2025/4/17 周四,5.,密度聚类,引言,27,27,2025/4/17 周四,5.,密度聚类,引言,28,28,2025/4/17 周四,5.,密度聚类,引言,29,29,2025/4/17 周四,5.,密度聚类,引言,30,30,2025/4/17 周四,5.,密度聚类,引言,31,31,2025/4/17 周四,6.,层次聚类,引言,32,给定聚类簇,Ci,,,Cj,,可以通过下面的式子来计算距离:,32,2025/4/17 周四,6.,层次聚类,引言,33,33,2025/4/17 周四,6.,层次聚类,引言,34,以西瓜数据集,4.0,为例,令,AGNES,算法一直执行到所有样本出现在同一个簇中,即,k=1,,可以得到下面这个树状图,9.12,34,2025/4/17 周四,6.,层次聚类,引言,35,35,2025/4/17 周四,THANK YOU,2018.4.3,参考资料:,周志华,机器学习,CSDN:,周四,

展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服