ImageVerifierCode 换一换
格式:PPT , 页数:52 ,大小:603.04KB ,
资源ID:10262516      下载积分:14 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10262516.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(数学建模聚类分析省名师优质课获奖课件市赛课一等奖课件.ppt)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

数学建模聚类分析省名师优质课获奖课件市赛课一等奖课件.ppt

1、本幻灯片资料仅供参考,不能作为科学依据,如有不当之处,请参考专业资料。谢谢,聚 类 分 析,第1页,一、聚类分析(,Cluster Analysis,)介绍,聚类分析是直接比较各事物之间性质,将性质,相近,归为一类,将性质,差异较大,归入不一样类分析技术。,数理统计中数值分类有两种问题:,判别分析,:已知分类情况,将未知个体归入正确类别,聚类分析,:分类情况未知,对数据结构进行分类,第2页,基本思想,聚类分析基本思想:对所研究样品或指标(变量)之间存在着程度不一样相同性(或亲疏关系)。,(1)依据一批样品多个指标,详细找出一些能够度量样品或指标之间相同程度,统计量,。,(2)以这些统计量为分类

2、依据,把一些相同程度,较大,样品(或指标)聚合为一类。,把另一些彼此之间相同程度,较大,样品(或指标)聚合为另一类。,第3页,基本思想,按相同程度大小,把关系,亲密,样品聚合到一个,小,分类单位,关系,疏远,样品聚合到一个,大,分类单位,直到把全部样品(或指标)都聚合完成。,把不一样类型一一划分出来,形成一个由小到大分类系统。再把整个分类系统画成一张分群图(又称,谱系,图),用它把全部样品(或指标)间亲疏关系表示出来。,第4页,要做聚类分析,首先得按照我们聚类目标,从对象中,提取,出能表现这个目标,特征指标,;然后依据亲疏程度进行分类。,聚类分析依据分类对象不一样可分为Q型和R型两大类,Q型是

3、对样本进行分类处理,其作用在于:,含有共同特点样本聚在一起,所得结果比传统定性分类方法更细致、全方面、合理,二、聚类对象,第5页,R型是对变量进行分类处理,其作用在于:,能够了解变量间及变量组合间亲疏关系,能够依据变量聚类结果及它们之间关系,选择主要变量进行回归分析或Q型聚类分析,第6页,2 相同性度量,进行“相关性”或“相同性”度量。在相同性,度量中经常包含有许多主观上考虑,不过最主要,是考虑指标性质或观察尺度。,当样品进行聚类时,“靠近”往往是,距离,。同时对指标进行聚类时,依据,相关系,数或某种,关联性度量来,聚类。,第7页,Q型,样品间“相同性”度量距离,设每个样品有,p,个指标,观察

4、值记为,(1),每个样品 可看成是,p,维,空间一个点。于是,可用各点之间距离来衡量各样品点之间靠近程度。,样品 和 之间距离 ,普通应满足以下条件:,(),且 时当且仅当 ;,();,();,有时所用距离不满足(),但在广义角度上仍称为距离。惯用距离有以下几个:,第8页,3、明考斯基距离(Minkowski),1、绝对距离(Block距离),2、欧氏距离(Euclidean distance),4,、切比雪夫距离(Chebychev),第9页,6.马氏距离,5.数据标准化,以上距离与各变量量纲相关,为了消除量纲,影响,可对数据标准化。,第10页,例1 欧洲各国语言有许多相同之处,有十分,相同

5、为了研究这些语言历史关系,可能经过比较,他们数字表示式比较恰当。表列举出英语,挪威语,,丹麦语,荷兰语,德语,法语,西班牙语,意大利语,,波兰语,匈牙利语和芬兰语1,2,10拼法,希望,计算这11种语言之间语言距离.,第11页,11种欧洲语言数词,第12页,选择适用距离,在聚类分析中通常要结合实际问题来选择,适用,距离,有时应依据实际问题定义新距离,显然,本例无法直接用上述公式来计算距离。但能够发觉,前三种文字,(英、挪、丹)很相同,尤其是每个单词第,一,个字母。能够用10个数词中,第一个,字母,不一样个数,来定义两种语言之间距离。,比如:英语和挪威语中只有1和8第一个字母不一样,则它们之间

6、距离为2。,第13页,第14页,1、夹角余弦,2、相关系数,R型聚类统计量,对两个指标之间相同程度用,相同系数,来刻划,,相同系数,绝对对值越靠近于1,表示指标间关系,越亲密,绝对值越靠近于0,表示指标间关系越,疏远.,第15页,三,系统聚类分析,1.系统聚类分析基本思想是:,距离相近样品(或变量)先聚成类,距离,相远,后,聚成类,过程一直下去,每个样品(或,变量)总能聚到适当类中。,系统聚类分析过程是:,假设总共有,n,个样品(或变量),第一步将每,个样品(或变量)独自聚成一类,共有,n,类;,第16页,第二步依据所确定样品(或变量)“距离”公式,,将距离较近两个样品(或变量)聚合为一类,其

7、他样品(或变量)仍各自聚为一类,共有,n,1,类;,第三步将“距离”最近两个类深入聚成一类,共,聚成,n,2,类;以上步骤一直进行下去,,最终,将全部样品或变量)聚成一类。,将整个分类系统地画成一张谱系图,所以有时,系统聚类分析,也叫,谱系聚类分析,。,第17页,2.,类间距离,首先定义类与类之间地距离,又类间距离定义,不一样产生不一样系统聚类分析。常见类间距离,有,法。它们归类步骤基本是一致。,8,种之多,与之对应系统聚类分析也有,8,种之多、,分别为最短距离法、最长距离法、中间距离法、重心,法、类平均法、可变类平均法、可变法和离差平方和,第18页,用,i,j,表示样品 。用 表示 与 之

8、间距离,用 与 表示两个类,所包含样品数分别为,与 之间距离用 表示。下面给出四种最惯用类与类之间距离定义。,第19页,1、最短距离(Nearest Neighbor),x,21,x,12,x,22,x,11,第20页,即定义 与 之间距离为 与 中最近两个样品距离。,类与类之间最短距离有以下递推公式。设 由 与,合并而成,则 与其它类 最短距离为,第21页,1、,依据样品特征,要求样品之间距离 ,共有 个。将全部列表,记为,D,(,0,)表,该表是一张对称表。全部样本点各自为一类。,2、,选择,D,(,0,)表中最小非零数,不妨假设 ,于是将 和 合并为一类,记为 。,开始各样本自成一类,最

9、短距离法进行聚类分析步骤以下:,第22页,3、利用递推公式计算新类与其它类之间距离。分别,删除,D,(0)表第p,q行和第p,q列,并新增一行和一列添上结果,产生,D,(1)表。,第23页,4、在,D,(1)表再选择,最小,非零数,其对应两类有组成新类,再利用递推公式计算新类与其它类之间距离。分别删除,D,(1)表对应行和列,并新增一行和一列添上新类和旧类之间距离。结果,产生,D,(2)表。类推直至全部样本点归为一类为止。,第24页,最短距离法进行聚类分析步骤以下:,(,1)定义样品之间距离,(2)找出距离最小元素,设为,,,则将,合并成一新类记为,记为,(,3,),按,上,式计算新类与其它类

10、之间距离。,(4)重复(2),(3)步骤,直到将全部元素,并成一类为止。,(假如某一步距离最小元素不止一个,则将对,应这些最小元素类能够同时合并),第25页,例2 设有6个样品,每个只测一个指标,分别是1,2,5,7,9,10,试采取,绝对值,距离用,最短距离,法将它们进行分类。,第26页,解(1)样品首先采取绝对值距离,计算样品之,间距离阵为,D,(0).,G,1,G,2,G,3,G,4,G,5,G,6,G,1,0,G,2,1,0,G,3,4,3,0,G,4,6,5,2,0,G,5,8,7,4,2,0,G,6,9,8,5,2,1,0,D,(0),第27页,G,2,=2,G,1,=1,G,3,

11、5,G,4,=7,G,5,=9,G,6,=10,G,7,G,8,G,9,G,10,1,2,3,D,第28页,2.最长距离(Furthest,Neighbor,),x,11,x,21,第29页,即定义 与 之间距离为 与 中最远两个样品距离。,类与类之间最长距离有以下递推公式。设 由 与,合并而成,则 到 最长距离为,2.最长距离(Furthest Neighbor),第30页,组间平均连接(Between-group Linkage),3.类平均距离,第31页,组内平均连接法(Within-group Linkage),x,21,x,12,x,22,x,11,3.类平均距离,第32页,4.重

12、心法(Centroid clustering):均值点距离,第33页,将p和q合并为k,则k类样品个数为,它重心是,某一类 r 重心是,,它与新类k距离是,经推导能够得到以下递推公式:,设聚类到某一步,类p与 q分别有样品,、,个,,第34页,例2 设有6个样品,每个只测一个指标,分别是1,2,5,7,9,10,试采取欧氏距离平方,试用重心法将它们进行分类。,G,1,G,2,G,3,G,4,G,5,G,6,G,1,0,G,2,1,0,G,3,16,9,0,G,4,36,25,4,0,G,5,64,49,16,4,0,G,6,81,64,25,9,1,0,D,2,(0),第35页,G,7,G,3

13、G,4,G,8,G,7,0,G,3,12.25,0,G,4,30.25,4,0,G,8,64,20.25,6.25,0,D,2,(1),其中,第36页,D,2,(2),G,7,G,9,G,8,G,7,0,G,9,20.25,0,G,8,64,12.25,0,D,2,(3),G,7,G,10,G,7,0,G,10,39.0625,0,第37页,G,1,=1,G,2,=2,G,3,=5,G,4,=7,G,5,=9,G,6,=10,2,4,12.5,D,1,G,9,G,7,G,8,G,10,G,11,第38页,5.动态聚类法(快速聚类法),系统聚类法,是一个比较成功聚类方法。然而当样本点数量十分,

14、庞大,时,则是一件非常繁重工作,且聚类计算速度也比较慢。,比如在市场抽样调查中,有4万人就其对衣着偏好作了回答,希望能快速将他们分为几类。,这时,采取系统聚类法就很困难,而动态聚类法就会显得方便,适用。,动态聚类使用于大型数据。,第39页,基本思想:选取若干个样品作为凝聚点,计算每个样品和凝聚点距离,进行初始分类,然后依据初始分类计算其重心,再进行第二次分类,一直到全部样品不再调整为止。,第40页,选择凝聚点,分 类,修改分类,分类是否合理,分类结束,Yes,No,第41页,用一个简单例子来说明动态聚类法工作过程。比如我们要把图中点分成两类。,快速聚类步骤:,1、随机选取两个点 和 作为凝聚点

15、2、对于任何点 ,分别计算,3、若 ,则将 划为第一类,不然划给第二类。,4、分别计算两个类重心,则得 和 ,以其为新凝聚点,对空间中点进行重新分类,得到新分类。,第42页,(b)任取两个凝聚点,(c)第一次分类,(d)求各类中心,(a)空间群点,第43页,(e)第二次分类,第44页,动态聚类法,优点:计算量小,方法简便,能够依据经验,先作主观分类。,缺点:结果受选择凝聚点好坏影响,分类结果不稳定。,第45页,第一,选择凝聚点;,第二,初始分类;,对于取定凝聚点,视每个凝聚点为一类,将每个样品依据定义距离向最近凝聚点归类。,第三,修改分类,得到初始分类,计算各类重心,以这些重心作为新凝聚点

16、重新进行分类,重复步骤2,3,直到分类结果与上一步分类结果相同,表明分类已经合理为止。,动态聚类法基本步骤:,第46页,例3:某商店5位售货员销售量和教育程度以下表:,售货员,1,2,3,4,5,销售量(千件),1,1,6,8,8,教育程度,1,2,3,2,0,对这5位售货员分类。,第47页,选择凝聚点,1,为最大。可选择2和5作为凝聚点。,计算各样品点两两之间距离,得到以下距离矩阵,第48页,对于取定凝聚点,视每个凝聚点为一类,将每个样品依据定义距离,向最近凝聚点归类。,1,G,1,G,2,1,3,4,得到初始分类为:,:,:,2.初始分类,第49页,计算G,1,和G,2,重心:G,1,重心(1,1.5),,G,2,重心(7.33,1.67),G,1,G,2,1,2,3,4,5,得到分类结果:,:,:,3.修改分类,以这两个重心点作为凝聚点,再按最小距离标准重新聚类,重心是指每类均值向量,第50页,售货员,1,2,3,4,5,销售量(千件),1,1,6,8,8,教育程度,1,2,3,2,0,对这5位售货员分类。,G,1,重心(1+1)/第一类中样品个数=1,1.5),,G,2,重心(6+8+8)/3=7.33,1.67),第51页,修改前后所分类相同,故可停顿修改。,和,。,5个售货员可分为两类,第52页,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服