收藏 分销(赏)

系统聚类分析.pptx

上传人:精**** 文档编号:4348266 上传时间:2024-09-09 格式:PPTX 页数:43 大小:354.73KB
下载 相关 举报
系统聚类分析.pptx_第1页
第1页 / 共43页
系统聚类分析.pptx_第2页
第2页 / 共43页
系统聚类分析.pptx_第3页
第3页 / 共43页
系统聚类分析.pptx_第4页
第4页 / 共43页
系统聚类分析.pptx_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、地理系统分析的意义和作用地理系统分析的意义和作用地理系统是一种多要素、多类型、多种区域组合地理系统是一种多要素、多类型、多种区域组合在一起的、具有特殊结构与功能的综合体。因此在一起的、具有特殊结构与功能的综合体。因此对地理系统的研究很重要的一个问题就是要进行对地理系统的研究很重要的一个问题就是要进行地理分区与分类。由于地理系统的复杂性,使地地理分区与分类。由于地理系统的复杂性,使地理学长期不能定量的、客观的、科学的分类。随理学长期不能定量的、客观的、科学的分类。随着生产技术、数学、电子计算机和相邻科学定量着生产技术、数学、电子计算机和相邻科学定量分类法的发展,地理学的分类已从传统的、主要分类法

2、的发展,地理学的分类已从传统的、主要靠经验和定性的知识进行分类向应用数学的方法靠经验和定性的知识进行分类向应用数学的方法和电子计算机进行定量分类。有人称这种分类法和电子计算机进行定量分类。有人称这种分类法为聚类分析。聚类分析法是最新近发展起来的一为聚类分析。聚类分析法是最新近发展起来的一门多元统计方法,它可以避免传统分类法的主观门多元统计方法,它可以避免传统分类法的主观性和任意性的确定。性和任意性的确定。聚类分析聚类分析:根据地理变量(或指标或样品)的属性或根据地理变量(或指标或样品)的属性或特征的相似性、亲疏程度,用数学的方法把它们逐特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,

3、最后得到一个能反映个体或站点之步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系的分析系统。间、群体之间亲疏关系的分析系统。聚类分析法的特点:聚类分析法的特点:1 1、事先无需知道分类对象的分类结构,而只需要一、事先无需知道分类对象的分类结构,而只需要一批地理数据。批地理数据。2 2、选好分类统计量,并按一定的方法步骤进行计算、选好分类统计量,并按一定的方法步骤进行计算3 3、最后自然的、客观的得出一张完整的分类系统图、最后自然的、客观的得出一张完整的分类系统图聚类分析是根据各变量的观测值予以分类的,它聚类分析是根据各变量的观测值予以分类的,它涉及到通过各种途径和手段所得到的有意

4、义的地涉及到通过各种途径和手段所得到的有意义的地理数据。由于要素的量纲、数量级和数量变化幅理数据。由于要素的量纲、数量级和数量变化幅度的差异,如用原始数据进行聚类分析,就是将度的差异,如用原始数据进行聚类分析,就是将不同性质、不同量纲、不同数量变化幅度的数值不同性质、不同量纲、不同数量变化幅度的数值都统计在一起,这样就可能突出某些数量级特别都统计在一起,这样就可能突出某些数量级特别大的变量对分类的作用,而压低甚至排除了某些大的变量对分类的作用,而压低甚至排除了某些数量级很小的变量对分类的作用。为了有利于分数量级很小的变量对分类的作用。为了有利于分析、对比和使分类清晰,常对原始地理数据进行析、对

5、比和使分类清晰,常对原始地理数据进行适当和必要的处理和变换,使其在某种共同的、适当和必要的处理和变换,使其在某种共同的、相对均匀化的数值范围内。相对均匀化的数值范围内。一、聚类要素的数据处理一、聚类要素的数据处理 当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。聚 类 对 象 要 素 在聚类分析中,常用的聚类要素的数据标准化处在聚类分析中,常用的聚类要素的数据标准化处理方法如下:理方法如下:地理数据的对数变换地理数据的对数变换在对地理数据进行标准化之前,应先对数据进行对数变换。设有n个地点、地区,每个地点又有m

6、个指标,用Xij表示第i个地点或地区的第j个指标值。P131地点原始数据自然对数变换海拔高度年平均降水量最大冻土深8级大风日数海拔高度年平均降水量最大冻土深8级大风日数(1)(2)(3)(4)(1)(2)(3)(4)哈巴河532.6173.8150.061.86.278 5.1585.0114.124阿勒泰735.1191.5146.037.76.600 5.2554.9843.630克拉玛依427.0114.4197.075.46.057 4.7405.2834.323巴楚1116.541.661.07.67.018 3.7284.1112.028莎车1231.242.593.011.07.

7、116 3.7504.5332.398于田1427.046.481.01.47.263 3.8374.3940.336数据变换表数据变换表 地理数据的标准化:标准差标准化、极差标准化地理数据的标准化:标准差标准化、极差标准化标准差标准化,即把变换后的数据变换后的数据 减去其均值,再除以其标准差Sj (3.4.2)地点自然对数变换标准差标准化数据海拔高度年平均降水量最大冻土深8级大风日数海拔高度年平均降水量最大冻土深8级大风日数(1)(2)(3)(4)(1)(2)(3)(4)哈巴河6.2785.1585.0114.124-0.9101.0330.6580.865阿勒泰6.6005.2554.98

8、43.630-0.2501.1670.5970.541克拉玛依6.0574.7405.2834.323-1.3630.4551.2710.996巴楚7.0183.7284.1112.0280.607-0.946-1.372-0.511莎车7.1163.7504.5332.3980.808-0.915-0.420-0.268于田7.2633.8374.3940.3361.109-0.795-0.734-1.623地点自然对数变换海拔高度哈巴河6.2780.4440.197136阿勒泰6.6000.1220.014884克拉玛依6.0570.6650.442225巴楚7.0180.2960.087

9、616莎车7.1160.3940.155236于田7.2630.5410.292681合计40.3321.189778平均数6.722 极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。例题:表3.4.2给出了某地区九个农业区的七项指标,对它进行极差标准化处理 表表3.4.2 某地区九个农业区的七项经济指标数据某地区九个农业区的七项经济指标数据 区代号人均耕地x1(hm2/人)劳均耕地x2(hm2/个)水田比重x3(%)复种指数x4(%)粮食亩产x5(kg/hm2)人均粮食x6(kg/人)稻谷占粮食比重x7(%)G10.2941.0935.

10、63113.64510.51036.412.2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G90.1670.4142.994.84231.5574.6

11、1.17 表表3.4.3 极差标准化处理后的数据极差标准化处理后的数据x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.000.451.00G60.030.030.610.690.650.130.59G70.000.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.380.260

12、.040.000.150.000.00二、距离的计算 假设我们把研究的对象(地点)视为假设我们把研究的对象(地点)视为m m维空间的点,所谓距离就是用各维空间的点,所谓距离就是用各种方法计算出各点间的相互距离(种方法计算出各点间的相互距离(d dijij),并用它来刻化各点间的相似并用它来刻化各点间的相似性或亲疏程度。常见的距离有绝对值距离、欧式距离。性或亲疏程度。常见的距离有绝对值距离、欧式距离。绝对值距离绝对值距离 (3.4.5)式中,式中,X Xikik代表第代表第i i个地点的第个地点的第k k个指标的值,个指标的值,X Xjkjk代代表第表第j j个地点的第个地点的第k k个指标的值

13、,个指标的值,k=1k=1,2 2,3 3.,m.,m个指标数的距离系数个指标数的距离系数欧式距离式中,式中,Xik代表第代表第i个地点的第个地点的第k个指标的值,个指标的值,Xjk代表第代表第j个地点的第个地点的第k个指标的值,个指标的值,k=1,2,3.,m个指标数的距离系数个指标数的距离系数(3.4.9)三、直接聚类法 原理:原理:先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可

14、以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。例:根据距离矩阵(3.4.9)式,用直接聚类法对某地区的九个农业区进行聚类分析,步骤如下:在距离矩阵D中,除去对角线元素以外,d49=d94=0.51为最小者,故将第4区与第9区并为一类,划去第9行和第9列;在余下的元素中,除对角线元素以外,在余下的元素中,除对角线元素以外,d75=d57=0.83为最为最小者,故将第小者,故将第5区与第区与第7区并为一类,划掉第区并为一类,划掉第7行和第行和第7列;列;=003.596.314.529.124.288.032.1007.183.006.493.253.579.5078.19

15、9.286.146.472.4077.464.302.686.5023.147.119.2070.210.3052.10)(99ijdD 在第二步之后余下的元素之中,除对角线元在第二步之后余下的元素之中,除对角线元素以外,素以外,d82=d28=0.88为最小者,故将第为最小者,故将第2区区与第与第8区并为一类,划去第区并为一类,划去第8行和第行和第8列;列;=096.314.529.124.288.032.1078.199.286.146.472.4077.464.302.686.5023.147.119.2070.210.3052.10)(99ijdD 在第三步之后余下的元素中,除对角线元

16、素以外,在第三步之后余下的元素中,除对角线元素以外,d43=d34=1.23为最小者,故将第为最小者,故将第3区与第区与第4区并为一类,划去第区并为一类,划去第4行和第行和第4列,此时,第列,此时,第3、4、9区已归并为一类;区已归并为一类;=078.199.286.146.472.4077.464.302.686.5023.147.119.2070.210.3052.10)(99ijdD 在第四步之后余下的元素中,除对角线元素以外,在第四步之后余下的元素中,除对角线元素以外,d21=d12=1.52为最小者,故将第为最小者,故将第1区与第区与第2区并为一区并为一类,划去第类,划去第2行和第行

17、和第2列,此时,第列,此时,第1、2、8区已归并区已归并为一类;为一类;=078.186.146.472.4064.302.686.5070.210.3052.10)(99ijdD 在第五步之后余下的元素中,除对角线元素以外,在第五步之后余下的元素中,除对角线元素以外,d65=d56=1.78为最小者,故将第为最小者,故将第5区与第区与第6区并为一区并为一类,划去第类,划去第6行和第行和第6列,此时,第列,此时,第5、6、7区已归区已归并为一类;并为一类;=078.186.172.4064.386.5010.30)(99ijdD 在第六步之后余下的元素中,除对角线元素以外,在第六步之后余下的元

18、素中,除对角线元素以外,d31=d13=3.10为最小者,故将第为最小者,故将第1区与第区与第3区并为区并为一类,划去第一类,划去第3行和第行和第3列,此时,第列,此时,第1、2、3、4、8、9区已归并为一类;区已归并为一类;=064.386.5010.30)(99ijdD 在第七步之后余下的元素中,除去对角线元素以外,只有在第七步之后余下的元素中,除去对角线元素以外,只有d51=d15=5.86,故将第,故将第1区与第区与第5区并为一类,划去第区并为一类,划去第5行和第行和第5列,此时,第列,此时,第1、2、3、4、5、6、7、8、9、区均归并为一、区均归并为一类;类;根据上述步骤,可以作出

19、聚类过程的谱系图(图根据上述步骤,可以作出聚类过程的谱系图(图3.4.1)=086.50)(99ijdD图3.4.1 直接聚类谱系图 四、最短距离聚类法 原理:最短距离聚类法,是在原来的mm距离矩阵的非对角元素中找出,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式 计算原来各类与新类之间的距离,这样就得到一个新的(m1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。例题:以下根据(3.3.9)式中的距离矩阵,用最短距离聚类法对某地区的九个农业区进行聚类分析。(3.3.10)在99阶距离矩阵D中

20、,非对角元素中最小者是d94=0.51,首先将第4区与第9区并为一类,记为即G10=G4,G9。按照公式(3.3.10)式分别计算G1,G2,G3,G5,G6,G7,G8与G10之间的距离得:d1,10=mind14,d19=min2.19,2.62=2.19d2,10=mind24,d29=min1.47,1.66=1.47d3,10=mind34,d39=min1.23,1.20=1.20d5,10=mind54,d59=min4.77,4.84=4.77d6,10=mind64,d69=min2.99,3.06=2.99d7,10=mind74,d79=min4.06,3.32=3.32

21、d8,10=mind84,d89=min1.29,1.40=1.29这样就得到G1,G2,G3,G5,G6,G7,G8,G10上的一个新的88阶距离矩阵:在上一步骤中所得到的88阶距离矩阵中,非对角元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11=G5,G7。按照公式(3.3.10)式计分别算G1,G2,G3,G6,G8,G10与G11之间的距离,可得到一个新的77阶距离矩阵:在第二步所得到的77阶距离矩阵中,非对角元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12=G2,G8。再按照公式(3.3.10)式分别计算G1,G3,G6,G1

22、0,G11与G12之间的距离,可得到一个新的66阶距离矩阵:在第三步中所得的66阶距离矩阵中,非对角元素中最小者为d6,11=1.07,故将G6与G11归并为一类,记为G13,即G13=G6,G11=G6,(G5,G7)。再按照公式(3.3.10)式计算G1,G3,G10,G12与G13之间的距离,可得到一个新的55阶距离矩阵:在第四步中所得的55阶距离矩阵中,非对角线元素中最小者为d3,10=1.20,故将G3与G10归并为一类,记为G14,即G14=G3,G10=G3,(G4,G9)。再按照公式(3.3.10)式计算G1,G12,G13与G14之间的距离,可得一个新的44阶距离矩阵:在第五

23、步所得到的44阶距离矩阵中,非对角线元素中最小者为d12,14=1.29,故将G12与G14归并为一类,记为G15,即G15=G12,G14=(G2,G8),(G3,(G4,G9)。再按照公式(3.3.10)式计算G1,G13与G15之间的距离,可得一个新的33阶距离矩阵:在第六步所得的33阶距离矩阵中,非对角线元素中最小者为d1,15=1.32,故将G1与G15归并为一类,记为G16,即G16=G1,G15=(G1,(G2,G8),(G3,(G4,G9)。再按照公式(3.3.10)式计算G13与G16之间的距离,可得一个新的22阶距离矩阵:将G13与G16归并为一类。此时,所有分类对象均被归

24、并为一类。综合上述聚类过程,可以作出最短距离聚类谱系图(如图3.4.2所示)。图3.4.2 最短距离聚类谱系图五、最远距离聚类法 最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。最远距离聚类法的计算公式是:例子:对于前面的例子,最远距离聚类法的聚类过程如下:在99阶距离矩阵中,非对角元素中最小者是d94=0.51,将第4区与第9区并为一类,记为G10,即G10=G4,G9。按照公式(3.3.11)分别计算G1,G2,G3,G5,G6,G7,G8与G10之间的距离,得到一个新的88阶距离矩阵:(3.3.11)在第一步所得到的88阶距离矩阵中,非对角线元素中最小者为

25、d57=0.83,故将G5与G7归并为一类,记为G11,即G11=G5,G7。按照公式(3.3.11)式分别计算G1,G2,G3,G6,G8,G10与G11之间的距离,得到一个新的77阶距离矩阵如下:在第二步中所得到的77阶距离矩阵中,非对角线元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12=G2,G8。再按照公式(3.3.11)式分别计算G1,G3,G6,G10,G11与G12之间的距离,得到一个新的66阶距离矩阵如下:在第三步中所得的66阶距离矩阵中,非对角元素中最小者为d3,10=1.23,故将G3与G10归并为一类,记为G13,即G13=G3,G10=G3

26、,(G4,G9)。再按照公式(3.3.11)式计算G1,G6,G11,G12与G13之间的距离,得到一个新的55阶距离矩阵如下:在第四步所得的55阶距离矩阵中,非对角线元素中最小者为d1,12=1.52,故将G1与G12归并为一类,记为G14,即G14=G1,G12=G1,(G2,G8)。再按照公式(3.3.11)式分别计算G6,G11,G13与G14之间的距离,得到一个新的44阶距离矩阵如下:在第五步所得的44阶距离矩阵中,非对角线元素中最小者为d6,11=1.78,故将G6与G11归并为一类,记为G15,即G15=G6,G11=G6,(G5,G7)。再按照公式(3.3.11)式分别计算G13,G14和G15之间的距离,得到一个新的33阶距离矩阵如下:在第六步中所得的33阶距离矩阵中,非对角线元素中最小者为d13,14=3.10,故将G13与G14归并为一类,记为G16,即G16=G13,G14=(G3,(G4,G9),(G1,(G2,G8)。再按照公式(3.3.11)式计算G15与G16之间的距离,可得一个新的22阶距离矩阵如下:将G15与G16归并为一类。此时,各个分类对象均已归并为一类。综合上述聚类过程,可以作出最远距离聚类谱系图(如图3.4.3所示)。图图3.4.3 最远距离聚类谱系图最远距离聚类谱系图G1G2G8G3G4G9G5G7G6

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服