1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,.,*,本章主要内容:,5.1灰色关联聚类,5.2灰色变权聚类,5.3灰色定权聚类,5.4基于三角白化权函数的灰色评估,5.5灰色聚类应用,第 五 章 灰 色 聚 类 评 估,1,.,灰色聚类是根据灰色关联矩阵,或灰数的白化权函数,将一些观测指标或观测对象聚集成若干个可以定义类别的方法。按聚类对象划分,可以分为灰色关联聚类,和灰色白化权函数聚类,。,灰色关联聚类主要用于同类因素的归并,以使复杂系统简化。由此,我们可以检查许多因素中是否有若干个因素关系十分密切,使我们既能够用这些因素的综合平均指标或其中的某一个因
2、素来代表这几个因素,又可以使信息不受到严重损失。,灰色白化权函数聚类主要用于检查观测对象是否属于事先设定的不同类别,以区别对待。,2,.,5.1 灰色关联聚类,设有 个观测对象,每个观测对象 个特征数据,得到序列如下,对所有的 计算出 与 的绝对关联度,得上三角矩阵,3,.,其中,定义5.1.1,上述矩阵A称为特征变量关联矩阵.,取定临界值 一般要求 当 时,则视 与 为同类特征.,定义5.1.2,特征变量在临界值 下的分类称为特征变量的 灰色,关联聚类.可以根据实际问题的需要确定,越接近于1,分类,越细;越小,分类越粗糙.,4,.,例5.1.1,评定某一职位的任职资格。评委们提出了15个指标
3、1申请书印象,2学术能力,3讨人喜欢,4自信程度,5精明,6诚实,7推销能力,8经验,9积极性,10抱负,11外貌,12理解能力,13潜力,14交际能力,15适应能力。,大家认为某些指标可能是相关或混同的,希望通过对少数对象的观测结果,将上述指标适当归类,删去一些不必要的指标,简化考察标准。对上述指标采取打分的办法使之定量化,9名考察对象各个指标所得的分数如表5.1.1所示。,5,.,表5.1.1 9名考察对象15个指标得分情况,观测对象,指标,1,2,3,4,5,6,7,8,9,X,1,6,9,7,5,6,7,9,9,9,X,2,2,5,3,8,8,7,8,9,7,X,3,5,8,6,5,
4、8,6,8,8,8,X,4,8,10,9,6,4,8,8,9,8,X,5,7,9,8,5,4,7,8,9,8,X,6,8,9,9,9,9,10,8,8,8,X,7,8,10,7,2,2,5,8,8,5,X,8,3,5,4,8,8,9,10,10,9,X,9,8,9,9,4,5,6,8,9,8,X,10,9,9,9,5,5,5,10,10,9,X,11,7,10,8,6,8,7,9,9,9,X,12,7,8,8,8,8,8,8,9,8,X,13,5,8,6,7,8,6,9,9,8,X,14,7,8,8,6,7,6,8,9,8,X,15,10,10,10,5,7,6,10,10,10,6,.,表5
5、1.2 指标关联矩阵,X,1,X,2,X,3,X,4,X,5,X,6,X,7,X,8,X,9,X,10,X,11,X,12,X,13,X,14,X,15,X,1,1,.66,.88,.52,.58,.77,.51,.66,.51,.51,.9,.88,.8,.67,.51,X,2,1,.07,.51,.53,.59,.5,.99,.51,.51,.63,.62,.77,.55,.51,X,3,1,.56,.7,.51,.72,.51,.51,.51,.8,.78,.9,.63,.51,X,4,1,.56,.53,.58,.51,.69,.62,.52,.52,.51,.54,.6,X,5,1
6、07,.51,.53,.53,.52,.61,.61,.55,.75,.52,X,6,1,.51,.59,.05,.52,.84,.86,.66,.81,.51,X,7,1,.5,.7,.83,.51,.51,.51,.51,.89,X,8,1,.51,.51,.63,.62,.77,.55,.51,X,9,1,.81,.52,.52,.51,.53,.76,X,10,1,.51,.51,.51,.52,.92,X,11,1,.97,.74,.71,.51,X,12,1,.73,.72,.51,X,13,1,.6,.51,X,14,1,.52,X,15,1,7,.,5.2 灰色变权聚类,定
7、义5.2.1,设有n个聚类对象,m个聚类指标,s个不同灰类,根据第i(i=1,n)个对象关于j(j=1,m)指标的样本值x,ij,将第i个对象归入第k(k=1,s)个灰类之中,称为灰色聚类.,定义5.2.2,将n个对象关于指标j的取值相应地分为s个灰类,我们称之为j指标子类.j指标k子类的白化权函数记为,8,.,定义5.2.3,设j指标k子类的白化权函数 为如下图所示的典型白化权函,则称 ,为 的转折点,典型白化权函数记为,9,.,什么是白化权函数?,在灰数的分布信息已知时,往往采取非等权白化。例如某人2005年的年龄可能是30岁到45岁,是个灰数。根据了解,此人受初、中级教育共12年,并且是
8、在80年代中期考入大学的,故此人年龄到2005年为38岁左右的可能性较大,或者说在36岁到40岁的可能性较大。这样的灰数,如果再作等权白化,显然是不合理的。为此,我们用白化权函数来描述一个灰数对其取值范围内不同数值的“偏爱”程度。,10,.,什么是白化权函数?,例 图1.4.1中白化权函数 表示贷款额这一灰数及其受“偏爱”程度。其中,直线用来表示“正常愿望”,即“偏爱”程度与资金(万元)成比例增加。不同的斜率表示欲望的强烈程度不同,表示较为平缓的欲望,认为贷给10万元不行,贷给20万元就比较满意,贷给30万元就足够了;表示愿望强烈,贷给35万元也只有20%的满意程度;表明即使贷给40万元,满意
9、程度才达到10%,但贷50万元就行了,即非要接近50万元不可,没有减少的余地。,11,.,什么是白化权函数?,定义1.4.4 起点、终点确定左升、右降连续函数称为典型白化权函数。,典型白化权函数一般如图1.4.2(a)所示。,12,.,定义5.2.4:,1,、若白化权函数 无第一和第二个转折点 ,则称 为下限测度白化权函数,记为,2、若白化权函数 的第二和第三个转折点重合,则称 为适中测度白化权函数,,记为,3、若 无第三和第四个转折点,则称 为上限测度白化权函数,记为,13,.,14,.,命题5.2.1 对于典型白化权函数,有,相应地,下限测度白化权函数为,15,.,适中测度白化权函数为,上
10、限测度白化权函数为,16,.,定义5.2.5,:1、对于图1所示的j指标k子类白化权函数,令 ;2、对于图2所示的j指标k子类白化权函数,令,3、对于图5.2.1和图5.2.4所示的j指标k子类白化权函数,令,则称,j,k,为j指标k子类临界值。,定义5.2.6,设,j,k,为j指标k子类临界值,则称,为j指标关于k子类的权。,17,.,定义5.2.7 设x,ij,为对象i关于指标j的标本,f,j,k,()为j指标k子类白化权函数,,j,k,为j指标关于k子类的权,则称,为对象i属于k灰类的灰色变权聚类系数。,18,.,定义5.2.8 称 1、,为对象i属于k灰类的灰色变权聚类系数。,2、,为
11、聚类系数矩阵。,19,.,定义 5.2.9 设 ,则称对象i属于灰类k,*,灰色变权聚类适用于指标的意义、量纲皆相同的情形,当指标的意义、量纲不同,且指标的样本值在数量上悬殊较大时,不宜采用灰色变权聚类。,20,.,5.3 灰色定权聚类,当聚类指标的意义、量纲不同,且在数量上悬殊较大时,采用灰色变权聚类可能导致某些指标参与聚类的作用十分微弱。,解决上述问题有两条途径:1、采用初值化算子或均值化算子将指标样本值化为无量纲数据,然后进行聚类。这种方式不能反映不同指标在聚类过程中的差异性。,2、对各聚类指标事先赋权,即定权聚类。,21,.,定义 5.3.1,设x,ij,(i=1,n;j=1,m,)为
12、对象i关于指标j的样本值,,为j指标k子类白化权函数。若j指标关于k子类的权 与k无关,即对任意的 ,有,j,k1,=,j,k2,,记为,j,,并称 为对象j属于k灰类的灰色定权聚类系数。,22,.,定义5.3.2,设 为对象i关于指标j的样本值,,为j指标k子类白化权函数。若对任意的j总有 ,则称,为对象i属于k灰类的灰色等权聚类系数。,23,.,灰色定权聚类按下列步骤进行:,1、给出j指标k子类白化权函数:,2、根据定性分析结论确定各指标的聚类权:,3、由前两步得到的结果以及对象j关于k指标的样本值x,ij,算出灰色定权聚类系数:,4、若 ,则对象i属于灰类,24,.,例子:我国主要造林树
13、种生态适应性的灰色聚类。,我国国土辽阔,生态环境复杂,不同树种生态条件差异大。一个树种目前的生长区域一定条件反映了生态适应性。我们将生态环境条件分为地理生态值、温度生态值、雨量生态值和干燥生态值四个主要量化指标。,25,.,其中,地理值指标(j=1)衡量地理分布上广度指标,用东西经度差与南北纬度差乘积表示;温度值(j=2)用南北温度差表示;雨量值(j=3)用平均降雨量最大最小值之差表示;干燥值(j=4)用平均干燥度最大最小值之差表示。,我国17个主要造林树种的四个生态值指标如下表。试按广适应性、中适应性和狭适应性(k=1,2,3)作灰色聚类。,26,.,我国主要造林树种的四个生态值表,地理值,
14、温度值,雨量值,干燥值,1、樟子松,23,4,0,0,2、红松,79,6,600,0.75,3、水曲松,144,7,300,0.75,4、胡杨,300,6.1,189,12.00,5、梭梭,456,12,250,12.00,6、油松,189,8,700,1.50,7、侧柏,369,8,1300,2.25,8、白榆,1127,16.2,550,3.00,27,.,9、旱柳,260,11,600,1.00,10、白毛杨,200,8,600,1.25,11、麻栎,475,10,1000,0.75,12、华山松,314,8,900,0.75,13、马尾松,283,7.4,1300,0.50,14、杉木
15、240,8,1200,0.50,15、毛竹,160,5,1000,0.25,16、樟树,270,8,1200,0.25,17、南亚松,9,1,200,0,续前表,28,.,解:由于指标意义不同,且数量悬殊大,采用灰色定权聚类。,第一步:定性分析并给出各指标的广、中和狭的白化权函数f,j,k,()(j=1,2,3,4;k=1,2,3).,f,1,1,0,300,-,-,f,1,2,0,150,-,300,f,1,3,-,-,50,100,f,2,1,0,10,-,-,f,2,2,0,7.5,-,15,f,2,3,-,-,4,8,f,3,1,0,1000,-,-,f,3,2,0,600,-,12
16、00,f,3,3,-,-,300,600,f,4,1,0,1,-,-,f,4,2,0,0.5,-,1,f,4,3,-,-,0.25,0.5,29,.,由上述白化权函数可得对应数学表达式。,第二步:取地理生态值、温度生态值、雨量生态值和干燥生态值的权分别为:,1,=0.3,2,=0.25,3,=0.25,4,=0.2,第三步:由,可计算出定权聚类系数矩阵,为:,30,.,=(,i,k,)=,31,.,第四步:根据聚类系数矩阵,找出各对象的最大聚类系数所在的灰类,即为该对象的所属灰类。,广适应性树种:4胡杨、5梭梭、6油松、7侧柏、8白榆、9旱柳、10白毛杨、11麻栎、12华山松、13马尾松、14
17、杉木、16樟树;,中适应性树种:2红松、3水曲松、15毛竹;,狭适应性树种:1樟子松、17南亚松。,32,.,5.4基于三角白化权函数的灰色评估,本节介绍基于三角白化权函数的灰色评估方法。,设有n个对象,m个评估指标,s个不同的灰类,对象i关于指标j的样本观测值为x,ij,我们要根据x,ij,的值对相应的对象i进行评估、诊断.基于三角白化权函数的灰色评估方法的具体步骤如下:,33,.,第一步:,按照评估要求所需划分的灰类数s,将各个指标的取值范围也相应地划分为s个灰类.例如将j指标的取值范围a,1,a,s+1,划分为,a,1,a,2,a,k,a,k+1,a,s-1,a,s,a,s,a,s+1,
18、其中a,k,的值一般可根据实际情况的要求或定性研究结果确定。,34,.,第二步:,令,k,=(a,k,+a,k+1,)/2属于第k个灰类的白化权函数值为1,连接(,k,1)与第k-1个灰类的起点a,k-1,和第k+1个灰类的终点a,k+2,,得到指标j关于k灰类的三角白化权函数f,j,k,()。对于f,j,1,()和f,j,s,(),可分别将指标取数域向左、右延拓至a,0,,a,s+2,(见下图),35,.,36,.,对于指标j的一个观测值x,可由下列公式计算出其属于k灰类的隶属度f,j,k,(x)。,f,j,k,(x)=,37,.,第三步:,计算对象i关于灰类k的综合聚类系数,i,k,其
19、中f,j,k,(x,ij,)为j指标k子类白化权函数,,j,为指标j在综合聚类中的权重。,第四步:,由 ,判断对象i属于灰类k*;当有多个对象同属于灰类k*时,还可以进一步根据综合聚类系数的大小确定同属于灰类k*之各个对象的优劣或位次。,38,.,5.5 灰色聚类应用,1.关联聚类应用飞机方案的选择。,将灰色系统理论应用到飞机设计方案评价中,研究了一种含有方案评价指标体系和考虑评价指标权重以及灰关联分析的飞机方案优选灰色模糊聚类决策理论,这种决策理论利用指标权重将评价指标联系在一起,在评价方案与理想方案灰关联度的基础上进行灰色模糊聚类,实现方案优选.最后以一个短距/垂直起降(V/STOL)飞机
20、设计实例证实此方法的科学性与可行性.通过各种方案和评价指标之间的关联度分析来选择。,39,.,2.公路交通中交叉路口安全状况灰色聚类评价研究,对信号交叉口的状况进行分析和评价,发达国家通常采用饱和度和停车延误两项指标.在我国,由于机动车、非机动车、行人在交叉口处混行严重,现有的评价方法需要进一步发展.本文提出了一种新的评价方法,采用五个指标全面反映混合交通状况下交叉口的综合性能,运用灰色系统理论对信号交叉口综合质量进行灰色评价.研究表明,灰色聚类用于信号交叉口的综合评价,机理简单,实用性强.,40,.,3.灰色聚类决策在上市公司投资中的应用,灰色聚类分析是利用灰色系统中的决策理论,将不同的决策
21、对象,根据评判指标,按照一定的评判目标进行聚类分析,从而对对象优劣进行排序,为投资者提供决策的参考依据。文章介绍了灰类聚类决策模型的原理,并在此基础上详细阐述了其在上市公司投资中的应用。,4、日用陶瓷等级的灰色聚类分析,利用灰色聚类分析的原理和方法来确定日用陶瓷等级归属问题,避免了人为判断中的主观任意性,从而使等级归属问题有定性判断推进到定量计算。,41,.,结课作业2,已知2008年河南省下述五市幼儿园教育数据如表所示,试利用灰色定权聚类评估方法把五地区幼儿教育分为好、中等和差三个灰类。,地区,常住人口,(万人),幼儿园,(所),教职工,(人),在园幼儿,(人),洛阳,642,295,4643,104124,安阳,521,365,5367,73322,信阳,669,281,3138,133026,南阳,1004,405,4250,180493,濮阳,350,134,3197,50971,42,.,
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818