收藏 分销(赏)

遥感图像特征提取毕业论文正文终稿.docx

上传人:胜**** 文档编号:2121761 上传时间:2024-05-16 格式:DOCX 页数:33 大小:1.91MB
下载 相关 举报
遥感图像特征提取毕业论文正文终稿.docx_第1页
第1页 / 共33页
遥感图像特征提取毕业论文正文终稿.docx_第2页
第2页 / 共33页
遥感图像特征提取毕业论文正文终稿.docx_第3页
第3页 / 共33页
遥感图像特征提取毕业论文正文终稿.docx_第4页
第4页 / 共33页
遥感图像特征提取毕业论文正文终稿.docx_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、摘 要遥感图像在民用方面、精确定位等方面都有非常重要的作用,遥感图像的自动识别最关键的就是遥感图像的特征提取,为此开展遥感图像的特征提取研究具有非常显著的应用前景和实际意义。这次我主要研究和讨论了遥感图像的光谱特征特征提取方法。本文介绍了遥感和遥感技术发展的现状、图像的研究现状和特征提取,然后叙述了遥感图像特征提取方法的算法和基本理论,介绍了目前常用的光谱特征提取方法。在以上的基础上,针对传统的KPCA和PCA方法总结遥感数据的特点以及遥感图像光谱特征的缺陷,本文讨论一种将模糊-均值聚类与KPCA方法相结合的多光谱遥感图像特征提取的方法,并着重研究了此方法在多光谱遥感图像特征提取中的算法、理论

2、及其实现。通过对本文方法与KPCA和PCA方法的试验结果进行比较,证实了这种方法特征提取的性能较前两种方法有着显著的提高,可有效地提取出多光谱图像中的非线性信息。 关键词 遥感图像;遥感数据;光谱特征;特征提取;KPCA;FCM;AbstractRemote sensing image has great importance for military reconnaissance, precision attack and civil activities. Feature extraction is critical for the automatic recognition techno

3、logy of remote sensing image, so it has good application prospect to study feature extraction methods of remote sensing image. This thesis focuses the research work mainly on the feature extraction methods of spectrum.First, the thesis introduces the concept and development of remote sensing image,

4、the basic concept and research of image feature extraction. Then the thesis introduces the basic theory and algorithms of remote sensing image feature extraction methods. The commonly used remote sensing image feature extraction methods for spectrum are generalized separately. Considering the charac

5、ter of the remote sensing image data and the limitation of traditional PCA and KPCA methods when they are used to extract the spectrum feature of remote sensing image, a combination of the FCM and KPCA methods is used for extracting the spectrum feature. Both the theory and algorithm are studied, as

6、 well as the implementation. A comparison between the results of PCA, KPCA and FCM+KPCA methods is given, which shows that the FCM+KPCA method can give a much better result than other methods, especially in extracting the nonlinear information of multi spectral remote sensing images.Keywords Remote

7、sensing image Spectrum feature Feature extraction KPCA FCMIII目录一绪论11.1遥感技术概述11.2 遥感及遥感图像特征提取的现状2二遥感图像的光谱特征提取技术42.1 光谱特征提取技术研究的现状42.2 常用的光谱特征提取方法42.2.1典型分析方法52.2.2 主成分分析方法72.2.3 K-T变换9三遥感图像多光谱(非线性)特征提取113.1 FCM聚类算法113.1.1 FCM聚类算法发展背景113.1.2 FCM聚类算法模糊-均值聚类数学基础113.1.3 FCM聚类算法模糊-均值聚类原理及内容133.2 KPCA核主成分分

8、析法143.2.1 KPCA核主成分分析法原理及内容143.2.1 核函数原理及内容163.3 基于FCM和KPCA的多光谱图像特征提取17四实验结论分析与问题184.1 用标准PCA方法提取图像特征结果194.2 用KPCA方法提取图像特征结果214.3 用基于发FCM和KPCA的方法提取图像特征结果224.4 性能分析与比较23结论23个人总结24参考文献26武汉理工大学毕业设计(遥感图像特征提取算法研究)一绪论1.1遥感技术概述到目前为止它遥感技术是能够提供全球范围的动态观测数据的唯一手段,对所获取的信息进行提取、判定、加工、处理及应用分析的广泛综合性技术,它广泛应用于灾害预报、环境监测

9、、航空、航天、军事侦察、灾害预报、环境监测、土地规划与利用、灾害动态监测、资源勘探、农作物估产、气象预报等很多军事及民用领域,并且在这些领域中有着举足轻重的地位,对经济和社会发展起重大的推动作用。遥感能动态反映地面事物的变化 遥感探测能周期性、重复地对同一地区进行对地观测,这有助于人们通过所获取的遥感数据,发现并动态地跟踪地球上许多事物的变化。同时,研究自然界的变化规律。尤其是在监视天气状况、自然灾害、环境污染甚至军事目标等方面,遥感的运用就显得格外重要。遥感获取的数据具有综合性 遥感探测所获取的是同一时段、覆盖大范围地区的遥感数据,这些数据综合地展现了地球上许多自然与人文现象,宏观地反映了地

10、球上各种事物的形态与分布,真实地体现了地质、地貌、土壤、植被、水文、人工构筑物等地物的特征,全面地揭示了地理事物之间的关联性。并且这些数据在时间上具有相同的现势性。遥感获取信息的手段多,信息量大。根据不同的任务,遥感技术可选用不同波段和遥感仪器来获取信息。例如可采用可见光探测物体,也可采用紫外线,红外线和微波探测物体。利用不同波段对物体不同的穿透性,还可获取地物内部信息。例如,地面深层、水的下层,冰层下的水体,沙漠下面的地物特性等,微波波段还可以全天候的工作。遥感(Remote Sensing),字面的含义可以解释为遥远感知。它是一种远离目标,在不和对象目标直接接触的情况下,通过某一个平台上装

11、载的传感器来获取其特征信息。截止目前为止它是能够提供全球范围内动态观测数据的唯一手段,得到数据后对所获取的信息进行提取、判定、加工、处理及应用与分析的广泛综合性技术,大范围应用于灾害预报、环境监测、航空、航天、军事侦察、土地规划与利用、灾害动态监测、资源勘探、农作物估产、气象预报等很多军事民用领域,并且在这些领域中有着举足轻重的地位,对经济和社会发展起重要的推动作用。遥感是20世纪60年代兴起发展起来的一门综合性探测技术。它在航空摄影测量测算的基础上,伴随着电子计算机技术当代科技的迅速发展,以及地理学、生物学等各个学科发展的需要,逐渐的发展成为的一门新兴技术学科。其理论基础在于根据研究目标的种

12、类及处于的环境不同,从而对不同波长的电磁波信号具有不同的反射或辐射效应。而遥感技术利用的正是这种特性,通过研究探测目标的电磁波信息,从而分析出目标的几何信息和物理属性。遥感技术作为一种我们现在信息时代的产物和工具,具有探测范围广、获取信息快、信息量丰富、周期性动态观测、获取效率高等显著优势,因此可以说:遥感技术是当前人类获取时空信息的最有效的技术和手段之一。遥感目前应用正由定性向定量、静态向动态方向发展。遥感影像的空间分辨率己达到米级;波段数已增加到数十甚至上百个;回归周期可达几天甚至十多个小时。与遥感应用紧密相关的遥感信息处理理论和技术也有了实质性的提高。在遥感数据处理软件方面,国际上相继推

13、出了一批具有高水平的遥感影像处理商业软件包,比如加拿大ERM公司研制的ER MAPPER、美国ERDAS公司推出的ERDAS IMAGINE、新加坡3-Link公司研制的ENVI等遥感图像处理系统。所有这些都为遥感的应用奠定了坚实的基础。 1.2 遥感及遥感图像特征提取的现状为了便于分析,往往需要对给定的图像用更简单更明确的数值、符号或图形来表示。它们反映了图像中基本的信息,称之为图像的特征。图像特征是图像内部所具有的最基本内容,是该图像特有的、用于区别它和其它图像的最本质的属性。图像特征是因为景物的物理属性与几何特性使图像中局部区域中的灰度产生明显的变化而形成的,因而特征的存在就意味着在该局

14、部区域中有较大的信息量,而在图像中没有特征的区域,就只有较小的信息量。图像特征是分析图像的重要依据,获取图像特征信息的操作被称为特征提取。它作为图像理解、模式识别和信息量压缩的基础是很重要的。如图3-1所示,这样可以获得特征构成的图像(称为特征图像)和特征参数。或者增强处理特征提取特征提取图像特征量(特征参数)特征空间特征抽象化描述分类模式识别图像理解 图1.2.1 图像的特征提取图像特征提取涉及的范围很广。从一幅图像中提取什么样的特征,需要根据用户所关心的方面来决定。由于图像具有很强的领域性,不同的领域图像特征千差万别,与图像中所反映的对象物体各种物理的、形态的性能有很大的关联,因此有着各种

15、各样的特殊方法。在遥感图像分析中特征提取可以从两个意义上来实施:一种是按照一定的准则直接从原始空间中选出一个子集(即子空间),波段选择就属于此类;另一类是在原始特征空间和新特征空间之间找到某种映射关系,,将原始特征空间。映射到维数降低了的特征空间中去,。对于用于分类目的的特征提取,好的特征提取方法能使同类物质样本的分布具有密集性,而不同类物质的样本在特征空间中能够隔离分布,为进一步分类打下良好基础。遥感信息特征提取方法手段各异。在二十世纪七十年代至八十年代,软件技术尚不成熟,遥感信息特征提取主要是依靠遥感工作者目视解译来完成。这种方法以前尽管常被使用,但其耗时多、周期长的缺陷影响了遥感技术作用

16、的发挥。随着计算机的普及和软件水平的提高,从事遥感研究的学者们开始利用新的技术手段来提取遥感信息。由于图像特征提取具有很强的实用性,国内外测绘界、计算机视觉、模式识别与人工智能等领域都对图像特征(特别是线状特征)提取进行了深入研究。国外例如美国Mckeown实验室、瑞士的Amobe项目、德国的波恩大学、奥地利的格拉茨大学和法国地理学院等,国内的武汉大学、国防科技大学、信息工程大学等在这方面都作了很多工作,有些成果己具备初步的实用价值。但由于对图像特征理解的复杂性,尽管人们提出了很多特征提取算法,但现有的特征提取算法基本上还处于实验阶段,其准确性、实用性、通用性等方面离大规模实际应用的要求还有很

17、大差距。1.3研究的目标及内容PCA、FCM和KPCA方法具有运算量大、耗费时间长的缺点,针对该缺点及遥感数据的特点,通过对KPCA方法的输入数据方法进行改进,这样可能能够大大的降低计算的复杂度。所以此次我研究的目标就是找到一种方法对所输入的数据进行预处理,使得输入的图像或参数能够获得良好的特征提取性能,可有效地提取多光谱图像的非线性特征。 研究目标:本文对基于光谱的遥感图像特征提取的问题进行了研究,共分为三个部分,各部分的主要主要内容如下:第一部分主要介绍遥感的概念、发展现状,以及遥感图像特征的分类、特征提取的研究目的与意义和研究现状。第二部分介绍了遥感图像常用光谱特征提取的方法。其中包括主

18、成分分析法、KT变换方法、典型分析法以及基于遗传算法的特征提取法。第三部分给出一种多光谱图像特征提取方法基于KPCA和FCM多光谱图像特征提取方法。针对缺点及遥感数据的特点,通过对KPCA方法的输入数据方法进行改进,这样能够极大的降低计算的复杂度。最后通过实验说明本文中的方法能够有效的提取多光谱图像的非线性特征。二遥感图像的光谱特征提取技术遥感图像中包含着极为丰富的信息,图像特征结构比较复杂,不仅包括植被、地形、水文这样的自然特征,还包括房屋和道路这样的地上景物。此外,这些特征之间的关系也有一定的复杂度,不论是几何关系还是语义关系,都不是用简单的方法所能描述清楚的。在遥感图像分类识别的过程中,

19、图像的各种特征提取技术在其中扮演了十分重要角色。光谱特征和纹理特征是遥感图像的两大基本特征,也是进行遥感图像分析所依据的两个基本要素。人们在研究中利用的基本上只是地物光谱信息,光谱信息反映了地物反射电磁波能量的大小,是地物特征性状较直观的反映。2.1 光谱特征提取技术研究的现状光谱特征是图像中目标物的颜色及灰度或者波段间的亮度比等。光谱特征通过原始波段的点运算获得。它的特点是,它对应于每个像元,但与像元的排列等空间结构无关。光谱特征是一种地物区别于另一种地物的本质特征,是组成地物成分、结构等属性的反映,是遥感的基本出发点,是遥感图像数据中最为重要的信息。遥感图像光谱特征分析包括遥感传感器的光谱

20、分辨率和辐射分辨率。光谱分辨率(波谱分辨率)是指遥感传感器所用的波段数目、波段波长以及波段宽度。辐射分辨率(亮度分辨率)是指在一个波段中所记录的代表地物反射电磁波的强度(表现为亮度或灰度)的所有可能的数值。一般地,高的光谱和辐射分辨率能有效地提高遥感识别地物的能力。为了获得目标体的信息,常常要对遥感图像进行干扰信息的压抑和排除,突出有用信息,这时就需要用到图像特征提取的方法。经典的用于遥感图像分类处理中的光谱特征提取方法可以归纳为代数运算法、导数法、变换法三种方法。2.2 常用的光谱特征提取方法光谱遥感技术已经成为人们获取地球表面信息的一种主要的手段之一,发挥着越来越广泛的社会效益。随着光谱遥

21、感技术朝着“三高”(高空间分辨率、高光谱分辨率、高时相分辨率)和“三多”(多传感器、多平台、多角度)迅猛发展,人们将获取越来越庞大的光谱遥感数据。然而目前遥感信息的提取和利用水平大大滞后于遥感技术的发展,因此研究新的理论和方法提高遥感信息的提取水平具有十分重要的意义。2.2.1典型分析方法典型分析方法(Canonical Analysis,简称CA),在特征提取提取方法中也称为判别分析特征提取法,能够对任意数据集最大化其类间方差与类内方差 的比值,从而保证了其最大的可分离性。在遥感图像分类过程中,总是希望既能减少各类的类内灰度方差,又能够增大类间的灰度方差,以减少分类困难,提高分类精度。为此需

22、要选择恰当的投影方向,使同类的像元尽可能集中,不同类的像元尽可能的分开,这样处理后再进行分类,肯定将有利于分类精度的提高,这就是典型分析变换的出发点与基本思想。由于典型分析变换是在用训练样本取得的分类统计特征基础上的正交线性变换,因而可以用一般线性变换式来表示。问题的关键是如何从训练样本数据中找到一个理想的变换矩阵。下面介绍获得变换矩阵的具体步骤。选择训练样本在待研究的图像中,按照不同的地物类型选取训练场地及训练样本,这和一般监督分类方法所采用的训练程序相似,但选择的地物类别不一定包括所有的类别。设有个变量(波段),选取个类别,第类选取个标本,为在类训练样本中的第个像元第个变量的观测值。计算类

23、内及类间的协方差矩阵和根据所选定的训练样本,先计算总的均值向量和各类的均值向量以及协方差矩阵,即: (2.1) (2.2) (2.3) 式中:; (2.4) ; (2.5) ; (2.6) (2.7) 再用下式计算总的类内协方差矩阵和类间协方差矩阵: ; (2.8) (2.9) 其中,。 (2.10) 构成特征向量矩阵求出的特征值,并按大小顺序排列,然后求出与各特征值相对应的归一化特征向量,特征向量满足: 构成特征向量矩阵: 计算变换矩阵第一步,计算并构成矩阵 第二步,计算,及第三步,求的特征值及与之相应的特征向量,并构成矩阵第四步,算出变换矩阵: (2.11)最后用矩阵进行CA变换 (2.1

24、2)CA变换以类间差异和类内差异比值最大为优化条件,使得最大特征值相对应的第一典型轴包含了最大的可分信息,与次大特征相对应的第二坐标轴包含了第二大可分信息,依此类推。因为对应有个波段、类地物的遥感数据,CA变换最多能得到维非零子空间(即),只有个特征轴具有可分离信息,这就是说CA变换在增大类别可分性的同时也降低了数据空间的维数。2.2.2 主成分分析方法主成分分析(Principal component analysis)也称为K-L变换,是在统计特征基础上的多维(如多波段)正交线性变换,它也是遥感数字图像处理中最常用的一种变换算法。主成分分析是一种把原来多个指标化为少数几个相互独立的综合指标

25、的一种分析技术,对波段间高度相关的数据非常有用。一幅多波段图像的不同波段之间往往存在着很高的相关性,这就说明有相当一部分数据是冗余的。主成分变换的目的就是把原来各波段中的有用信息集中到数目尽可能少的新的主成分图像中,并使这些主成分图像之间互不相关,即各自包含不同的地物信息,同时使得原始图像的信息量损失最小。主成分分析的原理如图2.3.1所示。ABpq图2.3.1 主成分变换原理图因本特征向量的方向指向特征空间中集群分布的结构轴方向(图2-1中的和),所以该变换的几何意义是把原始特征空间的特征轴旋转到平行于混合集群结构轴的方向上去,得到新的特征轴。从图中可见,特征对应的的本特征值为,而对应。当时

26、,特征便可舍去,只用来表示原始集群的有效信息就足够了。主成分分析方法的步骤设原始图像数据矩阵为: (2.13)其中,和分别为波段数(或称变量数)和每幅图像中的像元数;矩阵中每一行矢量表示一个波段的图像。一般图像的线性变换可用下式表示: 式中为待变换图像数据矩阵,为变换后的数据矩阵,为实现这一线性变换的变换矩阵。主成分分析的具体步骤如下:第一步,根据原始图像数据矩阵,求出它的协方差矩阵,的协方差矩为: (2.14)式中: (2.15) (2.16) (即为第个波段的均值) (2.17) (2.18)S是一个实对称矩阵。第二步,求矩阵的特征值和特征向量,并组成变换矩阵,具体如下。考虑特征方程:式中

27、,为单位矩阵,为特征向量。解上述的特征方程即可求出协方差矩阵的各个特征值 ,将其按排列,求得各特征值对应的单位特征向量(经归一化) : (2.19)若以各特征向量为列构成矩阵,即: 矩阵满足:(单位矩阵),则矩阵是正交矩阵。矩阵的转置矩阵即为所求的主成分分析的变换矩阵。有了变换矩阵,将其代入,则: (2.20)式中矩阵的行向量为第主成分。经过主成分变换后,得到一组(个)新的变量(即的各个行向量),它们依次被称为第一主成分、第二主成分、第主成分。这时若将矩阵的各行恢复为二维图像时,即可以得到个主成分图像。2.2.3 K-T变换K-T变换即缨帽变换,是一种基于启发式考虑建立起来的,并不是建立在严格

28、的理论推导基础上的。此项技术最早应用于1976年,Kauth 和Thomas通过对MSS图像进行数值分析来研究农作物和植被生长过程的影像变化时,发现MSS图像波谱信息随时间变化的空间分布有一定规律性,它的形状像一个顶部有缨子的毡帽,缨帽的底面恰好反映了土壤信息的特征,称之为土壤面,它与植被的波谱特征互不相关。这种分析信息结构的正交线性变换就被称为缨帽变换。它是利用图像变量之间的相关性,在变量空间进行转轴变换,建立起K-T空间的3个新轴,分别命名为亮度,绿度和湿度轴。通过缨帽变换就可以成功地建立起光谱综合信息与自然景物特征间的联系,可以达到消除干扰分离信息的目的。Crist和Cicona将此种变

29、换方法应用于陆地卫星TM数据,将光谱信息综合成与自然景观特征相联系的信息,使其具有明确的物理意义。 X7X6X4X5ISBIGVIYIN0图2.3.2 K-T变换示意图K-T变换基于如下的统计事实 :把各种土壤和各种植被地物按它们在陆地卫星图像4个波段(和)中的亮度值(和)投影到光谱特征空间中,落在一个形似三角形帽状的集群范围内,如图2-4所示。缨帽结构反映出如下规律性:作物幼苗的遥感图像主要反映土壤波谱特征;随着幼苗的长大,其波谱特征逐渐向绿色植被区方向逼近;达到顶点后,作物成熟,变黄,枯萎,收割,其波谱特征又向土壤面回落。为了增强和提取上述变换信息,Kauth和Thomas在总结MSS图像

30、数据特征的基础上,提出了一种适用于MSS图像数据特征的基础上,提出了一种适用于MSS图像数据的经验线性变换,使其波谱特征空间变换到几个有物理意义的方向上,即: (2.21)式中:X为MSS图像4个波段数据组成的矩阵,每一行为一个波段像元组成的向量;Y为缨帽变换后的数据矩阵;R为缨帽变换的正交变换矩阵,;r为补偿向量,意在避免Y有负值出现。K-T变换对于处理Landsat/MSS和TM数据,尤其是提取的植被信息,由于利用了所有波段的线性组合,提取的植被信息量比只利用两个波段的植被指数NDVI要高。缨帽变换的缺点是依赖于传感器,固定的转换系数对其他的传感器不适用。三遥感图像多光谱(非线性)特征提取

31、分类是多光谱图像解译以及其它方面应用中的重要步骤,而特征提取则是保证图像分类精度的关键。主成分分析(PCA)是最为常用的特征提取方法,被广泛应用到许多领域。在一些文献中,PCA方法被用于提取多光谱图像的特征。然而,从本质上讲主成分分析方法是一种线性映射算法,这种方法只能保证线性特征被提取出来,而非线性特征很有可能会丢失。为此,一些文献提出了核主成分分析方法(KPCA),用于处理非线性问题。KPCA计算使用核矩阵,核矩阵的维数等于样本点的数量,由于多光谱图像中包含着大量的观测数据,带来核矩阵的维数比较大,造成计算复杂度增加。因此,KPCA很难直接处理多光谱图像。针对PCA和KPCA方法处理多光谱

32、图像的不足,本文利用一种基于聚类和KPCA的方法来提取多光谱图像中的非线性特征。因为聚类具有满足全局分布结构的特性,使用聚类的方法可把所有样本分为给定数量的类,每个类中的样本具有高度的内在相似性。由于每个类的中心在他们所在的类中更有代表性,可以代表该类作为KPCA算法的输入采样。这样,核矩阵的阶数就随着样本点分类而减少,大大降低了核矩阵的计算复杂度。3.1 FCM聚类算法3.1.1 FCM聚类算法发展背景聚类算法是一种多元统计分类方法,这种方法不必事先知道分类对象的分类结构,而是基于整个数据集内部存在若干“分组”或“聚类”为出发点而产生的一种数据描述方法。聚类分析的具体算法很多,有系统聚类法、

33、动态聚类法、神经网络聚类法、-均值聚类法、模糊-均值聚类方法等。对多谱图像进行聚类分析的目标是将所有样本分为给定数目的类。这样每个类的中心能够更加好的代表数据,它们将被作为KPCA的输入样本。模糊-均值聚类(Fuzzy C-Means Clustering,FCM)算法是Bezdek在1981年提出得最著名的模糊聚类分析算法,是结合-均值算法和模糊集理论而提出的。相对于模糊-均值算法,-均值算法也称为硬-均值算法。3.1.2 FCM聚类算法模糊-均值聚类数学基础给定数据集,其中,令为的幂集(集合的所有子集组成的集合)。的硬-划分就是集合族(是正整数),即将划分为类,其中每个就是一类。硬-划分可

34、以用中元素的特征(隶属度)函数来描述。属于,则;不属于,则。因此给定的值,则就可以惟一确定的一个硬-划分,反之亦然。应满足以下三个条件用元素构成矩阵,即可得到硬-划分的矩阵形式,定义如下:定义1 硬-划分:令为任意集合,为实阶矩阵的集合满足公式(3.2)到(3.4),为大于2小于的整数,则的硬-划分空间为集合 (3.1)但是硬-划分存在两个问题:一是中元素的非此即彼的性质,即隶属度只能取0或1,而实际上事物的划分不是严格的非此即彼的性质;硬-划分的另一个问题是空间过大。事实上,把划分为个非空子集的划法共有) (3.2)尽管离散的生成一个有限空间,但由于中元素的数量太多,以至于寻求“最佳”划分成

35、为令人生畏的任务。若将变为一个连续变量,使其在区间上任意取值,则就能够算出某个目标函数关于的梯度。进而利用梯度找到最好的搜索方向,从而大大简化寻求最佳划分的方法。基于上述两种原因(概念上的适当性和计算上的简便性),引入模糊-划分概念。定义2 模糊-划分:令,和的含义同定义1,则的模糊-划分空间为集合其中为隶属于类的隶属度,并满足。从空间或中选取“最佳”划分的方法之一为目标函数法。研究得最多得目标函数是总体组内误差平方和(overall within-group sum of squared errors),其定义为: (3.3)式中或,是类的中心。在目标函数法中,最优的类就是使目标函数达到局部

36、最小值的类。如果一类中的所有点都贴近于它们的类中心,则目标函数很小。-均值聚类算法其实就是常见的对应硬-划分空间的寻找目标函数最小值从而求得最优划分的算法之一。模糊-均值算法的目标在于找到和(),使得目标函数 (3.4)最小,其中为模糊加权指数。下面首先建立这个最小化问题的必要条件,然后根据此条件提出模糊-均值算法。定理1 令,为一给定数据集。设定和,假设对所有的和有。则仅当 和 时,和()才是的局部最小值。3.1.3 FCM聚类算法模糊-均值聚类原理及内容模糊-均值聚类是一种自动对数据样本进行分类的方法。它通过优化模糊目标函数得到每个样本点对类中心的隶属度,从而决定样本点的归属。下面结合遥感

37、图像说明算法及其步骤。设要进行聚类分析的图像像素数,图像像素集合,其中 ,为波段数。设把图像像素分为个类别,每个类别的聚类中心,聚类中心集合。用表示像素隶属于以为中心的类别的隶属度,定义隶属度矩阵如下: (3.5)矩阵中每一列的元素表明所对应的像素隶属于个类别中各个类的隶属度。满足以下的约束条件: (3.6)对隶属度进行了模糊化,可取0到1之间的任意实数,这样,一个像素可以同时隶属于不同的类别,但其隶属度的总和总是等于1。定义目标函数: (3.7)其中为Euclidean距离;为模糊加权指数。参数又称为平滑因子,控制着模式在模糊类间的分享程度,因此,要实现模糊聚类就必须选定一个,然而最佳的选取

38、目前尚缺乏理论指导。对目标函数进行最优化计算时,由于目标函数包含两个参数,故按拉普拉斯乘数进行优化计算时,对进行交替迭代优化计算。FCM算法的步骤如下: 确定聚类数,加权指数,中止误差,最大迭代次数LOOP。初始化隶属度矩阵。开始循环,当迭代次数为时,根据计算: (3.8)对,计算:若对所有的()满足,则对此计算 (3.9)若对某一个,有满足,则对应此,令;。若或,停止;否则置,并返回第三步。FCM算法允许自由选取聚类个数,每一向量接其指定的隶属度聚类到每一聚类中心。FCM算法是通过最小化目标函数来实现数据聚类的。3.2 KPCA核主成分分析法3.2.1 KPCA核主成分分析法原理及内容主成分

39、分析方法PCA是一种线性映射算法,这种方法只能保证线性特征被提取出来,而非线性特征很有可能会丢失。为此,一些文献提出了核主成分分析方法(KPCA),用于处理非线性问题。KPCA在经典的主成分分析基础上,通过引入核函数把数据非线性映射到高维核空间,在核空间利用传统的PCA技术进行特征提取。KPCA是一种新的非线性主成分分析方法,它基于输入数据的高阶统计,描述了多个像素间的相关性,同时可以把在输入空间不可线性分类的问题变换到特征空间实现线性分类,简化了分类器的设计。核主成分分析(kernel principal component analysis KPCA)方法是将核函数与一般的主成分分析有机融

40、合而形成的一种提取非线性特征的方法。下面简要介绍一下针对多光谱图像的KPCA方法,首先假设聚类中心被选取作为KPCA的输入样本,把输入空间通过非线性变换映射到特征空间,即:中的样本点记为,假设它们已被中心化,即满足如下条件: (3.10)空间中样本的协方差矩阵为: (3.11) 根据 (3.12)求的特征值和所对应的特征向量,的特征值均为非负。由于所有的特征向量可表示为空间中的样本(的线性张量,可记 (3.13)考虑等式 (3.14)定义一个有序核矩阵: (3.15)其中和为样本向量,为核函数。一般地,核函数可采用高斯核函数,表示形状参量。将(3.27)(3.28)代入(3.29)得 (3.1

41、6) 最初的核变换并不能保证,因此有必要对核矩阵进行归一化,表达式如下: (3.17)其中,是一个矩阵,。则特征值等式可以写为: (3.18) 根据等式(3.32),得到一组非零特征值以及对应的满足归一化条件(3.33)的特征向量。 (3.19)设是多光谱图像的观测数据,是图像像素数。则多光谱图像的第幅主成分图像可通过把所有变换后的观测数据按照顺序投影到第个特征向量得到。即: (3.20)由以上分析可见,KPCA是在特征空间进行通常的线性主成分分析,因此KPCA仍然保持线性PCA的各种数学与统计性质。KPCA是在高维特征空间中对角化核矩阵,非零特征根的数目最多为样本向量的个数,它通常高于样本向量的维数。特征空间的维数很高,甚至可能是无穷维的。但是KPCA并不是在整个特征空间中寻求主分量,它只是在由个观测数据所张成的子空间中寻求主分量,因而计算量只取决于样本集的大小,而与特征空间的维数无关。其次,我们不必计算非线性变换和内积,只需计算核函数,因而与PCA相比计算量的增加不会太大。KPCA算法的基本步骤如下:(1

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服