收藏 分销(赏)

基于最大熵模型的遥感土地利用多分类研究_熊东阳.pdf

上传人:自信****多点 文档编号:282885 上传时间:2023-06-28 格式:PDF 页数:9 大小:1.77MB
下载 相关 举报
基于最大熵模型的遥感土地利用多分类研究_熊东阳.pdf_第1页
第1页 / 共9页
基于最大熵模型的遥感土地利用多分类研究_熊东阳.pdf_第2页
第2页 / 共9页
基于最大熵模型的遥感土地利用多分类研究_熊东阳.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷,第 期自 然 资 源 遥 感,年 月 ,:引用格式:熊东阳,张林,李国庆 基于最大熵模型的遥感土地利用多分类研究 自然资源遥感,():(,():)基于最大熵模型的遥感土地利用多分类研究熊东阳,张 林,李国庆,(中国科学院教育部水土保持与生态环境研究中心,杨凌;中国科学院水利部水土保持研究所,杨凌;中国科学院大学,北京;西北农林科技大学黄土高原土壤侵蚀与旱地农业国家重点实验室,杨凌)摘要:影像解译中对土地利用单分类的关注成为遥感研究的热点问题。最大熵模型()被评价为最有潜力的单分类算法,被广泛应用于土地利用的单分类研究。然而,单分类算法(包括)是否能够进行土地利用多分类尚不明晰。为了解决

2、该问题,文章建立了利用 进行遥感土地利用多分类的技术流程,并将该流程应用在云岩河流域的土地利用多分类研究中。使用总体分类精度、系数、灵敏度以及特异度评估 的总体分类效果以及在各个地类上的预测表现;同时使用 值评估 与随机森林(,)、最大似然法(,)、支持向量机(,)在土地利用预测上的一致性表现。结果表明:的分类表现最好,总体分类精度为,系数为 ;在各个地类上没有最差的表现,甚至在某些地类上达到了最优的表现;与 和 的分类一致性较高,这 种算法预测的土地利用之间一致性评估 值均超过了 ;与其他 种分类算法预测土地利用的差异较大,值小于,说明 不适合该地区的土地利用解译。文章建立的技术流程仅仅依赖

3、于土地利用发生概率,而不依赖于阈值选择,从而使得以 为代表的单分类算法在遥感土地多分类应用中能够发挥巨大潜力。对于大范围的土地利用解译,加入并行计算将有利于提高利用 解决多分类问题的时间效率。关键词:最大熵模型;土地利用;单分类算法;多分类算法;遥感解译;云岩河流域中图法分类号:文献标志码:文章编号:()收稿日期:;修订日期:基金项目:国家自然科学基金项目“潜在植被约束条件下气候变化诱导树种聚合模式演变及其对森林经营启示 以黄土高原为例”(编号:)和国家重点研发计划项目“黄土高原人工生态系统结构改善和功能提升技术”(编号:)共同资助。第一作者:熊东阳(),男,硕士研究生,主要从事遥感土地利用分

4、类算法的研究。:。通信作者:李国庆(),男,副研究员,主要从事植被恢复与 模拟的研究。:。引言土地是地表某一地段包括地质、地貌、气候、水文、土壤、植被等多种自然要素在内的自然综合体,是人类赖以生存与发展的重要资源和物质基础,为人类提供了居住、生产等各方面的资源和条件。因此,获取准确的土地利用信息对于资源调查、环境监控以及国土空间规划与优化布局等诸多生产实践活动起着十分重要的支持作用。传统的土地利用调查是一项工作强度大、时间周期长的系统工程。遥感技术的出现和发展为人类提供了从多维和宏观的角度去认识和研究土地利用的新手段和新方法,同时大大节省了获取土地利用信息的时间和成本。利用卫星影像数据进行土地

5、利用分类是遥感应用研究的主要方向之一。近些年来,随着机器学习技术的高速发展,遥感影像分类算法得到了极大丰富。影像分类算法主要向传统的多分类算法和新颖的单分类算法 个方向发展。在传统的土地利用分类研究中,其主要目标是如何将观察到的众多地物分开,因此发展了很多非常成熟的分类算法,包括支持向量机(,)、随机森林法(,)、最大似然法(,)以及人工神经网络(,)等。随着遥感影像应用广度和深度的拓展,研究的兴趣越来越聚焦于某一种地类,而不关注其他地类,这样做的好处是不需要获得与研究目标无关地物的训练样本点,从而使得遥感解译的野外调查工作量减少。因此产生了很多单分类算法,例如单第 期熊东阳,等:基于最大熵模

6、型的遥感土地利用多分类研究分类支持向量机(,)、最 大 熵 模 型(,)等。将多分类算法应用在单分类实践中,已经有较多的探索。然而将单分类算法应用在多分类的实践中,却很少有研究关注这个问题。这个问题的解决对于拓展遥感多分类算法库有重要的实践意义,同时也对单分类和多分类算法的交叉和融合有重要的理论意义。是一个近年来在影像单分类领域应用最广泛的算法之一,也被评价为最有潜力的算法。在利用 识别单个土地类型时,只需要对感兴趣土地利用类型的样本点进行训练,而不需要训练其他土地利用类型的样本。等利用 和 对一幅 空间分辨率的航空相片进行单个土地类别的分类,结果表明 比 的表现更优;等基于最大熵模型,利用

7、地表反射率数据、归一化植被指数数据以及夜间灯光遥感数据等进行中国城市用地提取时也获得了较好的效果。然而,这些研究仅仅是利用 进行单个土地利用类型分类,而不是多类土地利用分类,从而无法与传统遥感影像多分类算法进行比较。为了探讨将单分类算法应用来解决多分类问题,并进一步丰富遥感土地利用多分类的算法库,本文建立了利用 进行土地利用多分类的技术流程,并将此模型应用于云岩河流域的土地利用解译中。通过比较 与传统多分类算法(,和)对遥感影像解译的差异,探究 在遥感土地利用分类应用中的优劣。本研究为遥感土地利用多分类研究提供了一个新的视角,以期更有利于 在遥感领域的应用与发展。研究区概况和数据源 研究区概况

8、云岩河流域位于陕西省延安市中东部(,如图 所示),是黄河中游的一级支流,干流全长 ,流域总面积为 ,云岩河流域地势西高东低,海拔大致在 之间。气候属于半干旱大陆性季风型气候,一年四季冷暖干湿差异显著。该流域降水季节差异大,年降水量约为 ,并主要集中于 月份。流域地表覆盖主要为厚层黄土,属于典型的以黄土塬为主的塬梁沟壑区。该地区水资源比较丰富,建设有小型灌溉设施以及水电工程。图 研究区概况 数据来源及预处理本文所用的遥感数据为 卫星影像,条带号分别为 和,数据来源于地理空间数据云(:),选取春季(月、月、月)、夏季(月、月、月)、秋季(月、月、月)以及冬季(月、月、月)各 景影像;卫星包括 个传

9、感器、个波段,本研究采用陆地成像仪中的 波段参与分类,其参数信息如表 所示。卫星影像可能会受到周围环境、传感器系统误差等因素的影响,从而产生一定的辐射差异,因此在使用之前需进行预处理。遥感影像的预处理过程主要包括辐射定标、大气校正、影像镶嵌以及裁剪等。表 陆地成像仪波段 参数特征 传感器类型波段波长范围 空间分辨率 主要应用领域陆 地成 像仪(蓝光波段)用于水体穿透、分辨植被和土壤等(绿光波段)用于分辨植被等(红光波段)用于观测道路、裸露土壤和植被等(近 红 外 波段)用于估算生物量、分辨潮湿土壤等 (短波红外 波段)用于分辨道路、土壤和水等 (短波红外 波段)用于矿物识别、分辨植被和潮湿土壤

10、等 数字高程模型(,)数据是进行流域水文分析的基础空间数据,本研究所用的 空间分辨率的 数据来源于地理空间数据云。首先对初始的 幅 数据进行图像镶嵌,使镶嵌后的 包含完自 然 资 源 遥 感 年整的研究区范围;为了减少计算量、提高运算速度,对镶嵌后的 数据进行不规则裁剪处理;然后利用 模型对经过裁剪处理后的 数据进行洼地填充、确定水流方向和计算累积流量等处理,提取云岩河流域矢量边界。是基于()模型开发的,与 配套使用。依据我国土地利用分类现状(),并结合云岩河流域的实际情况,本研究将该流域土地利用类型划分为 类:森林、灌木、草地、耕地、建设用地(房屋和道路)。在对该地区进行广泛实地踏勘的基础上

11、,利用 平台上的高分辨率影像进行随机采样,使采样点尽可能在研究区范围内均匀分布。本研究一共获得 个坐标点,其中包括森林 个、灌木 个、草地 个、耕地 个、建设用地 个。研究方法 的基本思想 是由最大熵原理推导实现的,最大熵原理是在 年 基于 的信息熵概念提出的,其基本思想是仅用已知有限信息推断未知的概率分布,未知信息被假设呈“均匀分布”的,通过熵的最大化来表示这种均匀分布。假设未知概率分布()在一个有限集合 上,其中,(其中 为训练点个数)表示在集合 上的训练样本,对未知概率分布()的约束条件是由集合 上的一组特征,(其中 为特征数)表示,这些特征是对有限集合 的不完整描述。为了估计集合 上的

12、未知概率分布(),需要构造一个近似于未知概率分布()的经验分布?(),其经验分布?()可以表述为:?():。()其中,特征函数 关于经验分布?()的期望值,用?()表示,即?()()。()如果模型可以获取训练数据中的信息,那么可以假设未知概率分布的期望值与其经验分布的期望值相同,可以表述为:()?()。()未知概率分布()的熵可以定义为:()()()。()模型认为,应该在所有满足已知约束条件的模型集合中选取熵最大的模型。软件利用“最大熵原理”估计物种的分布概率,其分布(吉布斯分布)形式为:()(),()式中:为环境变量的个数;为不同环境变量的权重;()为第 个环境变量;为归一化常数。构建基于

13、的土地利用多分类技术流程 是一种概率模型,主要可用于解决单分类问题,。当 应用于遥感影像分类时,研究区的每一个栅格构成了定义 概率分布的空间,每一个地类的训练数据构成样本点(即每个地类的“存在”数据),分类特征数据主要包括遥感影像的不同波段和时段的数据。本文利用 解决遥感影像的多分类问题,基于 等用 语言编写的可以免费获取的 软 件(:)。基本思想是先进行单分类研究,再整合单分类的结果,最终形成土地利用图。其主要技术流程如图 所示。图 最大熵模型进行土地利用多分类的技术流程 )假设研究区共有 种土地利用类型,在 软件中输入 种土地利用类型地面采样点的坐标数据和经过预处理后的遥感影像不同波段数据

14、。)运行结束后,输出 个概率分布图层,第 个第 期熊东阳,等:基于最大熵模型的遥感土地利用多分类研究概率分布图层的栅格值代表该栅格属于第 种土地利用类型的发生概率图。)分别对 个概率分布图层(土地利用类型)编号为,对 软件输出的 个概率分布图层进行空间叠加分析,通过对比 个图层同一位置的概率数值,输出该位置栅格值最大的图层所对应的图层编号。)获得的编号图层即为利用 分类得到的土地利用图。与传统多分类算法比较遥感土地利用分类的目的是将影像中的每一个像元根据其在不同波段的光谱特征、空间结构特征以及其他辅助信息,利用不同的分类算法或数学规则划分到不同的土地利用类别中去,。本研究使用 和 种传统算法进

15、行土地利用分类,即,和,。利 用 软件和 软件(:)实现,和 通过 包中的 函数实现,通过 软件中内置的 模块实现。遥感多分类算法的比较主要包括 种算法的预测准确性评估和算法之间一致性评估。种算法预测准确性评估利用 将通过 高分辨率影像获得的地面采样点数据按照 的比例进行随机分割,其中 的采样点数据用做训练集,用于训练分类器;的采样点数据用做测试集,用于精度评估。利用总体分类精度(,)、系数、灵敏度指数以及特异度指数作为土地利用分类精度评价指标。)总体分类效果评估。和 系数是用来反映分类器的整体表现。描述了遥感影像的分类结果与地面实际的土地利用类型相一致的概率;分析是一种用于准确性评估的离散的

16、多元技术,它考虑了混淆矩阵的所有因素,克服了其他精度评价指标的缺陷,因此常作为比较各分类器总体分类表现优劣的指标。和 系数的计算公式分别为:,()()(),()式中:为土地利用类型数;为总的用于精度评估的采样点数量;为混淆矩阵上第 行、第 列上的像元数量(即正确分类的像元数量);和 为第 行和第 列上总的像元数量。)分土地要素的评估。灵敏度和特异度是用来反映分类器在不同土地利用类别上的分类表现。灵敏度和特异度的计算公式分别为:,(),()式中:为灵敏度;为特异度;为实际为某一地类且预测为该地类的像元数量(真阳性);为实际为某一地类但预测不为该地类的像元数量(假阴性);为实际不为某一地类但预测为

17、该地类的像元数量(假阳性);为实际不为某一地类且预测不为该地类的像元数量(真阴性)。种算法之间一致性评估为了衡量分类图之间的相似性,本文利用 值和混合矩阵进行 种分类算法获得的土地利用图之间的一致性评估。值的计算与总体分类效果评估中的 系数的计算方法相似,但存在区别。具体计算步骤如下:将 种分类算法得到的 个土地利用的栅格图层分别转换为 个向量;将这 个向量之间两两配对计算混合矩阵;通过式()计算 值。由于有 种算法,按照排列组合的规律,应该有 对组合,即可获得 个 值,以此评估 种算法分类结果的一致性。统计量是分类变量分类可靠性的统计度量,它几乎等同于分类可靠性。一致性的评价标准见表。表 系

18、数评价一致性标准 一致性程度 ,)极差,)微弱,)弱,)中度,)高度,极强 结果与分析 总体分类结果与评价使用,和 这 种分类算法进行土地利用分类,分类的结果见图。和 系数作为总体分类精度评价结果见表。结果表自 然 资 源 遥 感 年()()()()图 种算法的土地利用分类图 明,的 为 ,系数为 ,在 种分类算法中表现最差;,和 这 种分类器相较于,分类精度有显著提升,为 ,系数为 ;其中 的分类精度最高,达到,系数达到,说明该算法在云岩河流域识别效果较好。表 种算法的 和 系数 指标算法 不同地类分类结果与评价通过 种分类算法对 种土地利用类型的灵敏度和特异度(表)的研究结果表明,种算法均

19、具有较高的特异度,对 种土地利用类型的特异度指数均达到或超过 ,说明 种算法均具有较低的型错误(即错误被预测为正确)。种分类算法在灵敏度上存在一定的差异性,对 种土地利用类型的灵敏度指数在 之间。,以及 对森林的灵敏度指数均为,说明这 种算法对森林的识别都较为准确;其次,种算法对建设用地的灵敏度指数均大于 ,说明 种算法对建设用地预测的准确性也较高;和 对于草地、耕地的提取表现显著优于其他 种算法;种分类算法对灌木的提取均不太理想,特别是 表现最差。总体来说,相对于其他 种算法在各个土地利用类型上没有最差的表现,甚至达到最优的表现。表 种算法的分类精度比较 土地利用类型灵敏度特异度灵敏度特异度

20、灵敏度特异度灵敏度特异度草地 耕地 灌木 建设用地 森林 一致性检验和混合矩阵 种分类算法产生的土地利用分类图的一致性 检验和混合矩阵结果见图,小图中格子数字表示不同模型分类结果的匹配栅格数量(万个,大小为 );小图上的横坐标(轴)名称为 符号前面的模型,纵坐标(轴)名称为 符号后面模型。与 和 的 系数都超过了 ,表明 与 和 有较高的一致性,达到了高度一致水平,混合矩阵也表明了这 种算法在各个地类上的较高一致性。但 与()()()()()()图 种分类算法分类结果的 一致性检验和混合矩阵 第 期熊东阳,等:基于最大熵模型的遥感土地利用多分类研究 分类图的 值均小于 ,表明 与 分类结果的一

21、致性较差。与此同时,与其他 种算法分类结果的 值也小于 ,表明 与 和 分类结果的一致性较弱,混合矩阵也表明了 与其他算法在各个地类上存在较大差异性。讨论 多分类方法体系与土地利用制图本研究建立了利用 进行遥感土地利用多分类的技术流程,并将此算法应用于云岩河流域的土地利用解译中。通过比较 与传统多分类算法(,和)对遥感影像解译的差异,探究 在遥感土地利用分类应用中的优劣。研究发现:总体分类精度最大,达到,系数为;在各个地类识别上没有最差的表现,甚至在某些地类上达到了最优的表现;与 和 的表现一致性较高,这 种算法产生的土地利用分类图之间一致性评估 值均超过了 。以上研究结果表明,建立的利用 单

22、分类算法解决遥感多分类问题的技术流程是有效的。就目前研究所知,本文是第一次尝试利用 来解决遥感多分类问题的。这个工作流的核心是通过比较栅格中各个土地利用类型的发生概率,认为概率发生最大的土地利用类型即为栅格的状态。这种算法的实现不同于单分类研究中依赖阈值的确定方法,。目前单分类遥感解译中最大的不确定性来源之一就是阈值方法的选择,而本文建立的方法体系不需要面临阈值选择的问题,从而能够避免由于阈值选择而带来的不确定性。本文技术流程虽然只是应用在 中,但同样适用于其他单分类算法,例如、逻辑斯蒂回归模型(,)以及广义线性模型(,)等。本文不仅为遥感土地利用多分类研究提供了一个新的视角,而且也为云岩河流

23、域土地利用制图提供了最精确的算法工具。以往很多研究,力图从采用更高分辨率影像、多源数据融合,以及分类算法改进等多方面提高影像分类精度。而本研究基于 单分类算法,提出一种新的多分类算法,能从总体分类表现上超过传统算法(,和)百分点的准确度,并且在各个地类识别上均表现出最佳或中等以上的分类精度。将 的分类结果作为云岩河流域最终的土地利用图,每种土地利用类型的面积如图 所示。研究表明,森林是云岩河流域最主要的土地利用类型,主要分布于研究区的西南部;其次分别为灌木、草地和耕地,建设用地在该区域分布较少。云岩河流域是黄河的一级支流,该地区是黄土高原水土保持治理的关键区域,及时掌握该地区的土地利用类型及其

24、变化对山水林田湖草沙系统治理具有重要意义。本文利用 获得云岩河流域的土地利用图,能够为后续该区域的土地资源优化配置、景观格局分析以及土地信息系统的构建等提供一定的数据支撑。图 云岩河流域不同土地利用类型的面积 在遥感土地利用多分类应用中的展望自从 年以来,在物种潜在分布研究领域得到了广泛应用。近 来,模型才开始逐渐应用于遥感影像的单分类研究。当主要研究目标为对单个地类进行信息提取时,只需选择目标地类的样本点作为训练数据,此时利用传统的多分类算法进行地类识别时可能会导致效率低下。在这种情况下,单分类算法可能是一种更为有效的替代方法。在过去利用 提取单类土地利用类型的研究中,在城市用地提取、地表水

25、提取以及植被识别等方面都获得了较好的识别效果。以上利用 进行单个地类识别大多是基于 软件的,然而 软件最初是由生态学家们用于物种地理分布的生态位模拟而设计开发的,并不是专门用来进行遥感土地利用分类的。因此,有遥感领域学者在 的参数优化和阈值调整,上做了一些研究,发现通过调整默认参数和更改阈值能够在一定程度上提高遥感解译精度。然而,上述研究也只是针对 的单分类而言的,关于如何进行内在参数优化配置来改进算法、提高 的泛化能力,从而获取更优的影像多分类效果仍需要进一步探索。虽然本研究利用 种算法进行土地利用分类自 然 资 源 遥 感 年时,总体分类表现最优,但是其分类全过程用时较长。利用 进行土地利

26、用分类时,对 软件输出的 个概率分布图层进行空间叠加分析以获取最终的土地利用图时,其运算效率取决于遥感影像的像元数量。当研究区遥感影像的空间分辨率进一步提高或研究范围扩大时,利用此方法进行土地利用分类,运行时长将成倍数增加。因此,提高 土地利用多分类的运算效率是目前亟须解决的问题。鉴于此,如果在后续的相关研究中将并行计算纳入到分类过程中,将有利于提高该模型的运算效率。因此,若将优化后的 集成在遥感影像专业处理软件如 或 中,则对于该模型在遥感领域的应用和发展具有非常重要的意义。结论)比其他 种传统算法(,和)更适合云岩河流域的土地利用分类,总体分类精度达到 ,系数为 ;利用 获取云岩河流域的土

27、地利用图,发现森林是该区域最主要的土地利用类型,其次是灌木、草地、耕地和建设用地。)种不同分类算法对 种地类提取的准确性存在显著差异。种算法对森林、建设用地的提取都表现较好;和 对于草地、耕地的提取表现显著优于其他 种算法;但 对灌木提取的准确性比 更好。)利用 对多光谱影像进行地物信息提取时,其地物识别精度、稳健性等方面都达到或者超过了其他 种传统的分类算法,显示出 在遥感多分类研究中的巨大潜力。但是其分类过程的时间效率相对较低,加入并行计算能够提高 的时间效率。)利用 进行遥感多分类的算法仅仅依赖于各个土地利用类型的发生概率,而不依赖阈值的确定方法,从而能够避免由于阈值选择而带来的不确定性

28、。建立的这套技术流程,在其他单分类算法中具有移植性和拓展性。参考文献():刘南威,郭有立 综合自然地理学(第 版)北京:科学出版社,():,刘彦随 区域土地利用优化配置 北京:学苑出版社,:,舒 弥,杜世宏 国土调查遥感 年进展与挑战 地球信息科学学报,():,():,:,:赵英时 遥感应用分析原理与方法 北京:科学出版社,:,():,():,():,():,:,:,():陈颖彪,郑子豪,吴志峰,等 夜间灯光遥感数据应用综述和展望 地理科学进展,():,():白琪阶,宋志松,王红瑞,等 基于 模型定量分析自然因素与人为因素对水文系统的影响 以漳卫南运河流域为例 自然资源学报,():,:,():

29、,():李 航 统计学习方法 北京:清华大学出版社,第 期熊东阳,等:基于最大熵模型的遥感土地利用多分类研究 :,():,:,():,():周 珂,杨永清,张俨娜,等 光学遥感影像土地利用分类方法综述 科学技术与工程,():,():,:,:,(),:骆剑承,王钦敏,马江洪,等 遥感图像最大似然分类方法的 改进算法 测绘学报,():,():,:张 睿,马建文 支持向量机在遥感数据分类中的应用新进展 地球科学进展,():,():,:李国庆,黄菁华,刘 冠,等 基于 卫星影像土地利用景观破碎化研究 以陕西省延安麻塔流域为例 国土资源遥感,():,:,():,():,():,():许泽宇,沈占锋,李 杨,等 增强型 算法和自适应损失函数的高分辨率遥感影像分类 遥感学报,():,():吴琳琳,李晓燕,毛德华,等 基于遥感和多源地理数据的城市土地利用分类 自然资源遥感,():,():王逸男,孔祥兵,赵春敬,等 年黄土高原植被覆盖度时空格局变化分析 水土保持学报,():,():,:,():,():,:,():,:,():关雪峰,曾宇媚 时空大数据背景下并行数据处理分析挖掘的进展及趋势 地理科学进展,():,():自 然 资 源 遥 感 年 ,(,;,;,;,):()(),()(),(),(),():,;,;,;,:;(责任编辑:张 仙)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服