1、第 卷,第 期自 然 资 源 遥 感,年 月 ,:引用格式:张国建,刘胜震,孙英君,等 基于弱监督鲁棒性自编码的高光谱异常检测 自然资源遥感,():(,():)基于弱监督鲁棒性自编码的高光谱异常检测张国建,刘胜震,孙英君,俞凯杰,刘丽娜(山东建筑大学测绘地理信息学院,济南;自然资源部第一大地测量队,西安;浙江中测新图地理信息技术有限公司,湖州;宁波市鄞州区测绘院,宁波)摘要:高光谱异常检测因其以无监督方式检测目标的能力而受到特别关注,自动编码器及其变体可以自动提取深层特征,还可以检测异常目标。由于训练集中存在异常,自动编码器泛化性较强,从而降低了从背景中区分异常的能力。为解决上述问题,该文提出
2、一种基于弱监督鲁棒性自编码的异常探测算法。首先提出了一种显著类别搜索策略,采用基于概率的类别阈值来标记粗样本,为网络弱监督学习做准备;同时,构建一个具有,范数与异常 背景光谱距离共同约束的鲁棒性自编码网络框架,该框架在训练期间对噪声和异常具有鲁棒性;最后,采用所有样本得到的重构误差检测异常目标。在 个高光谱数据集上进行实验,结果表明,与其他先进的异常检测算法相比,所提算法具有更好的检测性能。关键词:高光谱图像;异常检测;显著类别搜索;鲁棒性 中图法分类号:文献标志码:文章编号:()收稿日期:;修订日期:第一作者:张国建(),男,讲师,主要从事摄影测量与遥感技术方面的研究。:。通信作者:刘胜震(
3、),男,工程师,主要从事测绘方面的研究。:。引言成像光谱仪的出现与发展促进了遥感技术的进步,使得高光谱遥感技术在遥感领域受到越来越多的关注。高光谱影像能够同时获取地球表面空间信息和丰富的光谱信息,这些地物光谱信息在目标探测与地物分类中具有显著优势。目标探测技术是高光谱遥感领域的一个重要应用,而异常探测技术由于不需要任何目标与背景的先验信息,因此实际应用价值更高,广泛应用于精准农业、环境监测、军事领域等。异常目标定义为目标光谱特征与周围地物的光谱特征具有明显差异,且其目标小、数量少、分布随机的特性,因此异常目标的类型往往难以获取。高光谱异常检测通常具有以下特点:异常目标具有低概率特性;异常在光谱
4、特征上与背景明显不同;没有关于背景或异常的光谱先验信息可用;在复杂背景情况下,异常目标与背景混合,往往为混合像元或亚像元。这些特性使得高光谱异常检测成为遥感领域中一个研究热点。近年来,研究者提出大量异常探测算法。由 等提出的 算法通过假设背景服从某种分布,再使用统计方法来估计像素属于异常目标的概率。随后部分研究学者提出一些基于 算法的改进算法,例如非线性的核 异常探测算法、基于权重 探测算法等。然而,真实高光谱影像含有多类背景地物且分布不均匀,因此很难准确对不同背景地物建模,在实际应用中往往受限。为了避免估计背景分布,等提出基于协同表示的异常探测算法(,),该算法假设每个像素可以由背景字典进行
5、线性组合,其中预测值与真值之间的残差被视为像素的异常程度。针对背景字典中存在异常点污染导致检测精度下降的问题,刘万军等利用背景字典与字典均值的距离对背景字典中的各像元自适应设计权重,通过降低异常像元的权重提升检测精度。基于低秩和稀疏矩阵分解的马氏距离异常检测算法(,)通过在去除稀疏异常后充分探索背景的低秩特性来建立背景模型。基于分数傅里叶熵的检测器()创新性地将分数傅里叶熵理论引入高光谱异常检测中,取得了良好的检测结果。尽管上述方法取得了良好的探测效果,但仅利用了低阶自 然 资 源 遥 感 年特征,这也限制了检测器的性能。近年来,深度学习已经应用在高光谱遥感影像分类及目标探测当中,其中自编码网
6、络(,)是非监督学习领域中的一种,其以自动的方式获取抽象的、层次化的特征,已应用到高光谱异常检测中。等提出了一种光谱约束对抗(),其中将光谱约束策略结合到对抗性 中以学习高光谱数据的潜在表示,然后使用双层架构实现异常检测;等提出了基于流形约束 网络,该方法添加嵌入流形学习约束,最后,由全局和局部组成的重构误差用于异常检测。为了提出异常检测性能,等将高光谱影像分解为低秩部分和稀疏部分,低维潜在特征分别由 个堆叠 学习,最后采用局部马氏距离检测异常目标。上述深度方法有效提升了检测性能,网络在经过适当训练的情况下表现良好,而且由于没有背景或异常的先验光谱特征,训练集容易被异常像元破坏。当训练集中存在
7、异常时,学习性能非常好,以至于它可以很好地学习异常并以较小的重建误差重建异常,使得检测性能降低。为解决上述问题,本文提出一种基于弱监督鲁棒性自编码的异常探测算法(,)。该算法首先提出了一种显著类别搜索方法来搜索样本的伪标签,即弱监督学习所需的不准确标签。同时,引入,范数与异常 背景光谱距离构建鲁棒性 (,)框架,以减轻异常部分对参数微调的影响,这使得 网络在训练过程中更加对噪声和异常更具有鲁棒性。最后,将所有光谱样本输入到 模型中,从而产生具重构高光谱影像,利用重构误差以探测异常目标。实验证明,本文方法有效抑制了异常像元对背景建模干扰,同时降低了虚警率,提升了检测精度。方法原理针对训练样本中含
8、有异常目标且 网络训练不稳定问题,本文提出了一种用于高光谱异常检测的弱监督方法,并通过以弱监督方式对所提出的 网络进行对抗训练,从而学习具有背景鲁棒性和异常突出性的端到端重建。图 表示本文提出的 算法的框架,该方法由 个主要部分组成:显著类别搜索、弱监督 学习和重构影像的异常检测。图 算法结构 显著类别搜索针对训练样本中含有异常目标导致异常检测精度降低,结合基于密度的噪声应用空间聚类(,)算法,本文设计一种非监督的背景与异常目标的显著类别搜索算法,其是为弱监督网络学习准备,旨在预测给定输入的伪标签。根据预测的伪标签,该过程搜索包含 个子集,包括一个粗略的异常样本集,其中像素具有较高的属于异常的
9、概率,以及一个粗略的背景样本集,其中像素具有较高的属于背景的概率。因此,显著类别搜索问题可以看作是一个初始异常 背景分离问题,该算法分为 个主要部分:显著类别提取、坐标索引和粗样本集构建。在没有任何背景与目标先验知识的情况下,本文首先应用 的非监督聚类方法获取类别概率图(即聚类结果图)。由于 算法能够发现具有不同大小和形状的簇,并且在噪声和异常值的情况下对指定簇数的聚类性能更具有鲁棒性,因此 在高光谱异常检测中具有显著优势。第 期张国建,等:基于弱监督鲁棒性自编码的高光谱异常检测在聚类过程中,利用 扫描每个像元在(即相邻点之间的最小距离)距离内的邻域,若中心像素的邻居数超过(最小点数),就形成
10、一个簇,其中距离判定方法采用欧氏距离。给定一个输入高光谱影像 ,其中,为波段数,与 分别为行列数。在(,)的条件下,得到类别概率图 。针对不同高光谱影像的聚类类别数量差异很大问题,结合背景样本出现在异常检测中的概率,本文构建一种基于概率的类别阈值方法,其目的是获得粗略的标签划分,而不是精细分类。首先通过设定阈值 ,大于阈值 属于背景的样本的类别标签为,而其他样本可以粗略地分类为类别标签为 的异常,表达式为:()(),()式中:(,),表示类别显著图,作为 的伪类别标签集;(,)为第 个像素点在二维图像空间中的位置坐标,即 ()。根据类别显著图 的坐标索引,搜索粗异常样本集 和粗背景样本集 为:
11、(,),()(,),()式中:粗异常样本集 ;粗背景样本集 ;与 分别表示样本集 与 的样本数,且 。对于粗略异常样本或背景样本集,可以容忍一些类别的判别错误,即 中预测的粗略标签并不总是真实的。因此,将粗背景样本集送入网络模型训练,即以弱监督方式训练,从而提升异常检测的性能。网络 网络是一种非监督学习的网络模型,其由编码器与解码器 部分组成,前者用来将输入数据转换为潜在特征,后者是将潜在特征生成为与原始输入数据相似的重构数据。在 中,编码器的目标是将输入层 经过权重矩阵 和偏置 转换为隐藏层 ,公式为:(),()式中 为激活函数。解码器利用权重矩阵 和偏置 将隐藏层 映射到重构层?:?(),
12、()以神经网络作为函数逼近器,那么数据 的重构误差损失函数为:?。()由于 网络在每个待测像素中都采用 范数的平方,因此噪声或异常像素往往会获得更大的重建误差,这将破坏 网络的重构性能,因此无法判别一些异常像素。通常异常目标受到混合像元的影响,上述显著类别样本无法完整地将所有异常样本准确提取,保留了少部分异常样本位于粗略背景样本集中。,范数在算法中更加有效应对噪声和异常值,并已广泛应用于许多领域。受此启发,本文首先引入,范数作为目标函数,构建了一个新颖的 网络,同时以弱监督的方式来学习 网络,挖掘和增强异常与背景之间的判别特征。目标函数定义如下:?,?(?)(?),()式中;为一个对角矩阵 (
13、?);为一个很小的常数项。由于 在反向传播之前,范数对每个样本的重建误差进行了归一化,因此网络能够学习更多关于背景的信息并抑制异常对网络微调的影响。所以,范数约束的 网络可以更好地处理训练过程中的少部分异常样本。此外,为了更好地区别异常和背景之间的特征,本文构建异常 背景光谱距离(,)约束,其通过以最大化粗异常样本与粗背景样本之间的距离。的值越大,个光谱向量的区分度越高。因此,集合 和 之间的光谱距离 目标函数定义如下:,()式中:(),为 的正交子空间。此外,将粗异常样本集 压缩为异常样本向量,公式为:,()式中 为粗异常样本的平均值。通过将公式()和()的 个目标函数与正的权衡参数 集成在
14、一起,网络的目标函数如下:?,()自 然 资 源 遥 感 年式中:第一部分表示重构误差的,范数,促使 网络学习更多的背景信息,并对噪声和异常目标更具鲁棒性;第二部分表示异常和背景之间的区别特征的 光谱距离,以增强背景与异常的可分性。算法利用粗背景样本集对 网络训练完成后,利用得到训练完成的模型参数()进行异常目标检测。将输入高光谱影像 ,输入至 网络,使用式()的 网络的模型参数()获得重构的高光谱影像?,公式为:?()。()通过上述重建过程,模型()在从背景中识别异常时,使重建的?比原始 更具判别性。因此,最终的异常检测结果使用式()计算,即重构误差,公式为:?。()因此,算法以弱监督的方式
15、进行背景习,其不仅可以生成分布均匀的背景,同时结合构建的,范数损失与 光谱距离损失,以增强异常与背景的分离。本文所提的 算法的探测过程如下:输入:高光谱影像 ,阈值,权衡参数。输出:高光谱异常检测图。)显著类别搜索。利用 算法,根据式(),进行显著类别提取;利用 (),进行坐标索引;根据式()(),构建粗背景样本集 与粗异常样本集 ;)模型训练。初始化,网络模型参数;输入粗样本集 ,异常样本向量 ;迭代训练,根据式()更新网络参数;)异常检测。根据式()(),计算重构误差。实验结果与分析 实验数据在本文中,使用 个高光谱影像数据集来验证所提出算法的有效性,伪彩色图像和异常目标地物真值图,如图
16、所示。如图()()所示,数据集采用 传感器获取,空间分辨率为,影像尺寸为 像素 像素,具有 个光谱波段。如图()()所示,数据集据采用 传感器获取,空间分辨率为 ,影像尺寸为 像素 像素。在 的波长范围内去除水汽波段与噪声波段后,具有 个波段。该数据集共有 个异常像素,异常地物为飞机。如图()()所示,数据集采用 传感器获取,空间分辨率为 ,影像尺寸为 像素 像素,具有 个光谱波段。架飞机被视为异常。如图()()所示,数据集采用 传感器获取,空间分辨率 ,影像尺寸为 像素 像素。()影像 ()目标分布 ()影像()目标分布()影像 ()目标分布 ()影像()目标分布图 个高光谱数据集的伪彩色图
17、像和对应的地物真值图 第 期张国建,等:基于弱监督鲁棒性自编码的高光谱异常检测去除与吸水区域相对应的不良波段后,包含 个波段。由 个像素组成的 架飞机被视为异常。模型结构对比与分析为验证本文提出的 算法的先进性,进行以下消融研究:采用 范数约束的 网络,即();采用,范数约束的 网络,即(,);采用 范数与 光谱距离共同约束的 网络,即();采用,范数与 光谱距离共同约束的 网络,即本文提出的 网络。同时进行显著类别搜索构建粗背景样本集与粗异常样本集,对上述 种对比模型采用弱监督方式的方式进行训练。表 对比了各个模型的 的(,)和(,)值,其中,为算法的检测率,为虚警率,通过设定不同的阈值 计
18、算对应的虚警率与检测率。(,)值越接近,其检测性能越好,(,)值越接近,其误检的概率越低。从中可以看出,相比于传统采用 范数约束的,采用,范数的 或者添入 光谱距离约束的 显著提升了异常检测精度,同时误检的概率也在降低。网络采用的,范数与 光谱距离共同约束的,检测精度比原始范数、,范数以及,范数与 共同约束的 检测精度大幅提升。从引入弱监督训练来看,相比非监督的网络检测结果,基于弱监督的网络检测结果在一定的程度上提升了检查精度,同时也降低了虚警率,这表明采用弱监督学习对高光谱异常检测有积极影响。总之,本文所提出的显著类别搜索方法的弱监督训练策略,以及引入,范数与 光谱距离构建 框架是有效的,表
19、明了所设计方法的先进性和优越性。表 组数据集中消融研究的 值 消融方案 (,)(,)(,)(,)(,)(,)(,)(,)()()(,)(,)()()探测结果与分析为充分验证本文算法的先进性,本文选取了 种先进的异常检测算法进行对比,这 种算法分别为,和 算法。其中,及 为经典传统算法,而 和 是先进的深度学习算法。上述深度学习算法在(,和 )中实现,通过使用 优化网络,初始学习率为 ,隐藏节点数为,批量大小为 ,为 。在本文的 网络中,考虑到网络的像素级处理特性及其对参数的不敏感性,将 固定为,设为,阈值 ,设为 。表 展示了 组数据集中不同异常检测算法的检测结果对比,本文所提出的 算法获得的
20、检测图最接近异常地物真值图。方法可以确保在抑制丰富类别的背景的同时突出显示具有不同大小和形状的异常,而其他对比算法更有可能忽略异常、被背景分散注意力或失去异常的形状。以 数据集为例,确保在最小化背景干扰的同时检测到小目标。在 数据集中,可以捕捉不同尺寸的飞机的形状以及它们的位置,但是,和 并不能有效捕捉。算法几乎失去了 个较小的飞机目标。虽然 也可以清楚地检测到异常,但并不能很好地抑制背景。在 数据集中,具有更多结构信息的异常场景中,算法仍然可以很好地检测异常,甚至是目标的边缘。算法可以发现异常,但它更容易受到背景干扰。如上所述,尽管 在每个数据集中几乎不受背景的影响,但其异常目标很少被突出显
21、示并且丢失了大部分形状信息。算法易受窗口大小的影响,无法在所有数据集上获得完整的异常目标。算法并不能完整的检测到异常目标。和 算法在克服噪声和背景方面的鲁棒性较差。算法尽管能够探测出异常目标,但其抑制背景性能较差。而本文所提出的 算法在检测异常目标的同时,能够很好地抑制背景。自 然 资 源 遥 感 年表 类数据集不同异常检测算法结果对比 算法 异 常 参 考图第 期张国建,等:基于弱监督鲁棒性自编码的高光谱异常检测 本文采用的 组数据集中各异常检测算法的 曲线对比如图 所示。从中可以看出,算法的 曲线总体上位于左上角,显著优于其他对比算法,并且在同等虚警率条件下 算法能够达到更高探测率。尽管
22、算法与其余算法存在交叉,但在总体上仍位于左上角,仍然可以证明本文方法的先进性。而其余算法在不同数据集中展现的 曲线均不稳定,难以适应于所有高光谱数据集。()()()()图 组数据集中各异常检测算法的 曲线对比 表 对比了各异常检测算法的 的(,)和(,)值。从表 中 (,)值可以看出,算法在 组数据集中均获得了最优的检测性能。,和 算法的探测性能具有不稳定性。尽管 与 算法也取得了较高的探测精度,但它们的 (,)普遍高于 算法。从 (,)值可以看出,算法在 组数据集中的误检的概率也是较低的。尽管 算法的 (,)值在 与 中表现为最优,但 仍然是次优的,仍然可以证明本文方法的优越性。综上所述,表
23、 中的 值和图 的 曲线与 数据集中的异常检测图结果均一致,因此 方法比其他先进的异常检测算法更具有竞争力。表 组数据集中各异常检测算法的 值 检测算法 (,)(,)(,)(,)(,)(,)(,)(,)表 记录了 组高光谱数据集采用个异常检测算法的计算时间。算法的平均计算时间更快,但其在检测精度中较差。由于局部窗口参数的影响,方法的运行时间比其他方法要长得多。基自 然 资 源 遥 感 年于深度学习的方法,比传统方法,与 算法的运算效率更高。算法的时间效率在 种深度学习算法中表现最优,这是因为网络上经过训练后直接利用重构误差进行计算异常,而 和 包含了相关的后处理步骤,导致运算时间增加。以上分析
24、再次印证了 强大的竞争力。表 异常检测算法的平均计算时间 ()算法 结论本文提出基于弱监督鲁棒性自编码的异常探测算法()。该算法首先提出了一种显著类别搜索方法来搜索样本的伪标签,即弱监督学习所需的不准确标签。为了减轻传统 对噪声和异常值的敏感性,本文引入,范数与异常 背景光谱距离构建 框架,以减轻异常部分对参数微调的影响。最后网络生成的重构误差以探测异常目标。采用 个高光谱数据集验证了 算法的合理性和优越性,通过将本文算法与其他先进的异常检测算法对比,表明 算法对异常具有更强的鲁棒性,而且能够很好地抑制背景。如何进一步结合空间特征,具体研究异常像元的混合光谱、稀疏性地物问题,将是我们未来工作的
25、重点。参考文献():童庆禧,张 兵,张立福 中国高光谱遥感的前沿进展 遥感学报,():,():张 兵 高光谱图像处理与信息提取前沿 遥感学报,():,():成宝芝 高光谱图像异常目标检测算法研究与进展 国土资源遥感,():,():侯增福,刘镕源,闫柏琨,等 基于波段选择与学习字典的高光谱图像异常探测 国土资源遥感,(),:,(),:,():,:,():,:,():,():,():刘万军,武小杰,曲海成,等 改进协同表示的高光谱图像异常检测算法 计算机应用研究,():,():,():,():,():薛 白,王懿哲,刘书含,等 基于孪生注意力网络的高分辨率遥感影像变化检测 自然资源遥感,():,():韩彦岭,崔鹏霞,杨树瑚,等 基于残差网络特征融合的高光谱图像分类 国土资源遥感,():第 期张国建,等:基于弱监督鲁棒性自编码的高光谱异常检测 ,():,:,():,:,():,():,:,(,;,;,;,):,(),(),:;(责任编辑:李 瑜)