1、第 卷 第 期兵 器 装 备 工 程 学 报 年 月 收稿日期:修回日期:基金项目:国家自然科学基金项目()中国博士后科学基金项目()作者简介:贾世耀()男博士工程师:.:./.基于尺度无关损失优化的无锚图像目标检测贾世耀杨 祥潘思琦(交通运输部东海航海保障中心 上海航标处 上海)摘要:遥感影像中的目标检测是图像分析领域的一个基本而又具有挑战性的问题特别是针对任意对象的海上目标检测近年来受到广泛关注 针对任意对象的图像目标尺度和形状不规则导致的目标检测参数敏感以及复杂背景和密集排列在非极大值抑制过程中出现假阴性的问题提出了基于尺度基于尺度无关损失优化的无锚图像目标检测算法 将旋转边界框回归引入
2、到典型的无锚网络全卷积单级目标检测器中提出了与尺度无关的 ()损失用于图像目标检测的边界框回归可以快速将预测框的形状调整为开始时与真实相似的形状解决回归损失函数与检测器最终最优目标之间的不相容性的问题并在回归过程中加快收敛速度 数据集实验表明:本方法在各类别 曲线下面积的平均值()优于现有的广义交并比()损失函数和完全交并比()损失函数函数关键词:无锚回归损失函数面向任意对象检测尺度无关性图像目标检测本文引用格式:贾世耀杨祥潘思琦.基于尺度无关损失优化的无锚图像目标检测.兵器装备工程学报():.:.():.中图分类号:文献标识码:文章编号:()():.().()/()/().:引言随着深度学习
3、被广泛应用于遥感图像中的目标检测一系列基于卷积神经网络()的检测器被提出并且取得了良好的表现 然而许多检测器的开发都使用了通用目标检测框架而其中水平边界框用于定位目标 对于通常具有复杂背景和密集排列的遥感图像的目标检测具有额外背景信息的水平边界框()在非极大值抑制过程中难以处理这可能导致假阴性 由于这种问题的存在许多带有定向边界框()的检测器应势而生 然而这些框架大多依赖于锚点的设置对于未知对象需要放置不同比例和纵横比的锚点来进行预测和定位 显然使用固定参数预测未知物体会使检测器的性能严重依赖先验信息对参数的变化极为敏感同时导致冗余计算 为了缓解这个问题有人提出的无锚框架选择通过训练热图并通过
4、选择热图 上的峰值来预测对象的关键点 但大多数无锚框架仍然使用水平边界框来定位目标 定向边界框应用在无锚网络中并不是一种流行的做法除了骨干框架和锚机制的优化外还有一些检测器专门通过优化损失函数来提高检测性能 用于边界框回归的一系列损失函数 和 范数在许多检测器中被广泛采用 然而 并不适合作为边框回归的通用指标来评估预测框和真实框之间交并比()因此相关研究提出了一系列损失函数直接优化评估度量本身 损失函数会首先将所有绑定变量作为一个整体进行回归但在非重叠情况下存在梯度消失问题 损失函数扩展了 的概念并通过引入惩罚因子避免了非重叠情况下 损失函数的普拉托问题 惩罚因子缓解了非重叠情况下的梯度消失问
5、题但仍然存在边界框差异测量不全面和收敛速度慢的问题本文针对边界框回归提出了一种基于 损失的与尺度无关的 ()损失函数通过在 损失中添加惩罚因子来衡量 个框的形状之间的差异将一种特殊的形状表示方法改编成 形式考虑形状差异指标通过将 损失应用于无锚检测器可以生成旋转边界框来预测对象实现高性能的任意对象目标检测 无锚图像目标检测算法.旋转式全卷积单级目标检测器本节通过构建一个无锚基线为定向边界框()的回归设计与尺度无关的 ()损失将 损失应用于基线检测器以构建旋转式全卷积单级目标检测器旋转式全卷积单级目标检测器的整体结构如图 所示图 旋转式全卷积单级目标检测器的整体结构.本方法首先使用卷积神经网络作
6、为主干从输入图像中提取特征图应用 生成多个比例特征图并使用一个共享头来回归特征图上点的类别和位置 在回归分支中使用 个分支来完成对象分类和边界框回归 对于分类分类分支用于预测置信度中心度分支用于获取特征图中每个点的中心度 中心度是到目标对象中心的归一化距离 它可以以如下方式定义:()()()()()其中()用于描述目标的位置 通过添加中心度分支远离目标中心的框将被非极大值抑制压低 旋转式全卷积单级目标检测器的训练损失由 部分组成:分类损失、中心度损失、角度回归损失和边界框回归损失 损失函数如下:()()()()其中 表示分类的焦点损失表示中心度的二元交叉熵()损失表示分类分数表示角度回归的平滑
7、 损失表示角度回归分数表示边界框回归的 损失如果 将 为 否则为 表示回归分数表示正样本的数量.广义 损失函数为了在训练时获得更好的 回归性能本文提出了贾世耀等:基于尺度无关损失优化的无锚图像目标检测一种基于广义 损失的新损失函数:()()其中 表示一个正的权衡参数 表示用于调整 的比重尺度敏感是形状回归中的一个普遍问题它对小边框的影响比大边框更明显 因此设计了一个与尺度无关的()损失来衡量纵横比的一致性 在开始之前使用以下公式计算边框的宽度和高度:()那么可以使用()来表示边界框的形状 为了得到只与形状相似度而不是与框的纵横比有关的利用水平框来计算 损失 如图 所示首先将 个水平框放在一起计
8、算()然后改变预测框的宽度和高度来计算()最后选择最小值作为边界框回归的 损失 详细定义如下:()()()其中 为预测框和 框之间重叠部分是广义 这个重叠中心不考虑角度其定义如下:()()()()()()()()()()其中、和 分别表示预测框、比例交换预测框和 框分别用()、()和()、由()和()描述 损失的范围在 这种新颖的 损失函数将目标形状差异考虑在内帮助旋转全卷积单级实现对定向矩形框的准确描述并加快收敛速度 同时 损失在优化回归过程中具有更好的性能图 计算与尺度无关的 示例.仿真分析仿真模拟实验旨在将所提出的方法与以前的更一般情况下的 损失、损失和 损失进行比较 真实数据以()为中
9、心具有 个比例(面积为)和 个纵横比(即 、和 )初始预测框均匀分布在以()为中心、半径为 的圆内平均选择的 个位置其中包括重叠和非重叠情况 在每个位置上预测框的纵横比设置为与地面实况的纵横比相同即 、比例设置为.、.、.和 梯度下降法用于优化边界框回归:()/()()其中()指损失函数是学习率从.逐渐衰减到.为了加速收敛可将将梯度乘以 由于对于相同的回归情况不同的损失函数计算得到不同的损失值在此每个损失函数的性能采用 评估:()()()仿真实验清楚地表明无论是优化速度还是最终误差 损失下的优化都优于其他 种损失函数 回归案例分析结果见图 蓝色点是在圆中均匀选择的 个点红色框是在每个位置设置不
10、同比率的锚 绿色方框是以()为中心的 个不同比率图 回归案例分析.实验验证与分析本节采用遥感数据集 以验证所提出方法的有效性 是一个具有挑战性的遥感船舶检测数据集通过定向边界框来表示遥感船舶 包含 张各种船舶的图像分为训练集、验证集和测试集分别包含、张图像 将 提供的 文件转换为 文件 用于后续的训练和测试 除此之外还采用随机翻转、旋转和 颜色空间变换进行了数据增强利用上面描述的旋转全卷积单级目标探测器作为基线模型并应用 损失来优化边界框的回归在.、.环境下运行 所有图像大小都调整为 使用 优化器进行训练初始学习率设置为.在 的 个 中训练模型所有兵 器 装 备 工 程 学 报:/./模型在
11、上进行训练批量大小设置为 数据集上进行的实验结果证实了 损失的有效性 实验结果如表 所示:基线模型是上面详述的旋转全卷积单级目标探测器 回归头输出本节中的定向边界框 该检测器在 上实现了.的 与基线模型相比提高了.广义()解决了 在非重叠情况下的弱点加快了网络的收敛 形状损失考虑了边界框的形状因此进行了更高的检测精度 它将 提高了.总而言之这种与尺度无关的形状损失不仅加速了收敛过程而且对预测框的形状提供了约束表 不同分量的评价 损失、分别代表广义 损失、形状损失、交换比率策略 .(.).(.)另外通过进行参数敏感性实验以在 损失中找到合适的超参数设置结果如表 所示 在存在不确定性抑制项的情况下
12、在适当增加 的同时与尺度无关的形状损失的影响增加从而导致 的改善 但是当 太大时性能会急剧下降表 数据集上的超参数 分析 .在 数据集上与相关方法对比实验结果如表 所示 主要使用.作为阈值来衡量模型的性能 基线模型利用 损失作为边框回归的损失函数 扩展了 的概念避免了 损失在非重叠情况下的平台期当 损失用于旋转式目标检测时它比 上的基线模型分别提高了.至于 损失它结合了边界框和地面实况之间的归一化距离与 上的基线相比分别增加了.然后整合了所有 个重要的几何因素从而导致更快的收敛和更好的性能 它比基线模型好.所提出的 损失在旋转物体检测中考虑了框的形状而没有考虑长宽比因此预测框对形状更敏感因此在
13、收敛性和准确性上都取得了更好的性能 与基线模型相比它在 上增加了.、和 阈值的 值等于.在表中显示为 在此阈值下进行的实验证明与其他方法相比本方法有助于检测器获得更多高质量的边界框表 上与其他损失函数的比较 损失函数/.图 显示了检测器在 上的可视化结果 损失模型预测边界更加合理和精确图 检测器在 上可视化结果.结论光学遥感图像处理中传统的目标检测方法由于存在不同尺度和形状不规则的图像目标在检测中很难设置具有最优参数的锚点 除此以外复杂背景和非极大值抑制处理也需要良好对齐的边界框来预测密集目标 然而需要注意的是回归损失函数与检测器最终最优目标之间的不相容性也对结果的收敛性和准确性拥有难以忽略的
14、影响 为了解决这个问题本文将旋转边界框回归引入到典型的无锚网络全卷积单级目标检测器中提出了与尺度无关的()损失用于图像目标检测的边界框回归 损失可以快速将预测框的形状调整为开始时与真实相似的形状并在回归过程中加快收敛速度 该检测器在 上实现了贾世耀等:基于尺度无关损失优化的无锚图像目标检测.的 与基线模型相比提高了.广义()解决了 在非重叠情况下的弱点加快了网络的收敛 形状损失考虑了边界框的形状因此达到了更高的检测精度它将 提高了.验证了 损失为任意对象的目标检测中的边界框回归效果优势参考文献:.():.张静农昌瑞杨智勇.基于卷积神经网络的目标检测算法综述.兵器装备工程学报():.():.任会峰朱洪前唐玥等.基于多级特征稀疏表示的遥感图像分类.重庆理工大学学报(自然科学)():.()():.:.():.:.():.():.:/().:.():.:/().():.():.:.():.:/().:/.():.():.():./().科学编辑 田鹏辉 博士(西安工业大学副教授)责任编辑 杨继森兵 器 装 备 工 程 学 报:/./