1、文章编号:1002-2082(2024)02-0405-10基于背景抑制和分类校正的小样本目标检测方法蔡伟,王鑫,蒋昕昊,杨志勇,陈栋(火箭军工程大学导弹工程学院,陕西西安710025)摘摘 要:要:为进一步提升小样本条件下对空中来袭目标的检测识别成功率,提出一种基于背景抑制和分类校正的小样本目标检测方法。首先,针对空中来袭目标背景前景易混淆问题,在区域候选网络前端引入背景抑制模块,通过抑制背景特征和增强前景特征来减轻目标背景对检测的影响;其次,在背景抑制模块后插入特征聚合模块,聚焦目标特征,通过缓解小样本条件导致目标特征难提取、不明显的问题,校正网络模型的分类参数;最后,在检测头网络中引入对
2、比分支,增强了类别内相似性和类别间独特性,缓解来袭目标“类间相似性高,类内差异性大”的问题,实现了对网络分类的进一步校正。实验结果表明,所提出的算法在 1、2、3、5、10shot 实验中均表现最佳,平均精度分别达到 28.3%、32.8%、39.9%、42.9%和 56.2%,提升了小样本空中来袭目标的检测性能。关键词:关键词:小样本目标检测;空中来袭目标;背景抑制;分类校正;深度学习中图分类号:TN219文献标志码:ADOI:10.5768/JAO202445.0203002Few shot target detection method based on background suppr
3、ession andclassification correctionCAIWei,WANGXin,JIANGXinhao,YANGZhiyong,CHENDong(SchoolofMissileEngineering,RocketMilitaryEngineeringUniversity,Xian710025,China)Abstract:Tofurtherimprovethesuccessrateofdetectingandidentifyingairbornetargetsunderfewshotconditions,afewshottargetdetectionmethodbasedo
4、nbackgroundsuppressionandclassificationcorrectionwasproposed.Firstly,aimingattheproblemthatthebackgroundforegroundofincomingairtargetswaseasyto confuse,a background suppression module was introduced in the front end of the regional candidatenetwork,whichenhancedtheforegroundfeaturesbysuppressingtheb
5、ackgroundfeaturesandreducedtheinfluenceofthetargetbackgroundondetection.Secondly,thefeatureaggregationmodulewasinsertedafterthebackgroundsuppressionmoduletofocusonthetargetfeatures,andtoalleviatetheproblemthatthetargetfeaturesweredifficulttoextractandnotobviousduetofewshotconditions,soastocorrectthe
6、classificationparametersofthenetworkmodel.Finally,acontrastbranchwasintroducedintothedetectionheadnetworkforenhancingthesimilaritywithinclassesanduniquenessbetweenclasses,whichalleviatedtheproblemofhighsimilaritybetweenclassesandlargedifferenceswithinclassesofincomingtargets,andrealizedthefurthercor
7、rectionofthenetworkclassification.Theexperimentalresultsshowthattheproposedalgorithmperformsbestinthe1,2,3,5and10shotexperiments,withaverageaccuracyreaching28.3%,32.8%,39.9%,42.9%and56.2%,respectively,whichimprovesthedetectionperformanceoffewshotsairborneincomingtargets.Key words:few shot target det
8、ection;airborne incoming targets;background suppression;classificationcorrection;deeplearning收稿日期:2023-06-07;修回日期:2023-09-11基金项目:173 技术领域基金项目(2021-JCJQ-JJ-0871)作者简介:蔡伟(1974),男,博士,教授,主要从事光电防护、计算机视觉研究。E-mail:通信作者:王鑫(1999),男,硕士研究生,主要从事光电防护、计算机视觉研究。E-mail:第45卷第2期应用光学Vol.45No.22024年3月JournalofAppliedOpti
9、csMar.2024引言作为军事领域的“杀手锏”,以隐形飞机和高空察打一体无人机为代表的空中来袭目标具有明显的非合作性和小样本特征。其可利用自身突防能力强、打击精度高的优势精确打击我方重点目标,破坏作战体系,是影响战争进程的重要武器,对我方作战防护提出了挑战。因此,实现空中来袭目标小样本条件下的精准目标检测,对提升我方应对空中威胁的防护能力具有重要价值和意义。目前小样本目标检测主要分为 6 类方法,分别是基于元学习的方法、基于度量学习的方法、基于数据增强的方法、基于微调的方法、基于模型结构的方法和基于集成的方法1。基于元学习的方法2,3以任务为单位训练模型参数,得到类别通用信息。如 KANGB
10、Y 等4和 YANXP 等5利用元学习方法,分别设计了基于重加权和基于 FasterR-CNN的元学习小样本目标检测框架,通过在任务训练中获取的通用信息,提升在新任务的检测性能;基于度量学习的方法6则通过计算目标区域特征和支持图像特征的相似度对目标区域分类,实现对不同目标的检测。如 KARLINSKYL 等7在度量方法原理基础上设计了多模态混合特征网络替换检测器分类头部,提升了模型的检测性能。XIAOZX 等8将关系门循环单元(relationgaterecurrentunit,Relation-GRU)模块嵌入区域候选网络(regionproposalnetwork,RPN)中,通过改进相似
11、性度量方式提升了模型分类的准确性;基于数据增强的方法9另辟蹊径,通过增加输入样本的数量,提升类内变化,以增强模型检测能力。如文献 10-13 在原有图像信息的基础上将语义信息引入小样本目标检测中,增加数据量,以提升检测性能;基于微调的方法14则利用预训练和微调两阶段训练方法实现小样本目标检测。如 CAOYH 等15在微调阶段通过加强来基类和新类间的联系,进一步提升了网络对新类的检测能力;而基于模型结构的方法16通过构建新的模型结构,增强网络的检测能力。如 WUJX 等17提出了多尺度正样本修正方法模型,解决了小样本目标尺度稀疏分布问题;基于集成的方法18则借鉴不同方法的优点,解决单一方法检测性
12、能有限的问题。如 CHENH 等19集成了单次检测器(singleshotdetector,SSD20)的优点,缓解了小样本目标检测的过拟合风险。上述小样本目标检测算法从不同角度出发,解决了小样本目标检测存在的许多问题,提升了检测网络的检测性能。但其相关研究都侧重于自然场景图像的检测识别问题21,对于空中来袭目标的研究较为欠缺,而且空中来袭目标的一些特性使得研究更加困难。首先相比于自然场景,空中来袭目标的场景更加复杂,检测模型更容易出现背景前景混淆情况。其次空中来袭目标由于自身的非合作性,样本获得更加困难,目标特征更难提取。另外,空中来袭目标不同类别在外形等方面具有较高的相似性,同一类别的不同
13、样本由于环境等因素的影响具有较大的差异性,即具有“类间相似性高,类内差异性大”特点。为解决上述问题,我们集成微调和模型结构方法的优点,在基于微调方法的基础上引入新的模型结构,提出了基于背景抑制和类别校正的小样本目标检测算法,以提高小样本条件下空中来袭目标的检测精度。首先,针对空中来袭目标场景复杂带来的背景前景混淆问题,我们在 RPN 网络前端引入背景抑制模块,在通道和空间两个维度进行最大值池化操作,形成通道和空间注意力特征图,经升维后与输入特征图相乘,增强目标特征,抑制背景特征,缓解背景前景问题。其次,为解决空中来袭目标小样本性带来的目标特征难提取的问题,提出特征聚合模块,从通道、水平和垂直方
14、向 3 个角度提取目标特征,利用 11 卷积捕获特征中的跨通道信息和方向与位置敏感信息,实现对 RPN 分类参数的校正。最后,我们在检测头网络中搭建对比分支,对候选框中的目标特征进行编码和归一化处理,通过对比损失函数,增强同类别特征的相似性,扩大不同类别间特征的差异性,实现检测头网络的分类校正,解决空来袭目标“类间相似性高,类内差异性大”的问题,提升小样本目标检测精度。另外,我们将本文设计的算法在通用数据集PASCALVOC 和我们自建的小样本军事类来袭目标数据集进行实验验证,均取得良好检测效果。1 方法文中提到的背景抑制和类别校正的小样本目标检测方法架构如图 1 所示。将来袭目标的图片输入网
15、络中,经骨干网络(backbone)学习特征信息,得到的特征图输入 RPN 网络和感兴趣区域对齐(regionofinterestalignment,ROIAlign)中。在RPN 网络中,特征图经背景抑制模块(background406应用光学第45卷第2期suppressionmodule,BSM)、特征聚合模块(featureaggregationmodule,FAM)和 33 卷积处理后,分别输入 11 分类卷积和 11 位置卷积中,输出结果聚合形成预选框,然后输入 ROIAlign 中。经 ROIAlign 处理的特征输入检测头中,得到分类损失、回归损失和对比损失。骨干特征图背景抑制
16、11分类卷积33卷积候选框感兴趣区域对齐分类分类损失回归损失回归检测头对比对比损失全连接层区域候选网络(RPN)11回归卷积特征聚合图 1 背景抑制和类别校正的小样本目标检测方法架构Fig.1 Architecture diagram of few shot target detection methods for background suppression and classification correction1.1 背景抑制模块本节中,我们通过设计背景抑制模块缓解空中来袭目标因场景复杂导致的背景前景混淆问题,达到抑制背景特征、增强目标特征的目的。图 2为背景抑制模块结构图。特征CHW
17、33卷积CHWBNLeakyRelu通道最大池化C11空间最大池化1HW输出CHW扩充CHW扩充CHWSigmoidSigmoid图 2 背景抑制模块结构图Fig.2 Structure diagram of background suppression mo-dule在背景抑制模块中,输入特征经 33 卷积进一步提取特征信息后,通过 BN 层对所提取特征进行归一化处理,加快网络的训练和收敛速度,缓解过拟合问题。经归一化处理后的特征输入 Leaky-Relu 激活函数中,使网络具有非线性建模能力。LeakyRelu 激活函数的表达式如式(1)所示:FLeakyRelu(x)=xx 0Pleak
18、xx 0(1)x 0 xx 0PleakxPleak当时,输出为;当时,输出为,其中为超参数,设置为 0.3。CCLeakyRelu 输出的特征分别输入上分下 3 个分路,在上分路中对输入特征图执行通道最大值池化操作,提取各通道目标特征关键信息,得到 11的通道注意力向量,其中 为通道数,计算过程如式(2)所示:Fch=f1max(ykHW)(2)FchykHWk0 k C HWf1maxykHWH W式中:为通道注意力向量;为第 个通道特征图,;和为特征图的宽和高;为通道最大值池化函数,用以提取中的最大值。中分路对输入特征执行空间最大值池化操作,提取空间维度目标特征关键信息,得到 1 的空间
19、注意力向量,计算公式如式(3)所示:Fsp=f2max(yCi,j)(3)Fspf2maxyCi,jyCi,ji j0 i H 0 j WFchFspC H W式中:为空间注意力向量;是空间最大值池化函数,用以提取中的最大值;为 位置的空间特征向量,,。最大值池化得到的和分别扩充至 维度,输入 Sigmoid函数进行数据处理,其函数表达式如式(4)所示:S(x)=11+ex(4)Sigmoid 函数通过将数值控制在 01 的范围内,从而对神经元的输出进行归一化处理。经 Sigmoid函数处理后聚合得到的上、中分路特征图与下分应用光学2024,45(2)蔡伟,等:基于背景抑制和分类校正的小样本目
20、标检测方法407路输出的特征图逐像素相乘,使特征图目标表征信息得到加强,背景信息得到抑制,实现降低背景与目标混淆度的目的,提高 RPN 网络对目标和背景的分类能力。1.2 特征聚合模块本节中,我们设计了特征聚合模块用于提升目标特征的表征能力,从通道和水平、垂直空间方向提取输入目标特征图的关键信息,通过缓解小样本情况下目标特征不明显的问题,校正网络分类参数。图 3 为特征聚合模块结构图,特征聚合模块分为左右两条聚合分支,左侧通道聚合分支首先对输入特征执行通道平均池化操作。Resnet 模块CHWC-平均池化C11压缩+一维卷积(k=3)C11二维卷积(k=1)+BN+HardSwishC11(W
21、+H)SigmoidC11SigmoidCH1SigmoidC1W卷积(k=1)C1W卷积(k=1)CH1扩充C11更新权重CHWW-平均池化CH1H-平均池化C1W图 3 特征聚合模块结构图Fig.3 Structure diagram of feature aggregation module表达式如式(5)所示:Ach=1HWHm=1Wn=1yc(m,n)(5)AchHW0 m H0 n Wycc0 cCCdd式中:为输出的通道特征向量;和为输入特征的高度和宽度,,;为第个通道的特征图,为输出特征的总通道数。将通道特征向量进行压缩,对压缩后的通道特征向量进行卷积核大小为 的一维卷积操作,
22、实现跨通道交互,提取通道间的依赖关系,的大小取决于输入通道数的大小,表达式如式(6)所示:d=?log2(C)+b?odd(6)bodddAch式中:和 为超参数;则为对上式括号内的数值取最接近的奇数。通道特征向量经自适应 核一维卷积解压后输入 Sigmoid 激活函数,得到最终通道注意力向量。右侧分支分为水平和垂直 2 个空间分路,分别对输入特征执行一维水平平均池化和一维垂直平均池化,表达式如式(7)和式(8)所示:AHsp=1CWCc=1Wn=1x(c,n)(7)AWsp=1CHCc=1Hm=1x(c,m)(8)AHspAWspxAHspAWspC1H+WC1HC1WCHAHspCWAWs
23、pAchAHspAWsp式中:和为输出的水平平均池化特征向量和垂直平均池化特征向量;表示输入特征图的空间元素。将和合并,输入 11 的二维卷积中,压缩通道,捕获水平方向和垂直方向的跨通道信息,经 BN 层和 HardSwish 函数编码垂直方向和水平方向的空间信息,输出1()的特征向量,将输出结果分离为1 的水平特征向量,得到1的垂直特征向量,分别经 11 的二维卷积输出1 的水平注意力特征向量和1的垂直特征向量。最后将左侧分支得到的最终通道注意力向量、右侧分支得到的水平注意力特征向量和垂直特征向量通过在通道上加权的方式与输入特征图融合,得到输出特征图,其表达式如式(9)所示:F=F Ach
24、AHsp AWsp(9)FF式中:和 分别表示输入特征图和输出特征图。1.3 对比分支为解决空中来袭目标类内差距大、类间差距小带来的类别混淆问题,我们将对比分支引入检测头中,通过类别之间的对比学习,增强类别内的相似性和类别间的区别性,对类别的分布起到校正作用。我们引入的对比分支与检测头中的原有结构平行,引入对比分支后的检测头结构图如图 4所示。ROIAlign 输出的候选框分别输入分类头(classifyhead,clshead)、回归头(regressionhead,reghead)和对比分支中,检测头和回归头对输入的候选框特征处理,输出得到预测的类别标签和目标坐标值,进一步得到分类损失和回
25、归损失。输入对比分支的预选框特征向量经感知机编码处理,得到预选框实例的目标特征。我们进一步对目标特征进行 L2 归一化处理,以消除极端值和噪声的影响,相似度计算的表达式如式(10)所示。并在此之后引入对比损失,对原有的实例特408应用光学第45卷第2期征进行同一批量的对比学习,增大各类别的独特性,其中对比损失函数如式(10)所示:Lcon=1MMl=1f(ul)Lzl(10)Lconf(ul)LzlMzllulf(ul)ul ulLcon对比损失函数由和两部分组成。为 1 个批量的实例数;是针对第 个实例的编码ROI 特征;表示其与匹配的地面实况边界框的交集(intersectionoveru
26、nion,IOU)得分。的表达式如式(11)所示,其从回归角度对实例特征进行判断,将的特征筛选出来,将符合要求的 返回,的设定值为 0.7。f(ul)=if(ul)ul(11)Lzl的表达式如式(12)所示,其从类别角度对特征分布进行校正,通过计算同一类别实例特征的相似度损失,使相同类别的相似度更加紧凑。Lzl=1Myl1Mj=1,j,lif(yl=yj)logexp(zlzj/)Mk=1if(k,l)exp(zlzj/)(12)ylMylyl式中:表示真实的类别标签;为 类别的实例数量;为超参数。Lconf(ul)Lzl对比损失函数一方面通过对实例特征进行筛选,选择 IOU 较高的实例特征,
27、以防止低IOU 建议偏离回归对象的中心太多,因此可能包含不相关的语义,对特征类别的一致性产生影响;一方面借助对同类别的实例特征分布进行校正,使同类别分布更加紧密,不同类别之间的距离扩大,增强检测模型在小样本下的检测能力。检测头的模型训练分为 2 个阶段,在预训练过程中,检测头仍然采用FasterR-CNN 的原有损失函数,LLrpnLclsLreg原有损失函数由 3 部分组成,分别为用于区分前景背景的 RPN 损失函数、检测头分类损失函数和定位损失函数,其表达式如式(13)所示:L=Lrpn+Lcls+Lreg(13)在微调阶段我们加入对比分支以缓解空中来袭目标在小样本情况下的类内差距大、类间
28、差距小导致的分类混淆问题。其损失函数表达式如式(14)所示:L=Lrpn+Lcls+Lreg+Lcon(14)Lcon我们在原有损失函数的基础上加入对比损失函数,并以超参数 加以调节,平衡损失函数的关系。图 5 为 3 种检测头的对比示意图,图 5(a)为原有检测头类别分布图,在未进行校正前类别特征间犬牙交错,较难分别,类别内分布较为分散;图 5(b)为加入相似度计算的检测头特征分布。(a)原检测头(b)相似度检测头(c)对比分支检测头图 5 3 种检测头的对比示意图Fig.5 Schematic diagram of comparison of three detectionheads相似度
29、计算模块是在分类头基础上进行改进,其表达式如式(15)所示:Sim(s,d)=xTst?xs?t(15)stSim(s,t)xTst式中:为梯度缩放因子,预测第 个实例为第 个类的相似度得分由实例特征与类别权重的余弦相似度计算得出。相似度计算通过计算实例特征和类别权重的相似度得到各实例与分类分类头回归头感知机对比学习对比损失预测标签坐标分类损失回归损失L2归一化编码特征感兴趣区域对齐候选框图 4 引入对比分支的检测头结构图Fig.4 Structure diagram of detection head introducing contrast branch应用光学2024,45(2)蔡伟,等
30、:基于背景抑制和分类校正的小样本目标检测方法409类别之间的相似度得分,用以优化目标类别间的分布关系,提高同类别间的相似性和不同类别间的独特性。在加入相似度模块后,特征分布混淆问题得到缓解,类别内分布变得紧凑,右侧为加入对比分支的分布图,相比于相似度模块,其类别内特征分布更加紧密,不同类别间的间距明显,进一步提升了各类别的独特性。2 实验与结果分析实验结果与分析由 6 部分组成,其中实验设置、军事类空中来袭目标小样本数据集和评价指标 3 部分对实验条件和准备进行了详细介绍,而空中来袭目标结果分析、空中来袭目标消融实验、PASCALVOC 数据集目标检测结果分析则侧重于对实验结果进行论述和分析。
31、2.1 实验设置实验训练阶段的硬件平台配置如表 1 所示,本文实验采用 pytorch 深度学习开发框架。表 1 硬件平台配置Table 1 Hardware platform configuration名称相关配置GPUNVIDIAGV100CPU4210/128GGPU内存32G操作系统Win10计算平台CUDA10.2CPU(测试)InterCorei710700/16G训练的基础模型框架为 FasterR-CNN 模型,训练采用两阶段方法。首先输入 PASCALVOC 数据集进行预训练,PASCALVOC 数据集包含 20 个类别,主要应用于人体动作识别、语义分割、目标检测、图像识别等
32、任务。训练过程的优化方法为随机梯度下降法,初始学习率设置为 0.02,动量因子为 0.9,权重衰减系数为 0.0001,随后得到训练后的权重模型;其次将权重模型作为微调阶段的基础模型,冻结类无关模块,初始化类相关模块,输入小样本空中来袭目标数据集对基础模型进行微调,初始学习率设为 0.001。2.2 军事类空中来袭目标小样本数据集我们所构建的军事类空中来袭目标小样本数据集包含 F35、Su57、J20、MQ9、RQ4、B2 共 6 类空中目标,数据集分为训练集、验证集和测试集。其中训练集按照 1、2、3、5、10shot 小样本任务的需求,对应包含 6 类目标的 1、2、3、5、10 张照片,
33、用于模型训练。同时从 6 类目标中分别提供 10 张照片组成验证集辅助模型训练。另外我们从 6 类目标中各提供 5 张图片,共计 30 张图片组成测试集,用于对模型的性能进行测试。最后利用图像标记软件LabelImg对训练集、验证集和测试集中的样本数据进行标记,数据集标签格式与PASCALVOC数据标签格式。2.3 评价指标深度学习中的检测准确率和目标召回率的定义分别如式(16)和式(17)所示:Precision=NtNt+Nf(16)Recall=NtNr(17)NtNfNrPAPPAPPAP式中:为算法检测到的真实目标的数目;为算法误检出的虚假目标的数目;为图像中实际存在的真实弱小目标的
34、数目。平均精度则综合检测准确率和目标召回率,按照文献 2 的计算方式,将置信度阈值设置为0.5,用于评价检测模型对单个类别的检测性能。均值则对所检测的类别的值取平均,以评价检测模型的整体性能,其表达式如式(18)所示:MAP=1nniPAP(18)n0 i nPAPMAP式中:代表类别总数,。通常情况下,和值越高,模型的检测性能越好,反之亦然。2.4 空中来袭目标结果分析用 TFA/fc2、TFA/cos2、AttentionRPN19和本文算法对本文所构建的军事类空中来袭目标小样本数据集进行检测,检测结果的对比如表 2 所示。表 2 基于军事类空中来袭目标小样本数据集的不同目标检测算法实验结
35、果Table 2 Experimental results of different target detectionalgorithms based on few shot dataset of militaryairborne incoming targets方法/shotMAP0.51shot2shot3shot5shot10shotTFA/fc25.629.427.437.144.2TFA/cos17.223.523.123.429.2AttentionRPN23.829.229.139.454.3本文算法28.332.839.942.956.2410应用光学第45卷第2期从表 2 中
36、可以看出,本文所提出的算法在检测能力上均表现最强,特别是在 3shot 任务中,检测精度相比于次优算法上涨了 10.8%,检测性能大幅度提升。在 1、2、5、10shot 任务中涨幅也同样明显,检测精度相比次优算法分别上涨了 2.8%、3.4%、3.5%和 1.9%,说明在各项 shot 任务中均有效提升了对空中来袭目标的检测精度。图 6 为我们所设计的基于解耦的算法与 AttentionRPN和 TFA/fc的 3 种 MAP0.5 高于 0.6 的网络模型可视化输出结果对比。(a)TFA/fc(b)Attention RPN(c)本文算法(d)基准图F35|0.89F35|0.89F35|
37、0.96F35J20Su57F35|0.80Su57|0.61Su57|0.61B2|0.61B2|0.85B2|0.85B2|0.96B2MQ9MQ9|0.93MQ9|0.83Su57|0.83Su57|0.92J20|0.85J20|0.86J20|0.92J20|0.95J20|0.87J20|0.61J20|0.73MQ9|0.81J20|0.72图 6 军事类数据集算法结果对比图Fig.6 Comparison images of algorithm results of military datasets图 7 为本文方法对 RQ4 目标各姿态的可视化图像,通过主观对比,可以发现
38、6 张图片的 RQ4 姿态不一,外形尺寸存在差异。其中第 1 行 RQ4 的尺度较小,几何形状特征较不明显,图 7(c)与其他图 几 何 特 征 差 别 较 大;第 2 行 相 对 于 第 1 行,RQ4 尺度较大,几何特征较为明显,但图 7(e)和其他图片的 RQ4 相比,颜色和形状区别性较高。而通 过 量 化 对 比,我 们 发 现 图 7(c)、图 7(e)和图 7(f)的 RQ4 检测精度出现下降。通过分析,我们认为图 7(c)和图 7(e)由于颜色、纹理、外形与其他图片的区别度较高,使得模型对 RQ4 检测精度下降;图 7(f)因拍摄角度问题,使 RQ4 翼展较长,改变了其几何特征,
39、造成其检测精度的降低。虽然 RQ4 目标因几何特征不同,造成了部分样本应用光学2024,45(2)蔡伟,等:基于背景抑制和分类校正的小样本目标检测方法411检测精度下降,但是我们设计的模型依然可以将目标从图片中准确检测出来,且检测精度下降幅度较低,说明我们的模型对不同姿态的目标具有良好的检测性能,泛化能力较强。(b)山地(a)滩头(c)戈壁(d)城市(e)沙漠(f)草地图 7 RQ4 目标各姿态可视化图Fig.7 RQ4 target visualization images for each attitude2.5 空中来袭目标消融实验本文所设计的算法针对背景前景混淆、特征难提取和类别间混淆
40、问题分别提出了背景抑制模块、特征聚合模块和对比分支。为评估不同模块组合和改进对算法的优化程度,我们设计了消融实验,表 3 为在相同的实验条件下空中来袭目标的消融实验结果。表 3 基于军事类空中来袭目标小样本数据集的消融实验Table 3 Ablation experiment based on few shot dataset ofmilitary airborne incoming targets基线模型背景抑制特征聚合对比分支MAP0.51shot2shot3shot5shot10shot25.629.427.437.144.227.329.736.741.454.127.530.137.
41、642.554.428.332.839.942.956.2在小样本数据集上进行实验验证,实验结果表明:不同的组合对模型整体表现也基本呈现正向优化,其中基线模型在 1、2、3、5、10shot 任务中MAP分别为 25.6、29.4、27.4、37.1 和 44.2。在加入背景抑制模块后,各 shot 任务的 MAP都有不同程度的上升,特别在 3shot 和 10shot 处,分别上升了9.3%和 9.9%,加入背景抑制模块后,有效缓解了前景背景混淆的问题。我们在加入背景抑制模块的基础上加入特征聚合模块,shot 任务平均上升 0.6%,在抑制背景特征的基础上,进一步聚合前景特征,缓和因小样本带
42、来的特征不明显的问题。最后我们加入对比分支,各 shot 任务的 MAP继续上升,在2shot 任务处上升最快,上涨 2.7%,有效缓解了空中来袭目标“类间相似性高,类内差异性大”的问题,提高了模型的检测精度。2.6 PASCAL VOC 数据集目标检测结果分析我们在PASCALVOC 数据集上用TFA/fc、TFA/cos、AttentionRPN 和本文算法进行小样本目标检测,将其中的鸟、公共汽车、牛、摩托车、沙发等5 类目标作为新类目标,20 类目标中的其余 15 类作为基类,检测结果如表 4 所示。表 4 基于 PASCAL VOC 数据集的不同目标检测算法实验结果Table 4 Ex
43、perimental results of different target detectionalgorithms based on PASCAL VOC dataset方法/shotMAP0.51shot2shot3shot5shot10shotTFA/fc36.839.143.655.757.0TFA/cos39.836.144.755.756.0AttentionRPN35.036.039.151.755.7本文算法40.147.648.057.160.5其中本文所提出的算法在 1、2、3、5、10shot中均取得最好的检测结果,相比于次优算法分别412应用光学第45卷第2期提高 0.
44、3%、8.5%、3.3%、1.4%、3.5%,在 2shot 任务中上升幅度较高,证明所提方法在通用数据集下具有很好的效果,在小样本检测任务下拥有很好的鲁棒性和泛化能力。图 8 为我们所设计算法与AttentionRPN和 TFA/fc的 3 种 MAP0.5 高于 0.6 的网络模型可视化输出结果对比。(a)TFA/fc(b)Attention RPN(c)本文算法(d)基准图bird|0.68cow|0.68bus|0.73bus|0.81bus|0.85buscarcarcow|0.68cow|0.87person|0.77person|0.96person|0.97boatboatbo
45、atboatboatpersoncowsofa|0.74sofa|0.79sofasofadog|0.61图 8 PASCAL VOC 数据集算法结果对比图Fig.8 Comparison images of algorithm results of PASCAL VOC datasets3 结论针对空中来袭目标小样本特征和非合作性带来的背景复杂和类别分类困难,本文提出了基于背景抑制和分类校正的小样本目标检测方法。通过引入背景抑制模块,实现了对特征图背景特征的有效抑制,缓解了空中来袭目标小样本带来的背景前景混淆问题;提出了特征聚合模块,聚焦目标特征,提高了模型识别准确度,实现了对 RPN 的分
46、类校正;构建了对比分支网络,利用同一批量的候选框进行对比学习,增强了空中来袭目标类内的相似性和类间的差异性,实现了对检测头的分类校正。实验结果表明,本方法在空中来袭目标数据集和 PASCALVOC 数据集中的 1、2、3、5、10shot实验中均表现最佳,较 TFA/fc 算法检测精度平均提升 7.3 和 4.2 个百分点。提高了小样本条件下对空中来袭目标的检测精度,对于军事目标的防护具有重要的意义。参考文献:张振伟,郝建国,黄健,等.小样本图像目标检测研究综述J.计算机工程与应用,2022,58(5):1-11.1ZHANGZhenwei,HAOJianguo,HUANGJian,etal.
47、Re-viewoffew-shotobjectdetectionJ.ComputerEngineer-ingandApplications,2022,58(5):1-11.ZHANGGJ,LUOZP,CUIKW,etal.Meta-DETR:im-age-levelfew-shotobjectdetectionwithinter-classcorrel-ation exploitationEB/OL.(2021-09-20)2023-06-06.http:/arxiv.org/abs/2103.11731.2KIRKPATRICKJ,PASCANUR,RABINOWITZN,etal.Over
48、comingcatastrophicforgettinginneuralnetworksJ.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2017,114(13):3521-3526.3KANGBY,LIUZ,WANGX,etal.Few-shotobjectde-tectionviafeaturereweightingC/2019IEEE/CVFIn-ternational Conference on Computer Vision(ICCV).Seoul:IEEE,2020:8419-8428.4YA
49、NXP,CHENZL,XUAN,etal.MetaR-CNN:to-wards general solver for instance-level low-shot lear-ningC/2019 IEEE/CVF International Conference onComputer Vision(ICCV).Seoul:IEEE,2020:9576-9585.5ZHANGTF,ZHANGY,SUNX,etal.Comparisonnet-workforone-shotconditionalobjectdetectionEB/OL.6应用光学2024,45(2)蔡伟,等:基于背景抑制和分类校
50、正的小样本目标检测方法413(2020-01-20)2023-06-06.http:/arxiv.org/abs/1904.02317.KARLINSKYL,SHTOKJ,HARARYS,etal.RepMet:representative-basedmetriclearningforclassificationandfew-shot object detectionC/2019IEEE/CVF Confer-enceonComputerVisionandPatternRecognition(CV-PR).LongBeach:IEEE,2020:5192-5201.7XIAOZX,QIJH,X