收藏 分销(赏)

一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf

上传人:自信****多点 文档编号:467672 上传时间:2023-10-12 格式:PDF 页数:8 大小:1.80MB
下载 相关 举报
一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf_第1页
第1页 / 共8页
一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf_第2页
第2页 / 共8页
一种基于锚框质量分布的动态标签分配策略_王璐璐.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 49卷 第 4期2023年 4月Computer Engineering 计算机工程一种基于锚框质量分布的动态标签分配策略王璐璐1,2,陈东方1,2,王晓峰1(1.武汉科技大学 计算机科学与技术学院,武汉 430065;2.武汉科技大学 智能信息处理与实时工业系统湖北省重点实验室,武汉 430065)摘要:传统的标签分配策略根据锚框与 ground-truth之间的交并比(IoU)是否超过阈值来划分正负样本,但确定IoU阈值需要依靠大量的经验和实验,并且在不同的网络结构中需要重新设定新的阈值;其次固定的阈值无法保证正负样本数量变化的平缓,过多或过少的正样本都将影响网络训练的稳定性。为解决这

2、些问题,提出一种自适应标签分配策略。根据中心先验原则设计中心权重,通过联合分类得分和定位得分表示锚框质量,组成一个统一的锚框评分方案便于简化划分步骤。为了使网络能够根据训练程度自适应调整 IoU 阈值,保证网络训练的稳定性,利用锚框质量高斯函数模拟锚框总体质量得分的分布情况,使用极大似然估计算法获取最优参数,根据统计结果动态预测最佳 IoU 阈值。实验结果表明,该算法在基于锚框和基于无锚框的检测算法中均使检测性能得到有效提升,在 PASCAL VOC数据集上分别提升 3.1和 6.6个百分点,并且可以有效降低漏检率。关键词:标签分配;目标检测;深度学习;样本;交并比开放科学(资源服务)标志码(

3、OSID):中文引用格式:王璐璐,陈东方,王晓峰.一种基于锚框质量分布的动态标签分配策略 J.计算机工程,2023,49(4):85-91,100.英文引用格式:WANG L L,CHEN D F,WANG X F.A dynamic label assignment strategy based on quality distribution of anchor J.Computer Engineering,2023,49(4):85-91,100.A Dynamic Label Assignment Strategy Based on Quality Distribution of Anc

4、horWANG Lulu1,2,CHEN Dongfang1,2,WANG Xiaofeng1(1.School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China;2.Hubei Province Key Laboratory of Intelligent Information Processing and Real-Time Industrial System,Wuhan University of Science and Technology,W

5、uhan 430065,China)【Abstract】Traditional label assignment strategies divide positive and negative samples according to whether the Intersection over Union(IoU)between the anchor and ground-truth exceeds the threshold.However,determining the IoU threshold requires considerable experience and experimen

6、tation,and new thresholds must be set for different network structures.Moreover,a fixed threshold cannot guarantee the consistent partitioning of positive and negative samples,and too many or too few positive samples will affect the reliability of network training.To solve these problems,we propose

7、an Adaptive Label Assignment Strategy(ALAS).First,the center weights are designed according to the center prior principle;the anchor quality is represented by the joint classification and localization scores;and a unified anchor scoring scheme is developed to simplify the partition.To enable the net

8、work to adaptively adjust the IoU threshold according to the degree of training and ensure the consistency of network training,the anchor quality Gaussian function is used to simulate the distribution of the overall quality score of the anchor.The maximum likelihood estimation algorithm is used to o

9、btain optimal parameters,and then the optimal IoU threshold is dynamically predicted based on statistical results.The experimental results show that the algorithm can effectively improve both anchor-based and non-anchor-based detection algorithms,and it improves these algorithms by 3.1 and 6.6 perce

10、ntage points,respectively,on the PASCAL VOC dataset.Therefore,it can effectively reduce missed detection rates.【Key words】label assignment;object detection;deep learning;sample;Intersection over Union(IoU)DOI:10.19678/j.issn.1000-3428.0064346基金项目:国家自然科学基金(61572381,61273225)。作者简介:王璐璐(1999),女,硕士,主研方向为

11、深度学习、目标检测;陈东方,教授、博士;王晓峰,副教授、博士。收稿日期:2022-03-31 修回日期:2022-05-17 Email:人工智能与模式识别文章编号:1000-3428(2023)04-0085-07 文献标志码:A 中图分类号:TP182023年 4月 15日Computer Engineering 计算机工程0概述 目标检测是计算机视觉领域中一个重要的研究方向,其在人脸识别、无人驾驶、医学图像处理等方面都有广泛的应用。在目标检测过程中,一张图片中会产生成千上万的锚框,而待检测目标可能只有几个,所以需要为锚框匹配相应的目标框,让网络知道每个锚框需要预测的目标是哪个,为锚框匹配

12、ground-truth的过程就是标签分配。标签分配的结果决定了模型的学习目标,进而决定模型的性能1。检测算法主要依据交并比(Intersection over Union,IoU)2的大小划分正负样本,但是如果设置比较低的 IoU 阈值,会得到过多的噪声样本,导致网络的识别能力降低,影响检测精度,而如果 IoU 阈值设置得过高,则只能保留到高质量样本,过滤掉太多中等质量的样本,可能会产生过拟合现象3。设置合理的IoU阈值能够提高检测精度,避免过拟合问题。传统的标签分配是基于交并比的手工分配策略,如需要手动调整 IoU 阈值、提前设定锚框等。近年来关于标签自动化分配的方案越来越多:经典的基于锚

13、框的算法 RetinaNet4根据锚框和 ground-truth之间的交并比确定正负样本;FreeAnchor5在它的基础上,通过极大似然估计的思想构建损失函数去除人工参与指定锚框的过程,使网络能够自主匹配锚框和标签框;基于无锚框结构的 FCOS6网络根据目标中心区域和物体的尺度范围确定正负样本;在FCOS 的基础上,ATSS7通过自适应训练样本选择的方法实现正负样本划分;Autoassign8跳出以往非正既负的分配方式和监督原则,认为每个位置都有正样本属性和负样本属性,在优化过程中,这些样本将会同时受到正样本和负样本的监督,利用正负样本权重平衡配比。虽然当前有很多高效的正负样本划分方法,但

14、FSAF9、FreeAnchor 等都是通过增加额外的卷积层来划分正负样本,然而改变网络结构将会导致其他检测网络无法直接使用这类划分方法。此外,在训练后期,随着定位能力提高,锚框平均 IoU 的数值增大,这会导致网络分配到的正样本数量大幅增加,进而影响训练的稳定性。而采用 K-means10、混合高斯模型11等聚类方法划分正负样本会提高计算复杂度,降低网络训练测试速度。针对以上问题,本文提出一个新的自适应标签分配策略(Adaptive Lable Assignment Strategy,ALAS)。为统一计算锚框分数,设计中心权重函数限定样本点位于 ground-truth 的中心附近,同时联

15、合分类和定位分数,采用统一的加权机制设计锚框质量得分函数。在此基础上,将标签分配建模为一个概率分布的过程,利用高斯模型计算锚框的整体质量分数,通过最大似然估计获取最优参数,使得模型能够根据锚框得分情况动态学习如何分配标签。最后,在MS COCO201712数据集和 5 个主干网络设置下进行对比实验,验证所提方法的有效性。1自适应标签分配策略 自适应标签分配策略设计应考虑以下两点:1)应能够衡量锚框的定位和分类质量;2)将锚框划分为正样本和负样本的过程应是自适应的,这样就不需要人工设计固定的超参数。1.1锚框评分方案首先需要设计一个能够反映网络定位和分类能力的锚框评分方案。图 1 为 FCOS

16、网络训练迭代过程中正样本点的可视化结果(彩色效果见 计算机工程 官网 HTML版本,下同),迭代次数增加后网络定位准确度增加,而这时热力图显示正样本点更多地集中在物体中点附近,可知在训练阶段关注目标框的中心区域可以使检测器达到更好的效果。利用 L213损失函数对离群点的敏感性实现上述 中 心 先 验 的 要 求,记 真 实 边 界 框 的 中 心 点 由(gx,gy)表示,样本点坐标由(bx,by)表示,则本文的中心加权函数如式(1)所示:Wcenter=e-i x,yL2()bi-gi(1)在式(1)中,Wcenter与L2呈负相关,离群点的中心权重相对其他样本点较小。为了使评分方案能够同时

17、评估定位和分类的质量,可以将定位得分和分类得分相乘。直接将网络中分类分支输出的置信度作为分类得分,用中心权重(式(1)表示定位得分,因为定位分支输出的是偏移量而不是一个分数,所以利用中心权重使评分方案更加简洁。本文将锚框评分方案定义为中心权重与分类得分的乘积,如式(2)所示:Q=Wcenter Scls=e-i x,yL2()bi-gi Scls(2)其中:Scls表示分类得分;Wcenter是样本点的中心权重。本文取质量函数 Q的负对数,得到:-ln Q=-ln Wcenter-ln Scls=i x,yL2(bi-gi)+Lcls(3)Q=e-i x,yL2(bi-gi)-Lcls(4)中

18、心权重可以规范样本中心点的位置,但锚框的尺度对框定范围也有影响,不能仅使用中心权重代表定位质量。如图 2(a)和图 2(b)所示,当样本点与 ground-truth 的中心点距离很近时,锚框过大或过小都会使定位不准确,然而在这种情况下它们的中心权重很高。在图 2(a)和图 2(b)中都有较高的中心图 1迭代过程中置信度权重的演化Fig.1Confidence weight evolution during iteration process86第 49卷 第 4期王璐璐,陈东方,王晓峰:一种基于锚框质量分布的动态标签分配策略权重,但是 IoU 较低,进一步利用 IoU 来细致规范锚框的定位就

19、可以将这类锚框从高定位质量锚框的队列中筛选出来,如图 2(c)所示,同时在拥有较高的中心权重和 IoU时才能高质量地预测到物体的位置。具体来说,预测框与对应 ground-truth 框之间的IoU 不仅用于计算 IoU 损失,还可以作为分类的标签。利用 IoU 指导分类训练,即把 one-hot分类标签的 0或 1替换成对应的 IoU,再计算分类损失,可以将IoU 作为定位质量使其与分类相结合,IoU 较低即定位能力很差时,它的分类分数也会比较低。进一步将定位与分类相结合使网络可以同时筛选出定位错误但分类正确的边界框和定位准确但分类错误的边界框。由于将离散的分类标签(0 或 1)替换成了连续

20、的 IoU,因此需要将离散型的 Focal Loss改为连续型的质量焦点损失(Quality Focal Loss,QFL):FFocalLoss=-y ln y-(1-y)ln(1-y)=|-ln y,y=1-ln()1-y,y=0(5)QQFL(p)=Lcls=-|y-py ln p+|y-p()1-y ln()1-p(6)其中:p 为预测结果;的取值为 2;y 为标签即样本点与对应 ground-truth 之间的 IoU 值,y 0,1。具体来说,y=0 表示定位分数为 0 的负样本,0y1 表示IoU 分数为 y 的正样本。在训练过程中,预测框与ground-truth 框之间的 I

21、oU 得分在 0 到 1 之间动态变化。QFL 依旧保留分类的向量,但是对应类别位置的置信度的物理含义不再是分类得分,而是质量预测的分数。如表 1所示,ALAS算法利用 QFL作为分类损失函数比使用 Focal Loss提高了 0.2个百分点。若使用Focal Loss,算法将按照中心先验原则衡量锚框的定位质量。而 QFL联合 IoU,使 ALAS可以在中心先验的基础上进一步考虑到锚框框定范围的准确性。经过优化后,最终的锚框质量评价模块如下:Q=e-i x,yL2(bi-gi)-QQFL(7)1.2正负样本划分策略单纯的锚框质量评价方案只是一个锚框得分的计算方式,依旧无法动态调整 IoU 阈值

22、。为了动态掌握网络的训练状态,更方便模型根据总体质量得分分布情况划分正负样本,本文使用高斯模型模拟锚框评分的分布情况,引入一个参数可学习的锚框质量高斯函数 G(如式(8)所示),根据不同的数据分布自动调整 IoU阈值。通过 MLE最大化锚框的质量得分 Q的概率计算最优参数。G(Q|x,g,)=12 exp(-()Q-222)(8)其中:Q 表示式(7)中的质量得分;和是可学习的参数。一开始,参数会被初始化为 0,=1。给定一组锚框得分,可以使用最大似然估计算法优化函数G 的概率,计算最优参数。本文将参数和的总和作为 IoU阈值。若基于聚类思想采用混合高斯模型模拟锚框得分情况,则无法使用最大似然

23、估计为其求解,而需要通过迭代的方法划分代表正负样本的两个高斯模型,迭代求解的过程将大大影响网络训练和检测的速度。本文方法可直接利用 MLE 求解,在参数量、计算复杂度和检测速度上都的到了进一步优化。算法 1 描述了所提方法对输入图像的工作原理。对于图像上的每一个 ground-truth 标签框 g,首先找出它的候选正样本。如算法 1第 37行描述,在金字塔的每一层选取 k个质量评分最高的锚框。之后根据这些候选框的质量得分计算出锚框质量高斯函数 G,见算法第 9行。在算法第 10行,通过极大值似然估计计算出 和 两个参数,根据这些统计数据计算 ground-truth g的 IoU 阈值tg=

24、g+g。最后只需要根据算法第 1216 行选择那些 IoU 大于或等于IoU阈值的候选框作为正样本,如果一个锚框被分配给多个 ground-truth,则会选择 IoU 最高的那个,其余都是负样本。算法 1 自适应标签分配策略 ALAS输入 ground-truth标签框G,所有的锚框A,金字塔第i层的锚框Ai,金字塔层数 L,每层金字塔选取的候选框数 K输出 正样本 P,负样本 N1.P ,N ,Cg 2.for g G3.for i=1 to L do4.Wcenter计算中心权重5.Qi计算锚框质量(Ai,g)6.Si根据Qi选择 K个候选框7.Cg=Cg Si8.end for9.G(

25、Q|x,g,)计算 G10.通过最大似然估计计算参数g、g11.为 ground-truth g计算 IoU阈值:tg=g+g12.for each candidate c cg do图 2中心权重定位的局限性Fig.2Limitations of center weight positioning表 1Focal Loss和 QFL对网络结果的影响 Table 1Effect of Focal Loss and QFL on network results%计算方式Focal LossQFLAP78.678.8872023年 4月 15日Computer Engineering 计算机工程1

26、3.if IoU(c,g)tg14.P=PUC15.end if16.end for17.end for18.N=A-P19.return P,N在算法 1中,IoU 阈值的大小是根据模型参数条件自适应确定的,能够根据质量得分的总体分布动态调整参数和 IoU 阈值,这与之前的方法14-15有所不同,文献 14-15 方法只考虑到锚框的定位能力,忽略了网络预测能力提升对正负样本划分带来的影响。本文通过 ALAS 联合分类和定位动态模拟质量分布情况自适应调整 IoU阈值,改善了检测效果。2实验结果与分析 为验证所提方法的有效性,在 MS COCO 2017和 PASCAL VOC16两个公共数据集

27、上进行实验。MS COCO2017 数据集共包含 80 个类别,训练集包含约 118 000 张图片,val 集包含约 5 000 张图片,test-dev集包含约 20 000张图片。本文在 test-dev 2017 上进行实验并与现有的目标检测算法比较,然后在 val集上进行数据分析。PASCAL VOC 数据集包含 20个类别,其中训练图片 22 136 张,测试图片 4 952 张,实验结果遵循VOC 数据集的指标,其中平均精度表示该类别在IoU 阈值为 0.5 时的平均精度。同时,在 VOC 2012和 VOC 2017上进行消融实验和对比实验。2.1超参数设置ALAS 只涉及一个

28、 top-K 超参数,在本节中进行多个实验研究 top-K 的取值对检测器效果的影响。top-K表示从每个金字塔层级中选择的候选框个数。表 2 为 top-K 取值为 921 时的效果对比。可以看出:太小的 K 值会导致准确率明显下降,因为过少的候选正样本会导致漏检也会造成样本统计不准确;太大会导致过多低质量的候选框,造成精度损失。如表 2 所示,当 top-K 的取值在 1321 的范围内时 AP 变化不敏感,实验结果显示 top-K 是一个稳健的超参数。经过详细比较,当 K 取值为 17 时效果最好,达到了 78.8%的准确率。2.2联合分类损失效果分析由于本文研究的主要目的是简化锚框分配

29、的步骤,在实现动态调整阈值的同时,还需要重点关注模型的大小和训练速度,为了更好地评价网络性能优劣,设计实验对比网络的参数量和计算复杂度。从图 3可以看出:传统检测器 Faster RCNN 的参数量大于其他模型,而 SSD 算法的计算复杂度远高于其他网络;FreeAnchor 的参数量和时间复杂度是ALSA 的 1.2 倍,针对标签分配的改进算法中参数量最少的 PAA 模型的参数量也是 ALSA 的 1.1倍;本文方法的总体参数量和计算量都达到了与 ATSS 模型相当的水平。表 3 所示为本文方法分别应用在基于有锚框和基于无锚框的目标检测算法的速度。可以看出:以FCOS 和 RetinaNet

30、 为基础网络时,训练过程中每次迭代分别仅增加 0.04 s和 0.02 s,而在检测过程中,检测单张图片分别增加 0.006 s 和 0.005 s,相应的检测精度分别提高了 6.6 和 3.1 个百分点,自适应标签分配算法在对训练和检测速度影响细微的情况下,能有效提高检测的精确度,提高网络的效率。与采用聚类思想利用高斯混合模型分离正负样本的 PAA 方法相比,本文的 ALAS 方法简化迭代过程在训练和检测的速度上提升了 23%,同时在检测的准确度上提高了 0.8个百分点。2.3与主流目标检测网络效果对比为 了 验 证 ALAS 的 有 效 性,分 别 在 MS COCO2017和 PASCA

31、L VOC(07+12)数据集上进行训练和测试,同时与其他目标检测网络进行对比和定量表 2ALAS使用不同 K值的结果 Table 2Results of using different number of K on the ALASK值79101315171921AP/%77.777.878.078.678.778.878.678.4图 3参数量与计算量对比Fig.3Comparison of parameters and computation表 3ALAS与 PAA方法速度与精度对比Table 3Speed and accuracy comparison of ALAS and PAA

32、methods目标检测算法FCOSRetinaNetFCOS+ALASRetinaNet+ALASFCOS+PAARetinaNet+PAA训练速度/(s iter-1)0.360.410.400.430.520.58检测时间/s0.2120.2240.2180.2290.2670.294AP/%72.274.378.877.478.676.288第 49卷 第 4期王璐璐,陈东方,王晓峰:一种基于锚框质量分布的动态标签分配策略分析。在MS COCO测试子集上对本文模型与其他的目标检测进行比较,如表4所示。为了不失公平性,除top-K 外,本文其他超参数与 FCOS 保持一致。选用ResNet

33、101作为检测器的主干特征提取网络,特征融合网络选用 FPN。从表 4 可以看出:在 MS COCO 数据集中,在ResNet-10117作为主干网络的情况下,本文方法比相同网络结构的密集检测器FCOS平均提高了2.2 个 百 分 点,与 经 典 网 络 结 构 RetinaNet、FSAF、NoiseAnchor相比也有不低于 1个百分点的提升,在目标检测任务上取得了不错的性能提升;与同样改进标签分配策略的 FreeAnchor相比也有 0.7个百分点的提升;通过使用更深的主干网络 ResNext-101 进一步将精确度提高到 44.2%。利用可变性卷积(DCN)18改进ResNet101主

34、干网络以及检测器的最后一层后,可以将 检 测 网 络 的 AP 提 高 到 46.4%,优 于 FCOS、RetinaNet、RepPoints等目前常用的目标检测网络。为 了 验 证 ALAS 的 鲁 棒 性,在 PASCAL VOC(07+12)数据集上与多个经典的目标检测网络进行了逐类别对比,如表 5 所示。由表 5 可以看出:自适应锚框分配策略相比于 ATSS 总体精确度提高了0.8 个百分点,高于 Faster RCNN、SSD、FCOS 网络1.3个百分点以上;对 20个类别的检测准确度详细比较,自适应标签分配策略在鸟类、汽车、狗类、显示器等 10 个类别效果突出;总体上,在小目标

35、上的检测效果要高于 Faster RCNN、FCOS、ATSS、SSD 等检测网络。分别在MS COCO和PASCAL VOC数据集中对自适应标签分配策略与 FCOS和 ATSS网络进行可视化对比。由图4和图5可以看出,在物体被部分遮挡以及待检测物体较小的情况下,自适应标签分配更容易正确检测出物体的位置,能够有效检测出FCOS和ATSS网络都未检测出的目标,降低漏检率。表 4MS COCO2017数据集上的测试结果对比 Table 4Comparison of test results on MS COCO2017 dataset%方法RetinaNetDetNet19Soft-NMS20FC

36、OSNoisyAnchor21FSAF22FreeAnchorSAPD23MAL24ATSSFCOSNoisyAnchorRepPoints25ATSSFreeAnchorATSSALASBackboneResNet-101DetNet-59ResNet-101ResNet-101ResNet-101ResNet-101ResNet-101ResNet-101ResNet-101ResNet-101ResNeXt-64x4d-101ResNeXt-101ResNet101-DCNResNet101-DCNResNeXt-64x4d-101ResNeXt-64x4d-101ResNet-101R

37、esNeXt-101ResNet101-DCNAP39.140.340.841.541.842.843.143.543.643.643.244.145.046.344.945.643.844.246.4AP5059.162.162.460.761.163.162.263.661.662.162.863.866.164.764.364.662.864.064.6AP7542.343.844.945.044.946.546.446.547.147.446.647.549.050.448.549.747.347.150.0APs21.823.623.024.423.427.824.524.925.0

38、26.126.526.026.627.726.828.526.426.228.7APm42.742.643.444.844.945.546.146.846.947.046.247.448.649.848.348.947.247.649.9APl50.250.053.251.652.953.254.854.655.853.653.355.057.558.455.955.653.854.958.6表 5VOC 数据集上的测试结果对比Table 5Comparison of test results on VOC dataset%类别飞机自行车鸟类船瓶子公交车轿车猫椅子牛餐桌Faster RCNN7

39、6.579.070.966.552.183.184.786.452.081.965.7SSD3002679.583.976.069.650.587.085.788.160.381.577.0FCOS76.479.470.963.357.077.782.885.054.280.663.9ATSS83.981.976.068.368.483.787.088.262.285.374.4本文方法86.282.777.569.683.987.088.261.761.784.472.4类别马摩托车人植物羊沙发火车显示器狗APFaster RCNN84.677.576.738.873.673.983.072

40、.684.873.2SSD3002687.583.979.452.377.979.587.676.886.177.5FCOS79.876.777.342.477.370.581.368.279.372.2ATSS85.882.883.650.681.471.583.177.185.478.0本文方法86.083.683.451.484.074.584.278.686.378.8892023年 4月 15日Computer Engineering 计算机工程图 4在 MS COCO数据集上的可视化结果对比Fig.4Comparison of visualization results on MS

41、 COCO dataset图 5在 PASCAL VOC数据集上的可视化结果对比Fig.5Comparison of visualization results on PASCAL VOC dataset90第 49卷 第 4期王璐璐,陈东方,王晓峰:一种基于锚框质量分布的动态标签分配策略3结束语 本文提出一种自适应标签分配策略(ALAS),将标签分配作为一个概率分布的似然估计过程。该策略的核心是确定对模型有利的正样本和负样本划分方法,从而提高检测器的精度,比启发式 IoU 硬性分配或非概率分配策略更容易训练,并能保证网络的稳定性。在 PASCAL VOC 数据集上,本文方法对多个类别的检测准

42、确率都有了明显提升,且最终的mAP 指标提升至 78.8%;在具有挑战性的 MS COCO数据集上利用各种主干网络进行大量实验,并在ResNet-101作为主干网络时将 AP提升至 43.8%。下一步将充分利用本文联合分类定位得分的思想,对检测网络的后处理过程进行优化。参考文献 1 张晨阳,黄腾,吴壮壮.基于K-Means聚类与深度学习的RGB-D SLAM 算法 J.计算机工程,2022,48(1):236-244,252.ZHANG C Y,HUANG T,WU Z Z.RGB-D SLAM algorithm based on K-means clustering and deep le

43、arning J.Computer Engineering,2022,48(1):236-244,252.(in Chinese)2 JIANG B,LUO R,MAO J,et al.Acquisition of localization confidence for accurate object detection C/Proceedings of European Conference on Computer Vision.New York,USA:ACM Press,2018:816-832.3 包俊,刘宏哲.融合可变形卷积网络的鱼眼图像目标检测 J.计算机工程,2021,47(4)

44、:248-255.BAO J,LIU H Z.Object detection in fisheye images combining deformable convolutional networksJ.Computer Engineering,2021,47(4):248-255.(in Chinese)4 LIN T Y,GOYAL P,GIRSHICK R,et al.Focal loss for dense object detection C/Proceedings of IEEE International Conference on Computer Vision.Washin

45、gton D.C.,USA:IEEE Press,2017:2999-3007.5 ZHANG X S,WAN F,LIU C,et al.FreeAnchor:learning to match anchors for visual object detection EB/OL.2022-02-10.https:/arxiv.org/abs/1909.02466.6 TIAN Z,SHEN C H,CHEN H,et al.FCOS:fully convolutional one-stage object detection C/Proceedings of IEEE/CVF Interna

46、tional Conference on Computer Vision.Washington D.C.,USA:IEEE Press,2020:9626-9635.7 ZHANG S F,CHI C,YAO Y Q,et al.Bridging the gap between anchor-based and anchor-free detection via adaptive training sample selection C/Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition.Wa

47、shington D.C.,USA:IEEE Press,2020:9756-9765.8 ZHU B J,WANG J F,JIANG Z K,et al.AutoAssign:differentiable label assignment for dense object detectionEB/OL.2022-02-10.https:/arxiv.org/abs/2007.03496.9 ZHU C C,HE Y H,SAVVIDES M.Feature selective anchor-free module for single-shot object detection C/Pro

48、ceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition.Washington D.C.,USA:IEEE Press,2020:840-849.10 REDMON J,FARHADI A.YOLO9000:better,faster,stronger C/Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Washington D.C.,USA:IEEE Press,2017:6517-6525.11 KI

49、M K,LEE H S.Probabilistic anchor assignment with IoU prediction for object detectionC/Proceedings of European Conference on Computer Vision.Berlin,Germany:Springer,2020:355-371.12 LIN T Y,MAIRE M,BELONGIE S,et al.Microsoft COCO:common objects in context C/Proceedings of European Conference on Comput

50、er Vision.Berlin,Germany:Springer,2014:740-755.13 BHLMANN P,YU B.Boosting with the L2 Loss J.Journal of the American Statistical Association,2003,98(462):324-339.14 REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-time object detectionC/Proceedings of IEEE Conference on Computer V

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 品牌综合 > 临存文档

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服