收藏 分销(赏)

基于改进YOLOX的轻量型垃圾分类检测方法.pdf

上传人:自信****多点 文档编号:582114 上传时间:2024-01-02 格式:PDF 页数:11 大小:6.79MB
下载 相关 举报
基于改进YOLOX的轻量型垃圾分类检测方法.pdf_第1页
第1页 / 共11页
基于改进YOLOX的轻量型垃圾分类检测方法.pdf_第2页
第2页 / 共11页
基于改进YOLOX的轻量型垃圾分类检测方法.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、生活垃圾分类是保护生态环境、促进绿色和谐发展的有效措施。针对移动端设备计算资源和内存有限,重量级模型难以嵌入等问题,本文提出一种基于改进 YOLOX-tiny 轻量型的垃圾分类检测方法。首先,使用 EIoU 替换原来的IoU 损失函数,能加速收敛,提升检测精度;其次,在颈部网络引入注意力机制 CBAM,对不同通道的权重重新分配,获取更多浅层的细粒度特征和深层的语义信息;最后,使用 GhostBottleneck 模块替换特征提取网络中的 CSP 模块,保留更多边缘信息,同时降低参数量,使模型轻量化。在华为云垃圾数据集上的实验结果表明,改进的算法与 YOLOX-tiny相比,参数量降低至原来的

2、87.97%,精度提升了 0.3 个百分点,在 TrashNet 数据集上的实验效果提升了 0.36 个百分点,从而证明了本文算法的有效性,该算法有利于嵌入移动端设备使用,具有一定的实用价值。关键词:垃圾分类;YOLOX;轻量型网络;EIoU;CBAM;GhostBottleneck中图分类号:TP391.41 文献标志码:A 文章编号:1001-6600(2023)03-0080-11目前,我国城镇化已进入高速增长期,城镇生活垃圾呈爆发式增长,据相关统计,2020 年我国生活垃圾清运量为 23 511.7 万吨1,对生活垃圾进行正确分类可以有效缓解垃圾污染问题。2019 年 6 月,住房和城

3、乡建设部等 9 部门印发关于在全国地级及以上城市全面开展生活垃圾分类工作的通知2;2019 年7 月 1 日,上海市政府出台了强制垃圾分类的政策,政策要求上海市 2 600 万居民,包括商业机构,在垃圾的源头进行垃圾分类处理3;2022 年 4 月 26 日,贵阳市政府根据中华人民共和国固体废物污染环境防治法等法律法规的规定,结合贵阳市实际,制定了贵阳市城镇生活垃圾分类管理条例4。由此可见,政府越来越重视垃圾分类的问题,如果能有效解决该问题,将会减少环境污染,进一步提升人居环境。随着计算机视觉技术的迅猛发展,基于卷积神经网络的目标检测算法广泛应用于人脸识别5、道路交通6、人工智能7、医疗影像分

4、析等领域。目标检测包括用于提取特征的主干网络、进行特征融合的颈部以及检测头 3 个部分,其主要分为双阶段检测算法(two-stage)和单阶段检测算法(one-stage)。two-stage算法分为 2 步:第一步产生感兴趣区域(ROI);第二步对这些感兴趣区域进行训练,通过卷积神经网络对目标分类。常见的 two-stage 算法有 R-CNN、Faster-RCNN、SPP-Net、R-FCN 等8-10,该类算法检测精度高但速度慢。one-stage 算法则直接在网络中对目标物体进行特征提取,将 two-stage 的 2 个步骤融合为一步,检测速度更快,常见的算法有 SSD11、YOL

5、O 系列12-15。针对垃圾分类检测问题,一些研究者进行了相关的研究工作。如:陈智超等16提出基于 MobileNetV2改进的垃圾图像分类算法,在自制垃圾数据集(共 14 类,4 256 张图片)上的准确率为 94.6%,实现了推理速度与预测准确率的提升;高明等17提出基于新型空间注意力机制的垃圾图像分类算法,证明了神经网络 GANet 在垃圾分类问题中具有良好的性能,推理时间为 80 ms;袁建野等18提出基于轻量级残差网络的垃圾图片分类方法,在中国科学院自动化研究所智能服务机器人实验室提供的数据集(共 2 400 张图片,6 个类别)上进行实验,其 MAPMobileNet-18 模型的

6、精度为 86.34%;罗安能等19提出基于 YOLOv5s 改进的算法,结合 ShuffleNetV2 与深度可分离卷积,在自制数据集(共 6 632 张图片,10 个类别)上进行实验,收稿日期:2022-10-08 修回日期:2022-11-30基金项目:国家自然科学基金(62162010);贵州省科技支撑计划项目(黔科合支撑2022一般 267)通信作者:苟刚(1976),男,贵州贵阳人,贵州大学副教授。E-mail:http:精度达到 94.01%;吕东等20对 ResNet-101 进行改进,融入注意力机制模块,并使用 11 卷积代替注意力机制模型的全连接层,在 TrashNet 数据

7、集上的准确率为 80.87%。上述文献模型要么使用自制数据集,泛化性能较弱,要么网络模型参数量较多,不适合移动端设备的嵌入。轻量化网络在保证模型精度的基础上降低了模型的参数量和复杂度。为了解决上述问题,同时对模型进行轻量化,本文提出一种轻量级垃圾分类检测网络结构,采用 YOLOX-tiny 作为基线模型,在颈部网络中引入注意力机制,使用轻量化模块 GhostBottleneck 替换 CSP 模块并更换模型损失函数,来提升模型的整体性能,并在降低网络参数量的同时不损失网络性能。在 TrashNet 垃圾数据集和华为云垃圾数据集上的实验显示,本文改进算法具有实用性与鲁棒性。1 背景知识1.1 Y

8、OLOX 网络结构传统的 YOLO 系列算法获得的特征层是将输入的图像进行网格划分,每个特征点对应若干先验框,网络的预测结果相当于对先验框内部是否包含物体进行判断,并调整先验框获得预测框。YOLOX 融合了 YOLO 系列网络的优点,主要改进为:1)使用 Focus 网络结构对特征点的信息进行划分,间隔像素点进行取值,扩张通道,同时使用 SiLU 激活函数,在其基础上进行有效改进;2)将 YOLOv3、YOLOv4 的耦合头部改为解耦头部,提高收敛速度,将检测头分为 2 个部分,分别实现分类与回归、目标检测任务,最后对特征信息进行融合;3)使用 Mosaic 和 MixUp 数据增强方式扩充数

9、据集,丰富被检测物体的背景信息;4)采用 Anchor-Free 的方式,缓解正负样本不平衡的问题,降低时间成本;5)采用 SimOTA 动态匹配正样本,降低训练时间。YOLOX-tiny 的网络结构如图 1 所示,共 4 个部分,分别为输入、主干网络、颈部网络、检测头。在输入端,输入需要检测的图片;在主干网络部分,将输入的图片经过 Focus 切片,周期性地抽取高分辨率图像的像素点重构至低分辨率图像中,减少计算量,提升速度,然后经过 Dark2、Dark3、Dark4 获得浅层相关特征,在 Dark5 的 CBS 和 CSP 之间插入 SPP 池化结构,扩大感受野,获得更多的语义信息;在颈部

10、网络部分,将C5 经过卷积、上采样,并与 C4 获得的特征信息拼接融合,接着使用 CSP 结构,再次卷积、上采样,与 C3 获得的特征信息融合,进行下采样,依次输出 P5、P4、P3,使上下层获得的信息被充分利用,最后输出预测结果。图 1 YOLOX-tiny 网络结构Fig.1 Network structure of YOLOX-tiny18广西师范大学学报(自然科学版),2023,41(3)1.2 损失函数交并比(IoU)21被用于测量目标检测中预测框与真实框的重叠程度,用预测框 A 和真实框 B 的交集除以它们的并集,如式(1)所示,A 与 B 的交集越大,表明模型的检测效果越好。Io

11、U=ABAB。(1)当预测框 A 和真实框 B 不重合时,交集的面积为零,大范围内损失函数没有梯度,无法更好反映两者之间的距离。Rezatofighi 等22对其进行改进,提出了 GIoU,如式(2)所示,C 表示 2 个框的最小外接矩阵。LGIoU=1-IoU+|C-(AB)|C|。(2)虽然 GIoU 加入了最小外包框作为惩罚项,解决了 IoU 作为损失函数时梯度无法计算的问题,但是依然存在一些局限性。随后 Zheng 等23提出了 DIoU,如式(3)所示,(A,B)表示 A 框与 B 框中心点坐标的欧氏距离,c 表示包住它们的最小方框的对角线距离。LDIoU=1-IoU+2(A,B)c

12、2。(3)DIoU 仅考虑了中心点距离以及重叠面积,未考虑到长宽比的问题,CIoU 在 DIoU 损失的基础上添加衡量预测框和真实框纵横比 v,一定程度上加快了预测框的回归速度,如式(4)所示,表示权重参数。LCIoU=1-IoU+2(A,B)c2+v。(4)1.3 注意力机制注意力机制能够定位到感兴趣的区域,自适应地决定不同区域的权重比,在通道位置关注更高语义的信息。比如高分辨率特征图包含更多目标的细粒度特征,低分辨率特征图包含更多语义信息,通过注意力自适应分配不同权重,可以有效提高感兴趣目标的检测精度。由于卷积池化过程中特征图在不同通道的不同权重会带来负面影响,2018 年,Hu 等24提

13、出通道注意力机制 SENet(squeeze-and-excitation networks),首先对输入的特征层进行全局平均池化,之后使用 2 次全连接并通过 sigmoid 将其值固定在 0 与 1 之间,最后将获得的权值与原输入特征层相乘。2018 年,Woo等25提出 CBAM(convolutional block attention module)注意力机制,CBAM 结合了通道注意力模块 CAM(channel attention module)和空间注意力模块 SAM(spatial attention module),如图 2 所示。图 2 通道注意力与空间注意力结构Fig.

14、2 Structure of channel attention and spatial attention1.4 Ghost 网络结构2020 年,华为诺亚方舟实验室提出了新的轻量级神经网络 GhostNet26,其将传统的卷积分为 2 步:一方面,利用较少的计算量通过传统卷积生成通道较小的特征图;另一方面,从已经获得的特征图信息通过深度卷积生成新的特征图,最后对特征进行融合拼接。在 ImageNet 分类任务中,GhostNet 的 Top-1 正确率28http:达到 75.7%,比轻量级网络 MobileNetV327提升了 0.5%。GhostNet 的网络结构如表 1 所示,G-b

15、neck 表示幽灵瓶颈,#exp 表示扩展大小,#out 表示输出通道的数量,SE 表示是否使用 SE 注意力机制模块。表 1 GhostNet 网络结构Tab.1 GhostNet structureInputOperator#exp#outSEStride22423Conv2d 33162112216G-bneck16161112216G-bneck4824256224G-bneck7224156224G-bneck72401228240G-bneck120401128240G-bneck24080214280G-bneck20080114280G-bneck18480114280G-bn

16、eck18480114280G-bneck48011211142112G-bneck67211211142112G-bneck6721601272160G-bneck960160172160G-bneck9601601172160G-bneck960160172160G-bneck9601601172160Conv2d 11960172960AvgPool 7712960Conv2d 111 2801121 280FC1 0002 改进的 YOLOX 算法2.1 改进的网络结构针对多分类任务中数据集正负样本不平衡、背景复杂、检测困难、误检、漏检等问题,本文使用 EIoU 作为损失函数,调整模型

17、训练过程中样本比例失衡的问题,提升检测性能。其次,随着网络深度的增加,会丢失部分信息,本文对主干网络 3 个输出特征层 C3(5252)、C4(2626)、C5(1313)分别融合 CBAM 注意力机制,重新分配不同通道的权重,使深层的语义信息与浅层的细粒度特征充分融合,使模型更加关注感兴趣的区域。然后对获得的特征信息进行卷积、上采样、连接、下采样操作,其中 P3 负责检测小目标物体,P4 负责检测中目标物体,P5 负责检测大目标物体,为了细化小目标特征,在 P3 之前再次引入 CBAM。最后,使用 GhostBottleneck 模块替换 C4、C5 层的 CSP 模块,降低参数量,轻量化模

18、型。本文改进的网络结构如图 3 所示。38广西师范大学学报(自然科学版),2023,41(3)图 3 改进的 YOLOX 结构Fig.3 Improved YOLOX structure2.2 EIoU 损失函数CIoU 虽然考虑了边界框回归的重叠面积、中心点距离、纵横比,但式(4)中 v 反映的是纵横比的差异,而不是宽高分别与其置信度的真实差异,有时会阻碍模型有效地优化相似性。为了解决该问题,Zhang等28提出 EIoU,拆开了 CIoU 的纵横比,EIoU 损失函数包含 3 个部分:重叠损失、中心距离损失、宽高损失,如式(5)所示。LEIoU=LIoU+Ldis+Lasp=1-IoU+2

19、(b,bgt)c2+2(w,wgt)C2w+2(h,hgt)C2h。(5)式中:C2w、C2h分别表示预测框和真实框最小外接矩形的宽和高。EIoU 损失的重叠损失和中心距离损失使用 CIoU 中的原方法,而宽高损失直接使预测框与真实框的宽度和高度之差最小,使得收敛速度更快。本文使用 EIoU 作为改进模型的损失函数,能有效提升精度。2.3 CBAM 模块由于部分通道的信息特征更为重要,所以本文引入了 CBAM 注意力机制,如图 4 所示,CAM 用于处理特征图通道权重分配的关系,SAM 用于处理图像分类,将注意力聚焦于重要区域。首先对输入的特征通过 CAM 模块进行全局最大池化与全局平均池化,

20、得到 2 个 11C 的特征层;再通过 MLP,输入分别为 C和 C/r,其中 r 表示升维或者降维因子,实验中 r 取值为16,进行卷积、ReLU 操作;接着使用 sigmoid 函数生成 Mc;然后通过 SAM 模块,进行通道拼接;再经过 77 卷积、Sigmoid 函数,获得目标的重要特征信息,提升模型的检测性能。2.4 GhostBottleneck 模块GhostBottleneck 模块由 2 个 GhostConv 模块和 1 个残差块组成。GhostConv 由卷积、批归一化、ReLU激活函数组成,能有效减少参数量,有利于节约计算资源和内存,与 Ghost 模块相比,训练速度更

21、快,参数量更少,故使用 GhostBottleneck 替换原来颈部网络的 CSP 结构。GhostBottleneck 结构如图 5 所示:步长为1 时,GhostBottleneck 由 2 个 Ghost 模块堆叠而成,第 1 个 Ghost 模块用于增加通道数,第 2 个 Ghost 模块用于减少通道数,并使用短切连接,如图 5(a)所示;当步长为 2 时,2 个 Ghost 模块之间使用深度卷积连接,如图 5(b)所示。3 实验结果与分析3.1 实验条件与数据集实验在 Ubuntu18.4 操作系统上进行训练与测试,GPU 为 NVIDIA GeForce RTX 2080 Ti,C

22、PU 为 Intel48http:(R)core(TM)i3-12100,内存 16 GiB,实现环境是 Pytorch1.8.0。InputChannelAttentionModuleSpatialAttentionModuleRefinedFeature图 4 CBAM 结构Fig.4 CBAM structure AddAddBNGhost moduleGhost moduleBN ReLUBN ReLUBNBNGhost moduleGhost moduleDWConv Stride=2aStride=1 bStride=2图 5 GhostBottleneck 结构Fig.5 Gho

23、stBottleneck structure本文在训练过程中使用预训练模型来加快训练速度,分为冻结层训练和解冻层训练 2 部分。先进行冻结层训练,其中训练批次大小(batch size)设置为 16,迭代次数为 50;再进行解冻层训练,其中训练批次大小设置为 8,迭代次数为 250。总共训练 300 个 Epoch,训练所用的参数如表 2 所示。本次实验数据集来源于 2020 年华为云人工智能大赛的生活垃圾图像数据集,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾 4 个大类,易拉罐、电池、茶叶渣等 44 个小类,共 14 964 张图片,训练集与测试集划分比例为 8 2,由于类别较多,此处仅展

24、示部分垃圾类型的标注框数量,如图 6 所示。表 2 训练参数Tab.2 Training parameters参数名称数值Input_size416416Batch_size16/8optimizer_typeSGDInit_lr110-2Min_lrInit_lr10-2Momentum0.9Epoch50/300lr_decay_typecosweight_decay510-4图 6 数据集标记框数量Fig.6 Number of labeled boxes in dataset3.2 评价指标本次实验用到的评价指标包括 mAP、计算量(FLOPs)、参数量、查准率(P)、召回率(R)、综

25、合评价指标(F-Measure,F1)、帧率(frame per second,FPS)。查准率、召回率和 F1的计算公式如式(6)(8)所示。P=NTPNTP+NFP;(6)R=NTPNTP+NFN;(7)58广西师范大学学报(自然科学版),2023,41(3)F1=2PRP+R。(8)式中:NTP表示分类器分类为正样本,且实际上也是正样本;NFP表示分类器分类为正样本,但实际上是负样本;NFN表示分类器分类为负样本,但实际是正样本。AP 是利用精确度和召回率的不同点组合绘制的曲线下面积,如式(9)所示;mAP 即对所有类别的 AP取平均值,如式(10)所示。PAP=10p(r)dr;(9)

26、PmAP=1kki=1PAP,i。(10)3.3 不同损失函数分析为了证明改进损失函数的有效性,在保证其他参数不变的情况下,仅对损失函数进行修改,实验结果如表 3 所示。由表 3 可知,EIoU 损失函数的效果最好,mAP 提高了 0.4 个百分点,表明 EIoU 损失函数可以更好地收敛,提升精度。3.4 消融实验为了证明本文改进的每一部分对模型性能的提升均有贡献,使用 YOLOX-tiny 作为基线模型,进行消融实验,实验中使用模型的参数量、mAP 对模型进行评价。由表 4 可知,在基线模型中使用 EIoU 损失函数,并在颈部网络融合 CBAM 注意力机制,可以对不同层的通道进行权重重新分配

27、,提高模型对感兴趣区域的关注度,能有效提高模型性能。由表5 可知,与基线模型相比,使用 GhostBottlenek 替换原来的 CSP 结构后,参数量降低了 12%,性能也略有提升,证明本研究具有一定的应用价值。表 3 损失函数表Tab.3 Loss function table损失函数mAP/%YOLOX-tiny+IoU67.59YOLOX-tiny+GIoU67.71YOLOX-tiny+EIoU67.99YOLOX-tiny+CIoU67.72 表 4 消融实验Tab.4 Ablation experimentsGroupEIoUCBAMmAP/%参数量/个167.595 045 3

28、79267.995 045 379368.895 050 085表 5 基线模型与改进模型的对比实验Tab.5 Comparison experiment between baseline model and improved modelGroupEIoUCBAMGhostBottlenekmAP/%参数量/个467.595 045 379567.894 438 2833.5 不同模型对比实验为了证明本文算法的有效性,输入大小均为 416416,各模型在华为云垃圾数据集上的实验结果如表6 所示。由表 6 可知,SSD、YOLOv4 的参数量与计算量均较大,不适合移动端设备的嵌入,且 FPS 相

29、对较低,不能满足实时性要求;YOLOv4-MobileNetV3、YOLOv4-Ghost 的 mAP 较低,检测效果不佳;YOLOv5-s 的计算量、mAP、FPS 均略差于本文算法;YOLOX-s 的 mAP 高于本文算法 1.08 个百分点,但是本文算法参数量和计算量比 YOLOX-s 却分别降低了 50.43%和 46.83%;YOLOX-nano 的 mAP 与本文算法相比低了 4.58个百分点;YOLOX-tiny 比本文算法 mAP 低了 0.3 个百分点,本文算法比其参数量降低了 12.03%,计算量降低了 6.66%,说明本文算法能有效提升模型性能,综合考虑,本文改进方法更适

30、合于移动端的部署。68http:表 6 不同模型对比实验Tab.6 Comparative experiments of different models模型mAP/%参数量/个计算量/109次FPS/(frames-1)SSD65.5629 359 712123.4029YOLOv444.0264 169 24160.2731YOLOv4-MobileNetV343.5711 535 2097.43937YOLOv4-Ghost44.0911 234 6856.89547YOLOv5-s63.607 179 5137.1258YOLOX-s68.978 954 32311.3450YOLOX

31、-nano63.31905 1391.0969YOLOX-tiny67.595 045 3796.4663本文模型67.894 438 2836.0362图 7 所示为华为云数据集上本文算法与 YOLOX-tiny 的性能变化曲线图,图 7(a)为 mAP 的变化曲线,图 7(b)为损失曲线,由图可知,本文模型略优于基线模型。图 7 本文算法与 YOLOX-tiny 的 mAP 和损失曲线对比Fig.7 Comparison of mAP and loss curve between YOLOX-tiny and our method表 7 TrashNet 数据集对比实验Tab.7 Tras

32、hNet dataset comparison experiment%模型mAPF1RecallPrecisionYOLOX-tiny92.3087.7688.0387.50本文模型92.6688.2388.8587.62为了进一步证明本文算法的有效性,将本文算法和基线模型在 TrashNet 数据集上进行实验,实验结果如表 7 所示。由表 7 可知,本文算法 mAP、F1值、Recall、Precision 比基线模型 YOLOX-tiny 分别提升了0.36、0.47、0.82、0.12 个百分点,再次验证了本文改进算法的有效性。基线模型 YOLOX-tiny、本文算法与文献20在 Tra

33、shNet 数据集上的准确率、召回率在各类别上的比较如表 8 所示。实验结果表明,本文算法在玻璃、金属类别的查准率低于基线模型,召回率则只有塑料类别低于基线模型,本文算法整体更优。另外,通过与华为云垃圾数据集的 mAP 比较,表明了在垃圾类别少和背景简单、单目标的情况下,垃圾检测性能有极大的提升。78广西师范大学学报(自然科学版),2023,41(3)表 8 不同垃圾类别的检测结果对比Tab.8 Comparison of detection results of different garbage categories%类别PrecisionYOLOX-tiny本文模型文献20RecallY

34、OLOX-tiny本文模型文献20塑料86.988.476.393.091.074.0硬纸板96.198.792.091.492.686.2纸张89.490.888.796.797.593.2玻璃91.488.585.786.786.766.0金属89.286.269.796.197.485.2其他72.073.161.864.367.977.8图 8 为本文改进算法的检测效果展示,主要针对不同类别的垃圾、背景变化、一个及以上的目标进行检测,检测的垃圾类别包含了有害垃圾、可回收垃圾、厨余垃圾、其他垃圾。图 8(a)是不同背景下对有害垃圾干电池的检测结果,精度达到 90%左右;图 8(b)第一张

35、图片中不仅检测到快递纸袋,还检测到了位于图片边缘的污损塑料,准确率达到 64%,表明本文算法对极小目标也有一定的检测效果;图 8(c)是在出现多目标时的检测结果,均能被准确检测;图 8(d)的第一张图片甚至能检测到稍微模糊的烟蒂,且准确率达到 67%。从检测的结果可知,本文模型能够准确地识别出不同种类的垃圾,并且对垃圾准确分类,因此,本文提出的改进模型具有实际应用价值。图 8 不同类别垃圾检测结果Fig.8 Detection results of different garbage categories4 结语本文对 YOLOX-tiny 网络进行了改进,在模型颈部网络融合注意力机制 CBA

36、M,对上下文提取到的深层语义信息以及浅层的位置信息在通道中进行权重的再分配,使模型更加关注感兴趣的位置,提高模型的检测精度;使用 GhostBottleneck 替换颈部大目标和中目标的 CSP 结构,降低了参数量和计算量,并改进了损失函数,提升了检测精度。为了验证改进算法有效性,本文在华为云数据集和 TrashNet 数据集上进行了88http:检测,实验结果表明,本文模型相对于基线模型在参数量、计算量降低的情况下,检测性能得到提升。本文提出的算法能有效解决计算资源不足的问题,有利于在嵌入式设备上部署,具有实用性。在未来工作中,将进一步探索在背景复杂度高、数量大、目标多的情况下,垃圾识别率欠

37、佳和泛化能力较弱的问题。参 考 文 献1 国家统计局.中国统计年鉴 2021M.北京:中国统计出版社,2021.2张涛,白冬锐,孙煜璨,等.全过程管理视角的上海市垃圾分类回顾与展望J.环境工程,2022,40(3):173-180,146.DOI:10.13205/j.hjgc.202203026.3王洁,顾卫华,陈泽辉,等.生活垃圾分类实践效果、问题与对策分析:以湖州市织里镇为例J.环境工程,2022,40(3):188-193.DOI:10.13205/j.hjgc.202203028.4贵阳市城镇生活垃圾分类管理条例N.贵阳日报,2022-08-16(4).5李永杰,周桂红,刘博.基于

38、YOLOv3 模型的人脸检测与头部姿态估计融合算法J.广西师范大学学报(自然科学版),2022,40(3):95-103.DOI:10.16088/j.issn.1001-6600.2021070911.6刘英璇,伍锡如,雪刚刚.基于深度学习的道路交通标志多目标实时检测J.广西师范大学学报(自然科学版),2020,38(2):96-106.DOI:10.16088/j.issn.1001-6600.2020.02.011.7吕方方,陈光喜,刘家畅,等.基于卷积神经网络的小目标检测改进算法J.桂林电子科技大学学报,2021,41(5):368-374.DOI:10.16725/45-1351/t

39、n.2021.05.005.8GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accurate object detection and semanticsegmentation C 2014 IEEE Conference on Computer Vision and Pattern Recognition.Los Alamitos,CA:IEEEComputer Society,2014:580-587.DOI:10.1109/CVPR.2014.81.9GIRSHICK R.Fast R-CNNC 201

40、5 IEEE International Conference on Computer Vision(ICCV).Los Alamitos,CA:IEEE Computer Society,2015:1440-1448.DOI:10.1109/ICCV.2015.169.10REN S Q,HE K M,GIRSHICK R,et al.Faster R-CNN:towards real-time object detection with region proposal networksJ.IEEE Transactions on Pattern Analysis and Machine I

41、ntelligence,2017,39(6):1137-1149.DOI:10.1109/TPAMI.2016.2577031.11LIU W,ANGUELOV D,ERHAN D,et al.SSD:single shot multibox detectorC Computer Vision-ECCV2016:LNCSVolume 9905.Cham:Springer,2016:21-37.DOI:10.1007/978-3-319-46448-0_2.12REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-

42、time object detectionC 2016 IEEEConference on Computer Vision and Pattern Recognition(CVPR).Los Alamitos,CA:IEEE Computer Society,2016:779-788.DOI:10.1109/CVPR.2016.91.13REDMON J,FARHADI A.YOLO9000:better,faster,strongerC 2017 IEEE Conference on Computer Vision andPattern Recognition(CVPR).Los Alami

43、tos,CA:IEEE Computer Society,2017:6517-6525.DOI:10.1109/CVPR.2017.690.14REDMON J,FARHADI A.YOLOv3:an incremental improvementEB/OL.(2018-04-08)2022-10-08.https:arxiv.org/abs/1804.02767.DOI:10.48550/arXiv.1804.02767.15GE Z,LIU S T,WANG F,et al.YOLOX:exceeding YOLO series in 2021EB/OL.(2021-08-06)2022-

44、10-08.https:arxiv.org/abs/2107.08430.DOI:10.48550/arXiv.2107.08430.16陈智超,焦海宁,杨杰,等.基于改进 MobileNet v2 的垃圾图像分类算法J.浙江大学学报(工学版),2021,55(8):1490-1499.DOI:10.3785/j.issn.1008-973X.2021.08.010.17高明,陈玉涵,张泽慧,等.基于新型空间注意力机制和迁移学习的垃圾图像分类算法J.系统工程理论与实践,2021,41(2):498-512.DOI:10.12011/SETP2020-1645.18袁建野,南新元,蔡鑫,等.基于

45、轻量级残差网路的垃圾图片分类方法J.环境工程,2021,39(2):110-115.DOI:10.13205/j.hjgc.202102017.19罗安能,万海斌,司志巍,等.基于改进 YOLOv5s 的可回收垃圾的检测算法J/OL.激光与光电子学进展:1-152022-10-08.http: J H,JIANG Y N,WANG Z Y,et al.Unitbox:an advanced object detection networkC Proceedings of the 24thACM International Conference on Multimedia.New York,NY

46、:Association for Computing Machinery,2016:516-520.DOI:10.1145/2964284.2967274.22REZATOFIGHI H,TSOI N,GWAK J Y,et al.Generalized intersection over union:a metric and a loss for bounding boxregressionC 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).Los Alamitos,CA:IEEE Compu

47、ter Society,2019:658-666.DOI:10.1109/CVPR.2019.00075.23ZHENG Z H,WANG P,LIU W,et al.Distance-IoU loss:faster and better learning for bounding box regressionJ.Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(7):12993-13000.DOI:10.1609/aaai.v34i07.6999.24HU J,SHEN L,SUN G.Squeeze-

48、and-excitation networksC 2018 IEEE/CVF Conference on Computer Vision andPattern Recognition.Los Alamitos,CA:IEEE Computer Society,2018:7132-7141.DOI:10.1109/CVPR.2018.00745.25WOO S H,PARK J C,LEE J Y,et al.CBAM:convolutional block attention moduleC Computer Vision-ECCV 2018:LNCS Volume 11211.Cham:Springer Nature Switzerland AG,2018:3-19.DOI:10.1007/978-3-030-01234-2_1.26HAN K,WANG Y H,TIAN Q,et al.GhostNet:more

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签
资源标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服