基于改进YOLOv5算法的可回收饮料瓶检测方法研究.pdf

资源描述

1、第43卷第4期辽宁工业大学学报(自然科学版)Vol.43,No.4 2023 年 8 月 Journal of Liaoning University of Technology(Natural Science Edition)Aug.2023 收稿日期：2022-08-17 基金项目：辽宁省大学生创新创业项目(X2021011)作者简介：林一鸣(1996-)，男，辽宁大连人，硕士生。王宇钢(1977-)，男，辽宁锦州人，副教授，博士。DOI:10.15916/j.issn1674-3261.2023.04.005 基于改进 YOLOv5 算法的可回收饮料瓶检测方法研究林一鸣1，王宇钢1

2、，季莘翔1，徐茁2（1.辽宁工业大学机械工程与自动化学院，辽宁锦州 121001；2.辽宁航星海洋科技有限公司，辽宁锦州 121003）摘要：针对 YOLOv5 算法目标检测存在重叠目标漏检率高、检测置信度低的问题，提出基于 EA-YOLOv5m模型的可回收饮料瓶检测方法。采用 EAM(efficient attention module)注意力模块提升重叠目标检测精度，采用-IOU Loss 函数对损失函数进行改进，提升检测框的定位精度及置信度。实验结果表明，EA-YOLOv5m 模型训练的位置损失值和置信度损失值较 YOLOv5m 模型均有下降，测试的 AP_0.5 和 AP_0

3、.5-0.95 较 YOLOv5m 模型分别提高了 0.15%和 1.28%，检测速度达到 7.8 帧/s。针对不同程度遮挡的重叠目标，EA-YOLOv5m 模型的检测置信度得到明显提升，分别达到 0.81 及 0.68。该算法可以大幅提升重叠目标检测能力，满足基于视觉的可回收饮料瓶检测应用。关键词：YOLOv5 算法；目标检测；可回收饮料瓶；EAM；-IOU Loss 中图分类号：TP391.7 文献标识码：A 文章编号：1674-3261(2023)04-0232-07 Research on Detection Method of Recyclable Beverage Bottles

4、Based on Improved Yolov5 Algorithm LIN Yi-ming1,WANG Yu-gang1,JI Shen-xiang1,XU Zhuo2（1.College of Mechanical Engineering and Automation,Liaoning University of Technology,Jinzhou 121001,China;2.Liaoning Hangxing Marine Technology Co.,Ltd,Jinzhou 121001,China）Abstract:A detection method of recyclable

5、 beverage bottles based on the EA-YOLOv5m model is proposed to address the issues of high overlap target miss rate and low detection confidence in YOLOv5 algorithm object detection.The EAM(Efficient Attention Module)attention module is used to improve the accuracy of overlapping object detection，-IO

6、U LOSS function is used to improve the loss function and the positioning accuracy and confidence of the detection frame.The experimental results show that the position loss value and confidence loss value of the EA-YOLOv5m model training have decreased compared to the YOLOv5m model,and the tested AP

7、_ 0.5 and AP_ 0.5-0.95 has improved by 0.15%and 1.28%respectively compared to the YOLOv5m model,with a detection speed of 7.8 frames per second.For overlapping targets with varying degrees of occlusion,the detection confidence of the EA-YOLOv5m model has been significantly improved,reaching 0.81 and

8、 0.68 respectively.This algorithm can significantly improve the ability to detect overlapping objects and meet the requirements of vision based recyclable beverage bottle detection applications.Key words:YOLOv5 algorithm;target detection;recyclable beverage bottles;EAM;-IOU Loss 第4期林一鸣等：基于改进 YOLOv5

9、算法的可回收饮料瓶检测方法研究 233 由于环保法规政策的健全，对可回收垃圾的资源化利用已成为迫切需要解决的问题1。可回收垃圾中各种废旧饮料瓶、金属瓶和玻璃瓶数量巨大，可回收价值高。目前，在垃圾物品中分拣可回收垃圾时，传统的手工分拣效率低、成本高，而基于视觉的自动分拣方法检测精度低，特别对于重叠目标的漏检率高。因此，如何在保证检测效率的前提下提高检测精度对可回收垃圾的资源化利用具有重要的研究意义。目前，利用深度学习方法进行目标检测已经成为一个热门课题。其中，基于 YOLO 算法的目标检测技术在各个方面得到了广泛的应用2。基于YOLOv5s 算法，王莉等3提出了一种垃圾分类的检测模型，与 YO

10、LOv3 算法相比，该检测模型在不同条件下，检测准确率和检测效率均得到提升。李成在小目标检测任务方面，由于误差和识别精度不高，提出了一种改进 YOLOv5 算法的目标检测方法，与传统目标检测算法Faster RCNN与SSD相比，检测效率和检测精度得到一定提升4。现阶段学者基于 YOLOv5 算法的改进虽然对目标检测的整体检测精度有所提升，但是对于重叠目标检测精度及置信度低的问题仍未有效解决。针对在垃圾物品中回收饮料瓶过程中，存在重叠目标漏检率高、检测置信度低的问题。本文将注意力模块 EAM 融入 YOLOv5m 模型，加强这一模型对重要特征通道的敏感性，从而提取出更具代表性的重要特征通道；采

11、用-IOU Loss 函数对YOLOv5m 模型的损失函数进行改进，提升检测框的定位精度和置信度，满足在有遮挡情况下获得优异检测精度。1 检测流程采用 YOLOv5 算法来进行数据检测，检测流程如图 1 所示5。首先建立可回收饮料瓶检测数据集并进行数据集标注，将其标注的文件转换为 YOLOv5 算法的输入格式。然后将输入数据分为训练集和测试集，将训练集输入 YOLOv5 算法进行训练，完成分阶段训练及验证后获得基于 EA-YOLOv5m 的可回收饮料瓶检测模型。最后输入测试集测试模型是否满足要求。模型若没有满足要求，则调整参数重新训练，直到满足要求后对模型检测效果可视化。2 EA-YOLOv

12、5m 模型 YOLOv5 算法包含 4 种网络结构模型，分别是图 1 检测流程 YOLOv5x、YOLOv5l、YOLOv5s 和 YOLOv5m。它们只在宽度和深度上有所不同，但算法原理是相同的。其中，YOLOv5m 模型在网络结构上更加复杂，检测精度更高，但是检测效率相对较低。应用 YOLOv5m 模型进行物体检测时，应设置训练总轮次、批次大小和迭代次数参数，将待检测目标图像输入模型，通过训练获得表明定位精度的位置损失值及表明检测精度的 AP_0.5 值输出。本文提出了一种基于改进YOLOv5m模型的目标检测模型EA-YOLOv5m。模型共由 4 个部分构成：输入端（Input）、主干网

13、络（Backbone）、颈部网络（Neck）和输出端（Prediction），其模型结构如图 2 所示。各部分的主要功能如下：(1)Input：包括马赛克(Mosaic)数据增强、自适应锚框计算、自适应图片缩放3个方面。其中Mosaic通过随机对 4 张图片缩放和裁剪，再进行拼接实现数据增强。自适应锚框是通过计算输出预测框，并将输出预测框与实际框进行对比，计算对比二者的差异，并进行反向更新，迭代卷积网络参数。自适应图片缩放是指把原始图片缩放到统一的一个标准尺寸，然后将其输送到卷积神经网络中。(2)Backbone：包括焦点层(Focus)、空间金字塔池化(Spatial Pyramid Poo

14、ling，SPP)与跨阶段局部网络层(Cross Stage Partial Network，CSP)3 部分。其中 Focus 是对图像切片分割，得到 2 倍信息的下采样特征图。SPP 结构在 3 次卷积特征层后进行最大池化和平均池化，从而提高了网络结构的非线性表达能力。CSP 结构主要是为了解决计算量过大的问题。本文将 EAM 模块融入到原 YOLOv5m 模型的 Backbone 部分，以此来提高模型检测能力。(3)Neck：延用原 YOLOv5m 的 FPN(Feature 234 辽宁工业大学学报(自然科学版)第 43 卷 608*608*3FocusDwConv CSP1_1 EA

15、MCSP1_1 EAM上采样上采样CSP2_1CBLConcat上采样上采样CSP2_1CONVConcat76*76*255CBLConcatCSP2_1CONV38*38*255CBLConcatCSP2_1CONV19*19*255CBLCONVBNLeakyrelu=Resunit=CBLCBLAddCSP1_X=CBLResunitCONVX个残差组个残差组件件CONVConcatBNLeakyreluCBLCSP2_X=CBLCBLCONV2*X个个CONVConcatBNLeakyreluCBLFocus=FocusFocusFocusFocusConcatCBLSPP=CBLM

16、axpoolMaxpoolMaxpoolConcatCBL1.Input2.Backbone3.Neck4.PredictionDwConvDwConv CSP1_1CBL+SPPEAMCBL+CSP2_1 图 2 EA-YOLOv5m 模型结构Pyramid Networks)+PAN(Path Aggregation Network)的结构，以此来增强网络特征融合的能力。(4)Prediction：本文将-IOU LOSS 函数取代YOLOv5m模型的GIOU Loss(Generalized Intersection over Union Loss)函数作为损失函数，提高了检测框的定

17、位精度。2.1 EAM 模块目前许多研究人员将注意力模块融入卷积神经网络，实验结果表明注意力模块在对网络性能改进方面具有巨大的潜力6。CBAM模块（convolutional block attention module）能简洁、高效地实现注意力机制7。该模块将特征图按通道进行全局池化运算，得到了通道注意力模块和空间注意力模块。但是在卷积神经网络中，如果插入 CBAM 模块，则会导致网络参数的增加，从而导致卷积神经网络的效率下降。本文应用了改进的轻量化 CBAM 模块EAM 模块，将 EAM 注意力模块融入 YOLOv5m 模型8，其总体结构如图 3 所示。图 3 EAM

18、结构通道注意力模块首先将输入特征图F进行均值池化操作和最大值池化操作，并通过通道信息的特征聚合，产生 2 个通道描述符CavgF和maxCF。CavgF表示均值池化特征，maxCF表示最大值池化特征。在EAM 模块中，利用卷积核长度为 k 的一维卷积运算，对附近通道的信息进行聚合。然后在此基础上，将卷积运算后的两个池化特征进行元素相加操作，并利用 Sigmoid 函数进行激活运算，产生了通道注意力1 1()CCMFR。最后，将产生的通道注意力沿空间上的两个维度传播扩展到一个扩充空间C H WR中，再与输入的特征图 F 根据相对应的元素相乘，得到了一个注入通道注意力后的特征图，通道注意力计算公

19、式如式(1)所示。11max)()()kckccDavgDMFfFfF（(1)式中：为 sigmoid 函数；1kDf为卷积核大小为 k 的一维卷积操作。空间注意力模块首先根据注入注意力特征图的通道轴进行最大值池化和均值池化操作，产生两个不同的空间上下文描述符maxSF和SavgF。然后，再通过通道轴自动合并操作获得了一个有效的空间特征描述符。对空间内需要抑制或强调的区域信息采用空洞卷积操作，使其能更有效率的整合空间中的上下文信息，并通过 sigmoid 函数进行激活运算，第4期林一鸣等：基于改进 YOLOv5 算法的可回收饮料瓶检测方法研究 235 产生了空间注意力1()H WSMFR。最

20、后将产生的空间注意力沿通道维度传播扩展到一个扩充空间C H WR中，再将其与注入通道注意力后的特征图根据对应的元素相乘，得到了最终输出的特征图 F”，空间注意力计算公式如式(2)所示。3 3dilatmax);SSSavgMFfFF（(2)式中：3 3dilatf为卷积核大小为 3 的空洞卷积。2.2 -IOULoss 函数 YOLOv5m 模型使用 GIOU Loss 函数作为损失函数，虽然该损失函数可以使检测框获得较高的精度，但是在检测重叠目标时并不能取得较好的检测效果。因此，本文选择-IOU Loss 函数作为本文EA-YOLOv5m 模型的损失函数9。该损失函数由一个附加的功率正则化项

21、和一个功率项 IOU 组成。其中，功率正则化项包含一个功率参数，可用于更加灵活地调整定位精度。而且可以通过自适应地增加高 IOU 对象的损失和梯度的权重，进而提高检测框定位精度，如式(3)所示。IOUlog(),011,1IOULIOU(3)文献9在的经验取值为 3 时获得了较好效果。本文将的取值范围设定为 13，经试验当取值为 1.1 时模型位置损失值最低。3 试验与分析 3.1 数据集与预处理为符合可回收饮料瓶的实际检测情况，选用有遮挡情况的瓶子为检测对象。本文采用 COCO 数据集中瓶子图像 379 张，华为云人工智能大赛垃圾分类挑战杯数据集瓶子图像 121 张10，共计 500

22、张。数据集中检测目标中心点分布及尺寸大小情况如图 4 所示。图 4 数据集目标分布和尺寸情况由图 4 可知，目标分布在图片的中下部位置，且大多为小尺寸的目标。为了进一步丰富样本数量，同时弥补目标的尺寸大小不均及分布局限性，本文采用了 Moscia 数据增强方法使模型获得更好的训练效果。Mosaic 数据增强方法不仅丰富了目标的位置分布情况，并且在一定程度上放大了小尺寸目标，从而提高了模型训练效率。Mosaic 数据增强后的部分训练图片如图 5 所示。图 5 Mosaic 数据增强后的部分训练图片3.2 实验配置与模型训练实验基于 Pytorch 框架实现，实验环境：Windows10 操作

23、系统；CPU 为 Intel(R)Core(TM)i5-1135G72.40GHz，GPU 为 GeForceMX450，内存 2 GB。为在保证模型训练效果的同时提升训练效率，根据实验环境采用 YOLOv5 算法的默认训练参数。将数据集随机分为训练集及验证集，数量比设定为 82；训练的初始学习率设置为 0.000 1，warm-up 预训练步长为 5，训练步数设置为 300 步，分批规模 batchsize 为 8。实验对比了 YOLOv5s、YOLOv5m 和本文提出的 EA-YOLOv5m 3 种模型，图 6 为 3 种模型的训236 辽宁工业大学学报(自然科学版)第 43 卷练结果。

24、(a)置信度损失值 (b)位置损失值图 6 训练结果对比 3 种模型训练过程中所描述的置信度损失值和位置损失值如图 6 所示。由图(a)可以看出，当训练步数增大时，3 种模型的置信度损失值逐渐降低，最终趋于稳定，达到了拟合的状态。其中，EA-YOLOv5m 模型置信度损失值较 YOLOv5m 模型更早拟合且置信度损失值最低；而 YOLOv5s 模型在训练过程中最晚拟合且置信度损失值最高。由于 EA-YOLOv5m 模型使用了 EAM 注意力模块，所以能够获得更加全面的特征，并进一步学习有效特征。由图(b)可以看出，YOLOv5s 模型的位置损失值高于其他两种模型，而 EA-YOLOv5m 模

25、型的位置损失值在 50 steps 时已经全面低于原 YOLOv5m模型。这是由于 EA-YOLOv5m 模型使用了-IOU Loss 函数。所以在初始阶段需要进行位置信息编码，而造成初始损失值较高。但随着训练步数的不断增加，-IOU Loss 函数的优势逐渐体现，位置损失值迅速下降并趋于收敛。3 种模型在验证集上的 AP（Average Precision）值如图 7 所示。(a)AP_0.5 值 (b)AP_0.5:0.95 值图 7 AP 值对比从图(a)可以看出在 IOU 阈值设置为 0.5 时，3种模型的 AP 值均在训练 200 步左右收敛于 0.9。为了更好的对训练模型性能进

26、行客观比较，本实验比较了 IOU 阈值设置为 0.5 至 0.95 时 3 种模型的 AP值。由图(b)可知，EA-YOLOv5m 模型在整个训练过程中 AP 值提升的效率最高，在训练 150 步后整体高于 YOLOv5m 模型，最终达到 0.837 6。3.3 检测效果与性能评估为评估训练完成后模型的检测性能，将YOLOv5s、YOLOv5m 和 EA-YOLOv5m 模型在测试集上进行检测，以 AP 值和每秒检测帧数（frames per second，FPS）作为量化评价指标，对模型检测精度和效率进行评价；以生成模型的权重（Weights）作为模型大小的评估依据，评估模型是否能满足实际

27、工程部署。从表 1 所示的检测结果可以看出，YOLOv5s模型虽然模型权重最小，检测速度也高于其他两个模型，但是在检测精度上却是最低的。YOLOv5m模型较 YOLOv5s 模型增加了模型权重，第4期林一鸣等：基于改进 YOLOv5 算法的可回收饮料瓶检测方法研究 237 表 1 测试集检测结果 Model AP_0.5/%AP_0.5-0.95/%FPS Weights/MB YOLOv5s 85.79 56.92 13 14 YOLOv5m 89.98 62.47 7.3 42 EA-YOLOv5m 90.13 63.75 7.8 44 以至于检测速度略有下降，但是在检测精度上较YOLO

28、v5s 模型略有提高。而 EA-YOLOv5m 模型AP 值上高于其他 2 个模型。其中，AP_0.5 达到90.13%，较其他 2 个模型分别提高了 4.34%和0.15%；AP_0.5-0.95 达到 63.75%，较其他两个模型分别提高了 6.83%和 1.28%。模型结构复杂程度增大势必会带来权重的增加。因此 EA-YOLOv5m 模型在Weights上较YOLOv5m模型略有增加。在FPS方面，EA-YOLOv5m 模型在检测速度虽不及YOLOv5s 模型，但比原 YOLOv5m 模型略有提高，但是以少量的检测速度和模型权重增加为代价换来的检测精度的大幅度提高是极具性价比的。为了可视

29、化 EA-YOLOv5m 模型在遮挡情况下瓶子的检测效果，对比 3 种模型的两组饮料瓶目标检测结果如图 8 所示。(a)YOLOv5s (b)YOLOv5m (c)EA-YOLOv5m 图 8 遮挡情况下检测结果图中，第一组为小面积遮挡情况下的检测结果，位于图片第一行；第二组为大面积遮挡情况下的检测结果，位于图片第二行。图(a)、(b)、(c)分别对应 YOLOv5s、YOLOv5m 和 EA-YOLOv5m模型检测结果。可以看出，YOLOv5s 模型虽然能检测出目标，但是在有遮挡情况下定位精度和置信度较低。其中，第二组(a)图中检测目标的置信度为0.38，极易造成漏检。YOLOv5m 模型较

30、 YOLOv5s模型在有遮挡情况下检测性能上有所提升。第一组(b)图中检测目标置信度为 0.75，较 YOLOv5s 模型提升 0.11。但是 YOLOv5m 模型在第二组(b)中检测目标置信度只有 0.51，依旧容易漏检。而本文提出的 EA-YOLOv5m 模型在这两组对比中无论是在定位精度、置信度都有显著的性能提升。在第一组中检测目标置信度达到 0.81，较另外两个模型分别提升了 0.17 和 0.06；在第二组中检测目标置信度达到 0.68，较另外 2 个模型分别提升了 0.3 和 0.17。4 结束语针对饮料瓶回收检测过程中存在的重叠目标的漏检率高、检测置信度低的问题，提出了EA-Y

31、OLOv5m 模型。该模型采用 EAM 注意力模块提升检测精度，采用-IOU Loss 函数对损失函数进行改进，改善检测框的定位精度及置信度。实验结果表明，EA-YOLOv5m 模型测试的 AP_0.5 和AP_0.5-0.95较YOLOv5m模型分别提高了0.15%和1.28%，检测速度提高了 0.5 帧/s。本文模型在模型权重和检测效率以及检测精度方面达到良好的平衡，对遮挡情况下瓶子的检测定位精度、置信度均有明显提升，能很好地满足饮料瓶回收目标检测实际部署需求，具有较好的实际应用价值。参考文献：1 赵振振,张红亮,殷俊,等.对我国城市生活垃圾分类238 辽宁工业大学学报(自然科学版)第 4

32、3 卷的分析及思考J.资源节约与环保,2021(8):128-131.2 Yan B,Fan P,Lei X,et al.A Real-Time Apple Targets Detection Method for Picking RobotBased on Improved YOLOv5J.Computer Vision and Pattern Recognition,2021,39(20):152-160.3 王莉,何牧天,徐硕,等.基于 YOLOv5s 网络的垃圾分类和检测J.包装工程,2021,42(8):50-56.4 李成.基于改进 YOLOv5 的小目标检测算法研究J.长江信息

33、通信,2021,34(9):30-33.5 韩睿之.基于 GraspYOLO 的垃圾分类分拣系统研究与实现D.西安:长安大学,2021.6 PARK J,WOO S,LEE J Y,et al.A simple and lightweight attention module for convolutional neural networksJ.International Journal of Computer Vision,2020,128(9):783-798.7 WOO S,PARK J,LEE J Y,et al.CBAM:convolutional block attention m

34、oduleC./Proceedings of the European Conference on Computer Vision(ECCV).2018:3-19.8 付国栋,黄进,杨涛,等.改进 CBAM 的轻量级注意力模型J.计算机工程与应用,2021,57(20):150-156.9 He J,Erfani S,Ma X,et al.Alpha-IoU:A Family of Power Intersection over Union Losses for Bounding Box RegressionC.Neural Information Processing Systems,202

35、1,34:1-19.10 华为云.华为云人工智能大赛垃圾分类挑战杯EB/OL.https:/ 明(上接第 231 页)3.3 模具刃口对冲裁力的影响冲孔机多次工作之后，模具就会遭受一定程度的磨损，原来锋利的刃口就会出现圆角。使用小圆角会使冲裁力变大，但是工件的截面质量会有所提升；使用大圆角会使冲裁力减小，但会导致板料被冲头压入深度变大，阻碍了裂纹的发展。4 结束语本文根据冲裁的工艺特点，建立了厚度为3 mm的 Q235 钢冲孔的有限元模型，采用大型有限元软件 ABAQUS 对冲孔过程进行了仿真，对减振器连接套的变形情况、冲孔过程中冲裁力的变化进行了研究。通过对比经验公式与仿真结果的最大冲裁

36、力，证明了仿真模拟的可靠性。在此研究基础上，探讨了冲裁工艺参数对冲裁力的影响。参考文献：1 王健,王一臣,刘柱.双筒式液压减振器工作特性分析J.汽车实用技术,2016(12):144-146.2 董超.弹体冲拔成形中温度对壁厚差成形影响分析J.机械设计,2020,37(S1):212-216.3 吴小蓉,韩继龙.冲裁间隙对铜板断面质量影响的有限元模拟J.机械研究与应用,2014,27(2):87-88.4 Stegeman Y W，Goijaerts A M，Brokken D,et al.An experimental and numerical study of a planar blan

37、king processJ.Journal of Materials Processing Technology,1999,87(1):266-276.5 蔺锋.板料合理冲裁间隙确定方法的研究D.沈阳:沈阳航空航天大学,2013.6 张玉新.板料冲裁毛刺数值模拟与控制D.镇江:江苏大学,2009.7 Mole N,tok B.Finite Element Simulation of Sheet Fine Blanking ProcessJ.International Journal of Material Forming,2009,71(6):551-554.8 殷国军,刘剑,秦莉,等.铸造模具钢镶块刃口在板材冲裁过程中的动态显式有限元分析J.机械设计与制造,2008(2):189-191.9 曹建刚,邢淑清.冲裁模具设计中的应力分析J.包头钢铁学院学报,1998(3):74-76.10 候桂叶.基于 DEFORM 的冲压模具设计的仿真与分析D.成都:电子科技大学,2015.责任编辑：陈明

展开阅读全文