收藏 分销(赏)

基于改进YOLO v5s的甘蔗切种茎节特征识别定位技术.pdf

上传人:自信****多点 文档编号:2270109 上传时间:2024-05-24 格式:PDF 页数:13 大小:8.29MB
下载 相关 举报
基于改进YOLO v5s的甘蔗切种茎节特征识别定位技术.pdf_第1页
第1页 / 共13页
基于改进YOLO v5s的甘蔗切种茎节特征识别定位技术.pdf_第2页
第2页 / 共13页
基于改进YOLO v5s的甘蔗切种茎节特征识别定位技术.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023年10 月第54卷第10 期农报业学机械doi:10.6041/j.issn.1000-1298.2023.10.023基于改进YOLOv5s的甘蔗切种茎节特征识别定位技术李尚平1.2郑创锐1,2文春明1.2李凯华1,2甘伟光1.2李洋1.2(1.广西民族大学电子信息学院,南宁530 0 0 6;2.广西高校智慧无人系统与智能装备重点实验室,南宁530 0 0 6)摘要:为了实现甘蔗智能横向切种工作站的精准、高效的自动化切种,针对工厂化切种任务的特点,提出了一种基于改进YOLOv5s的甘蔗茎节特征边缘端识别与定位方法。首先,利用张正友相机标定法对摄像头进行畸变矫正;然后对甘蔗茎节数据集

2、进行数据增强,利用原始的YOLOv5s模型进行训练和测试,结果显示数据增强能一定程度上提高检测精度。针对茎节特征目标小以及模型体积大导致检测精度低、部署难度高等问题,对YOLOv5s的骨干网络进行改进,在SPPF特征融合模块前引人坐标注意力(Coordinateattention,CA)模块和Ghost轻量化结构,在Head网络中剔除P5大目标检测头,得到了改进后甘蔗茎节检测模型YOLOv5s-CA-BackboneGhost-p34,测试结果表明该模型优于其他主流算法和原始模型,具有高精度、小体积等优势。其中,平均精度均值1和平均精度均值2.分别提高5.2、16.5个百分点,模型浮点数计算量

3、和内存占用量分别降低42%和51%。最后,为了提高检测速度和实时性,将模型部署于边缘端,利用TensorRT技术加快检测速度,并在传送速度为0.15m/s的甘蔗智能横向切种工作站上完成实际切种实验。实验结果表明,加速后茎节检测速度达到95f/s,实时检测定位平均误差约为2.4mm,切种合格率为10 0%,漏检率0.4%,说明本文提出的模型具有高度可靠性和实用性,可以为甘蔗横向切种工作站的工厂化、智能化以及标准化应用提供有效的技术支持。关键词:甘蔗智能横向切种工作站;茎节识别与定位;YOLOv5s;边缘端部署中图分类号:S24;T P39文献标识码:A文章编号:10 0 0-12 98(2 0

4、2 3)10-0 2 34-12OSID:iStem Node Feature Recognition and Positioning Technology for TransverseCutting of Sugarcane Based on Improved YOLO v5sLI Shangping l-2ZHENG Chuangruil-2WEN ChunmingLI Kaihual.GAN Weiguang1,21,21,2LI Yang1,2(1.College of Electronic Information,Guangxi Minzu University,Nanning 53

5、0006,China2.Key Laboratory of Intelligent Unmanned System and Intelligent Equipment,Nanning 530006,China)Abstract:In order to achieve accurate and efficient automated seed cutting in sugarcane intelligenttransverse seed cutting workstation,a method based on improved YOLO v5s for identifying and loca

6、tingthe edge end of sugarcane stem node features was proposed for the characteristics of factory seed cuttingtasks.Firstly,the camera was corrected for distortion by using the ZHANG Zhengyou camera calibrationmethod,then the sugarcane stem node dataset was enhanced and the original YOLO v5s model wa

7、s usedfor training and testing,and the results showed that the data enhancement can improve the detectionaccuracy to some extent.Then,to address the problems of low accuracy and high model complexitycaused by small stem node feature targets,the backbone network of YOLO v5s was improved byintroducing

8、 the coordinate attention module and Ghost lightweight structure before the SPPF module,andremoving the P5 large target detection head in the Head network to obtain the improved sugarcane stemnode detection model YOLO v5s-CA-BackboneGhost-p34.The test results showed that the modeloutperformed other

9、mainstream algorithms and the original model with high accuracy and small size.Among them,mAP 0.5 and mAP 0.5:0.95 were improved by 5.2 and 16.5 percentage points,respectively,and the model computation and size were reduced by 42%and 51%,respectively.Finally,in order to improve the detection speed a

10、nd real-time performance,the model was deployed at the edgeend,and the detection speed was accelerated by using TensorRT technology,and the model wascompleted on a sugarcane with transmission speed of o.15 m/s.The actual seed cutting test were收稿日期:2 0 2 3-0 5-30 修回日期:2 0 2 3-0 7-10基金项目:国家自然科学基金项目(52

11、 16 50 0 9)作者简介:李尚平(1956 一),男,教授,博士生导师,主要从事智能制造技术信息化研究,E-mail:s p l i 50 1 v i p.s i n a.c o m235李尚平等:基于改进YOLOv5s的甘蔗切种茎节特征识别定位技术第10 期completed on the smart transverse seed cutting workstation with transmission speed of 0.15 m/s.The testresults showed that the accelerated stem node detection speed re

12、ached 95 f/s,the average error of real-time detection and positioning was about 2.4 mm,the seed cutting qualification rate was 100%,and theleakage rate was 0.4%,which indicated that the model proposed was highly reliable and practical,andcan provide effective technical support for the industrializat

13、ion,intelligence and standardization ofsugarcane transverse seed cutting workstation.Key words:intelligent transverse sugarcane cutting workstation;stem node identification andpositioning;YOLO v5s;edge-end deployment0引言甘蔗是我国最重要的糖料作物,在我国国民经济中占有特殊的重要作用。甘蔗种业是糖料甘蔗生产的基础,是促进甘蔗高产高糖的前提。甘蔗制种的工厂化、标准化以及智能化是促进糖

14、业发展必由之路。针对甘蔗制种的工厂化、标准化以及智能化生产技术的不足,课题组研发了甘蔗智能横向切种工作站2 ,它具有切种合格率高、伤芽率低等优点,为甘蔗的工厂化制种奠定了良好的基础。本文以提高甘蔗智能横向切种工作站的效率及精度为目标,对其甘蔗茎节识别部分进行优化改进以及部署于边缘设备上,进一步提高甘蔗智能横向切种工作站的实用性与可靠性。目前甘蔗茎节识别与定位方法相关的研究可以分为传统机器视觉方法、传感器识别分析方法和深度学习方法。在传统机器视觉方法方面,CHEN等31在甘蔗的感兴趣区域二值化图像内使用垂直投影函数,并对垂直投影函数连续求导后,根据可疑像素值确定茎节,单个茎节点识别准确率为10

15、0%。ZHOU等4 提出了一种基于Sobel边缘检测的甘蔗茎节点识别方法,识别准确率为93%,平均时间为0.539s。张圆圆等5 利用甘蔗茎节处具有拐点和灰度值不连续的特性,在边缘拟合法和灰度值拟合法的基础上使用中值决策法对甘蔗茎节进行识别,识别率达到94.7%。在传感器识别分析方法方面,CHEN等6 利用加速度传感器和薄膜压电传感器共同采集位置信息,基于小波分析对甘蔗茎节进行识别,识别精度为99.6 3%,单个茎节识别时间为0.2 5s。MENG等7 利用激光传感器获取甘蔗表面轮廓信号,并提出了一种基于多阈值多尺度小波变换的甘蔗茎节识别分析方法,识别率为10 0%,识别时间为0.25s。在深

16、度学习方法方面,陈延祥8 在改进后的YOLOv3的基础上使用边缘提取算法和茎节定位算法,识别调和平均值为97.3%。赵文博等9 在YOLOv5s的基础上引人bifpn、EI o U 损失函数和Focal loss损失函数提高识别平均精度,然后在颈部引人Ghost模块使模型轻量化,平均识别精度为97.8%,模型内存占用量为11.4MB。而在甘蔗智能横向切种工作站上使用的识别模型已有两代。第1代识别模型为:廖义奎等10 利用垂直投影方法确定甘蔗所在位置,然后利用卷积神经网络AlexNet搭建甘蔗蔗芽特征识别模型,模型实时动态检测精度为8 8%,平均检测时间为341.0 9ms;第2 代识别模型为:

17、李尚平等 通过改进YOLOv3算法实现了甘蔗茎节实时动态识别,识别平均精度为90.38%,识别平均时间为2 8.7 ms,模型内存占用量为 118 MB。传统机器视觉和传感器分析方法对于甘蔗茎节识别的研究大多数为静态或纵向识别,对场景和目标特征选择的依赖性较强,面对颜色分布差异较大或者外观形状不规律的甘蔗种时,识别能力较差,鲁棒性较低,效率低下,并不能满足工厂化生产的需求。而其它基于深度学习方法的甘蔗茎节识别模型虽然展现出较高的应用前景,但均未部署在嵌人式设备上,缺少实际切种任务的检验,真实效果有待检验,缺乏可靠性和真实性。因此,本文针对甘蔗智能横向切种工作站应用需求,提出一种基于改进YOLO

18、v5s的甘蔗茎节特征识别定位方法以及边缘端部署,优化甘蔗茎节实时检测流程,使其在复杂的光照条件和实时检测的动态环境下,克服特征模糊的影响,提高视觉系统的检测精度及可靠性,并将视觉系统部署于边缘设备上,使其具有更好的实用性与可扩展性,通过在切种工作站上进行实际切种试验,验证本文方法的优越性。1甘蔗智能横向切种工作站构建1.1甘蔗智能横向切种工作站组成与工作原理甘蔗智能横向切种工作站由二级耙结构、图像采集黑箱、切种平台、液压站、甘蔗分栋电机、甘蔗传送电机、摄像头、调节灯、光电传感器、图像识别及控制系统等零部件组成,如图1所示。切种过程中,随着二级耙的转动,整根蔗种被横向有序地送人黑箱中,黑箱顶部的

19、摄像头实时采集甘蔗图像序列,接着农机2362023年报业学械由图像识别系统同时检测各茎节位置和计算各切口坐标信息,并将其发送给控制器,由控制器调控多把切刀,同时完成一根甘蔗的双芽段切种工作。36(a)结构图(b)整机实物图图1甘蔗智能横向切种工作站Fig.1 Intelligent transverse sugarcane cutting workstation1.二级粑结构J2.图像采集黑箱3.切种平台4.液压站5.甘蔗分栋电机6.甘蔗传送电机7.摄像头8.调节灯9.光电传感器10.图像识别及控制系统1.2图像采集黑箱结构图像的采集工作主要在黑箱中完成,黑箱中包括顶部摄像头和侧边的矩阵灯带,

20、如图2 所示。其中,摄像头与传送带平面垂直距离为1.2 m,该距离的设置可以保证摄像头能够拍摄到传送带上的完整物体,避免甘蔗茎节信息缺失等问题三图2甘蔗智能横向切种工作站黑箱内部结构图Fig.2Internal structure of black box of intelligenttransverse sugarcane cutting workstation1.摄像头2.调节式矩阵灯带3.整根甘蔗4.传送链为了得到最佳的图像茎节特征,需要调节LED矩阵灯带的光照分布。经过多次试验,目前平均光照强度为430.7 1x时效果最佳,可充分展示甘蔗茎节的特征。在选用摄像头时,考虑到实际应用需求和

21、成本限制,使用了RMONCAM的G200型高清摄像头。该工业相机采集速度为30 f/s,分辨率为192 0 像素1080像素,曝光方式为卷帘曝光,曝光时间约为33ms,图像处理方式为自动曝光。这些参数的设置可以保证图像的清晰度和稳定性,同时满足目标检测的实时性要求1.3相机标定为了消除图像识别定位的畸变误差影响,需对工业相机进行精准的标定,实现相机坐标和实际坐标之间的转换。在计算机上生成7 9的棋盘方格,每个方格的尺寸为2.5cm2.5cm,如图3a所示。利用打印机进行1:1打印,再从不同角度对棋盘方格进行拍照,采集50 幅不同角度的图像,如图3b、3c所示。(a)棋盘标定板样式(b)位姿1标

22、定板样式(c)位姿2 标定板样式图3工业相机标定流程Fig.3Industrial camera calibration process采用图像处理算法对相机进行标定处理,通过张正友相机标定算法进行计算12】,可以得到相机内部参数R,和畸变参数R表达式为518.30650309.72767R,=0517.9153249.605 6(1)001R,=0.396 50.1583000(22甘蔗茎节图像数据集采集与预处理2.1甘蔗茎节的数据采集本研究以广西甘蔗为研究对象,在崇左市扶绥县的广西大学广西亚热带农科新城进行甘蔗的采集13-14。为了保证数据的多样性和鲁棒性,从2022年10 月到2 0 2

23、 3年3月,通过人工砍收的方式分3次收集40 4根甘蔗,甘蔗品种包括中蔗9号、桂糖42 号和桂辐98-2 96。平均长度约为1.8 m,平均直径达到30 mm,其中保留2 0 根作为实际切种的试验样本,其余甘蔗置于切种工作站的传送链上,传送速度分别从0.1m/s逐渐升高至0.15m/s,并使用摄像头对整杆甘蔗的茎节特征进行视频采集。通过视频顿分割方式,最终采集到共计2 336 幅整根甘蔗图像,格式为JPG。采集到的图像包含不同摆放密度、不同光照、多品种的蔗种图像,以保证目标着图像竖直向下的左上角轴方向沿看像水轴方向沿符与式(3)(4)对应图像坐标点位于图像图6 为甘蔗框标注示意图。图中的字23

24、7李尚平等:基于改进YOLOv5s的甘蔗切种茎节特征识别定位技术第10 期检测的准确性与鲁棒性。如图4所示。图4整杆甘蔗的茎节图像Fig.4Image of stem nodes of whole sugarcane2.2数据筛选以及数据标注为提高实时动态环境下的甘蔗茎节识别的精度和速度,因此在筛选过程中,首先从传送速度和曝光度等因素出发,删除一些不符合要求的图像。其次,为了提高模型鲁棒性,着重选择一些模糊但仍具有茎节特征的图像数据。最终保留449幅不同疏密、不同光照的甘蔗茎节图像,便于YOLO目标检测算法更好地去学习标注好的甘蔗茎节目标细节特征,提高整体模型识别精度。在数据标注方面,本文使用

25、Labellmg软件对这些图像进行了标注,并将标注信息转换为YOLO需要的txt格式。在标注过程中,得到包含茎节目标的中心坐标(x,y)、宽、高信息的xml文件。由于YOLO需要的标注文件类型为txt文件,因此使用Python编程将xml文件转化为txt格式的标注文件,得到了可以在YOLO模型中运行的数据集1518YOLO楼数据格式如图5所示classh图5YOLO数据格式Fig.5YOLOdata format图5中class表示数值化的类别标签,标签从0开始索引,就本研究而言,仅有一个类别标签,所以class值仅为O;x、y、w、h 的计算式为W(3)HWW(4)hhH式中W-图像宽度H图

26、像高度W归一化后目标宽度h归一化后目标高度X归一化后目标中心x坐标归一化后目标中心Y坐标W目标宽度h目标高度(0,0)WH图6 甘蔗茎节数据标注示意图Fig.6Schematic of sugarcane stem node data labeling通过对标注的甘蔗茎节边界框数据进行统计,449幅图像经过标注后得到8 10 2 个甘蔗茎节实例,因为1幅图像可能存在多根甘蔗、多个茎节,所以得到的实例数量较多。接着对图中边界框坐标中心(x,y)和边界框的宽、高进行了归一化处理。统计结果如图7 所示,图中颜色较深的区域表示数据高度重叠。0.700.080.650.070.600.060.550.0

27、50.500.040.450.030.400.020.350.300.010.20.40.60.800.0050.0100.015茎节边界框中心横坐标茎节边界框宽度(a)甘蔗茎节边界框中心(b)甘蔗茎节边界框坐标分布图宽、高分布图图7 甘蔗茎节边界框统计结果Fig.7Statistical results of box of sugarcane stemnode boundary从图7 a可知,甘蔗茎节的边界框的中心(x,y)主要分布在y轴0.3 0.7 之间以及x轴0.2 0.8之间,这是因为在安装摄像头时,在其外部增加了一个黑色外壳,用于减弱光线的干扰,所以在识别画面出现四周黑边的情况,从

28、而影响了甘蔗茎节边界框的分布。此外,根据图7 b可知,每个甘蔗茎节实例的边界框面积都不超过整幅图像区域的0.12%,总体呈现小目标的特点,这也是在后续算法改进中需要解决的一个重点问题2.3数据增强采用Imgaug图像增强库扩大甘蔗茎节图像数农2023年238机报学业械量,记录数据增强前后的训练、测试效果对比。本实验选择YOLOv5s模型作为基准模型,并将原始数据随机抽样出约10%数据作为测试集,共50 幅图像。训练集、验证集和测试集的划分比例为8:1:1,接着分别对训练集和验证集采用仿射变换、翻转变换、高斯模糊、高斯噪声等方式扩增数据集7 倍,测试集采用原始数据集分割得到的测试集,数据划分结果

29、如表1所示表1数据集划分Tab.1Divisionof data set数据集类型训练集验证集测试集总数原始数据集3495050449Imgaug数据增强后2.443350502.843分析数据增强前后数据集在每一轮训练后在验证集上的效果,如图8 所示(图中平均精度均值1指mAP0.5,平均精度均值2 指mAP0.5:0.95,YOLOv5s_aug指在训练YOLOv5s模型时使用数据增强后的数据集,YOLOv5s_noaug指在训练YOLOv5s模型时使用原始数据集)。从结果上可以看出,数据增强后的模型在精确率(Precision)、召回率(R e c a l l)和平均精度均值(Meana

30、verageprecision,mAP)上都有不同程度的提升,并且震荡幅度更小,这是由于数据增强丰富了数据集的多样性,使得模型能够学习到更多的数据分布和场景,从而提高模型的泛化能力和鲁棒性,降低了过拟合风险。图9为50 0 轮训练过程中在训练集和验证集下的box损失值以及object损失值,box损失值描述预测框与锚框之间的匹配程度,object损失值描述预测物体类别与真实类别的差异程度。从图中可以看出,使用数据增强后的box损失值越小,object损失值也相对较低,说明经过数据增强后模型收敛更快。从图9中还可以看出,在前10 0 轮的训练以及验证过程中,目标损失出现先上升后下降的趋势,其原因

31、是在训练初期过程中,模型只能学习到一些基本的特征,导致目标损失函数的值较高。随着训练迭代次数的增加,模型会学习到更多的特征,从而降低目标损失函数的值。数据增强前后的模型在测试集上的检测性能如表2 所示。从表2 可以看出,在原始数据集基础上进行数据增强使精确率、召回率、平均精度均值1、平均精度均值2 分别提高3.8、5.2、5.4、8.5个百分点,其中平均精度均值2 提升最明显。这是因为数据增强扩展了原始数据集,增加了样本数量和多样性,使得模型能够学习到更多丰富的甘蔗茎节特征,一定程度上提高了模型的检测精度、稳定性和鲁棒性。YOLOv5s_aug模型性能参数和损失值如图10所示。从图中可以发现,

32、采用数据增强策略能显著且稳定提高模型检测精度和稳定性,加快收敛速度。3基于改进生YOLOv5s的甘蔗茎节识别模型3.1YOLOv5s算法结构优化YOLOv5s是YOLOv5中模型复杂度较低,且兼具较高检测精度和速度的模型,被广泛应用于各80806060%/率%/率回品40402020YOLOv5s_aug-YOLOv5s_aug-YOLOv5s_noaug-YOLOv5s_noaug01002003004005000100200300400500送代次数送代次数508040%6030402020YOLOv5s_aug10-YOLOv5s_aug-YOLOv5s_noaugYOLOv5s_noa

33、ug01002003004005000100200300400500送代次数送代次数图:数据增强前后数据集训练过程验证集性能评估结果Fig.8Performance evaluation results of validation set before and after data enhancement for dataset training process239李尚平等:基于改进YOLOv5s的甘蔗切种茎节特征识别定位技术第10 期0.10r0.10-YOLOv5s_aug-YOLOv5s_aug0.09YOLO v5s_noaugYOLOv5s_noaug0.080.080.070.0

34、60.060.050.040.040.030.020.0201002003004005000100200300400500送代次数选代次数0.034YOLOv5s_aug0.055YOLOv5s_aug0.032YOLOv5s_noaugYOLOv5s_noaug0.0500.0300.0450.0280.0400.0350.0260.0300.0240.02501002003004005000100200300400500选代次数送代次数图9数据增强前后数据集训练过程损失值变化曲线Fig.9Curves of loss value during training process of dat

35、aset before and after data augmentation表2数据增强前后数据集训练所得模型在测试集上性能参数Tab.2 Performance evaluation results of trained modelon test set before and after data augmentationof dataset%精确召回平均精度平均精度数据集类型率率均值1均值2原始数据集88.785.887.344.7数据增强后数据集92.591.092.753.2类工业生产活动。将它作为网络优化的基础,可以保证网络结构的可靠性和高效性,避免过多的参数穴余对实际应用造成不良

36、影响。所以,本研究将以YOLOv5s算法为基础,对骨干网络和Head网络进行优化改进,使其对甘蔗茎节小目标的检测性能提高,模型复杂度降低。3.1.1骨干网络优化骨干网络是是YOLOv5s模型的基础,负责提取输人图像的特征,它的模块主要包括Conv模块、C3模块以及SPPF模块。Conv模块实现了对输入特征的提取和转化;C3模块利用残差网络进行残差学习,提高了模型的深度;SPPF模块是在SPP的基础上减少网络层数,并对不同感受野的信息特征进行融合,提高特征图的表达能力和特征融合的速度。但是,原始网络对小目标特征的提取能力有限,提取的特征图中也包含了许多允余特征信息,增加了计算量和内存占用量。所以

37、,为了进一步提高YOLOv5s的特征提取能力以及降低模型复杂度,本文将对它的骨干网络进行优化改进。图11为YOLOv5s模型的原始骨干网络以及改进后的骨干网络结构示意图。从图11b中可以看出,原始骨干网络的SPPF层前面引入CA模块,并将Conv模块和C3模块换成轻量级GhostConv模块和C3Chost模块,最后将输出结果同P3、P4和P5特征共同输人至下一级0.09训练集锚框损失值800.08验证集锚框损失值训练集目标损失值0.07验证集目标损失值600.060.0540精确率0.04召回率200.03平均精度均值1平均精度均值20.020100200300400500010020030

38、0400500选代次数送代次数图10YOLOv5s_aug模型性能参数和损失值变化曲线Fig.10Performance parameters and loss curves variations of YOLO v5s_aug model农2402023年报学机业械P3P4P5ConvConvC3ConvC3ConvC3ConvC3SPPF(a)YO LO v 5s 原始骨干网络P3P4P5ConvChostConvC3ChostChostConvC3ChostChostConvC3ChostChostConvC3ChostCASPPF(b)改进后骨干网络图11改进前后的骨干网络对比Fig.

39、11Comparison of backbone networks before and after improvementNeck网络。CA注意力模块的结构图如图12 所示,从图中可以发现,CA注意力模块是通过对水平方向和垂直方向上分别进行平均池化,再使用转换器对空间信息进行编码,最后把空间信息通过加权的方式融合进通道中,这将有利于CA注意力机制全面考虑空间信息和通道信息,增强特征提取能力19-2 0 1O高度平均卷积层Sigmoid池化残差拼接+连接卷积宽度平均卷积层Sigmoid池化图12CA注意力模块Fig.12CA attention moduleGhost结构2 1 由Ghost卷

40、积模块和Ghost瓶颈模块组成。Chost卷积模块包括常规卷积和线性变换两部分(图13a),首先通过有限的常规卷积得到一部分特征图,之后利用廉价的线性变换生成更多Ghost特征图,生成的Ghost特征图能够极大的表现常规卷积中包含的穴余特征信息,最后通过恒等映射将两组特征图进行组合。Chost瓶颈模块(图13b)是由两个Ghost卷积模块构成的,其中一个Chost卷积作为扩展层,用于增加特征维度,扩张通道数;另一个Chost卷积用于减少通道数使其与直连的特征相匹配,最后经过shortcut连接后输出特征。IdentityConv输人输出(a)Chost模块GhostConvChostConvA

41、ddBNBNReLU(b)Chost瓶颈模块图13Chost结构图Fig.13Ghost structure diagram相比于原始骨干网络,在SPPF层前加人CA注意力模块,不仅可以加强特征的表现力,使网络更加关注重要的特征,而且可以在多尺度提取不受影响的情况下,保证特征图精细程度,使得模型更加稳定和准确。这一点可以帮助骨干网络有意识地提取出属于甘蔗茎节的特征点,从而实现更好的检测效果以及更高的检测精度。同时,引人Chost网络结构的骨干网络可以在不影响模型特征提取能力的情况下,降低模型计算量和参数量,减少模型的特征穴余,3.1.2Head网络的优化Head网络通常接在Neck网络之后,主

42、要负责预测目标检测任务中的类别、位置、置信度等信息。它的输人特征分别选取下采样为32、16 和8 的卷积输出结果,即分别对应图中的P5、P4和P3,在输人图像尺寸为6 40 6 40 的情况下,分别用于检测大小在32 32 以上的大目标、16 16 以上的中目标以及8 8 以上的小目标。然而在甘蔗茎节数据集的目标面积占比均小于0.12%的任务中,Head网络的大目标检测分支不适用于此目标检测任务。因此本文针对Head输出网络进行了如下优化:将输出的大目标检测分支剔除,只保留小目标和中目标检测,这将有利于小目标物体的位置信息检测,降低模型后处理阶段的容错率,使模型更加专注于训练有用的特征,减少了

43、网络计算量和参数量,加快模型的推理速度,提高模型精度。其优化结果如图14。小日标检测头P3-Neck网络中日标检测头P4一P5-大日标检测头图14Head网络优化示意图Fig.14Illustration of Head network optimization3.2算法优化实验对比训练数据集均统一采用数据增强后的数据,测试集采用原始数据10%的数据,表3为不同模型及其对应说明3.2.1算法优化改进对比不同YOLOv5改进算法在50 0 轮训练过程中的性能指标如图15所示。241李尚平等:基于改进YOLOv5s的甘蔗切种茎节特征识别定位技术第10 期表3模型名称及其说明Tab.3Model n

44、ames and their descriptions模型名称说明YOLOv5sYOLOv5s模型YOLOv5s-CA骨干网络添加CA注意力机制模块YOLO v5s-p34Head网络剔除P5检测头骨干网络添加CA注意力机制模块,YOLO v5s-CA-p34Head网络剔除P5检测头骨干网络添加CA注意力机制模块,并YOLOv5s-CA且引人Chost结构,Head网络剔除P5检BackboneGhost-p34测头骨干网络添加CA注意力机制模块,YOLOv5s-CANeck网络引入Ghost结构,Head网络剔NeckChost-p34除P5检测头骨干网络添加CA注意力机制模块,骨YOLO

45、v5s-CA-干网络和Neck网络引人Chost结构,Chost-p34Head网络剔除P5检测头从图15可得,单独使用CA注意力机制或者单独剔除大目标检测头都能显著提升模型性能,其中后者的优化策略效果更佳。而同时使用CA注意力机制与剔除大目标检测头的优化策略,可获得最佳性能表现。具体来说,单独或者结合使用这两种优化策略对模型的精确率、召回率、平均精度均值1和平均精度均值2 都有提升,在精度、召回率和平均精度均值1上差距较小,但在平均精度均值2 上提升效果最为明显。在YOLOv5s-CA-p34的基础上,对其骨干网络、Neck网络引人Ghost结构,发现在骨干网络或Neck网络中单独引人Gho

46、st结构的模型在平均精度均值等性能指标上都略微高于同时引人Chost结构的模型,特别是在平均精度均值2 上的差异最大。而相比YOLOv5s-CA-p34模型,3种轻量化模型检测精度都有细微下降,满足在兼顾检测精度的情况下实现模型轻量化需求。通过训练得到7 个模型的优化参数后,使其在统一的测试集上进行测试,结果如表4所示。100100r8080%/率%/率回6060YOLOv5s-CA-BackboneChost-p34YOLOv5s-CA-BackboneChost-p34YOLOv5s-CA-Ghost-p34YOLOv5s-CA-Chost-p3440YOLOv5s-CA-NeckChos

47、t-p3440YOLOv5s-CA-NeckChost-p34YOLOv5s-CA-p34YOLOv5s-CA-p34YOLOv5s-CAYOLOv5s-CA20YOLOv5s-p3420YOLOv5s-p34YOLOv5s-YOLOv5s01002003004005000100200300400500选代次数选代次数100708060%/%506040YOLOv5s-CA-BackboneChost-p34YOLOv5s-CA-BackboneGhost-p34YOLOv5s-CA-Chost-p3430YOLOv5s-CA-Ghost-p3440YOLOv5s-CA-NeckChost-p

48、34YOLOv5s-CA-NeckGhost-p34YOLOv5s-CA-p34YOLOv5s-CA-p3420YOLOv5s-CAYOLOv5s-CA20YOLOv5s-p34YOLOv5s-p34-YOLOv5s10YOLOv5s上01002003004005000100200300400500送代次数选代次数图15不同YOLO改进算法在训练过程中的性能结果Fig.15Performance results of different YOLO improvement algorithms in training process表4算法优化实验测试集性能评估结果Tab.4Performanc

49、e evaluation results of algorithm optimization experiment test set精确率/召回率/平均精度平均精度浮点数模型内存占模型%均值1/%均值2/%计算量用量/MBYOLOv5s92.591.092.753.21.58 101013.7YOLOv5s-CA97.696.697.967.61.58 101013.7YOLO v5s-p3497.197.098.072.21.43 10 1010.2YOLO v5s-CA-p3497.397.198.372.61.44 10 1010.3YOLOv5s-CA-Chost-p3497.196.

50、897.867.07.40 1095.8YOLOv5s-CA-NeckGhost-p3497.497.298.170.71.2610109.4YOLOv5s-CA-BackboneGhost-p3497.196.997.969.79.201096.7农2422023年机业报学械从表4可得,相比于YOLOv5原始模型,单独采用CA注意力模块、单独采用剔除大目标检测头优化策略的模型在测试集上的平均精度均值1分别提升5.2、5.3个百分点,在平均精度均值2 上分别提高了13.6、19个百分点,当两种优化方法结合时,其平均精度均值1和平均精度均值2 分别提高5.6个百分点和19.4个百分点。通过引人C

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服