基于改进YOLO v5s的马铃薯种薯芽眼检测方法.pdf

资源描述

1、2023年9 月第54卷第9 期农报学业机械doi:10.6041/j.issn.1000-1298.2023.09.026基于改进YOLOv5s 的马铃薯种薯芽眼检测方法张万枝1,2曾祥1.2刘树峰 1,2穆桂脂1,2张弘毅1,2郭壮壮1,2（1.山东农业大学机械与电子工程学院，泰安2 7 10 18；2.山东省农业装备智能化工程实验室，泰安2 7 10 18）摘要：芽眼检测是马铃薯种薯智能切块首先要解决的问题，为实现种薯芽眼精准高效检测，提出了一种基于改进YOLOv5s的马铃薯种薯芽眼检测方法。首先通过加人CBAM注意力机制，加强对马铃薯种薯芽眼图像的特征学习和特征提取，同时弱化与芽眼相似

2、的马铃薯种薯表面背景对检测结果的影响。其次引人加权双向特征金字塔BiFPN增加经骨干网络提取的种薯芽眼原始信息，为不同尺度特征图赋予不同权重，使得多尺度特征融合更加合理。最后替换为改进的高效解耦头Decoupled Head区分回归和分类，加快模型收敛速度，进一步提升马铃薯种薯芽眼检测性能。试验结果表明，改进YOL0v5s模型准确率、召回率和平均精度均值分别为93.3%、93.4%和95.2%；相比原始Y0L0v5s模型，平均精度均值提高3.2 个百分点，准确率、召回率分别提高0.9、1.7 个百分点；不同模型对比分析表明，改进YOLOv5s模型与FasterR-CNN、YO LO v 3、Y

3、O LO v 6、YO LO X和YOLOv7等模型相比有着较大优势，平均精度均值分别提高8.4、3.1、9.0、12.9、4.4个百分点。在种薯自动切块芽眼检测试验中，改进YOLOv5s模型平均召回率为91.5%，相比原始YOLOv5s模型提高17.5个百分点。本文方法可为研制马铃薯种薯智能切块芽眼识别装置提供技术支持。关键词：马铃薯芽眼；目标检测；YOLOv5；深度学习；改进解耦头中图分类号：S223.1；T P391.4文献标识码：A文章编号：10 0 0-12 98（2 0 2 3)0 9-0 2 6 0-10OSID:Detection Method of Potato Seed B

4、ud Eye Based on Improved YOLO v5sZENG XiangLIU Shufeng1,2ZHANG Wanzhil.2MU Guizhil,2ZHANG Hongyi.:21,2GUO Zhuangzhuang1,2(1.College of Mechanical and Electronic Engineering,Shandong Agricultural University,Taian 271018,China2.Shandong Provincial Engineering Laboratory of Agricultural Equipment Intel

5、ligence,Taian 271018,China)Abstract:The first problem to be solved in potato cutting fast is the detection of potato seed bud eyes,animproved YOLO v5s-based potato seed bud eye detection method was proposed to improve seed potato eyedetection performance.Firstly,by adding the CBAM attention mechanis

6、m,the feature learning andfeature extraction of the potato bud eye images were strengthened.The influence of the potato surfacebackground similar to the bud eyes on the detection results was weakened.Secondly,the weightedbidirectional feature pyramid BiFPN was introduced to increase the original inf

7、ormation of bud eyesextracted by the backbone network and assign weights to feature maps of different scales,making multi-scale feature fusion more reasonable.Finally,it was replaced with an improved and efficient DecoupledHead to distinguish between regression and classification,speed up the conver

8、gence speed of the model,and further improve the performance of potato bud eye detection.The test results showed that theprecision,recall rate,and average precision of the improved algorithm were 93.3%,93.4%_ and95.2%,respectively,which was 3.2 percentage points higher than that of the original algo

9、rithm in themean average precision,and the precision and recall rate were improved by 0.9 and 1.7 percentagepoints.The comparative analysis of different algorithms showed that this algorithm had absolute advantagescompared with Faster R-CNN,YOLO v3,YOLO v6,YOLOX and YOLO v7 algorithms.The mAP wasinc

10、reased by 8.4 percentage points,3.1 percentage points,9.0 percentage points,12.9 percentage pointsand 4.4 percentage points.In the actual detection application,the average recall rate of the improvedalgorithm was 91.5%,which was 17.5 percentage points higher than that of the original algorithm,and t

11、hemissed detection rate was reduced.The method can provide technical support for the next step in thedevelopment of a sprout-eye identification device for the intelligent cutting of potato seed potatoes.Key words:potato bud eye;object detection;YOLO v5;deep learning;improved decoupling header收稿日期：2

12、0 2 3-0 5-0 66修回日期：2 0 2 3-0 6-16基金项目：山东省薯类产业技术体系农业机械岗位专家项目（SDAIT-1610）和中国博士后科学基金项目（2 0 2 0 M681690）作者简介：张万枝（198 6 一），男，副教授，博士，主要从事智能农机装备研究，E-mail：z h a n g w a n z h i 16 3.c o m261张万枝等：基于改进YOLOv5s的马铃薯种薯芽眼检测方法第9 期0引言我国年均马铃薯种植面积为6.0 10 hm以上，总产量位居世界第一，是第一生产大国,但并不是生产强国1-3。我国与美国、荷兰等发达国家相比，马铃薯种植机械化水平偏低。

13、国内传统的切块作业方式仍然处于人工切块，存在耗时耗力、效率低下和出苗率难以保证等问题，为提高种植机械化水平，智能切块取代人工切块将显得尤为重要，而马铃薯种薯芽眼检测是实现智能切块的前提。为实现马铃薯种薯芽眼检测，国内部分学者通过传统视觉技术进行了相关研究。田海韬等4 在彩色和灰度空间中分割出芽眼，再将二者结合进行数学形态学处理得到芽眼标记结果。李玉华等5基于色饱和度三维几何特征进行马铃薯芽眼检测。吕钊钦等6 基于Gabor特征进行马铃薯图像滤波处理，剔除马铃薯边界连通区域进行芽眼区域提取，完成芽眼的检测。张金敏等7 提出使用局部二值模式（LBP）提取特征结合支持向量机（SVM）进行分类,完成对

14、马铃薯芽眼检测。YANG等8 在多光谱图像中结合监督多阈值分割模型和Canny边缘检测器,完成马铃薯芽眼检测。以上传统视觉检测是基于颜色、纹理、形状和其他手动标注的特征进行训练，虽然训练模型简单，但模型的泛化性和普适性较差，不利于在不同环境的实际应用。近年来随着深度学习快速发展，基于深度学习的目标检测技术在农业工程领域也得到了广泛的应用9-12 。该技术主要分为基于候选框的双阶段目标检测算法和更快检测速度的单阶段目标检测算法。双阶段目标算法最具有代表的是RC NN系列,其中包括R-CNN、Fa s t R-C NN、Fa s t e r R-C NN和 R-FCN 13-16。XI 等17 提

15、出基于改进 Faster R-CNN双阶段的马铃薯芽眼检测算法，对发芽马铃薯芽眼检测精度可达96.32%。杨森等18 利用迁移学习和复合特征字典方法对Faster RCNN训练，检测马铃薯病害叶片的斑块区域。双阶段目标检测算法先生成一系列样本候选框，再根据生成的候选框区域进行目标分类和回归，检测精度较优，但这也带来检测时间长的弊端，不适用于农业工程实时检测。单阶段目标检测算法与双阶段检测算法相比，候选框和检测同时进行，且兼顾检测速度和精度。此类最具有代表的是YOLO系列算法19-2 。陈志伟等2 3 采用YOLOv3单阶段目标检测算法对马铃薯种薯芽眼检测，并使用图像数据增强和迁移学习思想的方法

16、。王相友等2 4 针对马铃薯中土块石块检测问题对YOLOv4模型进行通道剪枝达到轻量化的目的。史方青等2 5 使用YOLOv3网络模型将多个遮挡、机械损伤、虫眼的芽眼及杂质的样本加人数据集中，实现对种薯芽眼的检测。目前基于深度学习的芽眼目标检测虽然取得了一定进展，但针对马铃薯种薯芽眼特征一般仅使用YOLO系列原始模型，未区别于一般检测物体特征展开研究。由于马铃薯种薯芽眼随机分布在表面，与整体背景较为相似,不易进行检测，同时种薯芽眼位于表面凹陷处，对于凹陷区域较浅的芽眼经过多次下采样后会造成特征信息丢失，在特征融合处效果较差。YOLO系列原始模型并未针对以上种薯芽眼特征存在的问题进行具体分析，为

17、实现种薯芽眼精准高效检测，本文提出一种基于改进YOLOv5s的马铃薯种薯芽眼检测方法。马铃薯种薯芽眼与马铃薯整体背景较为相似，为抑制除芽眼外的马铃薯背景，使用CBAM卷积注意力机制去除穴余特征，增强有用信息，使其对芽眼特征信息更加关注；马铃薯种薯芽眼特征融合效果差，使用加权双向特征金字塔网络BiFPN，引入骨干原始特征信息，同时为不同尺度特征图赋予不同权重，使得马铃薯种薯芽眼多尺度特征融合更加合理；引人解耦头，将检测头中分类问题和回归任务分开计算，加快模型的收敛速度，以进一步提升马铃薯芽眼检测性能。1马铃薯种薯芽眼检测模型1.1改进的YOLOv5s模型YOLOv5网络根据模型深度倍数（Dept

18、h_Multiple）和层通道倍数（Width_Multiple）分为n、s、m、1和x5种版本，同时模型的复杂度也依次增加，在牺牲检测速度的情况下提高检测精度。考虑到农业工程应用以实时检测为主，本文选择基于改进的YOLOv5s进行马铃薯芽眼检测。YOLOv5s网络模型分为4部分：输人端（Input）、骨干网络（Ba c k b o n e）、颈部网络（Neck）、预测端（PredictionHead）。输人端通过Mosaic数据增加、自适应锚框计算和自适应图像缩放，以此来达到丰富背景信息，计算最佳锚点框以及原图缩放到统一标准尺寸的目的。骨干网络由CBS、Bo t t l e n e c k

19、CSP和SPPF组成，在最新的版本中使用6 6 的Conv卷积模块替换了Focus切片操作，使用串行的SPPF替换了并行的SPP,减少计算量，在相同的精度条件下提高检测速度。颈部网络采用FPN+PAN结构，FPN传递高层的语义特征到低层特征中，增强语义信息利于分类，添加自底向上的PAN弥补并加强了位置信息。预测端将颈部网络输出的3个特征图作为网络的输农2622023年机报学业械出，维度分别为8 0 8 0、40 40 和2 0 2 0，分别用于检测小目标、中目标和大目标。本文首先针对马铃薯种薯芽眼与背景相似的问题，在检测头前端引入CBAM注意力机制，实现抑制背景的干扰,更加突出种薯芽眼的特征。

20、其次将FPN+PAN特征融合更换为更加有效的多尺度特征融合方法BiFPN，解决特征信息融合尺度不一致问题。最后把传统耦合头替换为解耦头，使得模型收敛速度更快，提升模型整体性能。改进后的YOLOv5s芽眼检测整体网络架构如图1所示。ConvConv2dBNSiLUBackboneNeckDetectC3ConvSPPFConvC3(k=1,s=1)DecoupledBottleNeck*xC3UpsampleBiFPNConvHead立(k=1,s=1)ConcatConvBiFPNConvConvC3C3C3CBAMDecoupled(k=1,s=1)Head个ConvConvBiFPNBot

21、tleNeckConv(k=1,s=1)ifC3UpsampleConvshortcutConvConvBiFPNC3CBAMDecoupled(k=3,s=1)HeadC3SPPFConvMaxpoolMaxpoolMaxpoolConv(k=1,s=1)(k=5,s=1)(k=5,s=1)(k=5,s=1)Concat640 x640 x3ConvConv(k=1,s=1)图1改进后YOLOv5s整体网络架构Fig.1Overall network architecture of improved YOLO v5s1.2CBAM注意力机制为了从复杂的特征信息中获取芽眼关键特征信息,并考虑到

22、芽眼与马铃薯整体较为相似的特性，本文引人了卷积注意力机制（Convolutionalblockattention module，CBA M）2 6 进行强化芽眼目标信息，抑制背景信息。CBAM结合了特征通道和特征空间2 个维度的注意力机制，分别负责寻找重要信息和确定重要信息位置，两者结合对特征信息进行权重分配，将有限的计算资源分配给重要的目标,其模块结构如图2 所示，图中H为输人图像高度，W为输入图像宽度，C为特征通道数。输人特征图F首先经过通道注意力模块，分别进行2 个并行的全局最大池化（Global maxpooling，GMP）和全局平均池化（Global average pooling

23、，GAP）,得到2 个C11的特征图,然后将其分别送入共享的2 层全连接层MLP中，激活函数为ReLU,得到卷积输出的2 个一维矢量进行element-wise的加和操作，最后使用Sigmoid激活，计算式为Me(F)=o(W,(W。(Fg)+W,(W o(F)(1)InputResidualCxHxWGAP+CMPCx1x1Conv+ReLUCx1x11x1 ConvCx1x1SigmoidRe-weightCxHxWChannel Pool2xHxW立7x7Conv1xHxWSigmoidRe-weightCxHxWOutput图22CBAM注意力模块结构Fig.2CBAM attenti

24、on module architecture式中Mc通道注意力模块特征图Sigmoid激活函数F平均池化特征图avgF最大池化特征图maxW输入的共享权重263张万枝等：基于改进YOLOv5s的马铃薯种薯芽眼检测方法第9 期经通道注意力模块处理后的特征图与输入特征图F相乘，得到特征图F作为空间注意力模块的输人，首先通过基于通道注意力模块的池化处理，得到2个1HW的特征图再进行相加，然后将经过77Conv卷积以及Sigmoid激活函数生成的特征图M，与特征图F相乘，计算式为Ms(F)=o(f77(Fsvg,Fmax)(2)avgmax1.3加权双向特征金字塔BiFPN为了提升经下采样得到不同种薯

25、芽眼特征图的融合能力，本文将YOLOv5的Neck网络中的FPN+PAN特征融合更换为加权双向特征金字塔网络(Bidirectional feature pyramid network，Bi FPN）,BiFPN的主要贡献为：高效的双向跨尺度连接和带权重的特征融合机制。PANet虽然提供自底向上的特征融合层，加强了位置信息，但输人是经FPN结构处理的特征信息，缺乏骨干网络提取到的特征中的原始特征信息。为解决该问题,BiFPN在同一层中的原始输人节点和输出节点之间添加了一条额外的特征融合边，旨在不增加太多成本的情况下融合更多的原始特征，同时删除了只有一条输入边且没有特征融合的节点，从而简化特征融

26、合网络，其结构如图3所示。P6P6P5P5P4P4P3P3(a)FPN+PAN(b)BiFPN图3不同特征金字塔结构Fig.3Pyramidstructure with different features传统的特征融合只是简单地将不同的特征图相加，并未考虑到不同分辨率的特征图对融合输人时贡献度也有所不同，因此简单地对其相加并不是最佳操作。为了解决这一问题，BiFPN引人快速归一化特征融合机制，对不同尺度的芽眼特征赋予不同的权重，其计算式为W;0=1(3）8+W;其中,；表示输人特征I;对应一个可学习的权重，为了保证w;0,在每个w；前采用ReLU激活函数，并将初始学习率设置为0.0 0 1以

27、此来避免数值不稳定。P4层的2 个特征融合过程计算式为w,Pin+w,Resize(Pin)Pld=Conv(4)W,+W2+8(wPin+wPld+w,Resize(Po)Pout=Conv(5)4wi+w+w+8式中Pi第i级的输人特征Pid第i级的中间特征P第i级的输出特征Resize一一上采样或下采样操作Conv()一卷积1.4DecoupledHead解耦检测头为了解决种薯芽眼分类问题和回归任务的冲突，加快模型的收敛速度，提高模型的整体性能，本文将YOLOv5中Head耦合头替换为DecoupledHead解耦头结构。SONG等 2 7 提出目标检测算法的分类问题和回归任务是互斥的关

28、系，即分类和回归的关注点不同,分类更加关注目标的纹理内容，回归更加关注目标的边缘信息。原始YOLOv5的检测头为耦合头，将分类问题和回归任务合并在一起计算，分类和回归分支共享参数。但这会存在一个问题，若网络模型过分关注分类的信息，则更加明显的马铃薯种薯芽眼特征响应值会很高，只框选出芽眼明显部分，对定位造成很大影响，导致芽眼检测位置不准确，同时也会引起训练过程中收敛速度较慢的问题。为解决该问题,引人Decoupled Head解耦头结构可以将分类问题和回归任务分开计算，使二者关注目标更加明确，加快收敛速度。YOLOX在检测头上使用Anchor-free的解耦头对分类和回归分支解耦计算，同时新增2

29、个额外的33CBS卷积模块，虽提升了检测精度，但在一定程度上增加了模型复杂度。为此本文在YOLOX基础上进行了精简设计，如图4所示，删除了11Conv降维卷积,采用检测头的维度由主干和颈部的宽度系数共同缩放，并删除了2 个分支中额外一个33CBS卷积模块。删除这2 部分的目的是因为过多卷积层会造成计算量增加以及部分信息YOLOXDecoupled HeadClsHxWxC1HxWx256FPNRegHxWx4feature128;HxWx256HxWx256ObjHxWx1512HxWx256改进后Decoupled Head:ClsHxWxCHxWx128,256,512FPN-featu

30、reRegHxWx4128HxWX2256512featureObjHxWx13x3ConvHxW128,256,5121x1Conv图4改进后的Decoupled HeadFig.4Improved Decoupled Head农2023年机264报学业械丢失，同时为每个CBS模块添加残差边，旨在降低网络优化难度，并在不增加成本的情况下提高检测头性能。2数据准备与模型训练2.1数据集构建数据集采集地点为山东省滕州市其祥马铃薯种植合作社，样本种薯品种为“荷兰15号”和“中薯3号”。种薯采集样本的品质会对芽眼的检测造成重要影响,因此选择无病害、干腐、病斑、虫眼等储存状况良好的马铃薯种薯作为采集样

31、本。采集后的数据集经人工剔除余、像素质量差的图像，共931幅种薯图像。为避免数据集样本过少影响其模型训练效果和泛化性能，本文采用翻转、旋转、改变亮度和添加噪声的方式进行数据扩充，经过扩充及处理后的数据集总共3936 幅图像，部分样本图像如图5所示。利用Labellmg软件对马铃薯种薯图像中芽眼进行标注，标注后的数据集按9：1的比例划分为训练集（3542 幅）和验证集（394幅）。图5增强后部分样本图像Fig.5Part of sample image after enhancement2.2试验环境与参数设置试验过程在Win11操作系统下进行，处理器型号为12 th Gen Intel（R）C

32、o r e（T M）i 7 12 7 0 0 K3.60GHz,显卡型号为NvidiaGeForceRTX3080Ti。深度学习框架为Pytorch，编程平台为PyCharm，软件环境为CUDA11.6和CuDNN8.0.5版本，所用编程语言为Python3.8。为提高算法性能，减少过拟合，训练采用的批量大小（batch size）为16，初始学习率设置为0.0 1，动量设置为0.937，训练总轮数设置为2 0 0，后续不同算法对比试验中也将保持统一变量。2.3评价指标为了通过检测结果来评价改进后YOLOv5s模型的性能，选用准确率（Precision，P）、召回率（Re c a l l,R）

33、、平均精度均值（Mean average precision，mAP）和顿率（Frames per second,FPS）作为评价指标。3试验结果与分析3.1YOLOv5版本对比试验YOLOv5s、Y O LO v 5m、Y O LO v 51和YOLOv5x的4个版本在速度和精度之间提供了不同的权衡，以适应不同的计算能力和实时性的需求，为了选择合适的版本作为基线模型，进行了不同版本的YOLOv5对比试验，试验结果如表1所示。表1YOLOv5不同版本性能比较Tab.1Performance comparison of different versionsofYOLOv5平均精度浮点运顿率/内存

34、占用模型参数量均值/%算数(fs-)量/MBYOLOv5s92.07.010 10615.835.713.6YOLOv5m92.32.103 10750.220.042.4YOLOv5193.34.660 107113.915.193.7YOLOv5x93.38.719 107216.914.3175.0可以看出，YOLOv5各版本模型的平均精度均值相差并不大的情况下，在参数量（Parames）和浮点运算数（GFLOPs）方面，其他3个版本模型比YOLOv5s模型增加3 13倍，同时也引起FPS降低和权重文件增大，综合性能不如YOLOv5s模型。分析其模型复杂度增加但平均精度均值并未有明显提升

35、的原因可能是芽眼目标较为单一，当使用m、l和x版本模型时，由于网络所含残差结构的个数和卷积核的个数不断增加，对芽眼特征提取操作次数也越多，造成芽眼特征信息丢失，使得检测精度并未有大幅度提升。综上所述，本研究所使用的马铃薯种薯芽眼数据集相对较小，目标样本较单调，因此使用较浅层的网络即可充分提取特征，同时考虑后续在实际应用中需要对模型进行边缘端部署等原因，选用复杂度较低且具有较高检测精度的YOLOv5s模型作为基线模型进行改进。3.2不同解耦头应用于YOLOv5s的性能比较为了评价改进后的解耦头与YOLOX解耦头在YOLOv5s模型中的性能优劣，分别单独加人YOLOv5s模型中进行试验，结果如表2

36、所示。可以看出，改进后解耦头的参数量相较于YOLOX解耦头参数量（Parames）有所下降，并且浮点运算数（GFLOPs）减少约50%，说明删除11Conv降维卷积和一个33CBS卷积模块后可降低计算量的有效性；同时改进解耦头在计算量下降的情况下，为每个CBS模块添加残差边使得平均精度均值仍然有0.4个百分点的提265张万枝等：基于改进YOLOv5s的马铃薯种薯芽眼检测方法第9 期升，这进一步说明本文解耦头有着更优的性能。表2不同解耦头性能比较Tab.2Performance comparison of differentdecouplingheads模型参数量浮点运算数平均精度均值/%YO

37、LOX解耦头1432546256.294.0改进解耦头1320955827.194.4改进前后平均精度均值曲线如图6 所示。由图6 可以看出，使用改进后的解耦头代替原模型耦合头能达到收敛速度更快、性能更好的效果。100r8060dyu40-YOLOv5s20二改进解耦头050100150200送代次数图6改进前后mAP曲线对比Fig.6Comparison of mAP curves before and afterimprovement3.3消融试验为实现马铃薯种薯芽眼精准高效检测，本文基于原始YOLOv5s模型，提出更有效的网络模型：加人卷积注意力模块CBAM，引人BiFPN特征融合结构，

38、更换解耦头，并分别进行4组消融试验验证，试验结果如表3所示。表3消融试验结果Tab.3Results of ablation experimentsCBAMBiFPN解耦头P/%R/%mAP/%一92.491.792.0一一92.993.094.4一一92.992.793.6一一92.592.794.493.393.495.2注：“V表示添加结构；“_”表示未添加结构。从表3中可知，加入CBAM注意力机制后，检测模型的mAP提高2.4个百分点，表明加人CBAM后模型能够更加准确地检测种薯芽眼信息；引人BiFPN特征融合结构，能够融合更多主干网络提取的原始特征并且让特征融合更加合理，mAP较原始

39、模型提高1.6 个百分点；将YOLOv5s原始模型的耦合头替换为改进后的解耦头，mAP提高2.4个百分点，表明替换解耦头能够解决种薯芽眼特征在分类问题和回归任务的冲突，这不仅使得模型加快收敛速度，而且还提高了整体检测性能。本文提出的改进模型，准确率达到93.3%，较原始模型增长0.9个百分点，同时召回率增加1.7 个百分点，mAP提升3.2 个百分点。以上数据说明了与YOLOv5s相比，本文模型有更强的特征提取能力和多尺度融合性能，在马铃薯种薯芽眼检测上有更好的表现。为了更加直观地展示本文模型与YOLOv5s原始模型对马铃薯种薯芽眼特征的关注程度不同，文中使用Grad-CAM28中类激活热力图

40、分别对2 个模型输出层进行可视化分析，即通过类激活热力图中某一区域的亮度来表示该区域在预测输出过程所占的权重，颜色鲜亮区域面积越大，表示预测输出关注度越高，反之亦然。2 个模型的类激活热力图如图7所示，可以看出本文模型对马铃薯种薯芽眼的特征预测输出权重分配更高，对于不显眼的马铃薯种薯芽眼也能得到更多关注，避免造成漏检；而且本文模型相较于原始模型在同一处的马铃薯种薯芽眼检测置信度更高，具有更好的鲁棒性。通过类激活热力图可以看出本文模型更适合马铃薯种薯芽眼特征检测。(a)原图(b)YOLO v5s(c)改进YOLOv5s图7类激活热力图Fig.7Class activation heatmaps3

41、.4与其他模型对比试验为了验证本文所提出模型的有效性，将本文改进后的YOLOv5s模型与其他主流检测模型进行对比试验，所有模型均在同一数据集和同一训练设备下采用控制变量原则进行试验，结果如表4所示。牛农2023年机266报学械业表4改进模型与其他检测模型对比Tab.4Comparison of improved models with otherdetectionmodelsmAP/内存占用顿率/模型P/%R/%量/MB(fs-I)Faster R-CNN86.8326.015.6YOLOv381.994.892.1123.416.3YOLOv5s92.491.792.013.635.7YOL

42、Ov683.384.686.238.730.1YOLOX88.378.382.334.324.3YOLOv786.288.290.871.313.5改进YOLOv5s93.393.495.225.832.4由表4可以看出，与YOLO其他系列原始模型相比，YOLOv5s原始模型综合性能要优于其他系列模型，证明了本文选择YOLOv5s作为基线模型的可行性。在针对马铃薯种薯芽眼检测，改进YOLOv5s模型准确率最优，与FasterR-CNN、Y O LO v 3、YOLOv6、Y O LO X和YOLOv7等模型相比，mAP分别提高8.4、3.1、9.0、12.9、4.4个百分点，并且在模型内存占用

43、量和顿率上也具有较大优势。召回率对比中，改进YOLOv5s模型略低于YOLOv3模型，主要是因为准确率和召回率存在一定的此消彼长关系，当模型降低了对芽眼检测要求，芽眼漏检数量将会减少，代表着预测出了更多的种薯芽眼，但这也会增加芽眼检测错误数量。由于本文模型加入高效解耦头，导致模型内存占用量与原始模型相比由13.6 MB增加到2 5.8 MB、检测顿率由35.7 f/s降至32.4f/s，但由于在种薯芽眼检测中更加注重准确率的提升，且顿率的略微下降并不影响实际应用，因此本文模型在兼顾准确率和召回率情况下，仍能保证最高平均精度均值和较高的帧率，综合性能最优。3.5种薯自动切块芽眼检测试验为了评估本

44、文所提出改进YOLOv5s模型在实际种薯自动切块芽眼检测的性能，在自制的马铃薯种薯自动切块装置进行试验，如图8 所示。将种薯放置在CCD相机下，经相机采集到种薯图像后，传输给计算机中改进的YOLOv5s模型进行芽眼检测，便于下一步根据检测到的种薯芽眼位置，通过切刀决策方法控制切刀运动实现种薯切块。从种薯表面检测出芽眼是自动切块的重要前提，同时考虑到种薯图像受拍摄设备及环境影响，且实际应用中希望检测得到更多的种薯芽眼，相较于准确率，召回率能更好地反映本文模型的性能。因此在试验结果中主要对召回率进行计算，并将置信度值设置为0.35。试验结果如表5所示。可以看出，3种不同品1-2-34-65图：马铃

45、薯种薯自动切块装置Fig.8Potato seed potato automatic block cuttingmachine structuredevice1.切块装置2.CCD 相机3.马铃薯种薯4.计算机5.步送电机驱动器6.供气装置表51马铃薯种薯芽眼检测结果统计Tab.5Statistics of potato bud eye detection results马铃薯种薯芽眼数量召回率/种薯品种模型总数检出数漏检数%YOLOv5s87672077.0荷兰15号改进YOLO v5s8779890.8YOLOv5s1491034669.1中薯3号改进YOLOv5s1491361391.3

46、YOLOv5s1571193875.8尤金8 8 5改进YOLOv5s1571451292.4种的种薯进行实际检测应用中，改进YOLOv5s模型漏检数明显下降，不同种薯品种的平均召回率达到91.5%，相较于原始模型提高17.5个百分点，说明了本文模型在实际种薯自动切块芽眼检测中拥有更强的多尺度性能以及对芽眼具有更多的关注度，能够降低漏检率，从而保证后续切刀根据芽眼位置做出姿态调整的精准性，避免切伤芽眼造成种薯浪费。图9分别为荷兰15号、尤金8 8 5和中薯3号3种品种种薯的漏检与误检情况。可以看出，YOLOv5s原始模型存在不同程度的漏检现象（图中椭圆形所示），即使较为明显的芽眼特征也未被检测

47、出,其原因是因为种薯芽眼特征在种薯表面不明显，在通过主干网络下采样以及FPN结构上采样过程后会造成特征信息丢失，导致在检测头处因特征信息不足引起漏检。而本文所提出的改进YOLOv5s模型能够有效避免该问题,并且能够检测到种薯边缘部分较小区域芽眼，漏检率较低。同时不同品种检测过程中YOLOv5s原始模型也存在主要以下3种误检情况：图9a原始模型将种薯表面的破损表皮误检为芽眼；图9b原始模型将种薯表面的裂痕误检为芽眼；图9c原始模型将种薯表面存在的泥土误检为芽眼。使用改进后的YOLOv5s模型进行检测可有效改善上述误检情况，降低误检率。通过将本文所提模型应用到实际种薯自动切块267第9 期张万枝等

48、：基于改进生YOLOv5s的马铃薯种薯芽眼检测方法装置中,与原始模型相比能够检测到更多芽眼,并且能够有效避免误检情况的发生，这说明位于检测头前端的CBAM注意力机制增加了对芽眼特征的权重分配，能够从相似背景下检测出芽眼；BiFPN中增添额外的特征融合边，引人了更多下采样过程中的原始特征信息，丰富了芽眼特征信息，同时带权重的特征融合机制也为芽眼特征分配到更多的权重，避免了特征信息的丢失；改进的解耦头能够解决分类和回归的冲突，分别更好地关注了芽眼目标的纹理内容和边缘信息。综上可知，本文提出的改进YOLOv5s模型能够更好地应用于实际种薯自动切块芽眼检测，budsYOLOv5s改进YOLOv5sYO

49、LOv5s改进YOLOv5sYOLOv5s改进YOLOv5s(a)荷兰15号budsYOLOv5s改进YOLOv5sYOLOv5s改进YOLOv5sYOLOv5s改进YOLOv5s(b)尤金8 8 5DUdDudeYOLOv5s改进YOLOv5sYOLOv5s改进YOLOv5sYOLOv5s改进YOLOv5s()中薯3号图9实际应用检测结果对比Fig.9Comparison of actual application test results4丝结论(1)为实现种薯芽眼精准高效检测，本文提出一种基于改进YOLOv5s的马铃薯种薯芽眼检测方法。首先通过加入CBAM注意力机制，加强对马铃薯种薯芽眼

50、图像的特征学习和特征提取，同时弱化与芽眼相似的马铃薯种薯表面背景对检测结果的影响；其次引入加权双向特征金字塔BiFPN增加经骨干网络提取的种薯芽眼原始信息，为不同尺度特征图赋予不同权重，使得多尺度特征融合更加合理；最后替换为改进的高效解耦头DecoupledHead区分回归和分类，加快模型收敛速度，进一步提升马铃薯种薯芽眼检测性能。(2)试验结果表明，改进YOLOv5s模型准确率、召回率和平均精度均值分别为93.3%、93.4%和95.2%；相比原始YOLOv5s模型，平均精度均值提高3.2 个百分点，准确率和召回率分别提高0.9、1.7个百分点；不同模型对比分析表明，改进YOLOv5s模型与

展开阅读全文