收藏 分销(赏)

基于改进YOLOv7的黄瓜叶片病虫害检测与识别.pdf

上传人:自信****多点 文档编号:2261025 上传时间:2024-05-24 格式:PDF 页数:9 大小:1.81MB
下载 相关 举报
基于改进YOLOv7的黄瓜叶片病虫害检测与识别.pdf_第1页
第1页 / 共9页
基于改进YOLOv7的黄瓜叶片病虫害检测与识别.pdf_第2页
第2页 / 共9页
基于改进YOLOv7的黄瓜叶片病虫害检测与识别.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于改进 YOLOv7 的黄瓜叶片病虫害检测与识别刘诗怡,胡滨,赵春(南京农业大学人工智能学院,南京210031)摘要:黄瓜叶片病虫害的检测与识别是科学防治病害的有效手段。为了提高对黄瓜叶片病斑细小特征的精准定位能力以及提高对早疫病叶片的检测性能,提出一种 DCNSE-YOLOv7 的深度学习算法。首先,将主干特征提取网络中对最后一个特征层的卷积 2Dconvolution(Conv2D)改为可变形卷积 2DDeformableconvolution(DCNv2),提高模型对病斑细小特征的提取能力;其次,对主干特征提取网络输出的 3 个特征层结果添加 Squeeze-and-Excitatio

2、nnetworks(SENet)注意力机制模块构建网络模型,加强模型对发病早期相似病害特征的有效提取能力;同时,通过 K-means+聚类算法对锚框重新聚类,避免算法在训练过程中盲目学习目标的尺寸和位置;最后,将原始 YOLOv7 的 CIOU 损失函数,更替为 Focal-EIOU 损失函数。试验结果表明,DCNSE-YOLOv7 算法能够有效对黄瓜叶片病虫害进行检测,其平均精度均值为 94.25%,比 YOLOv5l、YOLOv7、Faster-RCNN、SSD 和 YOLOv7-tiny 模型分别提高了 2.72、2.87、0.28、12.04 和7.02 个百分点,改进模型的精确度为

3、96.02%,检测速度为 52.04 帧/s。所提方法为黄瓜叶片病虫害的精准检测提供了一种有效的技术支持。关键词:病虫害;图像识别;黄瓜叶片;YOLOv7;可变形卷积;注意力机制doi:10.11975/j.issn.1002-6819.202305042中图分类号:S24文献标志码:A文章编号:1002-6819(2023)-15-0163-09刘诗怡,胡滨,赵春.基于改进 YOLOv7 的黄瓜叶片病虫害检测与识别J.农业工程学报,2023,39(15):163-171.doi:10.11975/j.issn.1002-6819.202305042http:/www.tcsae.orgLIU

4、 Shiyi,HU Bin,ZHAO Chun.Detection and identification of cucumber leaf diseases based improved YOLOv7J.TransactionsoftheChineseSocietyofAgriculturalEngineering(TransactionsoftheCSAE),2023,39(15):163-171.(inChinesewithEnglishabstract)doi:10.11975/j.issn.1002-6819.202305042http:/www.tcsae.org0引言黄瓜作为世界上

5、最重要的蔬菜作物之一,在中国已经有 2000 多年的栽培历史1-2。该类作物在温室大棚可以四季栽培,成本较低,且产量较高。2020 年中国黄瓜种植面积高达 127 万 hm2,黄瓜出口数量为 45437.3t3,为菜农带来了极大经济效益的同时,也对黄瓜病害防治提出了新要求4。在中国,黄瓜叶片靶斑病5、霜霉病6、白粉病7等在全国各地栽培的黄瓜叶片上普遍发生。在发病早期若防治不及时,几天内病害即可传遍棚室,造成黄瓜大面积减产8。因此在黄瓜种植中,要保证黄瓜产量与质量,就必须先对黄瓜叶片常见病害进行精准识别与检测。对叶片病虫害检测的传统方法是采用目测观察法,即通过肉眼观察叶片的形态、纹理、颜色等特征

6、9。这种方法虽然操作简单,但在检测过程中往往因出现经验和知识差异等主观因素对病害识别造成干扰,为种植户带来不可挽回的损失10,难以满足对黄瓜叶片病虫害的精准检测。为了提高识别精度,早期利用基于图像处理的检测11方法。彭占武12利用模糊识别,先对黄瓜病害进行图像预处理,再从灰度统计量、颜色、几何形状三方面进行特征提取,其不足之处在于处理的数据量较小,且原始特征维数高,算法的计算复杂度较高。田凯等13对茄子叶片病害图像进行边缘检测,提取病斑特征并优化,构建 Fisher 判别函数对茄子叶部病害识别,但仍使用传统的分割方法将病斑提出,使用贝叶斯判定方法对病害类别进行识别,识别效率较低。上述方法工作量

7、大,且在实际应用中难以推广。近 10 年来,许多学者采用神经网络来对农作物病害进行识别14,虽然在文献检索中对黄瓜叶片病虫害的研究不多,但在其他领域成果颇丰。MOHANTY 等15使用GoogLeNet 模型对标注后的图片进行训练,该模型的缺点是在不同环境下数据集检测精确度差距大,模型泛化能力不强。黄丽明等16提出改进 YOLOv4 模型自动识别无人机遥感影像上的松材线虫病异常变色木,该模型将深度可分离卷积和倒残差结构引入网络,然而对相似地物与异常变色木的细小特征提取结果不显著,不利于病害特征识别。RANGARAJAN 等17使用改进的 AlexNet和 VGG16 模型对番茄病害进行训练,但

8、其缺陷在于检测精度不佳。ZHANG 等18为了提高网络特征提取能力,提出一种多通道自动定向递归注意网络丰富番茄叶片病害特征,并引入渐进非局部均值算法降低特征识别难度,不过信道数的选择会对识别精确度产生影响。孙俊等19提出改进 MobileNet-V2 模型识别复杂背景下农作物病害,在原始模型上嵌入轻量型坐标注意力机制,采用分收稿日期:2023-05-08修订日期:2023-07-14基金项目:国家自然科学基金项目(32270208);江苏省大学生创新训练项目(202210307157Y)作者简介:刘诗怡,研究方向为计算机视觉,图像处理。Email:通信作者:胡滨,博士,副教授,研究方向为智慧农

9、业。Email:第39卷第15期农 业 工 程 学 报 Vol.39No.152023年8月TransactionsoftheChineseSocietyofAgriculturalEngineeringAug.2023163组卷积减少模型参数,需要注意的是模型对不同病害相似特征之间的细小区别未能有效识别。上述检测方法虽取得一定的成效,但在实际应用中对早疫病、尺度变形叶片的检测精度不高,对相似病害细小特征的识别不够精确,无法满足农业智能化的生产需要。在黄瓜实际种植场景中,自动化检测叶片病害的图像中往往包含不同种类的叶片,且叶片之间会出现部分遮挡情况。基于此,相较于图像分类算法20,目标检测算法

10、更适用于检测图像中的多个目标,并确定目标的大小和位置21。故在前人研究基础上,特别是从黄丽明等16使用 YOLOv4 模型对松材线虫病异常变色木识别受到启发,采用目标检测算法实现对黄瓜叶片病害的检测。由于一阶段目标检测算法不需要大量的数据训练,且YOLO22算法将迁移学习的概念引入其网络,不仅对数据集数量的要求降低,还可以提高模型的泛化能力。通过对目前 YOLO 系列算法比较,YOLOv723算法的检测速度与检测精度领先于当前主流目标检测算法,故选用YOLOv7 模型作为研究对象,并在此模型基础上提出一种 DCNSE-YOLOv7 深度学习算法。该算法首先在主干特征提取网络中引入可变形卷积24

11、(DCNv2)自适应不同叶片几何形变化带来的感受野尺寸变化,提升网络模型对病斑细小特征的精准定位能力;其次在主干特征提取网络的 3 个输出结果处添加通道注意力机制 SENet25模块,加强模型对发病早期、多病害叶片相似特征的有效提取能力;同时,通过 K-means+26聚类算法优化锚框信息,使先验框尽可能接近真实框,提升模型检测性能;最后,将 Focal-EIOUloss27函数替代原始损失函数,聚焦于高质量的预测框,并与 YOLOv7、YOLOv7-Tiny、Faster-RCNN、YOLOv5l、SSD 等网络模型进行对比,以此评估模型的性能与效果。1材料与方法1.1黄瓜叶片病虫害图像采集

12、黄瓜叶片常见的病虫害有靶斑病、霜霉病、白粉病等。利用相机在不同天气、不同时刻条件下,对患有靶斑病、霜霉病、白粉病以及无病虫害的黄瓜叶片进行多方位、多角度、多种距离拍摄,获得 849 张患病及无病虫害的黄瓜叶片图像。同时,通过网络爬虫技术对网络上公开的患有病虫害及无病虫害的黄瓜叶片高质量图像进行部分爬取,获得 310 张患病黄瓜叶片图像。为保证数据集独立分布,筛选删掉不适用图像后保留了1049 张图像制作数据集。包含 280 张靶斑病、300 张霜霉病、259 张白粉病以及 210 张无病害的黄瓜叶片图像,且 1/4 左右以上的图像包含两个或两个以上的叶片,黄瓜叶片病虫害图像如图 1 所示。从图

13、 1 可以看出,患有靶斑病的叶片病斑呈圆形或稍不规则形黄点子,病斑中间有近白色眼状靶心;患有霜霉病的叶片病斑呈多角形黄褐色斑点,病斑不过叶脉;患有白粉病的叶片正面或背面产生白色近圆形的小粉斑。靶斑病和霜霉病在发病前期病斑特征较为接近,且在自然环境下拍摄,图像中会包含如杂草、土壤等干扰区域,造成检测环境复杂,进一步增大检测难度。a.靶斑病a.Target spotb.霜霉病b.Downy mildewc.白粉病c.Powdery mildewd.正常d.Normal图 1黄瓜叶片病虫害Fig.1Diseasesandinsectpestsofcucumberleaf1.2数据集构建为了提高目标检

14、测算法对错误标签的记忆,增加样本的鲁棒性以及网络的泛化能力,对原始图像进行翻转、扭曲、加噪、亮度调节等方法对数据集进行初步扩充。对扩充后的图像使用 LabelImg 对数据集图像进行人工标注,标签分别为 Targetspot(靶斑病)、Downymildew(霜霉病)、Powderymildew(白粉病)和 Normal(正常)。试验采用 MixUp28数据增强方法再次扩充黄瓜叶片病害图像。MixUp 基本思想是将两个不同的样本进行线性插值,从而生成一个新的样本。如图 2 所示,使用MixUp 将两张图像分别进行翻转、缩放、色域变化等,在图像多余部分加上灰条,并堆叠在一起。a.原始图像 1a.

15、Original image 1b.原始图像 2b.Original image 2c.数据增强后结果c.Data augmentation result图 2MixUp 数据增强结果Fig.2MixUpdataenhancementresults164农业工程学报(http:/www.tcsae.org)2023年通过对数据集的增强与扩充,数据集图像由开始的1049 张扩充到 2699 张。将图像按照 8:1:1 的比例随机分为训练集、验证集和测试集,完成数据集的构建。2模型与训练2.1YOLOv7 算法与前几代 YOLO 算法相比,YOLOv7 算法在主干特征提取网络中加入了可扩展的高效聚

16、合层网络 Extended-efficientlong-rangeattentionnetwork(E-ELAN),这种结构可以通过影响深度神经网络的梯度路径从而加快模型的收敛,提高检测精度;其加强特征提取网络主要是对特征进行融合,在加强特征提取网络中引入空间金字塔池化-跨阶段部分连接 Spatialpyramidpooling-cross-stagepartialconnection29(SPPCSPC)模块用于增大感受野;YOLOv7 模型的分类与回归器主要用于得到模型预测输出结构,在预测头部 YoloHead 中加入重新参数化卷积层 Reparameterized convolution

17、al layer(RepConv),作为特殊的残差结构辅助训练调整通道数,降低网络复杂度。原始 YOLOv7 算法虽然能获得较好的检测精确度,但是如何减小相似特征、目标尺度变化和形状变化对检测精度的影响仍是 YOLOv7 需要改进的地方。2.2改进 YOLOv7 算法本研究拟对原始 YOLOv7 算法进行 4 个方面的改进,改进后的网络结构图如图 3 所示,改进如下:CBSCBSCBSCBSC7_1MP-C3C7_1MP-C3C7_1MP-C3C7_3SPPCSPCSENetSENetCBSCBSSENetCBSUpSampleConcatC7_2CBSUpSampleConcatC7_2Co

18、nvBNADDConvBNSILUADDConvMPCBSCBSCBSConcatC7_2ConvBNADDConvBNSILUADDConvMPCBSCBSCBSConcatC7_2ConvBNADDConvBNSILUADDConvCBS=ConvBNSILUCBS=ConvBNSILUCBS2=DCNv2BNSILUCBS2=DCNv2BNSILUC7_1=CBSCBSCBSCBSCBSConcatCBSCBSC7_1=CBSCBSCBSCBSCBSConcatCBSCBSC7_3=CBS2CBS2CBS2CBS2CBS2ConcatCBS2CBS2C7_3=CBS2CBS2CBS2CB

19、S2CBS2ConcatCBS2CBS2MP-C3=MPCBSCBSCBSConcatSPPCSPC=CBSCBSCBSMaxPoolMaxPoolMaxPoolConcatCBSCBSCBSConcatCBSSPPCSPC=CBSCBSCBSMaxPoolMaxPoolMaxPoolConcatCBSCBSCBSConcatCBSC7_2=CBSCBSCBSCBSCBSCBSConcatCBSC7_2=CBSCBSCBSCBSCBSCBSConcatCBS640640808040402020注:Conv 表示卷积;BN 表示批量归一化;SILU 表示 SILU 激活函数;DCNv2 表示可变

20、形卷积;Concat 表示特征融合;UpSamlple 表示上采样;SENet 表示 SENet 通道注意力机制模块;ADD 表示特征通道相加;MaxPool 表示最大池化;CBS、CBS2、C7_1、C7_2、C7_3、SPPCSPC、MP-C3 为合成模块。Note:Convrepresentsconvolution;BNrepresentsbatchnormalization;SILUrepresentsSILUactivationfunction;DCNv2representsdeformableconvolution;Concatrepresentsfeaturefusion;UpS

21、amlplerepresentsupsampled;SENetrepresentstheattentionalmechanismmoduleofSENetchannel.ADDrepresentstheadditionoffeaturechannels.MaxPoolrepresentsmaximumpooling.CBS,CBS2,C7_1,C7_2,C7_3,SPPCSPC,andMP-C3aresyntheticmodules.图 3改进 YOLOv7 网络模型Fig.3ImprovedYOLOv7networkmodel1)将原始 YOLOv7 模型主干特征提取网络的最后一个输出特征层

22、的卷积更换为可变形卷积 DCNv2,一定程度上加深模型对尺度变形大的目标的精准定位能力;2)给主干特征提取网络输出的 3 个特征层结果添加 SENet 通道注意力机制模块,增强有效特征信息的提取,压缩无用特征信息,提高模型对相似特征的识别能力;3)通过 K-means+算法对锚框信息进行更新,使得网络学习到更好的检测器,避免网络在训练过程中盲目学习目标的尺寸和位置,提高模型的检测性能;4)将原始 YOLOv7 的损失函数 CIOUloss 更换为Focal-EIOUloss,更新后的 Loss 函数可以聚焦于高质量的边界框。2.2.1可变形卷积由于黄瓜叶片图像形态、叶片面积大小、病斑大小不同,

23、原始 YOLOv7 使用普通卷积操作,造成卷积层在特征提取时没有适应图形几何变形时对不同位置区域的感受野尺寸的变化,大大削弱网络模型对形状、尺寸变形大的叶片中病斑细小特征的提取能力,因此依靠普通卷积操作来提取特征有一定的局限性。为缓解这一问题,在主干特征提取网络的输出层中将普通卷积 Conv2D 更替为可变形卷积 DCNv222,其结构如下图 4 所示。通过研究表明,可变形卷积通过增加可训练的偏移量,对于位置变化具有良好的适应能力,在采样时可以更贴近叶片病斑的形状和尺寸,从而有利于提高目标检测的精度和鲁棒性。本研究将主干特征提取网络中最后一个特征层的卷积改为可变形卷积,在采样时使其更贴近叶片病

24、斑的形状和尺寸,加强模型对病斑细小特征的提取能力,一定程度上提高了黄瓜叶片病虫害的检测精度。如图 4 所示,可变形卷积操作是在二维平面进行的,是在传统卷积的基础上增加调整卷积核的方向向量,将传统卷积核提取的大小为 WHC 的特征图作为输入,通过再施加一个卷积核(2 维)得到可变形卷积的偏移量,改变偏移量 x 和 y 方向的值使卷积层做平移变换。第15期刘诗怡等:基于改进 YOLOv7 的黄瓜叶片病虫害检测与识别165其中偏移量是利用插值算法通过反向传播进行学习,最后利用得到的偏移量和输入的特征图做卷积得到输出特征图。ConvOffset fieldWH2COffset yOffset xOut

25、put featureWHCInput featureWHC注:W、H、C 分别表示长、宽和特征通道大小;x 和 y 代表偏移量的方向向量。Note:W,H and C represent length,width and characteristic channel sizerespectively;xandyrepresentthedirectionvectoroftheoffset.图 4DCNv2 结构图Fig.4DCNv2Structure2.2.2SENet 通道注意力机制模块在黄瓜叶片病虫害的检测中,利用原始 YOLOv7 算法对病害发病早期,如霜霉病和靶斑病(这两种病害的病斑在

26、发病早期均会呈现“黄点子”特征)病斑进行检测时往往会出现误检现象,这是由于在特征提取的过程中对有效特征信息的筛选不足。因此,为提高模型对早疫病病斑的识别能力,需对各个特征通道的权值进行矫正。而在特征提取的过程中,SENet 通道注意力机制模块可以加强有效特征信息通道的权重,降低并压缩无用特征信息通道的权重,从而发挥有用信息的最大作用。SENet 通道注意力机制不会改变输入特征图的现有结构,而是通过改变各个通道的权重来实现特征加强,其模块如图 5 所示。ReLuSigmoidXGlobalaverage pool(bs,C)(bs,C)(bs,C/16)(bs,C/16)(bs,1,1,C)In

27、put(bs,C,W,H)Output(bs,C,W,H)注:X 表示上一层网络输出;bs表示输入批量的大小;Globalaveragepool表示全局平均池化。Note:Xrepresentsthenetworkoutputofthepreviouslayer;bsrepresentsthesizeoftheinputbatch;Globalaveragepoolrepresentsglobalaveragepooling.图 5SENet 模块Fig.5SENetmoduleSENet 分 3 步25,第一步为 Squeeze(压缩层)阶段,对输入的 WHC 的特征图进行全局平均池化,压缩

28、每个通道的特征至 11C 的 C 维向量,此过程通道数不变。第二步为 Excitation(激励层)阶段,用于捕捉通道之间的关系。通过 2 次全连接层从向量中提取各个通道的权重,第一个全连接层将维度降低为 C/16,通过修正线性单元 Rectifiedlinearunit(ReLu)函数进行激活,第二个全连接层将通道恢复为原来的 C 维,采用 Sigmoid函数将通道权值固定在 01 之间,为每个通道学习一个自适应权值,权值越低该通道上的特点越不需要被关注。最后在 Scale(比例层)将获得的权值乘上原输入特征层实现各个通道重要程度的调整。SENet 模块通过自主学习各个通道的重要程度来提高网

29、络对重要特征的注意力,增强有用信息提取,压缩无用信息来实现检测和识别精确度的提高。本研究在主干特征提取网络的 3 个输出结果处添加注意力机制,实现对发病早期相似病斑有用特征的加强,一定程度上提高了黄瓜叶片病虫害检测和识别的精确度。2.2.3K-means+锚框更新锚框作为目标检测网络中较为重要的先验信息,模型的先验框和真实框越接近,其检测精确度越高。为了避免网络模型盲目学习目标的尺寸和位置,利用 K-means+算法得到新的锚框初始值。相比于传统 K-means 锚框聚类,K-means+改进初始聚类中心点的选择方法,迭代次数通常较少且更加稳定26。本研究拟提取锚框坐标,将其转换为特征向量作为

30、 K-means+算法的输入,更新锚框初始值。同时,为了捕获不同目标在尺度、形态等方面的差异,生成更贴合于真实框的锚框,将聚类簇数量设置为大于目标类别数量,试验中设置为9。K-means+算法首先随机选取 1 个特征向量样本作为初始聚类中心点,计算其他样本与初始聚类中心的距离。再根据距离权重,以概率选择下一个聚类中心,并更新已选择的聚类中心,直至选择预定数量的聚类中心,最后得到更贴合于黄瓜叶片数据集的锚框信息,从而提高模型的检测精度。将聚类结果可视化展示在 640640 像素大小的画布上,如图 6 所示,不同颜色代表不同的簇,位于同一簇的样本其向量相似度度量接近,聚类后的锚框初始值为(168,

31、108)、(143,287)、(307,228)、(241,548)、(405,380)、(614,343)、(422,635)、(630,497)、(636,637)。通过计算聚类中心与目标之间并交比 Intersectionoverunion(IoU),选择最匹配的锚框作为候选区域,减少不必要的计算、提高目标检测的精确度。60050040030020010000100200300400500600注:“”表示聚类中心点;画布大小为 640640 像素;不同颜色的簇代表具有不同特征的锚框信息,试验中簇个数设定为 9。Note:“”representstheclustercenterpoint

32、;thecanvassizeis640640pixels;clusters of different colors represent anchor box information with differentcharacteristics,andthenumberofclustersinthisexperimentissetto9.图 6K-means+聚类可视化结果Fig.6K-means+clusteringvisualizationresult166农业工程学报(http:/www.tcsae.org)2023年2.2.4Focal-EIOU Loss 函数原始 YOLOv7 使用 C

33、IOU 作为坐标损失函数,CIOU损失考虑了重叠面积、中心点距离以及纵横比这 3 个几何因素。然而在目标识别和检测过程中,边界框Boundingbox(BBox)是决定其精确度的重要因素之一,原始YOLOv7 算法的 Loss 函数并未考虑到,因此引入 Focal-EIOUloss 函数来替代原始损失函数。Focal-EIOU 函数不仅包含了 CIOU 的有益特性,还聚焦于高质量的 BBox,提高模型检测精确度同时,还可以加快模型收敛27,Focal-EIOU 计算式如下:LEIOU=LIOU+Ldis+Lasp=1IOU+2(b,bgt)(wc)2+(hc)2+2(w,wgt)(wc)2+2

34、(w,wgt)(hc)2(1)式中 wc和 hc是最小包围框的宽高,将损失函数分为IOU 损失,距离损失 Ldis和方位损失 Lasp,给定预测框 b和 bgt,b 和 bgt分别表示目标框和预测框的中心点,表示 b 和 bgt之间中心点坐标的欧氏距离,EIOU 损失在增加长宽比相似度的同时,也考虑到了模型如何通过焦点损失的回归形式有效减少(w,h)和(wgt,hgt)之间的真实差异,更有益于模型检测精确度的提高。2.3模型训练与评价指标2.3.1训练平台本试验使用的训练平台主要参数为:Corei5-12400CPU4.4GHz、内存为 32GB,1TB 固态硬盘,NvidiaGeForceR

35、TX309024GB 显卡,安装 CUDA、Cudnn 版本为 11.4、8.2.2,系统为 Windows 操作系统,Python 版本为 3.8 以及深度学习框架为 Pytorch1.10.0。2.3.2训练参数训练参数设置:图像输入尺寸为 640640,批次Batch_size 为 24,多线程设置为 2,初始学习率为 0.01,每次训练迭代(Epoch)1000 次。每完成 10 个迭代,保存一次权重参数,共得到 100 个权重参数。由于试验修改了原算法的主干特征提取网络,因此在首次训练时无预训练权重,先进行 300 次的迭代训练,再利用训练好的权重重新进行 1000 次的迭代训练。2

36、.3.3评价指标参考孙丰刚等30使用的评价指标,采用精确度Precision(Pi,%)、召回率 Recall(Ri,%),平均精确度(averageprecision,APi,%)30、平均精度均值(meanaverageprecision,mAP,%)30以及帧速率(framepersecond,FPS,帧/s)作为模型的评价指标,计算式如下:Pi=TPTP+FP100%(2)Ri=TPTP+FN100%(3)式中 i 表示不同的叶片病虫害;N 表示数据集中分类的个数,本文为 4;TP表示图片中正确检测叶片病虫害的数量;FP表示图像中检测错误与目标分类错误的数量;FN表示图像中漏检的数量;

37、APi具体为某一种病虫害的P-R 曲线与坐标轴围成的面积,反应了目标检测精度的性能;mAP 表示模型对不同病虫害的整体检测精度的性能。3结果与分析为了对比分析本研究的改进方法对模型性能的影响,在模型训练参数一致的情况下设计了 3 组试验:主流模型性能对比试验、注意力机制对比试验和消融试验。并选取具有代表性的图像数据进行测试,从模型的可视化中,对模型的检测效果进行分析。3.1主流模型性能对比为了对比本研究模型与 SSD 模型、Faster-RCNN 模型、YOLOv5l 模型、YOLOv7 模型、YOLOv7-tiny 模型在目标检测任务中的有效性,本试验设计了第 1 组不同模型之间性能测试对比

38、。采用相同的数据集和参数设置进行 1000 次迭代训练和测试,表 1 列出不同模型的精确度、召回率、平均精度均值和帧速率。表1主流模型训练结果Table1Mainstreammodeltrainingresults模型Model精确度Precision/%召回率Recall/%平均精度均值MeanaverageprecisionmAP/%帧速率FramepersecondFPS/(帧s1)DCNSE-YOLOv796.0293.1594.2552.04YOLOv793.5992.3491.3852.72YOLOv5l93.8892.3491.5350.88Faster-RCNN95.7493.

39、5593.9729.60SSD84.2680.2782.21132.63YOLOv7-tiny87.6386.1987.23289.45对比试验结果显示 DCNSE-YOLOv7 模型的检测精确度和平均精度均值与其他网络相比都为最高。检测精确度与YOLOv5l、YOLOv7、Faster-RCNN、SSD、YOLOv7-tiny 模型相比分别提高 2.14、2.43、0.28、11.76 和 8.39个百分点,DCNSE-YOLOv7 模型与 Faster-RCNN 模型的检测精度差别不大,这是由于网络内部结构不同,Faster-RCNN 作为二阶段算法仅需送入网络一次便可测出所有边界框,故检

40、测精度稍小于 DCNSE-YOLOv7 模型;相比 YOLOv5l、YOLOv7、SSD、YOLOv7-tiny 模型,召回率分别提高 0.81、2.87、12.88、6.96 个百分点,与 Faster-RCNN 相 比 降 低 0.4 个 百 分 点;平 均 精 度 均 值 与YOLOv5l、YOLOv7、Faster-RCNN、SSD 和 YOLOv7-tiny 模型相比分别提高 2.72、2.87、0.28、12.04 和 7.02个 百 分 点;在 检 测 速 度 方 面,DCNSE-YOLOv7 比YOLOv5l 和 Faster-RCNN 分别提高 1.16 和 22.44 帧/

41、s,比YOLOv7、SSD、YOLOv7-tiny 降 低 了 0.68、80.59、237.41 帧/s。可见,本试验所构建的 DCNSE-YOLOv7 目标检测网络具有比其他 5 种模型具有更好的在检测准确率和检测速度之间平衡的能力,尤其在病斑细小特征识别方面能够胜任具有较多小目标的黄瓜叶片病斑检测任务。同时,从模型对单个图像的平均处理时长来看,DCNSE-YOLOv7 模型的检测速率虽低于 SSD、YOLOv7-tiny 模型,但其满足黄瓜叶片病斑在检测过程中对精确度的要求。3.2不同注意力机制检测性能对比为了验证 SENet 注意力机制的有效性,设计了第 2第15期刘诗怡等:基于改进

42、YOLOv7 的黄瓜叶片病虫害检测与识别167组试验,将 SENet 通道注意力机制模块,与卷积块注意力模块 convolutionalblockattentionmodule(CBAM)和高效通道注意力 efficientchannelattention(ECA)进行对比,结果见表 2。表2不同注意力机制模型训练结果Table2Trainingresultsofdifferentattentionmechanismmodels模型Model精确度Precision/%召回率Recall/%mAP/%FPS/(帧s1)DCNSE-YOLOv796.0293.1594.2552.04DCNCBA

43、M-YOLOv794.9191.4892.2852.17DCNECA-YOLOv795.0791.7992.5152.29由表 2 可得,DCNSE-YOLOv7 算法使用的 SENet注意力机制优于 CBAM 注意力机制和 ECA 注意力机制。与 DCNCBAM-YOLOv7 相比,DCNSE-YOLOv7 的精确度、召回率和 mAP 分别提高了 1.11、1.67 和 1.97 个百分点,FPS 下降了 0.13 帧/s;与 DCNECA-YOLOv7 相比,DCNSE-YOLOv7 的精确率、召回率和 mAP 分别提高了0.95、1.36 和 1.74 个百分点,FPS 下降了 0.25

44、 帧/s。因此,SENet 注意力机制在 YOLOv7 模型上对有效特征信息的筛选更优异,对病斑的识别能力高于 CBAM、ECA注意力机制算法,能够有效提升模型对黄瓜叶片病虫害识别的准确度,验证了该试验方法的可行性。使用本试验算法与原始 YOLOv7 迭代训练 1000 次得到的精确度 Precision、召回率 Recall 曲线如图 7 所示。从图中可以看出,初始时,DCNSE-YOLOv7 模型的 R曲线纵坐标非零,这是因为试验修改了原算法的主干特征提取网络,在首次训练时无预训练权重,故先进行300 次的迭代训练后,再利用训练好的权重和 YOLOv7模型进行 1000 次迭代训练。在训练

45、迭代第 500 次时,精确度曲线继续上升但趋于平稳,在迭代第 600 次时,召回率曲线虽伴有震荡但趋势明显放缓。0200400600800 1 0002040608010020406080100精确度priecsionDCNSE-YOLOv7YOLOv7a.DCNSE-YOLOv7与YOLOv7的精确度结果对比a.Compare priecsion result ofDCNSE-YOLOv7 and YOLOv7迭代次数Epoch0200400600800 1 000召回率RecallDCNSE-YOLOv7YOLOv7b.DCNSE-YOLOv7与YOLOv7的召回率结果对比b.Compar

46、e recall result ofDCNSE-YOLOv7 and YOLOv7迭代次数Epoch图 7精确度、召回率曲线图Fig.7PrecsionandRecallcurves3.3消融试验性能对比本研究在 YOLOv7 模型的基础上,使用可变形卷积DCNv2 自适应图形几何变化,提升网络模型的对病斑细小特征的精准定位能力;添加 SENet 注意力机制模块,加强模型对发病早期、多病害叶片相似特征的有效提取能力;通过 K-means+聚类算法对数据集的检测框重新聚类,提升网络表征能力;在预测层使用 Focal-EIOU 作为损失函数,获得更好回归结果。为验证各种改进的有效性,依次对 DCN

47、SE-YOLOv7 网络进行缩减,分别在测试集上进行消融试验,以平均精度均值 mAP 为评价指标,表 3 为消融试验结果。表3不同消融方法试验结果Table3Resultsofdifferentablationmethods试验TestMixUpDCNv2SENetK-means+Focal-EIOUmAP/%190.65291.34392.41492.96591.62691.58794.12注:试验以原始 YOLOv7 为基准,“”表示进行添加或改进,“”表示未进行变动。Note:ThetestisbasedontheoriginalYOLOv7,“”representsaddorimpro

48、ve,“”representsnochange.通过消融试验结果分析,使用 MixUp 数据增强后,模型的检测精度提高了 0.69 个百分点。在使用 MixUp数据增强的条件下,由试验 26 可得:在主干特征提取网络中将普通卷积更换为可变形卷积 DCNv2、引入SENet 注意力机制模块、更新锚框信息和使用 Focal-EIOU 代替原始 Loss 函数均为正向改进。引入可变形卷积 DCNv2 后,模型的 mAP 提高了 1.07 个百分点,说明引入 DCNv2 可以提升模型对尺寸变化大的目标的识别能力。加入 SENet 注意力机制后,模型更好地拟合通道间复杂的相关性,对有效特征的提取能力增强

49、,mAP 提高了 1.62 个百分点。更新锚框信息和使用 Focal-EIOU 损失函数后,mAP 分别提高了 0.28 和 0.24 个百分点。由试验 7 将 DCNSE-YOLOv7 模型应用在测试集上发现,模型在测试集与训练集上的性能表现接近,其 mAP 比训练集下降了 0.13 个百分点,且采用 MixUp 数据增强方式有效的削弱了过拟合现象的风险,模型具有较好的泛化能力,进一步验证了本试验方案的可行性。3.4不同模型黄瓜叶片病虫害检测可视化使 用 训 练 好的 DCNSE-YOLOv7、YOLOv7、YOLOv5l、Faster-RCNN、SSD、YOLOv7-tiny 模型分别对自

50、然场景下黄瓜叶片病虫害进行检测,得到可视化图像如图 8 所示,其中紫框为正常叶片,红框为靶斑病叶片、棕框为白粉病叶片、蓝框为霜霉病叶片。由图 8 可 知,与 YOLOv7 模 型 相 比,DCNSE-YOLOv7 模型对病害识别的精确度更高且其检测框更贴近实际目标尺寸大小。在第 2 列靶斑病的检测与识别中,SSD 模型对靶斑病出现了漏检现象。由第 2、3 列检测结果可看出,DCNSE-YOLOv7 模型很好的学习了靶斑病和霜霉病病斑的细微特征并进行区分,检测精确度均优于其余 5 个模型,且在自然拍摄环境下,DCNSE-YOLOv7 模型能有效识别被遮挡的黄瓜叶片,检测精度较高,成功解决了现有模

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服