收藏 分销(赏)

基于改进YOLOX-Nano的农作物叶片病害检测与识别方法.pdf

上传人:自信****多点 文档编号:582149 上传时间:2024-01-02 格式:PDF 页数:11 大小:24.75MB
下载 相关 举报
基于改进YOLOX-Nano的农作物叶片病害检测与识别方法.pdf_第1页
第1页 / 共11页
基于改进YOLOX-Nano的农作物叶片病害检测与识别方法.pdf_第2页
第2页 / 共11页
基于改进YOLOX-Nano的农作物叶片病害检测与识别方法.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、李康顺,杨振盛,江梓锋,等.基于改进 YOLOX-Nano 的农作物叶片病害检测与识别方法 J.华南农业大学学报,2023,44(4):593-603.LIKangshun,YANGZhensheng,JIANGZifeng,etal.DetectionandidentificationofcropleafdiseasesbasedonimprovedYOLOX-NanoJ.JournalofSouthChinaAgriculturalUniversity,2023,44(4):593-603.基于改进 YOLOX-Nano 的农作物叶片病害检测与识别方法李康顺1,2,杨振盛1,江梓锋1,王健

2、聪1,王慧3(1华南农业大学数学与信息学院,广东广州510642;2东莞城市学院人工智能学院,广东东莞523419;3深圳信息职业技术学院,广东深圳518172)摘要:【目的】实现精确迅速的农作物病害检测,减少人工诊断成本,降低病害带来的农作物产量和品质影响。【方法】根据对农作物病害和病斑特征的分析,提出一种基于卷积注意力机制改进的 YOLOX-Nano 智能检测与识别模型,该模型采用 CSPDarkNet 作为主干网络,将卷积注意力模块 CBAM 引入到 YOLOX-Nano 网络结构的特征金字塔(Featurepyramidnetwork,FPN)中,并在训练中引入 Mixup 数据增强方

3、式,同时将分类的损失函数由二分类交叉熵损失函数(Binarycrossentropyloss,BCELoss)替换为焦点损失函数 FocalLoss、回归损失函数由 GIOULoss 替换为本文设计的 CenterIOULoss 函数,采用迁移学习策略训练改进的 YOLOX-Nano 模型,以此提升农作物病害检测的精度。【结果】改进后的 YOLOX-Nano 模型仅有 0.98106的参数量,在移动端测试单张图片检测时间约为 0.187s,平均识别精度达到 99.56%。实践结果表明,其能快速有效地检测与识别苹果、玉米、葡萄、草莓、马铃薯和番茄等农作物的常见病害,且达到了精度与速度的平衡。【结

4、论】改进后的模型不仅对农作物叶片病害识别具有较高的精度和较快的检测速度,参数量和计算量较少,还易于部署在手机等移动端设备。该模型实现了在田间复杂环境对多种农作物病害精准定位与识别,对于指导早期农作物病害的防治具有十分重要的现实意义。关键词:YOLOX-Nano 网络;病害识别;FocalLoss;注意力机制;农作物病害中图分类号:TP391.41;S435.672文献标志码:A文章编号:1001-411X(2023)04-0593-11Detection and identification of crop leaf diseases based onimproved YOLOX-NanoLI

5、Kangshun1,2,YANGZhensheng1,JIANGZifeng1,WANGJiancong1,WANGHui3(1CollegeofMathematicsandInformatics,SouthChinaAgriculturalUniversity,Guangzhou510642,China;2SchoolofArtificialIntelligence,DongguanCityCollege,Dongguan523419,China;3ShenzhenInstituteofInformationTechnology,Shenzhen518172,China)Abstract:【

6、Objective】Toidentifycropdiseasesaccuratelyandquickly,reducethecostofartificialdiagnosis,andreducetheimpactsofcropdiseasesoncropyieldandquality.【Method】Basedontheanalysisofthecharacteristics of crop diseases and spots,an improved YOLOX-Nano intelligent detection and recognitionmodel based on convolut

7、ion attention mechanism was proposed.The model employed CSPDarkNet as the收稿日期:20220726网络首发时间:2023040711:05:24首发网址:https:/ and tomatoes,and achieve the balance of accuracy and speed.【Conclusion】Theimprovedmodelnotonlyhashigheraccuracyanddetectionspeedforcropleafdiseaseidentification,butalsohaslesspar

8、ametersandcalculationamount.Themodelwaseasytobedeployedonmobiledevicessuchasmobilephones.Inaddition,themodelachievesaccuratepositioningandidentificationofavarietyofcropdiseasesincomplexfieldenvironment,whichisofgreatpracticalsignificancetoguidethepreventionandcontrolofearlycropdiseases.Key words:YOL

9、OX-Nanonetwork;Diseaseidentification;FocalLoss;Attentionmechanism;Cropdisease中国是一个农业大国,作为国家发展的根本,农业在国家经济总量中占有很大的比重。如今全球粮食供给偏紧,农业是国家战略性、基础性核心产业,在农作物的生长发育过程中,气候环境、病虫迫害、病菌侵染等严重影响其产量和品质。目前常见的农作物病害有上千种,传统的依靠人工识别农作物病害,不但耗费时间精力,而且效率低。精确迅速地辨识出农作物病害有助于及时救助,对降低农作物病害带来的产量和品质影响具有重大意义。随着深度学习技术在物体分类方面的深入研究与计算机图像处

10、理能力的增强,计算机视觉技术也应用在农作物病害识别上,并且取得许多成果。刘翱宇等1提出一种基于深度残差网络的植物病害检测网络,引入 FocalLoss 损失函数,对植物病害图像的检测平均准确率高达 97.96%。Srdjan 等2将深度卷积神经网络用于植物病害识别,能够区分植物叶片与周围环境,并能够区分健康叶片与13 种不同的植物病害,在开发模型测试中,单类病害的识别平均准确率高达 96.3%。Albattah 等3提出了一种改进的 CenterNet 网络,以 DenseNet-77 为基础网络对病害样本图片特征进行提取,在 PlantVillage 数据集上训练,然后分别对番茄、葡萄等在内

11、的 14 种植物 26 类病害及健康叶片进行识别,检测精度比当时精确率最高的 EfficientNet 网络更高。刘洋等4针对 PlantVillage 数据集 14 种植物中的 26 种病害对比研究了 2 个轻量级网络系统MobileNet 和 Inceptionv3,结果表明 MobileNet 模型的程序数量更小,执行速率也更快,可部署于安卓操作系统中,在手机端也实现了图像识别。Saleem等5对 Xception 网络精修后,选择性能提升最明显的 Adam 优化器,对 PlantVillage 数据集中的 26 种植物病害进行检测,准确率达到了 97.81%。孙俊等6使用 AlexNe

12、t 作为基础网络,然后通过批归一化方法、引入全局池化层和减少特征图量等方式,共获得了 8 种改进模式,对 PlantVillage 数据集14 种植物的 26 种病害特征进行了鉴别,效果最好的检测模式平均准确度超过了 98.1%。李书琴等7提出了一种基于轻量级残差网络,通过缩减网络卷积核数目和轻量级残差模块减少网络参数,网络参数大幅减少的同时,在 PlantVillage 数据集上的检测精度达到 98.45%。上述深度学习方法不仅在检测准确度方面有了较高的提升,也有向低内存、少参数量改进的趋势,从而达到高精度识别、迅速检测、易部署移动端的目的。然而,检测精度提升的同时,网络参数量也在不断增多,

13、网络深度和宽度也不断加深,浮点运算量加大从而带来较高的延迟,实时检测的效果较差。人工智能公司旷视科技提出的 YOLOX-Nano8,有着参数量小、浮点运算快、延迟低、易部署移动端的优势且检测精度保持着中高水平。本文在原始 YOLOX-Nano 网络结构的基础上进行改进,在不显著增加网络内存和运算参数量的基础上,提出一种混合卷积注意力模块 CBAM9、Mixup数据增强策略10、FocalLoss 分类损失函数11和本594华南农业大学学报(https:/ CenterIOU 回归损失函数的改进YOLOX-Nano 模型。1 材料与方法 1.1 数据集的获取试验所需要的所有病害图片数据来自于公开

14、数据集 PlantVillage 网站(http:/plantvillage.psu.edu),数据集记录包含 54309 张图像,这些图像涵盖了 14 种作物:苹果、蓝莓、樱桃、玉米、葡萄、柑橘、桃、甜椒、马铃薯、覆盆子、大豆、南瓜、草莓和番茄。考虑到应尽可能研究某一类农作物的多种病害(3 种及以上),因此剔除数据集内仅含健康叶片的农作物数据和仅有 2 类病害的农作物数据,最终在公开数据集上精心挑选苹果叶片图像 4645 张,其中,苹果黑星病 1000 张、苹果黑腐病 1000 张、苹果松锈病 1000 张、健康叶片 1645 张;玉米叶片4354 张,其中,玉米灰斑病 1000 张、玉米锈

15、病 1192张、玉米大斑病 1000 张、健康叶片 1162 张;葡萄叶片 4369 张,其中,葡萄黑腐病 1180 张、葡萄轮斑病 1076 张、葡萄褐斑病 1383 张、健康叶片 1000张;马铃薯叶片 3000张,其中,马铃薯早疫病、马铃薯晚疫病、健康叶片各 1000 张;草莓叶片 4218张,其中,草莓叶焦病 2218 张,健康叶片为 2000张;番茄叶片 18835 张,其中,番茄疮痂病 1404张、番茄早疫病 1000 张、番茄晚疫病 1909 张、番茄叶霉病 1000 张、番茄斑枯病 1771 张、番茄红蜘蛛损伤 1676 张、番茄斑点病 2127 张、番茄黄叶曲叶病 5357

16、张、番茄花叶病毒病 1000 张和健康叶片1591 张,共计 6 类农作物 27 种病害,保证各类样本间数量均衡。此外,考虑到真实场景背景复杂的情况,数据集添加了无叶片背景图像 1143 张。试验样本图像如图 1 所示。1234567891011121314151617181920212223242526272814依次为苹果黑星病、黑腐病、松锈病和健康叶;58 依次为玉米灰斑病、锈病、健康叶和大斑病;912 依次为葡萄黑腐病、轮斑病、褐斑病和健康叶;1315 依次为马铃薯早疫病、晚疫病和健康叶;1617依次为草莓叶焦病和健康叶;1827依次为番茄疮痂病、早疫病、晚疫病、叶霉病、斑枯病、红蜘蛛

17、损伤、斑点病、黄叶曲叶病、花叶病毒病和健康叶;28 为无叶片背景图14areapplescab,appleblackrot,cedarapplerustandapplehealthyleavesinturn;58arecornCercospora zeaemaydisTehonandDaniels,cornPucciniapolysora,cornhealthyleavesandcornCurvularialeafspotfungus;912aregrapeblackrot,grapeblackmeasles,grapeleafblightfungusandgrapehealthyleaves

18、inturn;1315arepotatoearlyblight,potatolateblightandpotatohealthyleavesinturn;1617arestrawberryleafscorchandhealthyleavesinturn;1827aretomatobacterialspotbacteria,tomatoearlyblight,tomatolateblightwatermold,tomatoleafmold,tomatoseptorialleafspot,tomatospidermitedamage,tomatotargetspotbacteria,tomatoY

19、LCVvirus,tomatoToMVdiseaseandtomatohealthyleavesinturn;28isbladelessbackgroundimage图 1 PlantVillage 部分数据集Fig.1 Partial dataset of PlantVillage 1.2 数据预处理网络训练参数设置首先将所有样本图像的分辨率转变成 416416,使用标注工具 LabelImg 将所有样本按 PascalVOC 数据集的标注,生成.xml 类型的标注文件。此外,从试验数据集图像中随机选择60%样本(约23235张)用于训练模型,20%的样本(约 7675 张)用来验证,20%

20、样本(约 7675 张)用于测试。试验运用迁移学习,让 YOLOX-Nano 在大规模公开数据集 ImageNet 上进行训练,获得一个收敛的预训练权重,然后利用这个预训练权重迁移到改进的 YOLOX-Nano 网络模型中进行参数调优。训练过程中超参数设置为每批量样本数为 32,1 次遍历完全部训练集数据称为 1 次迭代,批量设置为100。采用随机梯度下降(Stochasticgradientdescent,SGD)优化算法调优网络参数,初始学习率设置为 0.01,动量因子为 0.9,每经过 10 次迭代训练,将学习率降低 1/10,模型迭代 1 次保存 1 次权重。第4期李康顺,等:基于改进

21、 YOLOX-Nano 的农作物叶片病害检测与识别方法595 1.3 基于改进 YOLOX-Nano 的农作物叶片病害检测与识别1.3.1YOLOX-Nano 网络YOLOX-Nano 作为YOLOX 系列的最轻量化版本,对比 YOLOX-X、YOLOX-L、YOLOX-M、YOLOX-S、YOLOX-Darknet 和 YOLOX-Tiny 高性能版本,其通过降低网络的宽度和深度、减少模型运算的参数量、取消训练时 Mixup 数据增强方式等改进,使网络结构更简单,速度更快。YOLOX-Nano 的结构如图 2a 所示,整个YOLOX-Nano 可以分为 3 个部分,分别是CSPDarkNet

22、 主干提取网络12、特征金字塔网络(Featurepyramidnetwork,FPN)13和路径聚合网络(Pathaggregationnetwork,PAN)14中间层以及YoloHead 输出层。a:YOLOX-Nano 网络结构图a:YOLOX-Nano network architectureSPPBottlenectConv2D_BN_SiLUConv2D_BN_SiLU无处理5913YoloHeadConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLU分类Classification置信度Con

23、fidence intervalCSPDarknetInputs(416,416,3)Foucs(208,208,12)Conv2D_BN_SiLU(208,208,64)Conv2D_BN_SiLU(104,104,128)CSPLayer(104,104,128)Conv2D_BN_SiLU(52,52,256)CSPLayer(52,52,256)ResblockResblockConv2D_BN_SiLU(26,26,512)CSPLayer(26,26,511)Conv2D_BN_SiLU(13,13,1 024)SPPBottlenect(13,13,1 024)CSPLayer(

24、13,13,1 024)ResblockFPNConcat+CSPLayer上采样 UpsamplingCov2DConcat+CSPLayer下采样 DownsamplingYoloHeadYoloHeadYoloHeadConcat+CSPLayerConcat+CSPLayer上采样 Upsampling下采样 DownsamplingCov2DPANb:改进后的 YOLOX-Nano 网络结构图b:Improved YOLOX-Nano network structureSPPBottlenectConv2D_BN_SiLUConv2D_BN_SiLU无处理5913YoloHeadCo

25、nv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLU分类Classification置信度Confidence intervalCSPDarknetInputs(416,416,3)Foucs(208,208,12)Conv2D_BN_SiLU(208,208,64)Conv2D_BN_SiLU(104,104,128)CSPLayer(104,104,128)Conv2D_BN_SiLU(52,52,256)CSPLayer(52,52,256)ResblockResblockConv2D_BN_SiLU(2

26、6,26,512)CSPLayer(26,26,511)Conv2D_BN_SiLU(13,13,1 024)SPPBottlenect(13,13,1 024)CSPLayer(13,13,1 024)ResblockFPNConcat+CSPLayer上采样 UpsamplingCov2DCBAMCBAMCBAMCBAMCBAMConcat+CSPLayer下采样 DownsamplingYoloHeadYoloHeadYoloHeadConcat+CSPLayerConcat+CSPLayer上采样 Upsampling下采样 DownsamplingCov2DPAN图 2 YOLOX-

27、Nano 网络结构和改进后的 YOLOX-Nano 网络结构Fig.2 Network structure of YOLOX-Nano and improved YOLOX-Nano输入的图片首先在 CSPDarkNet 进行特征提取,提取到 3 个特征层进行下一步网络的构建,FPN 是 YOLOX-Nano 的加强特征提取网络,在主干部分获得的 3 个特征层会在这一部分进行特征融合,获取不同尺度的特征信息。在 FPN 部分,已经获得的有效特征层被用于继续提取特征,在PAN 层中,网络会对特征进行阶段上采样和下采样操作实现特征融合。YoloHead 是 YOLOX-Nano 的分类器与回归器,

28、输入图片通过 CSPDarkNet、FPN 和 PAN 层已经获得了 3 个加强特征层,每一个特征图看作每一个特征点的集合,而 YoloHead会对特征点进行判断,判断特征点是否有物体与其对应。YOLOX-Tiny 的 YoloHead 被分为了 2 部分,分别实现检测和分类操作,最后在预测阶段将两者整合输出结果。由于 YOLOX-Nano 宽度和深度较浅,没有充分学习输入特征向量通道与空间之间的重要程度关系,对近似的难分辨目标预测效果较差,其次数据集内多种农作物病害图像样本复杂多样,二分类交叉熵损失(Binarycrossentropyloss,BCELoss)作为分类损失函数将困难样本和容

29、易样本赋予相同的权重进行训练,这样造成一些困难样本分类效果不理想,GIOU 损失函数对 2 个候选框没有相交时,IOU=0,不能反映两者的距离大小,也无法精确反映两者的重合度大小,不利于梯度回传和学习训练,致使密集病害定位缺失。综合以上问题,本文在 YOLOX-Nano 模型混合了卷积注意力 CBAM 模块,引入了 Mixup 数据增强方式来充实样本集,让网络训练地更充分,最后分类损失函数将 BCELoss 替换为 FocalLoss,回归损失函数将 GIOULoss 替换为 CenterIOULoss,改进后的 YOLOX-Nano 网络结构图如图 2b 所示。1.3.2混合卷积注意力机制

30、CBAM 模块在农作物病害检测与识别任务中,农作物叶片病害特征大体相似,只有细节部分略有差异。YOLOX-Nano 作为浅层模型,检测精度不够高,这是需要注意的地方。注意力机制是运用在深度学习模型中常见的小技巧,是实现网络自适应注意的一个方式,核心重点是让网络关注到它需要关注的特征,忽略不重要的特征,主要分为通道注意力机制和空间注意力机制,卷积注意力机制结构如图 3 所示。卷积注意力机制的前半部分为通道注意力机制,通道注意力机制先针对输入进来的单个特征层,依次执行全局平均池化方法和全局最大池化方法,之后再针对平均池化和最大池化的结果,利用共享596华南农业大学学报(https:/ 2 个结果进

31、行相加,之后再通过 Sigmoid 激活函数,得到输入特征层中每一条通道的加权值(01)。将这个权值乘上原输入特征层即可得到经过通道注意力机制处理后的特征图。卷积注意力机制的后半部分为空间注意力机制,首先对通过通道注意力机制处理的特征层每一个特征点的通道取最大值和平均值,之后将这 2 个结果进行堆叠,利用通道数为1 的卷积核卷积调整通道数,再经过 Sigmoid 激活函数,获得输入特征层每一个特征点的权值(01),然后将这个权值乘上原输入特征层即可得到最终处理的特征层。本文引入 CBAM 注意力机制模块,结合通道注意力机制和空间注意力机制,对输入的特征层分别进行通道注意力机制和空间注意力机制的

32、处理,卷积注意力机制对不同通道的特征图进行权重的重新分配,加强网络结构深层信息提取,让网络关注到它需要关注的特征,忽略不重要的特征。输入图像经过主干特征提取网络后获得 3 个有效特征层,在构建 FPN 层上采样前首先将经由加强特征提取网络的 3 个有效特征层送入 CBAM 模块,自动学习特征通道之间的相关性,输出 3 个尺度的检测结果,再经过卷积层提取特征。随后进行PAN 的构建,在 PAN 融合的下采样前,把主干特征网络获得的 3 个有效特征层,再经过 CBAM 注意力机制模块进行融合,然后经过另一个卷积模块再一次提取特征,将最后一个有效特征层卷积,最终获得 3 个特征。1.3.3引入 Mi

33、xup 数据增强策略Mixup 是一种混类增强的数据增强策略,它可以将不同类的图像batchx1batchy1batchx2batchy2进行混合,从而扩充训练数据集。Mixup 数据增强策略原理是假设是一个批次的图像样本,是该批次图像样本对应的标签;是另一个批次图像样本,是另一个批次图像样本对应的标签,是由参数为、的 Beta 分布计算出来的混合系数。由此可以得到 Mixup 原理公式为=Beta(,),(1)mixed_batchx=batchx1+(1)batchx2,(2)mixed_batchy=batchy1+(1)batchy2。(3)以玉米病害图像为例,在训练时先读取 1 张样

34、本图像,图像两侧填充,放大图片到 416416(图 4a),再随机选取 1 张样本图像,也放大到 416416(图 4b)。然后设置 1 个融合系数,如 0.5,将 2 张图像加权融合,最终得到完整的图像(图 4c)。在 YOLOX 中以 Mosaic 为基础,Mixup 策略作为一种额外的数据增强策略,在浅层模型用Mixup 数据增强策略会降低平均精确率(Averageprecision,AP),所以 YOLOX-Nano 没有使用Mixup 数据增强策略。本文使用 Mixup 数据增强策略,加大样本数据量防止模型欠拟合。根据图 5中的 Beta 分布概率密度曲线,当=1 时,等于(0,1)

35、均匀分布;当=1 时,表现为两头的概率大,中间的概率小,当=0 时,相当于0,1二项分布,要么取 0,要么取 1,等于原始数据没有增强,本试验随机设置 Mixup 参数=0.1,0.9,就可以得到多样化的(0,1)区间内的概率分布,使数据增强更具有随机性,模型更具有鲁棒性。1.3.4分类损失函数的改进一个好的损失函数平均池化AvgPool最大池化MaxPool平均池化 AvgPool最大池化 MaxPool多层感知器MLP输入特征Input feature通道注意力Channel attention空间注意力Spatial attention输出特征Output feature图 3 CBAM

36、 卷积注意力机制结构Fig.3 Structure of CBAM convolutional attention mechanism第4期李康顺,等:基于改进 YOLOX-Nano 的农作物叶片病害检测与识别方法597对于网络参数调优达到事半功倍的效果。由于多种农作物叶片病害纹理特征大致形似,模型对一些病害样本计算的分类置信度产生偏差,进而影响样本分类效果,造成错误分类病害的情况。基于以上计算样本分类置信度偏差的问题,YOLOX-Nano 将分类损失函数由 BCELoss 损失函数替换为 FocalLoss 损失函数,其能控制容易分类和难分类样本的权重,通过减少易分类样本的权重,使得模型在训

37、练时更专注于难分类的样本,让容易样本对损失产生贡献小,难样本对损失产生贡献大。p py FocalLoss 分类损失函数公式定义如式(4)所示,(0,1)表示预测值,表示真实值,(pt0)表示调节因子。设表示预测某真实标签的概率,定义如式(5)所示,范围为 0,1。由式(4)、(5)归纳后 FocalLoss(FL)损失函数公式如式(6)所示:f(x)=(1 p)ln(p),if y=1 pln p,if y=0,(4)f(x)=p,if y=11 p,其他,(5)FL(pt)=(1 pt)lnpt。(6)(1 pt)pt py(1 pt)与交叉熵函数损失函数相比,公式(6)多了一个系数,实质

38、是对交叉熵损失函数的优化。如图 6 所示,可以通过改变 调节因子的值,从而控制容易分类和难分类样本对损失的贡献。由公式(6)可知,若某样本类别概率趋于 1,说明预测值接近于真实值,这类样本就属于容易区分的样本,此时系数趋于 0,对损失贡献极少。012345FL(pt)=(1pt)ln(pt)易区分样本Well-classifedexamples损失Loss0.20.40.6pt0.81.0=0=0.5=1.0=2.0=5.0图 6 Focal Loss 函数曲线Fig.6 Focal Loss function curve1.3.5回归损失函数的改进YOLOX-Nano 在回归候选框时仍使用

39、GIOU 损失函数,本文根据数据集图片样本特点,设计出利于回归候选框的CenterIOU 损失函数。xpreyprextagytagxctyctBOX交集BOX并集Y=Ax+By+Cxctyct如图 7 所示,已知候选框中心点(,)、真实框中心点(,)与最小外接矩形中心点(,)。根据公式(7)计算候选框和真实框的 IOU,式中,、分别表示候选框和真实框的交集和并集;构造候选框中心点和真实框中心点两点的一般直线方程;根据公式(8)计算最小外接矩形中心点(,)到两框中心点的直线距离(Distance);最后代入公式(9),得到候选框回归损失。IOU=BOX交集BOX并集,(7)Distance=|

40、Ax0+By0+C|(A2+B2),(8)CenterIOU_Loss=1(IOUDistance)。(9)a:样本 1a:Sample 1b:样本 2b:Sample 2加权融合Weighted fusionc:融合后样本c:Fused image sample 图 4 Mixup 数据增强策略示意图(以玉米灰斑病为例)Fig.4 Schematic diagram of mixup data enhancementstrategy(Take corn Cercospora zeaemaydis as anexample)000.51.01.52.02.5f(x)3.03.54.00.20.

41、4x0.60.81.0=0.001,=0.001=0.010,=0.010=0.200,=0.200=0.100,=0.100=0.500,=0.500=1.000,=1.000图 5 和相同时的 Beta 分布概率密度曲线Fig.5 Probability density curve of beta distribution while and were equal598华南农业大学学报(https:/ CenterIOU 损失函数,较原 GIOU 函数让网络学习到预测框和目标框的相对位置,网络在反向传播时能更好地调优回归参数。1.4 病害检测系统的设计为获取实际状态下病害检测所需时间,对比

42、网络改进前后的效果,以训练好的模型为基础,开发手机端病害识别系统。利用 IOS 官方的 CoreMLTools 模型转换库将训练好的 pth 格式模型转换为IOS 平台使用的格式。前端界面提供图库、识别、保存 3 个按钮,对应调用相册上传识别图片、快速识别作物病害、保存识别记录 3 种功能。编译后生成安装文件部署在 iPhone8 手机,显示如图 8 所示。1.5 评价指标对于农作物叶片病害检测,需要网络具有高精确率和实时性。本文采用COCOmAP0.50:0.05:0.9515-16作为农作物病害检测评价指标来综合评估模型对苹果、玉米、苹果、玉米、葡萄、马铃薯、草莓、番茄6 类农作物的 27

43、 种病害和无叶片背景图像的检测性能,即分别在 IOU 阈值设置以 0.05 的步距从0.50 开始遍历至 0.95,取这些阈值条件下评估所得到的平均准确率(Averageprecision,AP)及其均值(Meanaverageprecision,mAP)。mAP与准确率(Precision,P)、召回率(Recall,R)有关,其计算公式如下所示:P=TPTP+AP100%,(10)R=TPTP+FN100%,(11)AP=w10P(R)dR,(12)mAP=1MMk=1AP(k)100%,(13)式中,TP 表示被模型预测正确的正样本数,FP 为被模型预测错误的正样本数,FN 为被模型预测

44、错误的负样本数,M 为类别总数,AP(k)为第 k 类平均准确率。将训练好的模型部署移动端系统后,检测单张样本图像所消耗的平均时间(包含程序加载图片所耗时间和检测时间)作为实时性指标,单位为s。参数量指标指深度网络模型中可训练参数的个数,以百万为单位,表示为 1106。2 结果与分析 2.1 改进方法性能分析使用 YOLOX-Nano 模型为基础网络,分别引入 CBAM 卷积注意力机制、Mixup 数据增强策略、使用 FocalLoss 替换原分类损失函数 BCELoss,本文设计 CenterIOU 损失函数替换原回归损失函数GIOU 作为改进网络。2.1.1融合 CBAM 卷积注意力机制Y

45、OLOX-Nano 对农作物病害叶片检测与识别的精度较低,单张样本图片检测精准率仅为 97.97%,其原因是6 种农作物 27 类病害的叶片病态特征表现比较相似。通道注意力可对特征图的不同通道赋予不同特征,选择性增大不同病害斑点特征通道的权重值;空间注意力对同一特征图不同位置特征点给予不同权重,区别对待特征图内部像素点。(xct,yct)(xpre,ypre)(xtag,ytag)最小外接矩形到两框中心点直线距离Line distance from mninimum outer rectangle tocenter point of two frames最小外接矩形Minimum boundi

46、ng rectangle图 7 CenterIOU 损失函数图解Fig.7 Diagram of CenterIOU loss function图 8 病害检测系统界面Fig.8 Interface of disease detection system第4期李康顺,等:基于改进 YOLOX-Nano 的农作物叶片病害检测与识别方法599引入 CBAM 卷积注意力机制模块后,虽然模型参数量由 0.92106增加到 0.96106、单张样本推断时间增加 18ms,但平均精确率由 97.97%提升到 98.89%,提升了 0.92 个百分点,在很大程度上提升了对两者叶片病害识别的准确率。两者结合可

47、总体提升识别准确率,表明了 CBAM 模块区别相似物体的有效性。利用 Grad-CAM17工具可视化进入 FPN 层前第一个 CBAM 卷积注意力机制18,明确对特征提取的效果。由于玉米病害的样本特征更为接近,可视化效果更佳,本文以玉米灰斑病样本、玉米锈病样本、玉米大斑病样本和健康玉米样本为例进行展示,如图 9 所示,引入卷积注意力机制前,网络对样本特征提取较随机,对叶片病害区域特征点关注不够。引入 CBAM 卷积注意力机制后,网络在前向传播过程中,重要特征通道逐渐占有更大的比重,能让网络学习到需重点关注的部分,使改进的 YOLOX-Nano 模型可以更高效地提取图像难区分的特征信息。2.1.

48、2训练引入 Mixup 数据增强策略使用Mixup 数据增强策略训练的网络模型单张样本图片检测时间较改进前平均减少了 4ms,其检测准确率却增加了 1.02 个百分点,一方面减少了检测推断所用时间,另一方面可以提高对农作物病害检测精度,可见引入 Mixup 数据增强策略扩充数据集可以提升农作物病害检测的效率,模型可以训练更充分,减少推断时间。2.1.3引入 FocalLoss 损失函数试验由式(6)可知,调节因子 可以控制样本对损失的贡献,从而影响到病害分类的性能。试验中通过调节 值来检测病害分类的效果,试验结果表明,取 0 时 mAP为 97.97%,取 1 时 mAP 为 98.69%,取

49、 2 时mAP 为 99.02%,取 3 时 mAP 为 98.42%,取4 时 mAP 为 97.32%,mAP 随 值的增大呈现先升高后降低的趋势,当 设置为 2 时,mAP 最大,检测效果最好。图 10a、10b 是选取 为 2 时 FocalLoss 损失函数和原 BCELoss 损失函数在训练和测试阶段的分类损失的变化曲线,可以发现,改进后的YOLOX-Nano分类损失总体趋势都是低于 YOLOX-Nano 的。改进后的 YOLOX-Nano 网络训练到 100 个迭代结束,训练和测试阶段均呈现出持续下降的趋势,且还存在下降空间,说明网络仍在学习,分类精度仍有上升的可能性,而曲线逐渐

50、趋于稳定,说明网络过拟合已经没有学习必要。玉米灰斑病Corn Cercospora zeaemaydisTehon and Daniels玉米锈斑病Corn Pucciniapolysora玉米大斑病Corn Curvularia leafspot fungus健康玉米叶片Corn healthy leaf原图Originalpicture未经 CBAM 卷积注意力机制处理的特征提取热力图Characteristic extraction thermogramwithout processing of the CBAMconvolution attention mechanism经过 CBAM

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服