1、第8期余胜 等:基于迁移学习和卷积视觉转换器的农作物病害识别研究1 9 1 D O I:1 0.1 3 7 3 3/j.j c a m.i s s n.2 0 9 55 5 5 3.2 0 2 3.0 8.0 2 6余胜,谢莉.基于迁移学习和卷积视觉转换器的农作物病害识别研究J.中国农机化学报,2 0 2 3,4 4(8):1 9 1-1 9 7Y u S h e n g,X i e L i.R e s e a r c h o n p l a n t d i s e a s e i d e n t i f i c a t i o n b a s e d o n t r a n s f e r
2、l e a r n i n g a n d c o n v o l u t i o n a l v i s i o n t r a n s f o r m e r J.J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o n,2 0 2 3,4 4(8):1 9 1-1 9 7基于迁移学习和卷积视觉转换器的农作物病害识别研究*余胜,谢莉(韶关学院信息工程学院,广东韶关,5 1 2 0 0 5)摘要:农作物病虫害对粮食生产和质量都有很大影响。针对当前传统的农作物病害识别过程中主要依赖人工特征
3、提取,且真实环境下采集的病害图像样本数目较少,识别方法鲁棒性差、分类准确率偏低等问题,基于迁移学习提出了以卷积操作预处理图像子块的视觉转换器(V i s i o n T r a n s f o r m e r,V i T)模型用于农作物病害识别。在V i T模型结构的基础上引入卷积操作对输入图像进行预处理,卷积操作能提高获取底层特征的丰富度,进而在V i T学习过程中通过多头注意力机制,加大有用特征的权重,削弱噪声等无用信息的影响,达到模型提高特征学习能力并增强鲁棒性的目的。试验结果表明,利用迁移学习方法在i b e a n数据集上能够提升模型的识别准确率1 0%以上;模型最终在i b e a
4、 n数据集上识别准确率为9 8.1 2%,约有2%的提高,在P l a n t V i l l a g e数据集识别准确率为9 9.9 1%,都达到了当前最佳识别水平。提出的识别方法在复杂背景干扰下具有较高的识别准确率和鲁棒性,可以满足自然条件下的农作物病害识别的要求。关键词:迁移学习;卷积视觉转换器;病害识别;注意力机制中图分类号:S 5:T P 3 9 1.4 文献标识码:A 文章编号:2 0 9 5 5 5 5 3(2 0 2 3)0 80 1 9 1 0 7收稿日期:2 0 2 2年3月7日 修回日期:2 0 2 2年5月1 3日*基金项目:广东省自然科学基金项目(2 0 2 1 A
5、1 5 1 5 0 1 1 8 0 3);韶关市科技计划项目(2 1 0 7 2 8 1 1 4 5 3 0 7 9 6、2 1 0 7 2 8 1 0 4 5 3 0 5 8 6)第一作者:余胜,男,1 9 8 2年生,湖南娄底人,博士,讲师;研究方向为视频图像处理、目标识别与检测。E-m a i l:y s_x ms g u.e d u.c nR e s e a r c h o n p l a n t d i s e a s e i d e n t i f i c a t i o n b a s e d o n t r a n s f e r l e a r n i n g a n dc
6、o n v o l u t i o n a l v i s i o n t r a n s f o r m e rY u S h e n g,X i e L i(S c h o o l o f I n f o r m a t i o n S c i e n c e a n d E n g i n e e r i n g,S h a o g u a n U n i v e r s i t y,S h a o g u a n,5 1 2 0 0 5,C h i n a)A b s t r a c t:T h e p l a n t d i s e a s e s i m p a c t o n b
7、 o t h t h e f o o d p r o d u c t i o n a n d q u a l i t y i n t h e a g r i c u l t u r e s e c t o r.A s t h e p r o b l e m t h a t t r a d i t i o n a l p l a n t d i s e a s e i d e n t i f i c a t i o n m e t h o d s r e l y o n t r a i n i n g s a m p l e d a t a a n d m a n u a l e x t r a
8、 c t i o n o f f e a t u r e s,i t i s d i f f i c u l t t o i d e n t i f y i n t h e f i e l d e n v i r o n m e n t a n d t h e c l a s s i f i c a t i o n a c c u r a c y i s n o t h i g h.B a s e d o n t r a n s f e r l e a r n i n g,t h i s s t u d y p r o p o s e s a C o n v o l u t i o n a l
9、 V i s i o n T r a n s f o r m e r(C V i T)m o d e l t h a t p r e p r o c e s s e s i m a g e s u b-b l o c k s w i t h c o n v o l u t i o n o p e r a t i o n s f o r p l a n t d i s e a s e i d e n t i f i c a t i o n.O n t h e b a s i s o f t h e V i s i o n T r a n s f o r m e r(V i T)m o d e l
10、 s t r u c t u r e,t h e c o n v o l u t i o n o p e r a t i o n i s i n t r o d u c e d t o p r e p r o c e s s i n p u t i m a g e s,t h e c o n v o l u t i o n o p e r a t i o n i m p r o v e s t h e r i c h n e s s o f t h e l o w-l e v e l f e a t u r e s,a n d t h e n i n t h e V i T l e a r n
11、 i n g p r o c e s s,t h e m u l t i-h e a d m e c h a n i s m i s u s e d t o i n c r e a s e t h e w e i g h t o f u s e f u l f e a t u r e s a n d n o i s e s u p p r e s s i o n.S o a s t o a c h i e v e t h e p u r p o s e o f i m p r o v i n g t h e f e a t u r e l e a r n i n g a b i l i t y
12、 a n d e n h a n c i n g t h e r o b u s t n e s s o f t h e m o d e l.T h e e x p e r i m e n t a l r e s u l t s s h o w t h a t u s i n g t h e t r a n s f e r l e a r n i n g m e t h o d o n t h e i b e a n d a t a s e t c a n i m p r o v e t h e r e c o g n i t i o n a c c u r a c y o f t h e m
13、 o d e l b y m o r e t h a n 1 0%.A p p l y i n g t r a n s f e r l e a r n i n g t o t h e C V i T m o d e l a c h i e v e s a r e c o g n i t i o n a c c u r a c y o f 9 8.1 2%o n t h e i b e a n d a t a s e t,a n i m p r o v e m e n t o f a b o u t 2%.T h e r e c o g n i t i o n a c c u r a c y i
14、 n t h e P l a n t V i l l a g e d a t a s e t i s 9 9.9 1%.T h e p r o p o s e d r e c o g n i t i o n m e t h o d h a s h i g h r e c o g n i t i o n a c c u r a c y a n d r o b u s t n e s s u n d e r c o m p l e x b a c k g r o u n d i n t e r f e r e n c e,a n d c a n m e e t t h e r e q u i r
15、e m e n t s o f p l a n t d i s e a s e i d e n t i f i c a t i o n u n d e r n a t u r a l c o n d i t i o n s.K e y w o r d s:t r a n s f e r l e a r n i n g;c o n v o l u t i o n a l v i s i o n t r a n s f o r m e r;p l a n t d i s e a s e i d e n t i f i c a t i o n;a t t e n t i o n m e c h a
16、n i s m第4 4卷 第8期2 0 2 3年8月中国农机化学报J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o nV o l.4 4 N o.8A u g.2 0 2 31 9 2 中国农机化学报2 0 2 3年0 引言粮食安全是国家安全的基础,而农作物疾病的防控是影响粮食安全的一个重要因素,及时准确地识别病害种类可以为农业生产提供有效的专业指导,从而提高农作物产量,减少经济损失12。在农作物病害识别中,传统机器学习方法将识别过程分为图像预处理、图像特征提取和分类三个步骤,其中特征
17、提取的结果是整个识别方法的基础,但特征提取方法往往需要丰富的经验和反复的试验,存在一定的主观性34。同时农作物病害图像存在背景复杂、病害目标区域不明显等特点,增加了特征提取与分类的难度。因此,基于传统机器学习的农作物病害疾病识别方法难以处理背景复杂的病害数据,且泛化能力较弱。随着硬件设备计算能力的提升和人工智能技术的飞速发展,深度学习在各行各业都取得了非常优异的成绩,如人脸识别、机器翻译和行人检测与识别等方面。在农作物病害识别方面,基于深度学习的识别方法相比于传统机器学习方法在识别准确率和识别速度上同样有很大的提升;在图像分类识别方面,卷积神经网络(C o n v o l u t i o n
18、a l n e u r a l n e t w o r k s,C NN s)是分类识别效果最佳的深度学习方法之一56;在农作物病害识别方面,C NN s也取得了较好的分类识别效果71 0。洪惠 群 等7为 了 扩 大 网 络 模 型 的 适 用 场 景,将S h u f f l e N e t网络中的R e L U激活函数用L e a k y R e L U激活函数代替,构建了轻量级神经网络用于农作物病害的识别。孟亮等8则以残差单元为基本网络结构设计了轻量级C NN s用于农作物病害识别。M o h a n t y等4构建了基于C NN s的识别模型,在P l a n t V i l l a
19、 g e数据集9上的识别准确率达到9 9.3%。马浚诚等1 0针对温室场景下黄瓜病害的卷积神经网络识别方法的平均准确率为9 5.7%。卷积神经网络强大的特征自主学习能力在农作物病害的识别方面取得了不错的成绩,但也存在卷积神经网络训练参数量大、网络收敛速度慢、严重依赖于训练样本 数 据 量 等 不 足。近 年 来,迁 移 学 习(T r a n s f e r L e a r n i n g,T L)1 11 3使得网络模型能快速适应目标学习任务,可以有效缓解过拟合,提升模型性能。赵恒谦等1 1提出迁移学习与分步识别相结合实现对农作物病害种类的识别。张建华等1 2将I m a g e N e t
20、-1 K数据集上预训练的VG G模型迁移到棉花病害数据集上,但I m a g e N e t-1 K数据集与棉花病害数据集相似度不大,迁移学习的知识没能很好地应用到目标数据集,最终识别准确率提升不明显。赵立新等1 3则首先在P l a n t V i l l a g e数据集上对模型进行预训练,然后在目标数据集棉花病害数据上对参数进行微调,获得平均9 3.5%的识别准确率。王东方等1 4基于迁移学习和残 差 网 络 提 出 农 作 物 病 害 识 别 模 型T L-S E-R e s N e X t-1 0 1,在真实环境下病害农作物的识别准确率明显高于未采用迁移学习的模型。以上的研究表明基于
21、深度学习的农作物病害的识别准确率和鲁棒性方面都要远远优于传统机器学习的方法,但当前基于卷积神经网络的方法大多是在背景单一的图像数据集上训练学习和测试。在真实环境的农作物病害识别过程中,由于受各种噪声的干扰,实际的识别准确率会大大降低,难以满足实际应用的需求。2 0 1 7年G o o g l e的 机 器 翻 译 团 队 成 员V a s w a n i等1 5完全抛弃卷积神经网络和递归神经网络结构,仅采用注意力机制实现机器翻译任务,并取得当时的最佳效果。受V a s w a n i1 5的启发,D o s o v i t s k i y等1 6尝试将T r a n s f o r m e r
22、应 用 到 计 算 机 视 觉 领 域,提 出V i s i o n T r a n s f o r m e r(V i T)模型。V i T包含输入图像分块、展平成序列、T r a n s f o r m e r编码和分类识别等模块,不依赖卷积神经网络结构,对噪声的干扰有很好的鲁棒 性,在 图 像 分 类 任 务 上 达 到 了 很 好 的 效 果,I m a g e N e t-1 K上的分类准确率达到8 8.5 5%。针对实际应用场景中包含复杂背景信息的农作物病害识别问题,本文在现有研究基础上,提出一种迁移学习与卷积视觉转换器(C o n v o l u t i o n a l V i
23、s i o n T r a n s f o r m e r,C V i T)模型相结合的农作物病害识别方法。1 病害识别模型1.1 卷积视觉转换器模型结构标准的T r a n s f o r m e r结构用于自然语言处理,输入为一维的标记嵌入(t o k e n e m b e d d i n g)向量。为有效处理输入图像,D o s o v i t s k i y等1 6首先将输入尺寸为2 2 42 2 4的图像共划分为互不重叠的1 9 6个1 61 6大小的图像块;然后通过线性投影变换将各图像块映射到7 6 8维度的一维向量;最后将1 9 67 6 8特征矩阵输入到T r a n s f
24、 o r m e r结构。而在实现农作物病害识别时,不同种类病害的表观特征往往仅有细微的表观区别,有效学习到病害图像的细粒度特征对农作物病害的识别至关重要。为此,将卷积 操 作 引 入 到V i T设 计 了 卷 积 视 觉 转 换 器(C o n v o l u t i o n a l V i s i o n T r a n s f o r m e r,C V i T)C V i T模型,其整体框图如图1所示。对比V i T模型中的线性映像操作,本文设计了一个用卷积层组来实现输入图像映射到二维特征矩阵的过程。卷积模块共包含N层卷积,输入图像经过N层卷积操作后将映射到1 41 47 6 8的特
25、征空间,并作为T r a n s f o r m e r结构的输入。第8期余胜 等:基于迁移学习和卷积视觉转换器的农作物病害识别研究1 9 3 图1 C V i T模型的结构框图F i g.1 A r c h i t e c t u r e f o r C V i T1.2 注意力机制注意力机制可以描述为将一个查询和一组键值对映射到一个输出,其中查询、键、值和输出都是向量。输出值通过加权总和计算得到,其中分配给每个值的权重由查询与相应键的兼容性函数计算。根据兼容性函数的不同,可以设计出不同的注意力机制,本文采用文献1 5 设计的缩放点乘注意机制。缩放点乘注意机制的结构如图2所示。图2 缩放点乘
26、注意机制F i g.2 S c a l e d d o t-p r o d u c t a t t e n t i o n输入由查询q、键k和值v组成。计算查询与所有键的点积,并将每个键除以dk,最后采用S o f t m a x函数来获得值的权重。在具体实现过程中为提升计算效率,一般同时计算一组查询的注意力函数并写成矩阵形式Q,键和值同样写成矩阵K和V,KT表示矩阵K的转置,注意力值的计算如式(1)所示。A t t e n t i o n(Q,K,V)=s o f t m a xQKTdk V(1)1.3 多头注意力机制在实际应用中,根据给定相同的查询、键和值的集合时,模型能基于注意力机制学
27、习到不同的目标特征信息,然后把不同的目标特征信息组合,捕获图像内多种信息间的依赖关系,达到提升模型识别性能的目的。传统注意力机制仅仅关注单一方面的注意力信息,为了从不同角度关注到不同的关键特征,V a s w a n i等1 5提 出 了 多 头 注 意 力 机 制(M u l t i-H e a d A t t e n t i o n,MHA)。多头注意力机制首先独立学习得到h组不同的线性投影矩阵来变换查询、键和值;然后将h组变换后的查询、键和值将并行输入到注意力汇聚模块;最后将这h个注意力汇聚的输出串接在一起,并且通过另一个可以学习的线性投影进行变换得到最终的输出,具体计算过程如图3所示。
28、图3 多头注意机制F i g.3 M u l t i-h e a d a t t e n t i o n首先通过线性变换将Q、K、V映射到新的子空间,然后使用缩放点乘注意机制进行计算,其中第i个注意力机制的计算结果计为h e a di。h e a di=A t t e n t i o n(QWQi,KWKi,VWVi)(2)其中 各 映 射 参 数 矩 阵WQi dm o d e ldk,WKidm o d e ldk,WVi dm o d e ldv。然后按式(3)将所有注意力机制的计算结果级联,同时再次使用线性变换转回原来的空间。M u l t i H e a d(Q,K,V)=C o n
29、 c a t(h e a d1,h e a dn)WO(3)其中映射参数矩阵WOi h dvdm o d e l。本文根据文献 1 5 的 参 数 设 定 方 法,选 择h=8,dk=dv=dm o d e l/h=6 4。2 试验结果与分析2.1 农作物病害数据集本文试验在P l a n t V i l l a g e9和i b e a n1 7两个公共1 9 4 中国农机化学报2 0 2 3年数据集上完成。1)公共数据集P l a n t V i l l a g e。P l a n t V i l l a g e数据集共收集了1 4个物种3 8个分类和1个不包含植物叶片图像的背景类别共5
30、43 0 6张农作物叶片图像,各个子类的图像从2 7 5到5 3 5 7张不等,存在一定程度的样本分布不均衡问题。所有图像都是在实验室条件下采集,背 景 单 一,图 像 分 辨 率 为2 5 6像 素2 5 6像素。P l a n t V i l l a g e数据集部分样本数据如图4所示。图4 P l a n t V i l l a g e数据集图像样例F i g.4 S a m p l e i m a g e s f r o m P l a n t V i l l a g e d a t a s e t 2)i b e a n数据集。i b e a n数据集是由M a k e r e r
31、e A I实验室与负责乌干达农业研究的国家机构国家作物资源研究所(N a C R R I)合作在乌干达不同地区实地拍摄的叶子图像。数据集包含健康叶子图像、角斑病和豆锈病3个类别,其中训练集包含10 3 5个数据样本,验证集包含1 3 3个样本,测试集包含1 2 8个样本。i b e a n数据集是在田间拍摄,包含背景较复杂,符合实际应用环境,图5所示为部分样本数据。(a)角斑病(b)豆锈病(c)健康图5 i b e a n数据集图像样例F i g.5 S a m p l e i m a g e s f r o m i b e a n d a t a s e t2.2 试验平台在进行模型的训练中
32、,试验的硬件配置情况为I n t e l C o r e i 5-6 6 0 0 K C P U,T I T AN X显卡,6 4G内存。软件系统为U b u n t u 1 8.0 4操作系统,T e n s o r f l o w深度学习平台,并使用C UD A和c u D NN作为支持。2.3 评价指标准确率(A c c u r a c y)常作为分类模型的一个主要评价指标,但当样本数据不均衡时,准确率高低主要受占 比 大 的 类 别 影 响。因 此,本 文 通 过 准 确 率A c c u r a c y、查准率P r e c i s i o n、查 全率R e c a l l和F1值
33、四个指标评价模型 的 性 能,各 指 标 定 义 如 式(4)式(7)所示。A c c u r a c y=T P+TNT P+TN+F P+FN1 0 0%(4)P r e c i s i o n=T PT P+F P1 0 0%(5)R e c a l l=T PT P+FN1 0 0%(6)F1=2P r e c i s i o nR e c a l lP r e c i s i o n+R e c a l l(7)式中:T P 真实值为正且预测为正的数目;FN 真实值为真而预测值为负的数目;TN 真实值为负且预测也为负的数目;F P 真实值为负但预测为正的数目。2.4 卷积层组结构的选
34、择卷积层组的主要作用是将图像转换为视觉转换模块的输入,同时为对比增加卷积层后与原V i T模型的性能,本文设计的C V i T模型的卷积层组最后的特征映射都统一为1 41 47 5 6,即与标准V i T模型视觉转换模块的输入维度一样。表1为本文对比试验的3种 卷 积 层 组 结 构,表2为 不 同 卷 积 层 结 构 在P l a n t V i l l a g e和i b e a n两个数据集上采用迁移学习方法所获得的识别准确率。对比3种卷积层组的网络结构发现,在仅采用1个卷积层的情况下,两个数据集上都获得最高的识别准确率;当增加到3个卷积层时,准确率都有明显的下降。原因可能是单层1 61
35、 6卷积核的卷积操完成第8期余胜 等:基于迁移学习和卷积视觉转换器的农作物病害识别研究1 9 5 了图像块的非线性映射,同时大尺度的卷积核可以较好地保留了图像的底层结构特征,这有利于V i T模型在此基础上实现高层语义特征的抽象。因此,本文设计的C V i T模型采用的是单层卷积输入的结构模型。表1 卷积层组结构T a b.1 A r c h i t e c t u r e s o f c o n v o l u t i o n a l l a y e r g r o u pA r c h i t e c t u r e 1A r c h i t e c t u r e 2A r c h i
36、t e c t u r e 3C o n v.1S t r i d eP a d d i n gO u t p u t s i z e1 61 67 5 61 601 41 41 61 63 7 8842 82 81 11 11 8 9405 45 4C o n v.2S t r i d eP a d d i n gO u t p u t s i z e557 5 6221 41 4333 7 8212 72 7C o n v.3S t r i d eP a d d i n gO u t p u t s i z e337 5 6211 41 4表2 不同卷积层组结构的识别准确率T a b.2
37、A c c u r a c y o f d i f f e r e n t c o n v o l u t i o n a l a r c h i t e c t u r e s数据集识别准确率/%A r c h i t e c t u r e 1A r c h i t e c t u r e 2A r c h i t e c t u r e 3P l a n t V i l l a g e9 9.9 19 9.8 99 9.8 0i b e a n9 8.1 29 7.5 69 6.5 32.5 训练过程中的模型准确率与损失值将C V i T、R e s N e t-5 0和E f f i
38、c i e n t N e t-b 0三个模型在P l a n t V i l l a g e数据集上的试验如图6所示,各模型都是迭代训练3 0个E p o c h。在P l a n t V i l l a g e数据集 上,除 用I m a g e N e t-1 K数 据 集 预 训 练 后 的E f f i c i e n t-b 0模型在前1 4个E p o c h迭代的准确率和损失值有较多波动外,其他模型的收敛速度都比较快,各模型的准确率最终达到9 9.5 0%以上。但C V i T模型在采取迁移学习方法后,迭代到第3个E p o c h时准确率达到了9 9.5 2%,收敛速度要快于
39、其它模型,说明在使用迁移学习后,模型在预训练过程中学习到了图像识别的公共特征,然后在目标数据集中能快速针对具体目标任务学习到对应的特征信息,实现目标数据集下的识别任务,达到节约模型的训练时间、提升识别性能的目的。i b e a n数据库中测试集上的准确率和损失值如图7所示,除使用采取迁移学习的C V i T和R e s N e t-5 0两个模型在迭代到第5个E p o c h后达到收敛,其它模型在前3 0个E p o c h的准确率和损失值波动都比较大,没能达到收敛状态。(a)测试集准确率(b)测试集损失值图6 P l a n t V i l l a g e数据集上的准确率与损失值F i g
40、.6 A c c u r a c y a n d l o s s f o r P l a n t V i l l a g e d a t a s e t(a)测试集准确率(b)测试集损失值图7 i b e a n数据集上的准确率和损失值F i g.7 A c c u r a c y a n d l o s s f o r i b e a n d a t a s e t导致该结果的可能有如下3个原因:(1)i b e a n数据集是在真实环境下采集,图像背景较复杂;(2)i b e a n数据集样本数目偏少,远小于P l a n t V i l l a g e数据集;(3)部分角斑病和锈斑病图像
41、差距细微,难以辨别。但采取迁移学习后的C V i T模型有较好的收敛过程,且达到了最高识别准确率9 8.1 2%,这说明设计的C V i T1 9 6 中国农机化学报2 0 2 3年模型使用迁移学习的方法后,在样本量少的情况下也能够从复杂的背景中学习到目标对象的细微特征信息,从而达到提高识别准确率的目标。2.6 数据集中各子类的性能比较为了解迁移学习过程中C V i T模型对各子类的分类情况,试验中保存训练过程中训练好的最佳模型,然后用最佳模型对测试数据集进行测试,表3为P l a n t V i l l a g e测试集中各子类的查准率、查全率和F1值。表3 P l a n t V i l
42、l a g e测试集的各子类查准率、查全率、F1值T a b.3 P r e c i s i o n,r e c a l l a n d F1 v a l u e o f C V i T o n P l a n t V i l l a g e d a t a s e t f o r e a c h c l a s s农作物种类病害类别查准率查全率F1值苹果黑心病1.0 0 0 01.0 0 0 01.0 0 0 0黑腐病1.0 0 0 01.0 0 0 01.0 0 0 0锈病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0背景
43、背景1.0 0 0 01.0 0 0 01.0 0 0 0蓝莓健康叶1.0 0 0 01.0 0 0 01.0 0 0 0樱桃白粉病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0玉米灰斑病1.0 0 0 00.9 6 0 80.9 8 0 0锈病1.0 0 0 01.0 0 0 01.0 0 0 0北方叶枯病0.9 8 0 01.0 0 0 00.9 8 9 9健康叶1.0 0 0 01.0 0 0 01.0 0 0 0葡萄黑腐病1.0 0 0 01.0 0 0 01.0 0 0 0黑痘病1.0 0 0 01.0 0 0 01
44、.0 0 0 0叶枯病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0橘子黄龙病1.0 0 0 01.0 0 0 01.0 0 0 0桃子细菌性斑点1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0辣椒细菌性斑点1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0土豆早疫病1.0 0 0 01.0 0 0 01.0 0 0 0晚疫病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0
45、 01.0 0 0 01.0 0 0 0覆盆子健康叶1.0 0 0 01.0 0 0 01.0 0 0 0黄豆健康叶1.0 0 0 01.0 0 0 01.0 0 0 0南瓜白粉病1.0 0 0 01.0 0 0 01.0 0 0 0叶焦病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0番茄细菌性斑点1.0 0 0 01.0 0 0 01.0 0 0 0早疫病1.0 0 0 00.9 7 0 00.9 8 4 8晚疫病0.9 9 4 81.0 0 0 00.9 9 7 4叶霉菌病1.0 0 0 01.0 0 0 01.0 0 0
46、 0七叶虫斑病0.9 9 4 41.0 0 0 00.9 9 7 2二斑叶螨病1.0 0 0 01.0 0 0 01.0 0 0 0靶点病0.9 9 2 91.0 0 0 00.9 9 6 4黄曲叶病1.0 0 0 01.0 0 0 01.0 0 0 0花叶病1.0 0 0 01.0 0 0 01.0 0 0 0健康叶1.0 0 0 01.0 0 0 01.0 0 0 0平均值0.9 9 9 00.9 9 8 20.9 9 8 6 从表3可以看出,各个类别的查准率和查全率以及F1值都比较高,出错相对较多的是玉米北方叶枯病、玉米灰斑病、番茄早疫病和晚疫病。通过对识错图片的比对分析发现,玉米北方叶
47、枯病和灰斑病、番茄早疫病和晚疫病的图像相似度较高,容易出现误判的情况。表4为i b e a n数据集在测试数据上的试验结果,平均查准 率为0.9 4 61,平 均 查 全 率 为0.9 4 54,平 均F1值 为0.9 4 56。试 验 结 果 表 明 基 于 迁 移 学 习 的C V i T模型在真实环境下,可以较高效的完成农作物病害的识别工作。表4 i b e a n测试集的各分类查确率、查全率、F1值T a b.4 P r e c i s i o n,r e c a l l a n d F1 v a l u e o f C V i T o n i b e a n d a t a s e
48、t f o r e a c h c l a s s病害类别查准率查全率F1值角斑病0.9 5 3 50.9 5 3 50.9 5 3 5锈病0.9 0 9 10.9 3 0 20.9 1 9 5健康叶0.9 7 5 60.9 5 2 40.9 6 3 9平均值0.9 4 6 10.9 4 5 40.9 4 5 62.7 各模型最佳准确率为了验证本文识别方法的有效性,在P l a n t V i l l a g e和i b e a n两个数据集上与当前最佳网络模型进行对比,试验结果如表5所示。基于迁移学习的C V i T模型在P l a n t V i l l a g e中 准 确 率 高 于V
49、 i T模 型0.3 3%,比R e s N e t-5 0模 型 的 准 确 率 高0.2 8%,也 高 于E f f i c i e n t-b 7模型0.0 5%。在i b e a n数据集中,本文提出模 型 的 测 试 准 确 率 高 于V i T模 型0.4 6%和E f f i c i e n t-b 7模型0.6 8%。试验表明,本文提出的模型在两个数据集上都获得了最高准确率9 9.9 1%和9 8.1 2%。表5 P l a n t V i l l a g e和i b e a n数据集上不同模型的平均准确率T a b.5 A v e r a g e a c c u r a c
50、y w i t h p r e v i o u s s t a t e-o f-t h e-a r t m e t h o d s i n P l a n t V i l l a g e a n d i b e a n d a t a s e t s%分类模型迁移学习无迁移学习P l a n t V i l l a g e i b e a n P l a n t V i l l a g e i b e a nR e s N e t-5 09 9.6 39 7.6 69 7.2 98 1.2 5E f f i c i e n t N e t-b 01 89 9.8 1*9 6.8 89 9.1
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100