1、第2 4卷 第5期空 军 工 程 大 学 学 报V o l.2 4 N o.52 0 2 3年1 0月J OURNA L O F A I R F O R C E E NG I N E E R I NG UN I V E R S I T YO c t.2 0 2 3收稿日期:2 0 2 3-0 5-2 6基金项目:陕西省自然科学基础研究计划(2 0 2 3-J C-QN-0 6 9 6)作者简介:渠 逸(2 0 0 0-),男,内蒙古赤峰人,硕士生,研究方向为表面微缺陷智能检测技术。E-m a i l:s t r s k y 7 7 81 6 3.c o m通信作者:汪 诚(1 9 7 4-),
2、男,江苏扬州人,教授,博士生导师,研究方向为航空测试技术与表面强化。E-m a i l:v a l i d_0 11 6 3.c o m引用格式:渠逸,汪诚,余嘉博,等.基于YO L O v 5的表面缺陷检测优化算法J.空军工程大学学报,2 0 2 3,2 4(5):8 0-8 7.QU Y i,WAN G C h e n g,YU J i a b o,e t a l.O p t i m i z e d A l g o r i t h m f o r S u r f a c e D e f e c t D e t e c t i o n B a s e d o n YO L O v 5J.J
3、o u r n a l o f A i r F o r c e E n g i n e e r i n g U n i v e r s i t y,2 0 2 3,2 4(5):8 0-8 7.基于Y O L O v 5的表面缺陷检测优化算法渠 逸,汪 诚*,余嘉博,孔亚康,陈贤聪(空军工程大学基础部,西安,7 1 0 0 5 1)摘要 快速、准确地检测材料表面缺陷已成为各领域研究的重要目标,为增加检测效率,实现设备轻量化,提出了一种基于YO L O v 5的目标检测优化算法,添加D y H e a d检测头,融合多个注意力机制,增强模型的检测精度;更换a L R P L o s s损失函数,
4、减少超参数调节工作,优化训练过程;基于F a s t e r N e t提出C 3-F a s t e r,代替网络中的C 3模块,以P C o n v的思想提升模型检测性能,减少模型体积;最后添加轻量级上采样算子C A-R A F E,扩大模型感受野,提升对不同大小目标的检测效果。实验结果表明,改进后的YO L O v 5模型相比于原版模型,在钢材表面缺陷数据集上总体平均精度提高了4.1 7 4%,参数量减少了1 1.2 5%,计算复杂度减少了1 3.7 5%,权重体积减少了1 0.7 2%,检测性能高于S S D、R e t i n a N e t、F C O S、YO L O v 3、Y
5、O L O v 4等主流目标检测算法,在工业检测中具有较高的应用价值。关键词 目标检测;YO L O v 5;钢材表面缺陷D O I 1 0.3 9 6 9/j.i s s n.2 0 9 7-1 9 1 5.2 0 2 3.0 5.0 1 0中图分类号 T P 3 9 1.4 1 文献标志码 A 文章编号 2 0 9 7-1 9 1 5(2 0 2 3)0 5-0 0 8 0-0 8O p t i m i z e d A l g o r i t h m f o r S u r f a c e D e f e c t D e t e c t i o n B a s e d o n Y O L
6、O v 5QU Y i,WANG C h e n g*,YU J i a b o,KONG Y a k a n g,CHE N X i a n c o n g(F u n d a m e n t a l s D e p a r t m e n t,A i r F o r c e E n g i n e e r i n g U n i v e r s i t y,X ia n 7 1 0 0 5 1,C h i n a)A b s t r a c t T h e r a p i d a n d a c c u r a t e d e t e c t i o n o f s u r f a c e
7、 d e f e c t s i n m a t e r i a l s h a s b e c o m e a n i m p o r t a n t o b j e c-t i v e a c r o s s v a r i o u s r e s e a r c h d o m a i n s.T o e n h a n c e d e t e c t i o n e f f i c i e n c y a n d r e a l i z e l i g h t w e i g h t e q u i p m e n t,t h i s p a p e r p r o p o s e s
8、 a t a r g e t d e t e c t i o n o p t i m i z a t i o n a l g o r i t h m b a s e d o n YO L O v 5,a d d i n g D y H e a d d e t e c t i o n h e a d t o e n h a n c e t h e d e t e c t i o n a c c u r a c y o f t h e m o d e l b y f u s i n g m u l t i p l e a t t e n t i o n m e c h a n i s m s;r
9、e p l a c i n g t h e a L R P L o s s l o s s f u n c t i o n t o r e d u c e t h e h y p e r p a r a m e t e r a d j u s t m e n t w o r k a n d o p t i m i z e t h e t r a i n i n g p r o c e s s;p r o p o s e C 3-F a s t e r b a s e d o n F a s t e r N e t t o r e p l a c e t h e C 3 m o d u l e
10、i n t h e n e t w o r k t o i m p r o v e t h e m o d e l d e t e c-t i o n p e r f o r m a n c e a n d r e d u c e t h e m o d e l s i z e w i t h t h e i d e a o f P C o n v;f i n a l l y a d d t h e l i g h t w e i g h t u p s a m p l i n g o p e r a t o r C A R A F E t o e x p a n d t h e m o d
11、e l p e r c e p t u a l f i e l d a n d i m p r o v e t h e d e t e c t i o n e f f e c t o n t a r g e t s o f d i f-f e r e n t s i z e s.T h e e x p e r i m e n t a l r e s u l t s s h o w t h a t t h e i m p r o v e d YO L O v 5 m o d e l i m p r o v e s t h e o v e r a l l a v e r-a g e a c c u
12、 r a c y b y 4.1 7 4%,r e d u c e s t h e p a r a m e t e r v o l u m e b y 1 1.2 5%,r e d u c e s t h e c o m p u t a t i o n a l c o m p l e x i-t y b y 1 3.7 5%,a n d r e d u c e s t h e w e i g h t v o l u m e b y 1 0.7 2%o n t h e s t e e l s u r f a c e d e f e c t d a t a s e t c o m p a r e
13、d w i t h t h e o r i g i n a l m o d e l,a n d t h e d e t e c t i o n p e r f o r m a n c e i s a l s o h i g h e r t h a n t h a t o f S S D,R e t i n a N e t,F C O S,YO L O v 3,a n d YO L O v 4 a n d o t h e r m a i n s t r e a m t a r g e t d e t e c t i o n a l g o r i t h m s,w h i c h h a v
14、e h i g h a p p l i c a t i o n v a l u e i n i n d u s t r i a l d e t e c t i o n.K e y w o r d s o b j e c t d e t e c t i o n;YO L O v 5;s t e e l s u r f a c e d e f e c t s 随着现代工业的发展,各行业对金属材料性能的把控能力愈加重要,钢材作为目前产量最高、应用最广的金属材料,在交通运输、机械制造、航空航天和国防工业等领域其他金属材料是无法替代的。随着我国工业水平的迅速发展,市场需求不断变化,各领域对钢材的质量要求
15、也在不断提升。钢材在生产制造的过程中,受到生产设备、工艺水平等因素制约,钢材表面会产生如裂纹、划痕、凹坑、斑块等无规律的缺陷1,导致在后续应用中,材料的力学性能、抗腐蚀性、抗磨损性能都会有不同程度地下降,严重的缺陷甚至会引发安全事故2。因此,探索一种准确、高效率的表面缺陷检测方法成为了当前工业发展的迫切需求。近年来,随着深度学习的发展,计算机视觉广泛应用在各个领域,对材料表面的目标检测是计算机视觉中重要的一环,该项技术大幅降低了人工成本,相较于传统人工检测手段具有稳定、高效、准确度高等优势。当前基于深度学习的目标检测算法主要分为o n e-s t a g e和t w o-s t a g e 2
16、种。o n e-s t a g e目标检测算法的检测 速度快,但 精度相对较 低,代表算法 有S S D3、YO L O4等。t w o-s t a g e目标检测算法检测精度较高,但检测速度慢,以F a s t R-C NN5、F a s t e r R-C NN6、M a s k R-C NN7等为代表。对于一般的物体表面缺陷检测,o n e-s t a g e目标检测算法的精度已经可以满足检测需求,又因为其具有更高的速度,所以被广泛应用8。YO L O网络作为o n e-s t a g e检测算法里最受欢迎的系列,近年来被大量学者使用和优化。F a n g等9通过改进的YO L O v
17、3算法实现了对金属表面的缺陷检测,通过对输入端的图像进行处理和损失函数优化提升了检测效果。李维刚等1 0使用加权K-m e a n s聚类算法,并通过融合浅层特征与深层特征的方式改进了YO L O v 3网络,在带钢表面缺陷数据集上的检测精度比原始网络提高了1 1%。L i等1 1通过构建全卷积YO L O检测网络检测带钢表面缺陷,为此类检测提供了端到端的检测方案,并取得了9 7.5 5的mA P。Z h a n g等1 2提出了改进的YO L O v 5算法,该算法在原有算法的基础上增加了微尺度检测层,并加入了C B AM关注机制,以控制小目标缺陷等缺陷的特征信息丢失。大量研究已经初步使目标
18、检测的精度和检测速度得到提升,但各类材料的应用场景变化较大,为满足各类环境下个人检测任务需求,检测设备需尽可能轻量化。在此基础上,本文针对工业应用场景,以提升检测精度与速度、减小模型体积为目标,提出了改进的YO L O v 5算法,并在N E U-D E T数据集上进行测试。1 实验基础1.1 数据集本文所涉及的实验数据集均采用东北大学宋克臣团队制作的钢材表面缺陷数据集(N E U-D E T),数据集内包含6个缺陷类别:c r a z i n g,i n c l u s i o n,p a t-c h e s,p i t t e d s u r f a c e,r o l l e d i n
19、 s c a l e,s c r a t c h e s,每类缺陷3 0 0张识别图像,各类别的缺陷标注信息通过x m l文件保存,共计1 8 0 0张灰度图像,4 1 8 9个检测缺陷边界框。将数据集内1 8 0 0张图像按照811的比例划分为训练 集、验证集 和测试集,得 到训练图片1 4 4 0张,验证图片和测试图片各1 8 0张,数据集内各类缺陷图片如图1所示,其中缺陷目标所在位置位于红框标注处。(a)c r a z i n g (b)i n c l u s i o n (c)p a t c h e s(d)p i t t e d s u r f a c e (e)r o l l e
20、d i n s c a l e (f)s c r a t c h e s图1 数据集部分图片1.2 Y O L O v 5YO L O是 一 种 通 用 的o n e-s t a g e目 标 检 测 算法,侧重于推理速度,被广泛应用在图像或视频的目标分类、定位工作中。迄今为止,学者通过不断改 进,发 布 了 各 种 版 本 的YO L O模 型,其 中YO L O v 5便是在YO L O v 4的基础上改进而来,其在输入端的模型训练阶段加入了M o s a i c数据增强、自适应图片缩放和锚框计算功能;融合了F o-c u s结构与C S P结构改进了基准网络;在N e c k部18第5期
21、 渠逸,等:基于YO L O v 5的表面缺陷检测优化算法分添加了F P N+P AN结构;改进了预测筛选框的D I o U NM S和训练时的G I OU L o s s,对比前代在精度和速度上都得到了很大提升。YO L O v 5目前已经更新到7.0版本,根据不同的使用场景,有n/s/m/l/x 5个模型可以使用,由n至l版本,模型大小和运算量逐步增加,精度也同时提高。根据本文的实验对象,经过对比试 验 后,采 用 体 积 相 对 较小、速度较快的s版本模型。2 算法改进2.1 添加目标检测头D y H e a d是由D a i等1 3提出的一种基于注意力机制的目标检测头,通过将多头s e
22、 l f-a t t e n t i o n注意力机制结合在尺度感知的特征层、空间感知的空间位置、任务感知的输出通道处,并将其统一在一个框架内,以此在没有多余算力开销的情况下有效提升目标检测头的检测性能。其结构如图2所示。从图2可以看出,D y H e a d将尺度注意力、空间注意力和任务注意力叠加在了一个模块内,将H e a d部分的输入,也就是G e n e r a l V i e w视为一个三维的t e n s o r,其中L为不同尺度(即不同层次和阶段)的特征图;S为空间位置信息,也就是特征图的宽高乘积;C为通道信息。D y H e a d使用分离式的注意力机制,使以上每个维度都能独立
23、通过注意力机制进行特征感知,3个注意力机制如下:1)S c a l e-a w a r e A t t e n t i o n为添加在l e v e l维度的尺度感知注意力,不同l e v e l的特征图所对应的目标尺度也不同,该机制的引入可以增强模型的尺度感知能力。2)S p a t i a l-a w a r e A t t e n t i o n为添加在s p a t i a l维度的空间感知注意力,当空间位置发生变化,所对应的便是检测目标的几何变换,该机制的引入可以增强模型的空间位置感知能力。3)T a s k-a w a r e A t t e n t i o n为添加在c h a
24、n n e l维度的任务感知注意力,不同的c h a n n e l所对应的检测任务也不同,该机制的引入可以增强模型对不同任务的感知能力。图2 D y H e a d结构2.2 改用a L R P L o s s一般的目标检测任务需要通过结合平衡超参数,来联合优化分类目标与定位目标,但这种方法在定位任务和分类任务之间缺乏关联,无法同时兼顾定位精度和分类精度;在训练过程中,对超参数的调节较为困难,导致在需要较长时间训练的网络内收敛变慢;容易受到正负样本不均匀或者正负样本异常值 变 动 的 影 响,在 参 数 调 节 上 需 花 费 更 多 精力1 4。为解决以上问题,O k s u z等1 5提
25、出了a L R P L o s s。这是一种基于r a n k i n g的损失函数,具有统一、有界、平衡等特点,通过对A P L o s s的扩展,建立一个能够优化不可导排序损失的通用框架,能有效用于目标检测中的分类和定位任务。与精确度和A P损 失 之 间 的 关 系 类 似,a L R P L o s s为 正 样 本L R P值(lL R P(i)的平均值,如式(1)所示:LaL R P=1PiPlL R P(i)(1)式中:P为精确率。L R P值定义为:lL R P(i)=1r a n k(i)NF P(i)+l o c(i)+kP,kil o c(k)H(xi k)(2)r a
26、n k(i)=NF P+NT P(3)l o c(k)=1-I o U(k)1-(4)式中:NF P为错误预测的数量;NT P为正确预测的数量;当k0时,H(k)=1,否则H(k)=0;为T P标记阈值,一般取0.5。相对于传统损失函 数,a L R P L o s s具有以下优点:1)在分类和定位任务中首次采用排名策略,将独立工作的2个分支合为统一整体,两者同时调用检测器的全部输出,从而同时兼顾检测精度和定位质量。28空军工程大学学报2 0 2 3年2)相对于目前S OT A方法中的6个超参数,a L R P L o s s仅有一个不需要调试的超参数,能够减少参数调节的工作量,并使模型更容易
27、训练。3)a L R P L o s s由A P L o s s拓展而来,能够替换A P L o s s、S m o o t h L 1 L o s s等损失函数,并以单个损失函数参与训练,具有出色的正负样本策略,以提高网络性能。2.3 基于F a s t e r N e t轻量化模型提出C 3-F a s t e r为提高算法的检测速度,C h e n等人1 6提出了一种新的部分卷积,其基本思想是在卷积操作中只对输入中非零的部分进行卷积,对输入中全零的部分不进行操作,可以同时减少计算冗余和内存的访问,更有效地提取空间特征,并在其基础上提出了F a s t e r N e t,在不影响检测精度
28、的同时,大幅提升了检测速度。在此 基 础 上,本 文 提 出 了C 3-F a s t e r,替 换 了YO L O v 5中用于提取特征的C 3模块。在C 3-F a s-t e r中调用了C 3模块的构造函数,初始化部分基本参数,并引入了P a r t i a l C o n v o l u t i o n部分卷积层和F a s t e r_B l o c k模块,二者都使用了类似P C o n v1 7的思想,其通过使用一个额外的掩蔽矩阵实现,该矩阵与输入图像大小相同,其中缺失或遮挡的的像素位置用0填充,而正常的像素位置用1填充。随后卷积核仅对被预设为1的像素进行卷积运算,其中在掩蔽矩
29、阵中对应为0的像素位置,卷积核中相应的权重也被设为0。这意味着在卷积计算过程中,这些被掩蔽的权重不会对输出特征图产生影响,不但降低了运算量,在处理不完整的输入数据时也能提供更好的结果,从而提高了模型的鲁棒性和泛化能力,可以增强模型的非线性表达能力,提高检测精度;F a s t e r_B l o c k通过部分卷积来处理输入特征图,从而减少计算量和模型参数。2.4 添加轻量级上采样算子C A R A F E上采样在目标识别算法中可以将低分辨率的物体特征图扩展到更高分辨率,在卷积神经网络中,高层特征图中的目标特征比较抽象,分辨率较低;低层特征图中物体特征更为精细,分辨率更高。通过将低层特征图上采
30、样到高层尺寸,可以将低层精细的特征和高层抽象的特征结合起来,从而更好地捕获物体的特征,提高识别的准确性。为了深度神经网络中实现特征图的高效上采样,W a n g等1 8提出了轻量级通用上采样算子(c o n-t e n t-a w a r e r e a s s e m b l y o f f e a t u r e s,C A R A F E),这是一种通用性强、轻量化、高效率的模块,相比于传统上采样模块,C A R A F E在更轻、更快的条件下,感受野进一步扩大,不依靠亚像素邻域运行,而是在更大的接受域内融合信息,并且可以针对特定内容动态生成自适应内核,能够更优秀地进行内容感知。C A
31、R A F E运行的具体步骤是在每个位置为中心的预定义区域内,使用加权组合来重新组装特征,并通过内容感知的方式生成权重,并且上述的每个位置都会存在多组生成的上采样权重,最后将生成的权重重新排列为一个完整的空间快,以此进行特征上采样。具体来说,给定一个大小为CHW的特征图X和一个上采样率(假设为一个整数),将生成一个大小为C H W的新特征图X,其原理如式(5)、(6)所示:Wl=(N(Xl,Ke n c o d e r)(5)X l=(N(Xl,Ku p),Wl)(6)对于输出X 的任一个目标位置l=(i,j),在输入X中都能找到一个相应的源位置l=(i,j),其中N(Xl,k)为以l为中心的
32、特征图X的kk子区域,Ku p为重组核的大小,同时考虑到性能和效率,使用核大小的卷积层Ke n c o d e r一般取值为Ku p-2。式(5)中,内核预测模块根据Xl的子区域,为每个l 预测该位置上的内核Wl,即输出大小为Cu pHW的重组核,Cu p为:Cu p=2k2u p(7)式(6)中是内容感知重组模块,可以将Xl的子区域与内核Wl重新组合,如式(8)所示:(X l)=rn=-rrm=-rWl(n,m)X(i+n,j+m)(8)式中:r=Ku p/22.5 改进的5种模型基于以上4点改进方向,本文共提出5种改进的YO L O v 5模型如下:1)YO L O v 5-D:为YO L
33、 O v 5网络添加基于分离式注意力机制的D y H e a d目标检测头;2)YO L O v 5-A:改用由A P_L o s s拓展而来的a L P R L o s s损失函数;3)YO L O v 5-F:将YO L O v 5算法中的C 3模块替换为基于F a s t e r N e t网络提出的C 3-F a s t e r;4)YO L O v 5-C:为YO L O v 5网 络 添 加C A-R A F E轻量级上采样算子;5)YO L O v 5-D A F C:将D y h e a d目 标 检 测 头、a L P R L o s s损失函数、C 3-F a s t e
34、r模块、C A R A F E上采样算子同时部署在YO L O v 5网络中。改进 后 的YO L O v 5-D A F C网 络 结 构 如 图3所示:38第5期 渠逸,等:基于YO L O v 5的表面缺陷检测优化算法图3 YO L O v 5-D A F C结构3 实验本文实验环境基于W i n d o w s操作系统,运行内存1 2 8 G B,使用P y t o r c h 1.1 1.0作为深度学习框架,P y t h o n版本为3.8,C UD A版本为1 1.2。C P U为I n t e l(R)X e o n G o l d 6 3 3 0 C P U 2.0 0 GH
35、 z。C P U为NV I D I A G e F o r c e R T X 2 0 8 0 T i 1 1 G。3.1 实验评价标准本文从模型自身参数、模型检测参数两方面进行效果对比。其中模型自身参数包括以下几类:模型参数量,即网络结构中所有可训练参数的数量,通常是衡量模型复杂度和计算所需资源的指标;F L O P s,指模型在 推 理 期 间 进 行 的 浮 点 运 算 次 数,一 般 采 用G F L O P s,通常被用来评估模型的计算复杂度;权重体积,指模型训练后所生成权重文件的大小。模型的检测参数包括以下几类:精确率,指模型正确预测的目标数量与总预测目标数量之比;召回率,即在所有
36、真实目标数量中,模型准确预测的目标数量占比。A P1 90.5(I o U阈值为0.5时各个类别的平均A P值)而mA P则是在不同召回率下的精确率的均值,这一指标考虑了准确率和召回率的综合表现,是当前主流的目标检测评价指标。相关计算公式为:P=TP(TP+FP)(9)R=TP(TP+FN)(1 0)AP=ni=1P(i)R(i)=10P(R)dR(1 1)AMP=Ni=1PA iN(1 2)式中:P、R分别为精确率和召回率;N表示目标类别数;Tp为I o U0.5时的检测框数量(同一个G r o u n d T r u t h值计算一次);Fp为I o U0.5时的检测框数量(或者是检测到同
37、一个G r o u n d T r u t h的多 余 检 测 框 的 数 量);FN为 指 没 有 检 测 到 的G r o u n d T r u t h数 量;AMP为 均 值 平 均 精 度,即mA P。3.2 训练参数设置YO L O v 5使用了K-m e a n s聚类算法来生成锚框(a n c h o r b o x),通过统计训练集中不同大小的目标,自动生成合适的K值(锚框的数量),以便网络能够检测不同大小和比例的目标。本文针对目标数据集与服务器性能,初始学习率设为0.0 1,使用随机梯度下降法(s t o c h a s t i c g r a d i e n t d e
38、s c e n t,S G D),w a r m u p_e p o c h设为5,学习率动量为0.9 8,权重衰减系数w e i g h t_d e c a y设为5 e-5,w o r k-n u m b e r设为1 6,原始YO L O v 5模型b a t c h-s i z e设为3 2,后续训练根据模型大小与显存冗余调整至最优。依次对原YO L O v 5模型的s版本与5个改进模型进行训练48空军工程大学学报2 0 2 3年与测试,对比分析各模型的参数和性能。3.3 训练过程损失在训练过程中,本文提取了YO L O v 5原模型与YO L O v 5-D A F C模型的损失函数
39、值,如图4所示,其中绿色线条为原版YO L O v 5模型训练损失,橙色线条为改进后的YO L O v 5-D A F C模型训练损失。3个不同的损失变化图可以客观地描述本文中检测算法的训练变化过程。(a)YO L O v 5模型(b)改进后YO L O v 5模型图4 训练损失曲线 图4中B o x l o s s是定位损失,通过计算预测边界框与实际边界框差异所得,用于衡量模型对物体位置的预测能力。O b j l o s s是置信损失,通过F o c a l L o s s计算所得,用于衡量模型对预测物体与背景的置信度误差。C l s l o s s是分类损失,通过计算分类预测结果与实际标签
40、的交叉熵损失函数所得,用于衡量模型对每个类别的分类能力。可以看出,在训练e p o c h达到3 0 0时,2个模型均已收敛,损失值趋于平稳。添加了a L R P L o s s的改进模型损失曲线与原版区别较大,在B o x l o s s曲线中,D A F C模型在训练初期出现了过拟合2 0现象,相比原版的平滑下降,呈阶段性下降趋势,并且收敛速度明显快于原版,仅在5 0 e p o c h左右就已经进入收敛状态,且收敛后曲线平稳度高于原版;在O b j l o s s曲线中,D A F C模型训练初期仍有过拟合现象存在,但模型收敛后曲线平稳度仍高于原版。可以看出,引入了a L R P L o
41、 s s的D A F C模型在收敛速度和收敛后曲线稳定性方面均高于原版模型。4 实验结果对比4.1 模型性能对比为确定每个优化结构对网络性能的影响,本文进 行 消 融 实 验,分 别 对YO L O v 5、YO L O v 5-D、YO L O v 5-A、YO L O v 5-F、YO L O v 5-C、YO L O v 5-D A F C 6个模型进行训练,得到不同模型自身参数与测试性能如表1所示。表1 不同模型的参数与检测效果对比检测模型P a r a m e t e r sG F L O P sP/%R/%A P0.5/%W e i g h t/K BYO L O v 57 0 3
42、 5 8 1 11 6.07 3.16 4.87 2.8 1 71 4 1 3 7YO L O v 5-D7 5 9 8 3 5 51 7.26 9.77 1.57 3.9 1 81 4 7 4 6YO L O v 5-A7 0 3 5 8 1 11 6.06 4.57 3.47 2.3 0 71 4 1 3 7YO L O v 5-F5 7 9 5 7 7 91 2.77 2.47 2.47 5.6 4 21 1 7 2 7YO L O v 5-C7 0 3 5 8 1 11 6.07 4.56 8.97 2.8 8 81 4 1 3 7YO L O v 5-D A F C6 2 4 4 2
43、 3 51 3.87 1.27 2.67 6.9 9 11 2 6 2 2 通过分析表1实验结果可知,在网络中增加D y H e a d目标检测头、用C 3-F a s t e r替换C 3模块后,网络整体的训练参数量和计算复杂度会有较为明显的变化,前者增加了8%的参数量和7.5%的浮点运算量,将A P0.5提升了1.1 0 1%,同时权重体积增加了4.3%;后者则减少了1 7.6 2%的参数量和2 0.6 3%的浮点运算量,同时将A P0.5提升了2.8 2 5%,提升效果显著。而在 改 用A L R P L o s s损 失 函 数 与 增 加C A-R A F E上采样算子的A、C模型中
44、,相应的改进主要58第5期 渠逸,等:基于YO L O v 5的表面缺陷检测优化算法作用在检测精度的提升上,A、C两模型相比于原版模型,A P0.5分别提升了0.4 9%和1.0 7 1%。D A F C模型则是4个模型优点的整合,保留4个改进点对检测精度提升的同时,综合减少模型参数量与计算复杂度。相比于原模型,改进的D A F C模型在参数量减少了1 1.2 5%,计算复杂度减少了1 3.7 5%,权重体积减少了1 0.7 2%的同 时,A P0.5增加了4.1 7 4%。可以看出,改进的D A F C模型同时发挥了4个改进点的优势,在尽可能节约内存占用与计算资源的同时,做到了检测效果的最佳
45、优化。4.2 不同缺陷检测性能对比为研究本文所提出的模型对于不同类别缺陷的检测效果,摘取实验数据如图5所示。图5 各类缺陷检测效果 从图5的分析结果可以看出,对于本数据集内的6种缺陷类别,最优检测效果均分布在5个改进模型上,其中C模型对p i t t e d s u r f a c e和s c r a t c h e s类别缺陷检测效果最佳,检测精准度分别提升了0.5%、1.6%;对于c r a z i n g、i n c l u s i o n、p a t c h e s、r o l l e d i n s c a l e 4种缺陷,均为D A F C模型检测效果最佳,相比于原版模型,改进后
46、的D A F C模型对c r a z i n g的识别准确率提升了1.5%,i n c l u s i o n提 升 了1 3.7%,p a t c h e s提 升 了1 6.6%,r o l l e d i n s c a l e提升了8.6%,s c r a t c h e s提升了0.9%。改进后的模型对本数据集整体检测效果大幅提升,并对部分难检目标的检测效果提升明显,对实际应用场景的可用性有实质性的加强。4.3 检测效果对比为了直观了解改进后的模型对目标缺陷的检测效果提升,使用原模型与改进后的5种模型对测试集1 8 0张图片进行了检测,YO L O v 5 s与改进后的YO L O
47、v 5-D A F C模型对部分测试图片识别效果如图6所示。(a)YO L O v 5部分检测效果图(b)YO L O v 5-D A F C部分检测效果图图6 部分检测效果图通过对比可以看出,原版模型对较小目标容易发生漏检,对较大目标存在定位错误,并且存在重复描框、同一目标检测为多个等问题,改进后的D A F C模型相对于原版YO L O v 5,感受野增大后对较大目标识别效果提升,对较难检测的目标更为敏感,可以有效避免目标漏检的情况发生,并且对于紧邻的多个目标、叠加目标的检测策略更加智能,显著减少了对同一个目标重复描框、分段描框的情况和将多个目标识别为同一对象的情况,有效避免原版模型的检测
48、错误问题。4.4 主流检测算法性能对比为了进一步评估本文提出的模型的性能,在相同实验条件下,在同一数据集上选择了S S D、R e t i-n a N e t、F C O S、YO L O v 3、YO L O v 4和YO L O v 7 6种 主 流 的 一 阶 目 标 检 测 算 法,与 本 文 提 出 的YO L O v 5-D A F C模型进行实验对比分析,通过比较实验结果,可以更加客观地评估本文所提出改进模型的有效性和优越性。具体实验结果如表2所示。表2 与主流目标检测算法的性能对比算法A P0.5/%F P S/sW e i g h t/MBS S D2 7.7 11 9.49
49、 6.2R e t i n a N e t6 9.5 81 3.13 5.6 8F C O S6 8.8 29.08 7.2 5YO L O v 36 9.7 52 0.72 9.5 1YO L O v 46 7.2 91 9.43 2.6 3YO L O v 77 1.2 34 3.17 1.4 0YO L O v 5-D A F C7 6.9 95 4.31 2.3 268空军工程大学学报2 0 2 3年 通过以上对比可以明显看出,本文所提出的YO L O v 5-D A F C模型相比于几种主流的o n e-s t a g e目标检测算法,在整体检测精度、检测速度、模型体积3个方面都有较
50、大提升,并且在各方面均超过了更新的YO L O v 7模型,基本可以实现高精度、高速度、轻量级需求的工业检测。5 结语为实现精准、快速的材料表面缺陷检测,本文提出了改进的YO L O v 5优化算法,添加D y H e a d目标检测头,通过分离式注意力机制将多种注意力同时应用在同一个模块中,有效提升目标检测头的检测性能;更换A L R P L o s s损失函数,简化训练参数、优化训练效果的同时兼顾分类和定位精度;基于F a s t-e r N e t网络提出C 3-F a s t e r模块,用于替换原版C 3模块,提 升模型鲁棒 性同时减少 权重体积;添 加C A R A F E上采样算