1、第 卷第期陕西科技大学学报V o l N o 年 月J o u r n a l o fS h a a n x iU n i v e r s i t yo fS c i e n c e&T e c h n o l o g y D e c 文章编号:X()基于改进Y O L O v s的X光图像危险品检测张康佳,张鹏伟,陈景霞,龙闵翔,林文涛(陕西科技大学 电子信息与人工智能学院,陕西 西安 )摘要:随着近年来交通系统越来越发达,人们出行越来越频繁,通过X光安检机对人们的包裹进行检查,已经成为预防危及公共安全事件的重要手段目前,很多地方X光图像的危险品检测工作仍然由安检员人工进行,存在工作负荷大、
2、效率低等问题因此,利用现有的目标检测技术自动进行危险品检测非常必要但X光图像危险品背景往往比较复杂,导致危险品自动检测精度不高因此,本文提出一种改进的a t t_d e c o u p l e_YO L O v s模型,通过在YO L O v s模型的特征融合部分引入卷积注意力机制(C o n v o l u t i o n a lB l o c kA t t e n t i o nM o d u l e,C B AM),以加强相关特征信息、抑制背景信息;对模型的检测头部通过并行分支的方法进行解耦,解决分类和定位任务因为耦合在一起所产生的冲突问题最后,在公共数据集p i d r a y进行X光
3、图像 类危险品检测实验,实验结果表明,所提模型的检测性能指标均值平均精度在I o U(I n t e r s e c t i o no v e rU n i o n)阈值为 的情况下达到了 ,相比于YO L O v s模型提升了;在I o U阈值为 到 的情况下,均值平均精度达到了 ,相比于YO L O v s提升了;验证了本文改进算法的有效性关键词:X光图像;危险品检测;目标检测;YO L O v s;C B AM;解耦中图分类号:T P 文献标志码:AX r a y i m a g ed a n g e r o u sg o o d sd e t e c t i o nb a s e do
4、 n i m p r o v e dY O L O v sZ HANGK a n g j i a,Z HANGP e n g w e i,CHE NJ i n g x i a,L ONG M i n x i a n g,L I N W e n t a o(S c h o o l o fE l e c t r o n i c I n f o r m a t i o na n dA r t i f i c i a l I n t e l l i g e n c e,S h a a n x iU n i v e r s i t yo fS c i e n c e&T e c h n o l o g
5、y,X i a n ,C h i n a)A b s t r a c t:I nr e c e n t y e a r s,a s t h e t r a n s p o r t a t i o ns y s t e mb e c o m e sm o r ea n dm o r ed e v e l o p e da n dp e o p l e t r a v e lm o r ea n dm o r e f r e q u e n t l y,i th a sb e c o m ea n i m p o r t a n tm e a n s t oc h e c kp e o p l e
6、 sp a c k a g e s t h r o u g hX r a ys e c u r i t ys c r e e n i n gm a c h i n e st op r e v e n t i n c i d e n t se n d a n g e r i n gp u b l i cs a f e t y A tp r e s e n t,d a n g e r o u sg o o d sd e t e c t i o no fX r a yi m a g e s i nm a n yp l a c e s i ss t i l l c a r r i e do u tm
7、a n u a l l yb ys e c u r i t y i n s p e c t o r s,w h i c hh a sp r o b l e m so fh e a v yw o r k l o a da n d l o we f f i c i e n c y T h e r e f o r e,i t i sn e c e s s a r y t ou s e t h ee x i s t i n g t a r g e td e t e c t i o nt e c h n o l o g y t od e t e c td a n g e r o u sg o o d s
8、a u t o m a t i c a l l y H o w e v e r,t h eb a c k g r o u n do f d a n g e r o u sg o o d s i nX r a y i m a g e s i so f t e nc o m p l i c a t e d,w h i c hl e a d st ot h el o wa c c u r a c yo ft h ea u t o m a t i cd e t e c t i o no fd a n g e r o u sg o o d s T h e r e f o r e,t h i sp a p
9、 e rp r o p o s e sa ni m p r o v e da t t_d e c o u p l e_YO L O v sm o d e l B yi n t r o 收稿日期:基金项目:国家自然科学基金项目();陕西科技大学博士科研启动基金项目(B J )作者简介:张康佳(),男,陕西咸阳人,在读硕士研究生,研究方向:X光图像危险品检测通讯作者:张鹏伟(),男,陕西咸阳人,教授,研究方向:机器学习、目标检测、数据挖掘,z h a n g p e n g w e i s u s t e d u c n第期张康佳等:基于改进Y O L O v s的X光图像危险品检测d u c i
10、 n gt h eC o n v o l u t i o n a lB l o c k A t t e n t i o n M o d u l e(C B AM)i nt h ef e a t u r ef u s i o np a r to fYO L O v sm o d e l,t h er e l e v a n t f e a t u r e i n f o r m a t i o n i ss t r e n g t h e n e da n dt h eb a c k g r o u n d i n f o r m a t i o n i ss u p p r e s s e d
11、;T h ed e t e c t i o nh e a do ft h em o d e l i sd e c o u p l e db yt h ep a r a l l e lb r a n c hm e t h o dt os o l v e t h ec o n f l i c tp r o b l e mc a u s e db yt h ec o u p l i n go f c l a s s i f i c a t i o na n dp o s i t i o n i n gt a s k s F i n a l l y,t h i sp a p e r t e s t e
12、 d k i n d so f d a n g e r o u sg o o d s i nX r a y i m a g e s i n t h ep u b l i cd a t a s e t p i d r a y T h e e x p e r i m e n t a l r e s u l t s s h o w e d t h a t t h e a v e r a g e a c c u r a c yo f t h ed e t e c t i o np e r f o r m a n c e i n d e xo ft h ep r o p o s e dm o d e l
13、r e a c h e d w h e nt h eI o U(I n t e r s e c t i o no v e rU n i o n)t h r e s h o l dw a s,w h i c hw a s h i g h e rt h a nt h a to f t h eYO L O v sm o d e l;Wh e nt h e I o Ut h r e s h o l dw a sb e t w e e n a n d ,t h ea v e r a g ep r e c i s i o nr e a c h e d ,w h i c hw a s h i g h e r
14、 t h a n t h a t o fYO L O v s T h e e f f e c t i v e n e s so f t h e i m p r o v e da l g o r i t h mi s f u l l yv e r i f i e d K e yw o r d s:X r a y i m a g e;d a n g e r o u sg o o d sd e t e c t i o n;t a r g e td e t e c t i o n;Y O L O v s;C B AM;d e c o u p l i n g引言公共安全一直是人类关注的热点问题,为了预防
15、危及公共安全的事件发生,机场、火车站等各个重要场所都配有X光安检机和专门的安检人员,但是由于X光图像背景复杂,人工安检不可避免会发生错检、漏检的情况深度学习在近年来取得了巨大的进步,尤其是在图像识别和目标检测方面目前常用的目标检测方法分为两大类:一是以R C NN系列 为代表的两阶段方法,将定位任务和分类任务分成两个阶段去处理;二是以YO L O(Y o uO n l yL o o kO n c e)系列 和S S D(S i n g l es h o tm u l t i b o xd e t e c t o r)为代表的一阶段方法,直接得到分类预测和位置坐标信息而X光图像危险品检测属于目标
16、检测的下游分支,同样可以应用两阶段方法和一阶段方法展开研究在两阶段法目标检测方面,A k c a y等 探讨了传统的基于滑动窗口的卷积神经网络(C o n v o l u t i o n a lN e u r a lN e t w o r k s,C NN)和基于区域的全卷积网络(R e g i o n b a s e dF u l l yC o n v o l u t i o n a lN e t w o r k s,R F C N)在X射线图像检测的适用性,并将R F C N和残差网络相结合在I m a g e N e t数据集上进行两类枪支检测,均值平均精度(m e a nA v e r
17、 a g eP r e c i s i o n,mA P)达 到 了 的 精 度 S t e i t z等 针对多视角X射线图像数据,引入一种基于F a s t e rR C NN的多视图检测模型,利用聚合的多视图特征,在自定义 D数据集上进行最终分类,取得了不错的效果 G a u s等 研究比较了F a s t e rR C NN、M a s kR C NN和R e t i n a N e t模型在对不同几何形状、图像分辨率和颜色分布的X射线图像检测的可迁移性,在二分类和三分类X光图像数据集上进行目标检测的mA P性能分别达到了 和 L i u等 根据被检测物体与背景颜色差异,从X射线图像中
18、分离出被检测物体,然后将其送到R C NN网络中学习,最终在自建的六分类X光 危 险 品 图 像 数 据 集 上 进 行 目 标 检 测 的mA P达到 Z h a n g等 提出了一种基于X射线的分类区域神经网络(XMCR C NN),通过使用X射线物质分类器算法、有机分离算法和无机剥离算法解决X射线图像中的行李重叠问题,最终对枪、刀检测的查全率分别达到了 和 B h o wm i k等 使 用 内 容 感 知 重 组 特 征(C A R A F E),对类X射线危险品图像进行检测,取得了 的平均精度上述基于两阶段的X光图像危险品检测方法,虽然对X光图像取得了较高的检测精度,但是所使用的危险
19、品数据集类别较少,检测速度低下无法满足实际情况下的X光图像危 险 品 检 测 多 样 性 鉴 别 和 实 时 性 的 检 测要求在一 阶 段 法 目 标 检 测 方 面,L i u等 采 用Y O L O 网络针对X光图像中剪刀、气溶胶特征进行了深入研究,最终对这两类的危险品进行检测的 平 均 查 准 率 和 查 全 率 分 别 达 到 了 和 G a l v e z等 比 较 了YO L O v 模 型 在I E D X r a y数据集上使用迁移学习和从头训练方法对X射线图像中的简易爆炸装置进行检测的区别,发现在多尺度X光图像检测中,从头训练的目标检测精度能够达到 ,而用迁移学习的方法 只
20、 能 达 到 ,说 明 从开 始 训 练 的陕西科技大学学报第 卷YO L O v 在X光图像危险品检测方面优于迁移学习 W e i等 在S S D网络上通过添加额外的卷积层,并采用多任务迁移学习方法,在G D X r a y数据集上进行了类目标检测,取得了 的平均精度 Q i a o等 为了提高小规模违禁品的检测精度,在S S D网络上增加了特征融合模块和非对称卷积模块,将S S D模型进行目标检测的mA P提高了 Z h o u等 在YO L O v 网络上引入可变性卷积,并使用GHM损失优化损失函数,在S i x r a y数据集上类目标检测的平均精度达到了 上述基于一阶段的目标检测方法
21、,虽然在X光危险品图像检测中取得了较高的精度,但是模型相对较大,无法做到实时部署,并且所使用X光图像数据集中危险品类别较少,仍然无法满足实际应用需求针对上述X射线图像危险品检测实际存在的问题,本文在YO L O v s模型的基础上,引入了卷积注意力机制(C o n v o l u t i o n a lB l o c kA t t e n t i o nM o d u l e,C B AM),并 将 注 意 力 机 制 与 特 征 金 字塔(F e a t u r eP y r a m i dN e t w o r k sf o rO b j e c tD e t e c t i o n,F
22、P N)结构联合使用进行X射线图像危险品检测,使模型在特征学习与融合的过程中选择性强调危险品相关特征,并抑制背景干扰特征同时在模型的检测头部引入解耦头进行优化,使分类和定位任务分开处理,并使用了更适合分类任务的全连接层来处理分类任务,而定位任务仍然使用卷积层来完成通过这种方式来提高YO L O v s模型在危险品检测中的精度YO L O v s模型YO L O v s是一种用于单阶段目标检测的模型,它由输入端、基准网络、N e c k网络和h e a d输出端组成()输入端:输入YO L O v s模型的图像大小一般为 或者 ,本文输入的X射线危险品图像大小设置为 ,通道数为该部分对输入的危险
23、品图像进行一系列预处理操作,首先将危险品图像随机缩放到网络指定的输入大小,再进行归一化操作,通过对其进行随机排布,以进一步增强图像的特征表达能力()主干网络:F o c u s和C S P是主干网络的两个重要组成部分其中,F o c u s部分通过s l i c e切片操作,对输入的危险品图像进行裁剪,将其宽高缩小一半,变为了 同时,将危险品图像的通道数乘,变为,得到面积减少为原来的四分之一,通道数变为原来的四倍的特征映射 Y O L O v s的C S P结构包括三个部分:第一部分是由卷积、归一化和激活函数组成的C B S(C o n v B NS i L U)模块;第二个部分是由多个残差组
24、件组成的残差模块;第三部分是单个卷积层其作用是通过将特征图按照通道维度均分为两部分,其中一部分经过残差模块之后,再通过跨层连接将两部分再次合并,以达到减少计算量的同时,提高准确率()N e c k网络:N e c k位于主干网络和h e a d输出端之间,YO L O v s在N e c k部 分 采 用F P NP AN(P a t hA g g r e g a t i o nN e t w o r k)结构 F P N部分使网络输出特征图按从小到大结构排列,进而将更多的语义信息传递下来而P AN结构使网络输出特征图按从大到小的结构排列,进而将更多的定位信息传递上去通过将F P NP AN相
25、结合,将低层的强定位信息与高层的强语义信息进行融合,得到更加有用的特征信息()H e a d输出端:该部分从三个不同尺度对目标进行预测,最后对预测的结果进行非极大值抑制,进一步精简预测结果对YO L O v s模型的改进针对YO L O v s模型特征融合时背景信息的干扰和检测头部耦合问题,本文在YO L O v s模型的基础上所作改进如下,在F P N特征金字塔处,引入注意力机制模块;在检测头部分,对模型的预测头部进行解耦将其改进后的模型命名为a t t_d e c o u p l e_YO L O v s,其结构如图所示 注意力机制的引入在模型对危险品检测中,虽然F P N的自顶向下的特征
26、金字塔结构,能够更好地将强语义信息传递下去,与浅层网络的所传递的特征信息进行特征融合但是浅层网络所传递的特征信息并非都是有用的,其中包含许多背景干扰信息所以为了减少背景干扰信息的传递,本文在浅层网络与F P N信息融合处,结合注意力机制进行研究注意力机制在计算机视觉中的应用主要是三种,分别是通道域、空间域和混合域本文所使用的卷积注意力模块(C B MA)则是混合域上的应用,通过使用注意力机制抑制浅层网络所传递的特征信息中的干扰信息,如图所示:输入特征图X(NHW),经过通道注意力机制生成的通道注意力图Mc第期张康佳等:基于改进Y O L O v s的X光图像危险品检测(N ),然后将二者相乘,
27、得到特征图X(NHW),再将生成的特征图X输入到空间注意力模块,得到空间注意力图Ms(N ),将X与Ms相乘,得到最终输出图改进的a t t_d e c o u p l e_YO L O v s模型结构图图注意力机制在图中,可以看到通道注意力部分对输入特征图的操作过程输入特征图X经过最大池化和平均池化,分别生成两张N特征图:平均池化图F A和最大池化图FM将F A和FM分别送入共享全连接层(ML P),然后对两种特征进行加和操作,并使用S i g m o i d激活函数来强化不同通道的权重最终得到通道注意力图,计算过程如下:Mc(X)S(ML P(A P(X);MP(X)S(W(W(F A)W
28、(W(FM)()式()中:S为S i g m o i d激活函数,A P为平均池化,MP为最大池化,W和W分别为共享全连接层的第层和第层,c为通道数图通道注意力机制空间注意力模块专注于位置信息,与通道注意力模块相辅相成,如图所示图空间注意力机制在该模块,对输入特征图X在通道维度上对特征点分别求平均值和最大值,分别得到关于平均值的空间特征图S A P和关于最大值的空间特征图SMP然后通过拼接操作c a t将两种特征图进行拼接,再利用的卷积F生成空间注意力图,最后使用S i g m o i d激活函数对不同位置的特征点进行强化或抑制其计算过程如下:MSS(F(c a t(A P(X),MP(X)S
29、(F(c a t(SMP,S A P)()在图所示的注意力机制部分,本文通过卷积注意力模块,将浅层网络传递的特征信息分别从空间域和通道域进行不同区域的关注,提高有用信息的比重,并减少背景信息的影响如图的注意力机制部分和图所示,输出的底层特征图被注意力模块(C b a m B l o c k)给予不同的权重通过将其与高层特征相结合,提取出模型的有用特征,从而增强网络学习的目标特征信息,此外,这种方法基本上不会增加陕西科技大学学报第 卷模型的大小,也不会增加训练和推理成本 检测头部解耦在目标检测中,S o n g等 通过对空间敏感性热图进行可视化,发现分类和定位所关注的感兴趣区域的不同,分类更关注
30、于显著性区域信息,定位更关注边缘区域的信息,由此可以看出分类和定位任务之间的耦合一直存在冲突问题 YO L O系列之前是将分类和定位信息耦合在一起,G e等 提出的YO L O X模型在YO L O v 的基础上采用无锚a n c h o r f r e e并对检测头部进行解耦该模型在检测头部首先使用的卷积来减少通道维数,然后使用两个平行的分支,每个分支都包含两个的c o n v层,分别来处理分类和定位任务,以达到提 升 模 型 性 能 的 效 果但 由 于 本 文 选 用 的YO L O v s进行危险品检测,其在有锚框的检测,仍旧使用的是定位和分类耦合在一起的检测头,因此本文将YO L O
31、 X中的解耦头应用在YO L O v s下的有锚检测中,并且在其基础上进行了进一步的改进,其具体处理过程如图所示图解耦头处理过程将模型提取的特征图通过的卷积降维,可以得到 HW的特征图Y,将得到的特征图分别输入三个平行的分支,三个分支分别处理分类任务、置信度得分和定位任务在分类 任 务 分 支 中,对 特 征 图 进 行R(r e s h a p e)操作,使其变成HW 的特征图,将得到的特征图依次经过两个全连接层f和f,对其分类特征进行整合计算,再经过全连接层f,得到HW 的分类特征图最后再对其进行R(r e s h a p e)操作,得到特征图Y(HW),计算公式如下:YR(f(f(f(R
32、(Y)()在置信度得分的分支中,将其看作是一个软标签分类任务,对特征图Y进行R(r e s h a p e)操作,再经过全连接层f对置信度特征进行整合计算,最后经过全连接层f,得到HW 的置信度特征图,对其进行R(r e s h a p e)操作得到特征图Y(HW),其计算公式如下:YR(f(f(R(Y)()在定位任务的分支中,使用卷积C和卷积C依次对其定位特征进行整合计算;再经过卷积层C得到定位特征图Y(HW),计算公式如下:YC(C(C(Y)()最后是将三个分支得到的结果按照通道维度进行c a t连接操作得到最终的输出特征图Y 其计算公式如下:Y c a t(C,C,C)()本文通过上述方
33、法对YO L O v s的检测头进行解耦,解耦部分如图h e a d(解耦头)部分和图所示,将提取后的特征分别进行定位任务与分类任务处理根据定位任务和分类任务的特性,为定位任务选择卷积层进行处理,为分类任务选择全连接层进行处理,使YO L O v s模型在X光图像危险品检测中的检测精度有了较大的提升实验结果及分析本文基于NV I D A G e F o r c eG T X 显卡、G B内存的c e n t o s和p y t o r c h框架展开实验 数据集及评价指标本文实验所使用的数据集是W a n g等 在 年公开的大规模违禁品检测数据集p i d r a y,其包含了,张X射线图像下
34、违禁品图像,种类为 类,分别是枪、刀、扳手、钳子、剪刀、锤子、手铐、警棍、喷雾器、充电宝、打火机和子弹,每个种类在数据集中所占的比例如图所示图数据集中各类危险品数量第期张康佳等:基于改进Y O L O v s的X光图像危险品检测本文使用多种关于目标检测模型性能评估指标来衡 量危险品检 测的准确性,包括预测 精度(P r e c i s i o n)、召 回 率(R e c a l l)、均 值 平 均 精 确 度(m e a na v e r a g ep r e c i s i o n,mA P)精度定义为:PT PT PF P()召回率定义为:RT PT PFN()均值平均精确度定义为:m
35、 A Pp(r)dr()其中,T P表示正确检测出危险品的数量,FN代表被判定为背景的危险品数量,F P代表将背景区域判定为危险的数量 模型评估为了验证本文所选模型算法的优越性,首先用本文改进的a t t_d e c o u p l e_YO L O v s模型在p i d r a y数据集上进行训练,并将训练结果与R e t i n a N e t、F a s t e rR C NN、M a s kR C NN、S S D 和C a s c a d eR C NN等模型在p i d r a y数据集上的训练结果进行对比,对比结果如表所示在p i d r a y数据集上,本文改进的a t t_
36、d e c o u p l e_YO L O v s模型,相比于R e t i n a N e t、F a s t e rR C NN、M a s kR C NN,mA P、S S D 和C a s c a d eR C NN,其mA P性能分别提高了 、从实验结果可以看出,相较于目前主流的目标检测模型,本文改进的a t t_d e c o u p l e_YO L O v s模型更加适用于X光图像危险品检测表各个模型m A P对比模型mA P/R e t i n a N e t F a s t e rR C NN M a s kR C NN S S D C a s c a d eR C NN
37、 a t t_d e c o u p l e_Y O L O v s 消融实验为了进一步验证本文所提算法的有效性,将实验时所有对比模型的输入图片大小都统一设置为 ,b a t c h s i z e大小设置为,并通过多组对比实验验证本文所采用的各个方法的有效性为了验证本文在YO L O v s网络的F P N处引入注意力机制的有效性首先在YO L O v s网络模型的F P N结构中加入注意力机制,将加入注意力机制后的模型命名为a t t_YO L O v s,在模型的各个参数与YO L O v s模型各个参数设置相同的情况下在p i d r a y数据集进行实验实验结果如表所示,改进的a t
38、 t_YO L O v s模型相比于YO L O v s的精度提升了,而召回率只下降了,在I o U阈值为 的情况下,模型的mA P提升了,在I o U阈值为 到 的情况下,mA P只下降了,表明注意力机制在F P N出的引入有效性而 对 比 模 型 的 参 数 量,如 表所 示,YO L O v s参数量为 ,a t t_YO L O v s参数量为 ,比YO L O v s模型的参数量只增加了 ,表明引入注意力机制基本上不会增加模型体量由此可见,在YO L O v s模型的F P N处引入注意力机制对特征提取的有效性表X光图像检测下Y O L O v s及各个改进模型检测均值平均精度对比算
39、法模型PRmA P/mA P:/Y O L O v s a t t_Y O L O v s d e c o u p l e_Y O L O v s n e w_d e c o u p l e_Y O L O v s a t t_d e c o u p l e_Y O L O v s 表模型参数量对比模型参数量Y O L O v s a t t_Y O L O v s d e c o u p l e_Y O L O v s n e w_d e c o u p l e_Y O L O v s a t t_d e c o u p l e_Y O L O v s 为了验证本文在YO L O v s中引
40、入解耦头以及对解耦头改进的有效性,本文在YO L O v s中h e a d预测部分,引入了解耦头,将引入解耦头后的模型命名为d e c o u p l e_YO L O v s,并且对引入后的解耦头用全连接层替换定位分支和置信度分支的卷积层,将重新设计解耦头之后的模型命名为n e w_d e c o u p l e_YO L O v s 仍旧是将改进后模型各个参数与YO L O v s算法模型各个参数设置相同的情况下进行实验实验结果如表所示,YO L O v s加入解耦头后 的d e c o u p l e_YO L O v s模 型 相 对 于YO L O v s模型,模型的精度提升了,召
41、回率提升了;在I o U阈值为 的情况下,mA P上升了;在I o U阈值为 到 的情况下,mA P上升了 而对于参数量来说,如表所示,d e c o u p l e_YO L O v s模 型 参 数 量 相 比 于YO L O v s模型的参数量,只增加 倍证明了在YO L O v s中引入解耦头的有效性而n e w_d e 陕西科技大学学报第 卷c o u p l e_YO L O v s相对于YO L O v s,精度提升了;相对于d e c o u p l e_YO L O v s,精度提升了;n e w_d e c o u p l e_YO L O v s在I o U阈值为,相对于
42、YO L O v s,mA P提升了;相对于d e c o u p l e_YO L O v s,mA P提升了;在I o U阈值为 到 ,相对于YO L O v s,mA P提升了;相对于d e c o u p l e_YO L O v s,mA P提升了 而对于参数量来说,如表所示,n e w_d e c o u p l e_YO L O v s参数量相比d e c o u p l e_YO L O v s模型的参数量少 倍以上充分说明了对头部解耦,以及将分类问题用全接层处理的有效性为了验证Y O L O v s同时在F P N处加注意力机制和对头部解耦的有效性,本文在a t t_Y O
43、L O v s模型中加入改进的解耦头,并将其命名为a t t_d e c o u p l e_Y O L O v s,参数设置不变,对比实验结果如表所示通 过 对 比 综 合 评 价 指 标 发 现a t t_d e c o u p l e_Y O L O v s,无论是I o U阈值为 ,还是在I o U阈值为 到 ,其m A P都高于单独在F P N处引入注意力机制的a t t_Y O L O v,或者单独对头部解耦的n e w_d e c o u p l e_Y O L O v s,进一步验证了同时在头部解耦和F P N处引入注意力机制能够有效提升模型的精度在通过观察最终改进后的模型训练
44、时mA P的变化曲线,发现在e p o c h 时候,模型的检测性能仍旧有很大的提升空间为了寻找最优e p o c h,本文又分别在其他参数不变的情况下,将模型分别训练了 e p o c h和 e p o c h,其模型mA P变化曲线如图所示从图能够看出,e p o c h到 e p o c h之间,模型mA P性能mA P有明显的提升,e p o c h到 e p o c h之间,模型mA P性能基本保持不变,可见e p o c h 的时模型性能达到最优图不同e p o c h下的mA P的变化曲线最后,本文从测试图像中随机选取一部分危险品图像进行检测,检测结果如图所示图模型改进前后对比图
45、第期张康佳等:基于改进Y O L O v s的X光图像危险品检测图(a)显示了在X光图像背景下对钳子(P l i e r s)进行检测,原YO L O v s模型所识别出钳子的置信度低于本文提出的a t t_d e c o u p l e_YO L O v s模型图(b)显示了在X光图像背景下对充电宝(P o w e r b a n k)检测,原YO L O v s模型将背景区域误检为剪刀(S c i s s o r s)图(c)显示了在X光图像背景下在对枪(g u n)进行检测,原YO L O v s将枪错检 为 剪 刀,而 本 文 提 出 的a t t_d e c o u p l e_YO
46、 L O v s模型不仅检 测出了g u n,而 且 取 得 了 的置 信 度虽 然 本 文 提 出 的a t t_d e c o u p l e_YO L O v s模型将与锤子(H a mm e r)特征相似的背景区域错误检出,但是同时也给出了低置信度的打分测试结果再一次验证了本文所提a t t_d e c o u p l e_YO L O v s模型的有效性和先进性结论针对X光危险品检测任务中,其物品摆放复杂,背景复杂,危险品种类繁多,难以识别等问题,本文对经典的目标检测模型YO L O v s进行改进,得到了一种新的a t t_d e c o u p l e_YO L O v s模型首
47、先通过在YO L O v s网络的b a c k b o n e和N e c k的特征融合部分引入注意力机制,使浅层特征中有用特征的权重进一步加强,背景特征权重得到减弱,从而 提 升 了 特 征 融 合 的 有 效 性同 时,在 原Y O L O v s的检测头部分,通过对检测头部解耦,将分类任务和定位任务分开处理,减少了分类和定位因为耦合在一起所产生的冲突问题在p i d r a y数据集上进行了多组X光图像危险品检测的对比实验实验结果表明,所提的a t t_d e c o u p l e_Y O L O v s模型无论是从模型复杂度,还是从模型的检测精度来说,其各项性能评价指标都比其他同类
48、目标检测方法有明显的提升在实际应用中,X射线图像中危险品种类繁多,远远不止 类此外,X射线下的图像重叠严重,背景复杂,对X射线图像危险品的准确检测有着很大的影响在未来研究工作中,本课题组将使用多个X射线图像危险品数据集,对更多类型的危险品进行检测同时还将进一步研究更有效的X射线图像特征学习的模型和方法,缓解物品重叠和复杂背景的干扰,从而进一步提升X光图像中危险品检测的性能参考文献G i r s h i c kR,D o n a h u eJ,D a r r e l lT,e ta l R i c hf e a t u r eh i e r a r c h i e s f o r a c c u
49、 r a t eo b j e c t d e t e c t i o na n ds e m a n t i c s e g m e n t a t i o nC/I E E EC o n f e r e n c eo nC o m p u t e rV i s i o na n dP a t t e r nR e c o g n i t i o n C o l u m b u s:I E E E,:G i r s h i c k RF a s tr c n nC/I E E EI n t e r n a t i o n a lC o n f e r e n c eo n C o m p u
50、 t e r V i s i o n S a n t i a g o:I E E E,:R e nS,H eK,G i r s h i c kR,e ta l F a s t e rR C NN:T o w a r d sr e a l t i m eo b j e c td e t e c t i o nw i t hr e g i o np r o p o s a ln e t w o r k sJ I E E E T r a n s a c t i o n so nP a t t e r nA n a l y s i s&M a c h i n eI n t e l l i g e n