ImageVerifierCode 换一换
格式:PDF , 页数:10 ,大小:1.32MB ,
资源ID:467861      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/467861.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(一种轻量化的水下目标检测算法SG-Det_周华平.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

一种轻量化的水下目标检测算法SG-Det_周华平.pdf

1、D O I:1 0.1 6 1 3 6/j.j o e l.2 0 2 3.0 2.0 1 7 8一种轻量化的水下目标检测算法S G-D e t周华平*,宋明龙,孙克雷(安徽理工大学 计算机科学与工程学院,安徽 淮南2 3 2 0 0 0)摘要:基于深度学习的目标检测算法在水下进行检 测 主 要 存 在 两 个 困 难:水 下 设 备 的 存 储 和 计 算能力有限;水下图像模糊且小生物聚集。这种局限性要求水下目标检测算法要做到轻 量 且 高 效,因此现有的目标 检 测 算 法 不 能 完 全 满 足 水 下 目 标 检 测 的 需 求。为 此 本 文 在S S D(s i n g l es

2、h o tMu l t i B o xd e t e c t o r)的网络框架 上 进 行 改 进,设 计 了 一 种 轻 量 化 的 一 阶 段 检 测 模 型S G-D e t。一 方面,借鉴G h o s t N e t的思想,对S h u f f l e N e t V 2网络进行了重 构,提 出 一 种 新 的 轻 量 化 特 征 提 取 网 络S G n e t。此网络进一步减少了模型 参 数 量,使 模 型 大 小 更 适 合 部 署 在 水 下 设 备。另 一 方 面,网 络主要是利用6个不同尺度的特征 图 检 测 不 同 大 小 的 生 物,为 此 设 计 了 一 种 引

3、入 双 分 支 注 意 力 机制的跨尺度特征融合模 块(c r o s s-s c a l ef e a t u r ef u s i o nm o d u l e,A F F)。模 块 首 先 引 入 注 意 力 机 制 对输入的特征在全局通道和局部通道两方面进行加 权,突 出 有 用 信 息,从 而 减 少 背 景 等 无 关 信 息 的干扰。然后选取非线性化程度更高的第4层分别增强前3层的语义信息,以较小的代价使前3层在识别小物体方面有更好的表现。模型在中国水 下 机 器 人 大 赛 提 供 的 水 下 数 据 集UP R C进 行 试验,平均检测精度(mAP)和速度分别达到了7 1.7

4、 5%和6 9F P S,且模型参数量仅有4.9 1M。结果表明,所提出的方法在精度、速度和参数量之间取得了很好的平衡。关键词:神经网络;水下目标检测;轻量化;跨尺度特征增强中图分类号:T P 3 9 1.4 1 文献标识码:A 文章编号:1 0 0 5-0 0 8 6(2 0 2 3)0 2-0 1 5 6-1 0S G-D e t:Al i g h t w e i g h t u n d e r w a t e r i m a g e t a r g e t d e t e c t i o nm e t h o dZ H O UH u a p i n g*,S O N GM i n g l

5、 o n g,S U NK e l e i(C o l l e g e lo fC o m p u t e rS c i e n c ea n dE n g i n e e r i n g,A n h u iU n i v e r s i t yo fS c i e n c ea n dT e c h n o l o g y,H u a i n a n,A n h u i2 3 2 0 0 1,C h i n a)A b s t r a c t:D e e p l e a r n-b a s e do b j e c t d e t e c t i o na l g o r i t h mh

6、a s t w om a i nd i f f i c u l t i e s i nu n d e r w a t e r t a r g e td e-t e c t i o n,w h i c ha r e l i m i t e ds t o r a g ea n dc o m p u t i n gc a p a b i l i t i e so fu n d e r w a t e re q u i p m e n t a n d f u z z yu n d e r-w a t e r i m a g e s a n d s m a l l o r g a n i s m s g

7、 a t h e r i n g.T h i s l i m i t a t i o n r e q u i r e s t h eu n d e r w a t e r t a r g e t d e t e c t i o n a l-g o r i t h mt ob e l i g h t w e i g h t a n de f f i c i e n t,s o t h e e x i s t i n g t a r g e t d e t e c t i o na l g o r i t h mc a nn o t f u l l ym e e t t h en e e d so

8、 f u n d e r w a t e r t a r g e t d e t e c t i o n.I nt h i sp a p e r,a l i g h t w e i g h to n e-s t a g ed e t e c t i o nm o d e lS G-D E Ti sd e s i g n e d t o i m p r o v e t h en e t w o r k f r a m e w o r ko f s i n g l e s h o tM u l t i B o xd e t e c t o r(S S D).O n t h eo n eh a n

9、d,u s i n g t h e i d e ao fG h o s t N e t f o r r e f e r e n c e,S h u f f l e N e t V 2n e t w o r k i s r e c o n s t r u c t e d,a n dan e wl i g h t w e i g h tf e a t u r e e x t r a c t i o nn e t w o r kS G n e t i s p r o p o s e d,w h i c h f u r t h e r r e d u c e t h e n u m b e r o f

10、m o d e l p a r a m e t e r s a n dm a d e t h em o d e l s i z em o r e s u i t a b l e f o r d e p l o y m e n t i nu n d e r w a t e r e q u i p m e n t.O n t h e o t h e r h a n d,t h en e t-w o r km a i n l yu s e s s i x f e a t u r em a p s o f d i f f e r e n t s c a l e s t od e t e c t o r

11、 g a n i s m s o f d i f f e r e n t s i z e s.F o r t h i s p u r-p o s e,a c r o s s-s c a l e f e a t u r e f u s i o nm o d u l e(A F F)u s i n g t w o-b r a n c ha t t e n t i o nm e c h a n i s mi s d e s i g n e d.T h eA F Fm o d u l e f i r s t l y i n t r o d u c e s t h e a t t e n t i o n

12、m e c h a n i s mt ow e i g h t t h e i n p u t f e a t u r e s i nb o t hg l o b a l c h a n-n e l a n d l o c a l c h a n n e l,s o a s t oh i g h l i g h t u s e f u l i n f o r m a t i o n.T oi m p r o v e t h ep r o b l e mo f l o wd e t e c t i o na c-c u r a c yc a u s e db ys m a l l a n d f

13、 u z z y o b j e c t s,t h e f o u r t h l a y e rw i t h ah i g h e r d e g r e e o f n o n l i n e a r i t y i s s e l e c t e dt oe n h a n c e t h e s e m a n t i c i n f o r m a t i o no f t h e f i r s t t h r e e l a y e r s,s o t h a t t h e f i r s t t h r e e l a y e r sh a v eab e t t e r

14、光 电 子 激 光第3 4卷 第2期 2 0 2 3年2月 J o u r n a l o fO p t o e l e c t r o n i c sL a s e r V o l.3 4N o.2 F e b r u a r y2 0 2 3*E-m a i l:m l s o n g 9 7 1 6 3.c o m收稿日期:2 0 2 2-0 4-1 9 修订日期:2 0 2 2-0 5-0 2基金项目:安徽省重点研发计划、国际科技合作专项、矿用防爆纯电动运输车辆关键技术的研究与开发(2 0 2 0 0 4 b 1 1 0 1 0 0 2 9)资助项目p e r f o r m a n

15、c e i n i d e n t i f y i n gs m a l l o b j e c t sw i t has m a l l c o s t.T h em o d e l i s t e s t e do nt h eu n d e r w a t e rd a t as e tU P R Cp r o v i d e db yC h i n aU n d e r w a t e rR o b o tC o m p e t i t i o n,a n dt h em A Pa n ds p e e dr e a c h7 1.7 5%a n d6 9F P Sr e s p e

16、c t i v e l y,w h i l e t h en u m b e r o fm o d e l p a r a m e t e r s i so n l y4.9 1M.T h e r e s u l t ss h o wt h a tt h ep r o p o s e dm e t h o da c h i e v e s ag o o db a l a n c eb e t w e e np r e c i s i o n,s p e e da n dn u m b e r o f p a r a m e t e r s.K e yw o r d s:n e u r a ln

17、 e t w o r k s;u n d e r w a t e ro b j e c td e t e c t i o n;l i g h t w e i g h tn e t w o r k s;f e a t u r ee n h a n c e m e n tb yc r o s s-s c a l e0 引 言 水下生物是水下生态环境的重要组成 部分,水下生态保护组织通常通过人工潜水的方式进行水下拍摄,以便对水下生物的分布和生活 习性进行研究。由于水下环境复杂多变、水下图像模糊,研究人员难以准确发现水下生物,因此,用水下机器人代替人眼进行检测将成为一种趋势。基于深度学习的目标检测算法

18、在通用数据集上保持着较高的准确率,相比于一般的目 标检测任务,现在主流的目标检测网络不完全适 用于水下生物的检测。其中出现的问题一方面是由于水下采集的部分图像不清晰、水下生物较小 且大量聚集,需要设备部署识别精度高的网络;但另一方面,精度高的网络往往是以参数量和速度 为代价的,而水下设备一般存储能力有限,并不适合使用大型的深度神经网络。近年来,人们开始探索一些针对水下 生物的目标检测方法,例如S H I等1使用R e s N e t和双向特征金字塔网络(b i-d i r e c t i o n a l f e a t u r ep y r a m i dn e t-w o r k,B i F

19、 P N)对F a s t e r-R C NN进行改进并应用于水下生物的 检测;P AN2和XU等3改 进 了 基 于多尺度特征的R e s N e t方法,结合高层语义特征和低层 空 间 特 征 对 不 同 尺 度 的 目 标 进 行 检 测;MATH I A S等4将 视 觉 特 征 和 高 斯 混 合 模 型 与YO L O v 3(y o uo n l y l o o ko n c ev 3)深度网络相结合,提高了水下目标自动检测方法的检测效率。上述方法都对水下目标的检测精度有明显提升,但对于存储空间和计算能力有限的水下嵌入式设备来说,网络还是过于冗余。为了减少网络的参数量,Z HA

20、NG等5对YO L OV 4进行改进,用轻量级的M o b i l e N e t V 2作 为 主 干 网 络,NA S E E R等6使 用I n c e p t i o n网络 对F a s t e r-R C NN进 行 轻 量 化 改 进。两种方法均在牺牲了部分检测精度的情况下大大压缩了模型参数,从而在水下摄像机上实 现了对生物的自动检测。综合国内外 的研究现状 发现,当下关于轻量化水下目标检测网络的研究依然较少,目前的一系列算法仍存在改进空间。为了更有效的进行水下目标检测,本 文设计了一种轻量化检测网络S G-D e t,在算法精度和复杂度之间取得了很好的平衡。本文的贡献有以下几点

21、:1)更 少 的 参 数 量:借 鉴G h o s t N e t7思 想 对S h u f f l e N e t V 28网络结构进行改进,设计了一种更加轻量化的特征提取网络S G n e t,既获得了更快的检测速度,也大大减少了模型参数的数量。2)更轻量的特征融合:提出一种融合注意力的 跨尺度特 征 融 合 模 块(c r o s s-s c a l ef e a t u r ef u s i o nm o d u l e,A F F),以较小的代价增强浅层 特征的语义 信息,使其有利于水下小目标的检测。1 相关工作1.1 S S D及其改进 S S D(s i n g l es h o

22、 t M u l t i B o xd e t e c t o r)9使 用VG G作为网络的B a c k b o n e进行特征提取,选取6个不同尺度的特征层直接回归检测框,对大尺寸特征图使用小的回归框,既保证了较快的检测速度,又确保了检测精度。这种方法存在的一个缺陷是尺寸大的特征层卷积次数较少,这意味着学到的可用信息较少,因此S S D对小目标的检测效果较差。后期人们为了提高小目标的检测精度对网络进行了多次改进,如在D S S D1 0中,把B a c k b o n e改成了R e s i d u-a l-1 0 1,添加了反卷积模块,使前后特征层信息复用,以参数量的增加和检测速度的降

23、低为代价大大提高了小目标检测准确率;F S S D1 1中设计了一个轻量级的特征融合模块,使用不同尺度的特征图相互增强,在速度稍有下降的同时提高了S S D的检测精度。S S D网络结构见图1。751第2期 周华平等:一种轻量化的水下目标检测算法S G-D e t 图1 S S D网络结构图F i g.1 S S Dn e t w o r ks t r u c t u r e1.2 轻量化网络 模型轻量化是神经网络的另一个发展方向,例如M o b i l e N e t V 11 2和M o b i l e N e t V 21 3通过使用深度可分离卷积来代替传统卷积,S h u f f l

24、e N e t1 4使用分组卷积和通道重排来进行模型压缩。G h o s t N e t使用了另一种思想,其作者通过观察发现图片经过卷积操作之后,存在大量非常相似的特征图,因此考虑只用传统卷积方式生成部分特征图,其余的特征图不再通过卷积生成,而是通过廉价的线性运算生成。对于传统卷积给定输入数据XRchw(c、h、w分别是是输入数据的维度、高度和宽度)、输出数据YRh w n(n是特征图通道数,h 和w 分别是输出数据的高度和宽度)、卷积核大小为kk,则所需要的浮点运算数(f l o a t i n g-p o i n to p e r a t i o n s,F L O P s)为nh w c

25、kk。对于G h o s t模块,同样给定上面的数据,假设m个特征图是由原始卷积生成,每个原始模块变幻的数量为是s,每个线性运算的平均内核大小为dd,则线性变换的F L O P s仅为(s-1)mh w dd。经过式(1)分析可以得出,模型的参数压缩比为S,因此使用G h o s t模块网络的参数和计算成本显著降低。rc=nckknsckk+(s-1)nsddscs+c-1s。(1)2 S G-D e t结构设计 S G-D e t算法主要由轻量级提取特征的网络S G-n e t、A F F和分类及回归子网络构成,网络总体框架如图2所示。S G n e t借鉴了S h u f f l e n

26、e t V 2和G h o s t-N e t的思想,可以在保证特征提取能力的同时大大减少模型参数量。A F F模块是一个引入双分支注意力机制的轻量化特征融合模块,可以在不同尺度的特征层上进行3次跨尺度语义增强,通过增加少量的参数提高了模型对小目标的检测能力。在分类和回归子网络中,选取6个不同尺度的特征层作为额外层,每个层设置大小和数量均不相同的检测框,总共选取了8 7 3 2个候选框进行下一步的筛选,最后选取合适的框生成检测结果。2.1 特征提取网络S G n e t2.1.1 扩张块 特征提取网络是目标检测的基础,也是检测网络最重要的部分。受X c e p t i o n1 5的启发,本文

27、在第一个特征提取块之前设计了一种经济高效的特征扩张块(E x p a n dB l o c k)。扩张块结构如图3(a)所示,网络可以在不增加太多计算开销的情况下,增加首个卷积层的通道数,有效地提高特征表达能力,实现了特征的初步提取。其中用G h o s t模块代替11卷积,可以进一步减少参数和计算量。2.1.2 提取块 设计轻量化网络要考虑计算资源和能力,因此不能设计过深的网络。用G h o s t模块代替S h u f f l e-n e t V 2分组卷积中的逐点卷积,构造了特征提取块(E x t r a c tB l o c k)来代替传统卷积。在图3(b)所示的E x t r a c

28、 tB l o c k A模块中,首先对输入特征进行一个通道分割(c h a n n e l s p l i t),将通道平分成相等的两部分;然后保持其中一个分支不做变化,另一个分支利用G h o s t模块进行通道扩张,然后进行33的深度卷积,再利用一个G h o s t模块进行通道压缩;接着将两个分支进行通道拼接,这样做可以保持运算前后通851 光 电 子 激 光 2 0 2 3年 第3 4卷图2 S G-D e t网络整体结构F i g.2 O v e r a l l s t r u c t u r eo fS G-D e tn e t w o r k道数相同,使内存访问更为高效。最后通

29、过一个通道混洗(c h a n n e l s h u f f l e),在不增加计算量的情况下对通道进行充分的混合。图3(c)的E x t r a c tB l o c k B与E x t r a c tB l o c k A相比,深度卷积的步长(s t r i d e)设为2,特征图就被下采样到原来的1/2,在增大卷积核感受 野 同 时 过 滤 有 干 扰 的 噪 声。同 时E x t r a c tB l o c k B不需要进行c h a n n e ls p l i t操作,拼接后通道数扩大一倍,减少特征信息的丢失。图3 S G n e t子模块F i g.3 S G n e t u

30、 n i t2.1.3 S G n e t网络整体结构 根据上文设计的S G n e tu n i t,构建了如表1所示的骨干网络S G n e t。S G n e t网络整体结构分为4个阶段:S t a g e 0是由E x p a n dB l o c k构成以进行特征的951第2期 周华平等:一种轻量化的水下目标检测算法S G-D e t 初步提取,这个阶段将特征图下采样到7 57 5,特征图维 度 增 加 到6 4,可 以 有 效 增 强 特 征 表 达 能 力;S t a g e 1由上文提 出的若干E x t r a c tB l o c k A和E x-t r a c tB l

31、o c k B堆叠而成(其中s t r i d e为1表示使用E x t r a c t B l o c k A,s t r i d e为2表 示 使 用E x t r a c tB l o c k B,R e p e a t代表使用该模块的次数),首先用一个E x t r a c tB l o c k B模块,将特征图下采样为3 83 8的尺寸,然后连续使用3个E x t r a c tB l o c k A模块进行特征提取,然后将提取后的特征图送入S t a g e 2;同理S t a g e 2和S t a g e 3分别使用1个E x t r a c tB l o c k B、7个E

32、x t r a c tB l o c k A和1个E x t r a c tB l o c k B、3个E x-t r a c tB l o c k A进行特征提取。在每个S t a g e中,输入u n i t的特征的一半维度直接与下一个u n i t相连,这种特 征 重 用 可 以 在 保 持 高 效 率 的 同 时 提 高 检 测精度。表1 S G n e t网络整体结构T a b.1 S G n e tn e t w o r kf r a m e w o r kL a y e rO u t p u t s i z e S t r i d e R e p e a t O u t p u

33、t c h a n n e lI m a g e3 0 03 0 0-3S t a g e 07 57 5216 4S t a g e 13 83 83 83 821132 5 62 5 6S t a g e 21 91 91 91 921175 1 25 1 2S t a g e 31 01 01 01 021131 0 2 41 0 2 4G l o b a l a v g p o o l11-F C-1 0 0 02.2 跨尺度特征增强2.2.1 双分支注意力模块 在水下图像中,由于各种水下生物的颜色与背景色相似导致检测精度的降低,所以在A F F模块中设计了如图2(b)所示的双分支注意

34、力模块(d u a l-b r a n c ha t t e n t i o nm o d u l e,D B AM)来缓解这一情况。该模块通过在全局特征和局部特征通道上加权来放大有用的物体信息,消除无用的背景干扰等信息。D B AM模块利用两个不同的分支来获得通道注意力权重。一个分支分别使用全局最大池化和全局平均池化来研究全局特征的通道信息,而另一个分支使用逐点卷积来提取局部特征的通道信息。最后将两个分支融合在一起,以此来更好地组合不同尺度的特征。经过D B AM得到特征YRCHW的过程可以解释为式(2)。D B AM(X)表示经过D B AM得到的注意力权重,其中X是C NN中某一层的输出

35、,C为通道数,HW是特征图大小。G(X)和L(X)分别表示全局特征和局部特征通道上下文,可表示为式(3)和(4):Y=XD B AM(X)=X(G(X)L(X),(2)G(X)=M L P(A v g p o o l(X)M L P(M a x p o o l(X),(3)L(X)=B(P w C o n v2(B(P w C o n v1(X)。(4)式中,A v g p o o l(X)表示全局平均池化,M a x p o o l(X)表示全局最大池化,B表示批量归一化,表示R e-L U函数,表示S i g m o i d函数,表示广播机制的加法运算,表示逐元素乘法运算。2.2.2 A

36、F F 网络需要在浅层特征进行小物体的检测,因此设计了如图2(a)所示的融合双分支注意力机制的A F F,它可以使浅层特征获得更多高层特征的语义信息。实验结果表明:C o n v 7和C o n v 8完全丢失了小物体的细节,所以模型使用了C o n v 6之前的特征图进行特征增强。图4所示是将S G n e t 3_2和C o n v 6_2进行跨尺度特征增强的过程,首先需要将C o n v 6_2特征图上采样到与S G n e t 3_2相同大小;其次,将上采样的输出和S G n e t 3_2分别依次通过一个33的卷积层、R e L U激活函数层和L 2正则化层后对两个特征图进行求和输出

37、后传递给D B AM模块,通过得到相应的注意力权重后对原来特征图进行调整;最后,将两个特征相加后使用335 1 2的卷积核保证特征的可分辨性,并经过R e L U层后生成新的特征图C o n v 9。同理通过另外两个A F F模块生成了增强后的C o n v 1 0和C o n v 1 1。在S G-D e t网络的分类和回归子网络中将C o n v 6_2、C o n v 7_2、C o n v 8_2与特征增强后的C o n v 9(1 91 9)、C o n v 1 0(1 01 0)、C o n v 1 1(55)一块发送到预测模块进行预测。图4 S G n e t 3_2和C o n

38、 v 6_2跨尺度特征增强F i g.4 C o n v 6_2f e a t u r e s e n h a n c e dS G n e t 3_2061 光 电 子 激 光 2 0 2 3年 第3 4卷3 实验结果分析3.1 数据集来源及处理 本文共使用两个水下生物数据集。第一个是U P R C水下数据集(2 0 2 0年全国水下机器人目标抓取大赛提供),U P R C共有61 8 5张图片,又通过翻转、裁剪等方式将数据集扩充到1 1 5 0 0张,图片中包含海参、海胆、扇贝、海星、水草等5类水下生物,但因为水草标注过少(仅1 1 4)而不参与预测。第二个是自制的海洋生物数据集UWD数据

39、集,共有4 2 5 4张图片,又通过翻转、裁剪等方式将数据集扩充到7 3 0 0张,数据集中包含鱼、水母、企鹅、鲨鱼、海星、黄貂鱼、海鹦等7种海洋生物。其中U P R C数据集由水下设备拍摄,如图5(a)所示,大部分图片存在模糊、失真等现象。UWD数据集是在水族馆拍摄的清晰图片,如图5(b)所示,图片质量较高。通过在2种不同清晰度的数据集上进行实验,验证S G-D e t的鲁棒性。图5 两个水下生物数据集F i g.5 T w ou n d e r w a t e rb i o l o g i c a l d a t a s e t3.2 实验环境及评价指标 实 验 操 作 系 统 为U b

40、u n t u 1 8.0 4,显 卡 为NV I D I A G e F o r c eR T X2 0 8 0 T i,C UD A为1 0.0版本。使用深度学习框架P y t o r c h 1.3.1对S G-D e t进行训练、测试以及可视化分析,首先在P A S C A L VO C上进行预训练,初始学习率设置为0.0 0 1,批处理大小为3 2,每经过5 0个E p o c h将学习率降为原来的1 0%。目标检测模型的性能优劣可以从检测精度和速度两个方面进行评价。检测速度以帧每秒(F P S)为单位,即模型每秒能够检测到的图像数。对于单类检测,本文以精准率(P r e c i s

41、 i o n)、召回率(R e c a l l)作为检测精度的评价指标。这些被定义为式(5)和式(6):P r e c i s o n=T PT P+F P,(5)R e c a l l=T PT P+F N,(6)式中,T P、F P、FN分别为准确检测到、错误检测到、未检测到的对象数。以精准率和查全率所包围的图形区域作为这类对象的平均检测精度(A P)。在检测种类较多的情况下,检测精度一般以平均精度均值(mA P)作为评价指标,其中N为数据集中对象类别的个数。m A P=1NA P。(7)161第2期 周华平等:一种轻量化的水下目标检测算法S G-D e t 由于模型在考虑精度的同时,还要

42、兼顾模型的参数量,因此计算量(F L O P s)和参数量(P a r a m e t e r s)也作为评价的重要指标。3.3 实验结果3.3.1 消融实验 本文进行了消融实验来验证不同子模块或手段的有效性。表2显示了在U P R C上进行消融实验的结果。其中表示使用了相应的子模块。在列出的模型中,M o d e l 4使用了S S D算法的 主要 框 架,M o d e l 1将S S D的主干网络替换为S G n e t,其余网络结构与S S D一致;M o d e l 2是将A F F模 块加入到M o d e l 1的 模 型;M o d e l 3是 将D B AM模 块 加 入

43、到M o d e l 2的模型。表2所示的实验 结果表明,M o d e l 1与M o d e l 4相比,模型在精度相差不大的情况下,使用S G n e t模块后模型大小降为原来的1/9,速度提升了将近一倍,网络的参数和计算成本显著降低。M o d e l 2与M o d e l 1相比,因为进行了多尺度的特征融合,速度下降了1 0F P S,但参数量仅有少量的增加且精度提升了3%。表3显示了在使用A F F模块前后模型各类精度的变化,表4显示了在使用A F F模块前后召回率的变化,结果表明海参和海胆的准确率和召回率得到了明显的提升,其他目标也有不同程度的提升。图6是使用A F F模块前后

44、的检测效果对比,明显看出在使用了A F F模块后,小海参的漏检和模糊的海胆的漏检现象都有很大的改善,且准确率明显提升。实验结果充分说明了使用A F F模块进行跨尺度特征融合可以有效提升小目标的检测性能。M o d e l 3与M o d e l 2相比,在参数量和速度相差不大的情况下进一步提升了检测精度。综上所述,本文所提出的方法是有效的,以小的成本实现了大的收益。表2 U P R C上的消融实验结果T a b.2T e s t r e s u l t so f t h ea b l a t i o ne x p e r i m e n t o nt h eU P R CM o d e lM

45、e t h o d sS G n e t A F F D B AMmA P/%P a r a m e t e r s/MS p e e d/F P SM o d e l 1-6 8.9 53.7 58 1M o d e l 2-7 1.5 54.8 77 1M o d e l 37 1.7 54.9 16 9M o d e l 4-6 8.7 53 4.34 6表3 模型有无A F F模块的单类精度比较T a b.3 A c c u r a c yc o m p a r i s o no fm o d e lw i t hA F Fm o d u l eo rn o tM e t h o d

46、sA PH o l o t h u r i a n E c h i n u s S c a l l o p S t a r f i s hmA P/%W i t hA F F0.5 5 4 00.7 6 4 1 0.4 9 9 5 0.7 3 8 9 7 1.5 5W i t h o u tA F F0.3 9 3 50.7 2 0 8 0.4 3 6 5 0.7 0 0 1 6 8.9 5表4 模型有无A F F模块的召回率比较T a b.4C o m p a r i s o no f r e c a l l r a t eo fm o d e lw i t ha n dw i t h o

47、u tA F Fm o d u l eM e t h o d sH o l o t h u r i a nE c h i n u s S c a l l o p S t a r f i s hW i t hA F F0.5 5 4 00.7 6 4 1 0.4 9 9 5 0.7 3 8 9W i t h o u tA F F0.3 9 3 50.7 2 0 8 0.4 3 6 5 0.7 0 0 13.3.2 S G-D e t与其他目标检测算法在水下数据集上的比较 为了验证S G-D e t算法的有效性,在P A S C A LVO C上进行预训练后的S G-D e t模型分别转移到水下数

48、据集U P R C和UWD上进行最终训练,总e p o c h设置为2 0 0(f r e e z i n ge p o c h设置为3 0,n o n-f r e e z i n ge p o c h设置为1 7 0),其他训练参数保持不变,训练过程的损失曲线图如图7所示。对比使用6种检测的网络结构与本文提出的检测器,分别为S S D、D S S D、YO L OV 4、YO L OV 4-t i n y、S S D-S h u f f l e N e t V 2、P e l e e-N e t,所有模型都属于单阶段检测器,其中YO L OV 4-261 光 电 子 激 光 2 0 2 3年

49、 第3 4卷图6 模型有无A F F模块的检测效果对比F i g.6 C o m p a r i s o no f t h ed e t e c t i o ne f f e c tw i t ha n dw i t h o u tA F Fm o d u l e i nt h em o d e lt i n y、S S D-S h u f f l e N e t V 2、P e l e e N e t又是轻量级的检测器。表5和表6的数据显示,算法在两个数据集上与其他算法对比均有较好的表现。其中S G-D e t算法在UWD上mA P能达到8 7.3%,而且检测速度能达到6 7F P S,完全

50、满足实时检测的要求。U P R C数据集中的图片大多存在模糊和失真等现象,所以算法在U P R C数据集上检测效果要差于在UWD数据集上的检测效果,图7显示了算法在两个数据集上损失函数变化,显而易见算法在U P R C数据集上损失较高。尽管如此,算法在U P R C上的mA P依然维持在较高的水平,达到了7 1.7 5%,在所有模型中排名第二,仅次于D S S D。由此可见S G-D e t相比于其他算法更能适应不同的检测环境,具有更好的鲁棒性。图7 S G-D e t训练损失函数曲线图F i g.7 C h a r t o fS G-D e t t r a i n i n g l o s s

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服