收藏 分销(赏)

基于改进的YOLOv5的航拍图像中小目标检测算法_杨慧剑.pdf

上传人:自信****多点 文档编号:277527 上传时间:2023-06-26 格式:PDF 页数:8 大小:1.43MB
下载 相关 举报
基于改进的YOLOv5的航拍图像中小目标检测算法_杨慧剑.pdf_第1页
第1页 / 共8页
基于改进的YOLOv5的航拍图像中小目标检测算法_杨慧剑.pdf_第2页
第2页 / 共8页
基于改进的YOLOv5的航拍图像中小目标检测算法_杨慧剑.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 基于改进的Y O L O v 5的航拍图像中小目标检测算法*杨慧剑,孟 亮(太原理工大学信息与计算机学院,山西 晋中 0 3 0 6 0 0)摘 要:目前基于无人机航拍的目标检测技术广泛应用于军事和民用领域,但因其存在成像距离远、高空拍摄图像模糊和目标信息占比小等问题,目标检测准确率不高。针对这一问题,提出一种基于YO L O v 5的改进算法。该算法首先在数据增强方面对原始图像进行加雾处理,提高其在雾天的鲁棒性;其次通过融合C B AM模块,来增强不同通道和空间的重要性;再者将原算法中的S P P更换为A S P P,以减小池化操作对特征信息的影响;最后在F P N结构中增加一层检测头,用

2、于更细粒度的检测目标。以YO L O v 5 s为B a s e l i n e,实验表明,改进后的算法比原算法的mA P_0.5提高了6.9%,可以有效应用于航拍小目标的检测。关键词:YO L O v 5;无人机;注意力机制;金字塔池化;特征金字塔中图分类号:T P 3 9 1.4文献标志码:Ad o i:1 0.3 9 6 9/j.i s s n.1 0 0 7-1 3 0 X.2 0 2 3.0 6.0 1 3A s m a l l t a r g e t d e t e c t i o n a l g o r i t h m b a s e d o n i m p r o v e d

3、Y O L O v 5 i n a e r i a l i m a g eYANG H u i-j i a n,ME NG L i a n g(S c h o o l o f I n f o r m a t i o n a n d C o m p u t e r,T a i y u a n U n i v e r s i t y o f T e c h n o l o g y,J i n z h o n g 0 3 0 6 0 0,C h i n a)A b s t r a c t:A t p r e s e n t,t h e t a r g e t d e t e c t i o n t

4、e c h n o l o g y b a s e d o n UAV a e r i a l p h o t o g r a p h y i s w i d e l y u s e d i n m i l i t a r y a n d c i v i l f i e l d s,b u t t h e a c c u r a c y o f t a r g e t d e t e c t i o n i s n o t h i g h b e c a u s e o f t h e l o n g i m a g-i n g d i s t a n c e,b l u r r e d i

5、m a g e s t a k e n a t h i g h a l t i t u d e s,a n d s m a l l p r o p o r t i o n o f t a r g e t i n f o r m a t i o n.T o s o l v e t h i s p r o b l e m,a n i m p r o v e d a l g o r i t h m b a s e d o n YO L O v 5 i s p r o p o s e d.F i r s t l y,t h e o r i g i n a l i m a g e i s f o g g

6、 e d t o i m p r o v e i t s r o b u s t n e s s o n f o g g y d a y s.S e c o n d l y,t h e i m p o r t a n c e o f d i f f e r e n t c h a n n e l s a n d s p a c e s i s e n h a n c e d t h r o u g h t h e i n t e g r a t i o n o f C B AM m o d u l e s.F u r t h e r m o r e,t h e S P P i n t h e

7、o r i g i n a l a l g o r i t h m i s r e p l a c e d b y t h e A S P P t o r e d u c e t h e i n f l u e n c e o f p o o l i n g o p e r a t i o n o n f e a t u r e i n f o r m a t i o n.F i n a l l y,a d e t e c t i o n h e a d i s a d d e d t o t h e F P N s t r u c t u r e t o d e t e c t t a r

8、g e t s w i t h f i n e r g r a n u l a r i t y.T a k i n g YO L O v 5 s a s b a s e l i n e,t h e e x p e r i m e n t p r o v e s t h a t t h e i m p r o v e d a l g o r i t h m i n c r e a s e s mA P_0.5 b y 6.9%i n c o m p a r i s o n t o t h e o r i g i n a l a l g o r i t h m,a n d c a n b e e

9、f f e c t i v e l y a p p l i e d t o t h e d e t e c t i o n o f s m a l l t a r g e t s i n a e r i a l p h o t o g r a p h y.K e y w o r d s:YO L O v 5;u n m a n n e d a e r i a l v e h i c l e(UAV);a t t e n t i o n m e c h a n i s m;s p a t i a l p y r a m i d p o o l-i n g;f e a t u r e p y r

10、a m i d1 引言近几年无人驾驶飞机在低空、超低空等领域得到长足的发展,应用范围也逐步扩大,机器也由高精尖向平民化迈进。随着基于计算机视觉的目标检测技术日益成熟1,2,利用航拍的图像进行目标检测也发挥着重大作用。传统的地面监测系统覆*收稿日期:2 0 2 1-1 0-2 5;修回日期:2 0 2 2-0 2-0 9通信作者:孟亮(mm 1 3 6 t y u 1 6 3.c o m)通信地址:0 3 0 6 0 0 山西省晋中市太原理工大学信息与计算机学院A d d r e s s:S c h o o l o f I n f o r m a t i o n a n d C o m p u

11、t e r,T a i y u a n U n i v e r s i t y o f T e c h n o l o g y,J i n z h o n g 0 3 0 6 0 0,S h a n x i,P.R.C h i n a C N 4 3-1 2 5 8/T PI S S N 1 0 0 7-1 3 0 X 计算机工程与科学C o m p u t e r E n g i n e e r i n g&S c i e n c e第4 5卷第6期2 0 2 3年6月 V o l.4 5,N o.6,J u n.2 0 2 3 文章编号:1 0 0 7-1 3 0 X(2 0 2 3)0

12、6-1 0 6 3-0 8盖面积小,人力、物力耗费比较大,具有局限性。而航拍具有覆盖面积广、移动方便等优势3。由于无人机飞行高度的原因,拍摄到的图像中待检测目标往往呈现出小目标的特性,导致目标检测过程的识别准确率低、识别速度不佳,因此基于小目标的识别是目标检测中的一大难点。本文以YO L O v 5(Y o u O n l y L o o k O n c e v e r-s i o n 5)为基础,针对航拍图像中小目标检测准确率不高的问题,提出一种基于YO L O v 5改进的目标检测算法,分别采用基于加雾的数据增强手段、在骨干网络(B a c k b o n e)中嵌入通道和空间注意力机制模

13、块、将空间金字塔池化S P P(S p a t i a l P y r a-m i d P o o l i n g)模 块 更 换 为 空 洞 空 间 金 字 塔 池 化A S P P(A t r o u s S p a t i a l P y r a m i d P o o l i n g)模块4以及增加一层小目标检测头的方式进行改进。实验表明,本文改进算法的mA P_0.5相比YO L O v 5的提高了6.9%,得到了有效的提升。2 相关研究目前,目标检测算法大体上分为2类:两阶段(T w o-S t a g e)目标检测算法和单阶段(O n e-S t a g e)目标检测算法。2.1

14、 T w o-S t a g e目标检测算法研究T w o-S t a g e目标检测算法首先生成可能包含物体的候选区域,然后对候选区域进行分类和校准,最终得到检测结果。T w o-S t a g e目标检测算法最初由G i r s h i c k等5于2 0 1 4年提出的,并在区域卷积神经网络R-C NN(R e g i o n b a s e d C o n v o l u t i o n-a l N e u r a l N e t w o r k)中实现了该算法。2 0 1 4年,H e等6提出空间金字塔池化网络S P P N e t(S p a t i a l P y r a m i

15、 d P o o l i n g N e t w o r k),引入S P P解决了输入图像必须统一大小的问题。为解决R-C NN步骤繁琐、训练耗时严重、计算量过大和检测速度不理想等问题,2 0 1 5年G i r s h i c k7结合S P P N e t中S P P的优点,提出了F a s t R-C NN算法,2 0 1 6年又使用区域预测网络R P N(R e g i o n P r e d i c a t i o n N e t w o r k)取代原来的选择性搜索方法来生成候选框,提出了F a s t e r R-C NN算法8,用于提升检测速度,以满足端到端的实时应用需求。2

16、.2 O n e-S t a g e目标检测算法研究O n e-S t a g e目标检测算法不需要生成目标候选区域,仅需要将图像信息送入网络1次,即可预测出所有的边界框。T w o-S t a g e目标检测算法则先针对图像生成大量的目标候选区域,然后对目标候选区域进行分类和回归,耗费时间较长。相比T w o-S t a g e目标检测算法,O n e-S t a g e目标检测算法速度更快,适合在移动端部署。如单次多边框检测S S D(S i n g l e S h o t M u l t i B o x D e t e c t o r)9算法采用VG G(V i s u a l G e

17、o m e t r y G r o u p)1 91 0作为主干网,用于提取目标特征,还使用不同尺度的特征图来预测不同尺寸的目标,但其缺点是无法准确定位低分辨率图像中难以检测的小目标。YO L O系列1 1 1 4算法是O n e-S t a g e目标检测算法的代表,其核心思想是将图像划分为多个区域,如果目标的中心落在某个区域网格里,则该网格负责预测此区域目标的边界框和概率,这些边界框由预测的概率加权。随着不断的优化与更新,YO L O已经出现了v 1v 5共5个版本,目前已经成为科研人员采用的主流目标检测框架。3 算法分析与改进YO L O v 5按 照 深 度 和 宽 度 不 同 可 分

18、 为YO L O v 5 s、YO L O v 5 l、YO L O v 5 m和YO L O v 5 x共4种模型,YO L O v 5 s是速度最快、最轻量的模型,适宜在移动端部署。本文针对小目标的特点在YO L O v 5的基础上进行改进,以提升对小目标检测的准确率。3.1 Y O L O v 5算法介绍在YO L O v 4发 布 一 个 多 月 后,J o c h e r便 在G i t h u b上开源发布了YO L O v 5。YO L O v 5算法与YO L O v 4算法相似,整体结构同样分为骨干网络(B a c k b o n e)、瓶颈层(N e c k)和检测头部(H

19、 e a d)3大部分。YO L O v 5对YO L O v 4做出的改进在于:(1)采用自适应锚框计算,训练时无需单独计算锚框大小。(2)增加自适应的图像缩放功能,使得目标形变更小,有利于特征提取。(3)骨干网络中增加了F o c u s结构,用于加快算法检测速度。(4)构造2种跨阶段局部连接C S P(C r o s s-S t a g e P a r t i a l c o n n e c t i o n)结构,其中C S P 1_X结构应用于骨干网中,C S P 2_X结构用于N e c k中。C S P结构将输入的特征图分为2部分,一部分进行卷积操作,另一部分和卷积操作后的结果进行

20、特征融合,C S P结构实现了更丰富梯度组合的同时还减少了计算量。(5)瓶颈层同YO L O v 4一样采用特征金字塔网络F P N(F e a t u r e P y r a m i d N e t w o r k)+路径聚合网络P AN e t(P i x e l A g g r e g a t i o n N e t w o r k)的结构,不同的是YO L O v 4的N e c k中都是采用普通的卷积操4601C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)作,而YO L O v 5

21、则采用C S P 2_X结构,加强了网络的特征融合能力。(6)检测头部采用广义交并比损失G I o U_L o s s(G e n e r a l i z e d-I o U_L o s s)1 5作为损失函数,并在目标检测后的处理中使用非极大值抑制1 6,从而进一步 提 升 算 法 的 检 测 准 确 率。以YO L O v 5为例其算法结构图如图1 a所示。F i g u r e 1 A l g o r i t h m s t r u c t u r e s b e f o r e a n d a f t e r i m p r o v e m e n t图1 改进前后的算法结构图3.2

22、Y O L O v 5算法改进针对YO L O v 5算法在小目标检测上识别不佳的情况,本文对其进行相应的改进,以提升小目标检测的准确率。改进后的算法结构图如图1 b所示。3.2.1 基于加雾的数据增强考虑到基于航拍的目标检测有时会在雾天进行,而由于雾天的影响,能见度会随着距离的变化而改变,给远距离的目标识别带来严重的影响。所以,除YO L O v 5算法本身的数据增强方法外,本文还增加了对原始数据进行加雾处理的数据增强方法,用于提升算法的鲁棒性。本文采用基于中心点合成雾图方法,即将图像中一个点作为雾的扩散点,距离雾中心点距离越近,雾合成的效果越强,距离雾中心点距离越远,雾合成的效果越弱,以此

23、来模拟真实场景中的雾图。5601杨慧剑等:基于改进的YO L O v 5的航拍图像中小目标检测算法图2为图像加雾前后的对比。F i g u r e 2 I m a g e c o m p a r i s o n b e f o r e a n d a f t e r f o g g i n g图2 图像加雾前后对比3.2.2 注意力机制注意力机制的灵感来源于人类处理视觉信息的方式,目的是使算力集中到输入信号中信息量更多的部分。注意力机制最初应用于机器翻译1 7,能够更好地理解上下文的关联关系。后来被广泛应用于计算机视觉领域,并取得了不错的效果。神经网络可以在空间维度、通道维度或二者混合维度上引

24、 入 注 意 力 机 制。本 文 在 原 始YO L O v 5的B a c k b o n e中的C B S模块后融合C B AM(C o n v o l u-t i o n a l B l o c k A t t e n t i o n M o d u l e)1 8。C B AM是一个轻量级的模块,可以集成到C NN体系结构中,并且采用端到端的方式进行训练。C B AM结构如图3所示,其包含通道注意力模块和空间注意力模块2个独立的子模块,通过融合2个模块的方式,在只增加很少计算量的同时,得到稳定的性能提升。文献1 8 的实验表明,将C B AM集成到不同的算法中后,算法的性能得到了很大的

25、提升,证明了该模块的有效性。无人机拍摄的图像中含有大量的复杂背景元素,影响特征的提取,使用C B AM模块可以过滤掉一些干扰因素,并专注于目标特征信息。F i g u r e 3 C B AM s t r u c t u r e图3 C B AM结构图3.2.3 空间金字塔池化在YO L O v 5中,S P P用来实现局部特征和全局特征的提取,输入的特征图经过相同步长但不同尺寸的最大池化操作后,得到局部特征与全局特征,再利用连接(C o n c a t)操作将局部特征与全局特征相融合,丰富了特征图的表达能力,有利于提升对大小不一的目标的检测准确率。S P P模块由4个分支组成,分别是核大小为

26、55,99,1 31 3的最大池化和1个跳跃连接。但是,最大池化操作会不可避免地丢掉一些特征信息,这种操作不利于小目标的检测。本文采用基于空洞卷积的A S P P模块4替换S P P模块,A S P P模块采用不同采样率的空洞卷积进行卷积操作进一步提取特征。空洞卷积操作如图4 a所示,可以在不增加太多计算量的同时增大感受野,而且不像最大池化会丢掉一些特征信息。本文中的A S P P模块采用采样率r a t e分别为1,3,6的33空洞卷积核和1个跳跃连接,如图4 b所示。F i g u r e 4 A S P P s t r u c t u r e图4 A S P P结构图3.2.4 小目标检

27、测头在目标检测算法中,往往需要预测不同尺度的物体,采用特征金字塔网络F P N1 9可以很好地解决这个问题。YO L O v 5的N e c k部分采用的是基于F P N改进的路径聚合网络P AN e t结构2 0,P A-N e t是在F P N结构上加入从上到下的旁路连接,目的是加快特征信息间的传递,用于缩短底层特征和高层特征之间的信息路径。YO L O v 5的检测头有3层输出,分别预测大、中、小3种目标。当输入图像大小为6 4 06 4 0时,B a c k b o n e输出大小为2 02 0的特征图,将2 02 0的特征图经过2次上采样操作后得到8 08 0大小的特征图,再与B a

28、 c k b o n e中第2次C S P操作即输出为8 08 0的特征图进行连接(C o n c a t)后,即可得到融合了底层与高层特征信息的小目标检测头,6601C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)那么,可以从6 4 06 4 0的图像中检测到的最小目标大小为88。而分析V i s D r o n e数据集2 1后发现,该数据集包含大量的小目标信息,如图5所示,YO L O v 5的3层检测头并不足以满足小目标检测的要求。所以,本文在3层检测头的基础上增加了一层检测小目标的检

29、测头。改进后的网络模型如图1 b所示,将B a c k b o n e输出的2 02 0特征图经过3次上采样操作后与B a c k b o n e中第1次C S P操作后输出的1 6 01 6 0特征图进行连接(C o n-c a t),采取深层特征与更浅层特征相融合的方式进行预测,那么,可以从6 4 06 4 0的图像中检测到的最小目标大小为44。比如2 42 4的小目标在经过F o c u s结构与1次特征提取后输出大小为66的特征图,便与高维特征连接(C o n c a t)进行预测,而YO L O v 5算法需经过2次特征提取,输出大小为33的特征图。小目标经过过多的卷积池化操作后特征

30、图会被压缩得很小,容易出现根据1个特征点来预测整个目标的情况,不利于检测。增加检测层后减少了小目标经卷积池化操作后的特征丢失情况,计算量虽然有所增加,但针对小目标的检测性能有不小的提升。4 实验与结果分析本文实 验 所 采 用 的 配 置 如 下:操 作 系 统 为W i n d o w s 1 0,计算机配置为I n t e l E 5-2 6 8 0 C P U,6 4 G B内存,2块NV I D I A 2 0 8 0 t i G P U,显存1 1 G B。在以上硬件基础上使用P y T o r c h深度学习框架构建网络模型。4.1 数据集分析本文使用V i s D r o n e

31、 2 0 2 0数据集进行实验,该数据集由天津大学A I S KY E Y E团队使用各种无人机平台在不同场景、天气和光照条件下拍照构建,包含 1 0 2 0 9幅静态图像,3 4 2 3 9 1个标签。实验发现有2 8 3 2 6个标签大小小于33像素,分为1 0个类别,包括行人、汽车、自行车和三轮车等。数据集中类别占比与标签数如图5所示。在图5 a中,c a r和p e d e s t r i a n占据大部分,而t r i c y c l e、a w n i n g-t r i c y c l e和b u s等则占比很小,类比严重不均。图5 b则展示了数据集中目标所占图像大小的比例,绝大

32、部分目标均为小目标,大小只有几十个像素。类比不均与小目标数量过多均给算法带来了严峻的挑战。4.2 评价指标本文使用表1所示的评价指标进行算法评估。F i g u r e 5 D a t a s e t c a t e g o r y n u m b e r a n d s i z e r a t i o图5 数据集类别数及大小占比T a b l e 1 E v a l u a t i o n i n d i c a t o r s a n d t h e i r d e f i n i t i o n s表1 评价指标及其定义评价指标指标定义P r e c i s i o nP r e c i

33、 s i o n=T PT P+F PR e c a l lR e c a l l=T PT P+FNA P单类别平均准确率mA P多类别平均准确率平均值F P S每秒内可以处理的图像数量 表1中,T P表示实际为正例且被分类器划分为正例的数量,F P表示实际为负例但被分类器划分为正例的数量,FN表示实际为正例但被分类器划分为负例的数量,TN表示实际为负例但被分类器划分为负例的数量。一般来说,R e c a l l越大,P r e c i s i o n越小,而A P为以P r e c i s i o n与R e c a l l分别作为纵坐标和横坐标时曲线所围成的面积值,对于目标检测来说,A

34、P越大分类效果越好。mA P表示所有类别A P的平均值,常被用来衡量算法的整体性能,其中mA P_0.5是I o U为0.5时所有类别的mA P,mA P_0.5:0.9 5是I o U以0.0 5的步长从0.5到0.9 5时的mA P。除检测精度外,检测速度F P S也是算法的一项重要性能指标。4.3 消融实验及实验数据分析本节以YO L O v 5 s为B a s e l i n e,与改进之后的算法进行消融实验。B a t c h s i z e设置为3 2,e p o c h设置为2 0 0并使用YO L O v 5 s模型的预训练模型7601杨慧剑等:基于改进的YO L O v 5的

35、航拍图像中小目标检测算法进行迁移训练。图6是训练完成后采用T e n s o r-b o a r d对各类指标进行可视化后的结果,表2是算法的各项性能数值对比结果,其中F P S为检测输入大小为2 7 0 41 5 2 0的图像耗时所推算。从图6与表2的结果对比中可以看出,采用加雾的数据增强方法后mA P_0.5下降了1.2%,其原因是V i s-D r o n e数据集中缺少雾天场景下的图像,但在实际测试时采用加雾的数据增强手段处理数据对实验结果有较强的改善,如图7 b检测到的目标数要远多于图7 a检测到的目标数。更换A S P P与添加C B AM模 块 后mA P_0.5分 别 提 高0

36、.7%和1.3%,获得了较小的提升。而采用4层检测头后mA P_0.5提高了6.6%,可以看出增加1层检测头后,小目标的信息得以大量保留,算法性能提升比较大。改进之后的算法与YO L O v 5 s相比,P r e-c i s i o n提高5.3%,R e c a l l提高5.4%,mA P_0.5提高6.9%,mA P_0.5:0.9 5提高4.7%。检测精度方面,改进后的算法获得了全面的提升。由于改进后的算法增加了一些计算量,针对同一幅图像的检测速度F P S由3 1下降到2 0,训练完成后的权重文件大小由1 3.7 MB增加到1 8.6 MB。虽然检测速度下降了,但仍能满足实时目标检

37、测任务。在实际场景下2种算法的检测效果如图7所示。图7中原始图像为在航拍视角大雾天气下所拍摄的图像,分辨率为2 7 0 41 5 2 0。通过对比发现YO L O v 5 s算法仅检测到1个目标信息,如图7 a所示,改进之后的算法则检测到3 3个目标信息,如图7 f所示。本文采用的4种改进方法和Y O L O v 5 s相比检测效果均有所提升,其中采用加雾的数据增强方法后检测到1 9个目标信息,如图7 b所示,F i g u r e 6 C o m p a r i s o n o f e x p e r i m e n t a l r e s u l t s图6 实验结果对比T a b l e

38、 2 N u m e r i c a l c o m p a r i s o n o f e x p e r i m e n t a l r e s u l t s表2 实验结果数值对比算法m A P_0.5/%m A P_0.5:0.9 5/%P r e c i s i o n/%R e c a l l/%F P S权重文件大小/MBYO L O v 5 s3 2.31 7.24 7.13 5.03 11 3.7O u r s_F O G3 2.11 7.24 7.33 4.52 31 3.7O u r s_A S P P3 3.01 7.84 9.73 4.72 21 3.8O u r s

39、_C B AM3 3.61 8.04 5.73 4.23 51 3.8O u r s_4 F P N3 8.92 4.15 0.64 1.02 61 4.3O u r s_m e t h o d3 9.22 1.95 2.44 0.42 01 8.68601C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)F i g u r e 7 C o m p a r i s o n o f d e t e c t i o n e f f e c t s i n r e a l s c e n a r i

40、o s图7 真实场景检测效果对比可见该方法在有雾图像上得到了很好的效果。4.4 与其他算法的实验对比实验中发现将输入图像大小由6 4 06 4 0调整到1 0 2 41 0 2 4与1 2 8 01 2 8 0时,mA P_0.5分别由3 9.2%提高到4 9.3%与5 2.8%。为测试本文所提算法的有效性,将本文所提出的算法与其他算法在V i s D r o n e数据集上进行比较,实验结果如表3所示。T a b l e 3 C o m p a r i s o n o f t h e p e r f o r m a n c e o n V i s D r o n e 2 0 2 0 t e

41、s t s e t-c h a l l e n g e表3 在V i s D r o n e 2 0 2 0 t e s t s e t-c h a l l e n g e上实验结果对比算法输入图像大小m A P_0.5/%C a s c a d e R-C NN2 23 1.9F P N2 33 2.2L i g h t-H e a d R-C NN2 33 2.8C o r n e t N e t2 43 4.1O u r s_m e t h o d6 4 06 4 03 2.9O u r s_m e t h o d1 0 2 41 0 2 44 2.8O u r s_m e t h o

42、d1 2 8 0 1 2 8 04 4.0O u r s_m e t h o d_x6 4 06 4 04 4.5O u r s_m e t h o d_x1 0 2 41 0 2 44 8.3 表3中的O u r s_m e t h o d_x是将YO L O v 5 s替换为更深更宽的YO L O v 5 x。在YO L O v 5 x上进行实验时,可以获得更大的mA P。由表3可知,本文算法的实验结果优于C a s c a d e R-C NN等算法的,且随着图像输入尺寸的增大,mA P也随之升高。但是,由于算力的限制,当b a t c h s i z e最小设置为2时,输入图像大小最大

43、只能为1 0 2 41 0 2 4。如果能够拥有更强大的算力,将输入图像的尺寸调整到合适的大小,相信本文所提算法能够取得更好的检测效果。5 结束语本文针对航拍图像的目标检测技术存在的定位不准、小目标检测困难等问题,提出一种基于YO L O v 5的改进算法:(1)数据增强方面,通过加雾的处理方式,增强了算法在大雾天气的检测能力;(2)B a c k b o n e中嵌入C B AM模块可以增强网络对空间与通道的重视;(3)将S P P模块更改为A S P P模块,用于减少池化操作对特征的影响;(4)增加小目标检测头,在初次C S P操作后即将浅层特征与深层特征相连,用于检测小目标。通过实验96

44、01杨慧剑等:基于改进的YO L O v 5的航拍图像中小目标检测算法发现,相比原算法,改进后的算法虽然检测速度有所下降,但mA P提升幅度较大,能够有效完成小目标实时检测任务。参考文献:1 J i a o L,Z h a n g F,L i u F,e t a l.A s u r v e y o f d e e p l e a r n i n g-b a s e d o b j e c t d e t e c t i o nJ.I E E E A c c e s s,2 0 1 9,7:1 2 8 8 3 7-1 2 8 8 6 8.2 K r i z h e v s k y A,S u t

45、 s k e v e r I,H i n t o n G E.I m a g e N e t c l a s s i f i c a-t i o n w i t h d e e p c o n v o l u t i o n a l n e u r a l n e t w o r k sJ.C o mm u n i-c a t i o n s o f t h e A CM,2 0 1 7,6 0(6):8 4-9 0.3 B h a r a t h i T K,Y u v a r a j S,S t e f f i D S,e t a l.V e h i c l e d e t e c t i

46、 o n i n a e r i a l s u r v e i l l a n c e u s i n g m o r p h o l o g i c a l s h a r e d-p i x e l s n e u r a l(M S P N)n e t w o r k sC P r o c o f 2 0 1 2 4 t h I n t e r n a t i o n a l C o n-f e r e n c e o n A d v a n c e d C o m p u t i n g,2 0 1 2:1-8.4 Y a n g M,Y u K,Z h a n g C,e t a

47、l.D e n s e A S P P f o r s e m a n t i c s e g-m e n t a t i o n i n s t r e e t s c e n e sCP r o c o f 2 0 1 8 I E E E C o n f e-r e n c e o n C o m p u t e r V i s i o n a n d P a t t e r n R e c o g n i t i o n,2 0 1 8:3 6 8 4-3 6 9 2.5 G i r s h i c k R,D o n a h u e J,D a r r e l l T,e t a l.

48、R i c h f e a t u r e h i e r a r-c h i e s f o r a c c u r a t e o b j e c t d e t e c t i o n a n d s e m a n t i c s e g m e n t a t i o nC P r o c o f 2 0 1 4 I E E E C o n f e r e n c e o n C o m p u t e r V i s i o n a n d P a t t e r n R e c o g n i t i o n,2 0 1 4:5 8 0-5 8 7.6 H e K M,Z h a

49、 n g X,R e n S,e t a l.S p a t i a l p y r a m i d p o o l i n g i n d e e p c o n v o l u t i o n a l n e t w o r k s f o r v i s u a l r e c o g n i t i o nJ.I E E E T r a n s a c t i o n s o n P a t t e r n A n a l y s i s a n d M a c h i n e I n t e l l i g e n c e,2 0 1 5,3 7(9):1 9 0 4-1 9 1 6

50、.7 G i r s h i c k R.F a s t R-C NNC P r o c o f t h e I E E E I n t e r n a t i o n a l C o n f e r e n c e o n C o m p u t e r V i s i o n,2 0 1 5:1 4 4 0-1 4 4 8.8 R e n S Q,H e K M,G i r s h i c k R,e t a l.F a s t e r R-C NN:T o w a r d s r e a l-t i m e o b j e c t d e t e c t i o n w i t h r

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 环境建筑 > 房建工程

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服