改进YOLOv3的轻量化漂浮物检测算法.pdf

资源描述

1、Water Resources and Hydropower Engineering Vol.54 No.10170CEditorial Department of Water Resources and Hydropower Engineering.This is an open access article under the CC BY-NC-ND license.Resources and Hydropower Engineering,2023,54(10):170-179.REN Yingjie,LI Chuanqi,WANG Wei,et al.Lightweight floati

2、ng object detection algorithm based on improved YOLOv3J.Water任英杰李传奇王薇，等改进YOLOv3的轻量化漂浮物检测算法J.水利水电技术（中英文2023.54(10):170-179水利水电技术（中英文）第54卷2023年第10 期改进YOLOv3的轻量化漂浮物检测算法任英杰，李传奇，王薇，葛召华2（1.山东大学土建与水利学院，山东济南250061；2.山东省水利综合事业服务中心，山东济南250013)摘要：【目的】为解决水域监控下漂浮物检测效率低、检测模型复杂度高的问题，提出一种基于改进YOLOv3的轻量化漂浮物检测算法。【方法】使

3、用轻量级网络MobileNetv3代替YOLOv3的主干特征提取网络Darknet53以降低模型计算量和参数；构建简化版加权双向特征金字塔网络（Bi-FPN-tiny）以进行多尺度特征的加权融合；利用Focal Loss优化损失函数，加强对于困难样本的学习。为验证所提算法的有效性，建立了PASCALVOC格式的漂浮物数据集，并进行数据标注和增广。【结果】结果表明：改进后的算法平均精度均值（mAP）达到92.8%，比原算法提高了7.1%；在NVIDIAQuadroP2200显卡下检测速度达到了8 6 fps/s，高于YOLOv3算法的47 fps/s；模型体积为43.7 MB，仅为初始算法的17

4、.7%。【结论】改进YOLOv3是一种性能优越且轻量化的模型，为在移动端进行实时漂浮物检测提供了新的契机。关键词：YOLOv3算法；漂浮物；目标检测；轻量化；特征融合作者互动DO:10.13928/ki.wrahe.2023.10.015开放科学（资源服务）标志码（OSID）：中图分类号：TP399文献标志码：A文章编号：10 0 0-0 8 6 0(2 0 2 3)10-0 17 0-10Lightweight floating object detection algorithm based on improved YOLOv3REN Yingjie,LI Chuanqi,WANG Wei

5、,GE Zhaohua?(1.School of Civil Engineering,Shandong University,Jinan 250061,Shandong,China;2.Shandong Water ConservancyComprehensive Service Center,Jinan250013,Shandong,China)Abstract:ObjectiveTo address the challenges of low detection eficiency and high model complexity in detecting floatingobjects

6、 under water monitoring,a lightweight floating object detection algorithm based on improved YOLOv3 is proposed.MethodsJThe proposed algorithm employs MobileNetv3 as the feature extraction network and constructs a simplified version ofweighted bidirectional feature pyramid(Bi-FPN-tiny)for feature fus

7、ion.Focal Loss is used to optimize the loss function andstrengthen the learning of dificult samples.To evaluate the effectiveness of the improved algorithm,a floating object dataset inPASCAL VOC format is established and tested after data annotation and amplification.Results JExperimental result sho

8、w thatthe mean average accuracy(mAP)of the improved algorithm reaches 92.8%,which is 7.1%higher than the original algorithm.The detection speed of NVIDIA Quadro P2200 is 86 fps/s,higher than the 47 fps/s of YOLOv3.The model size is 43.7 MB,收稿日期：2 0 2 3-0 2-0 9；修回日期：2 0 2 3-0 5-15；录用日期：2 0 2 3-0 5-16

9、；网络出版日期：2 0 2 3-0 6-2 0基金项目：山东省自然科学基金（ZR2021ME030）；深圳市可持续发展科技专项项目（KCXFZ20201221173407021）；济南市水务科技项目（JN-SWKJ202106)作者简介：任英杰（1995），男，硕士研究生，研究方向为图像识别、水利工程。E-mail：12 0 432 148 5 q q.c o m通信作者：李传奇（196 3一），男，教授，博士，研究方向为防洪减灾、智慧水利。E-mail：l i c h u a n q i s d u.e d u.c n171水利水电技术（中英文）第54卷2023年第10 期任英杰，等/改进Y

10、OLOv3的轻量化漂浮物检测算法which is only 17.7%of the initial algorithm.Conclusion J The improved YOLOv3 is a high-performance and lightweight model,providing new opportunities for real-time floating object detection on mobile devices.Keywords:YOLOv3 algorithm;floating objects;object detection;lightweight;featu

11、re fusion0引言大范围高清水利视频监控系统在河湖监管保护中发挥着重要作用。在涉河湖区域和无人值守环境中，利用视频监控进行异常事件（如漂浮物）的自动准确检测已成为一个迫切的需求。河流、湖泊、水库等水域中常常出现各种漂浮物，漂浮物的大量聚集会对水体水质及水利工程的安全运行带来不利影响。利用监控视频实现漂浮物目标检测可提升河湖智能化管理水平，但海量的监控视频给数据存储和数据分析带来了极大的挑战。传统方法依靠人工判读视频图像进行漂浮物目标检测，不仅监控工作量巨大，而且检测精度和效率都无法得到保证。因此，及时从海量数据中捕捉关键信息，准确高效地识别和定位漂浮物，对实现河湖智能化管理具有重要意义。

12、随着目标检测算法2-4 的不断发展，基于深度学习的目标检测算法相对于传统检测算法具有更强的鲁棒性和泛化能力。基于深度学习的目标检测算法可分为两类：基于逻辑回归的单阶段目标检测算法和基于候选框区域的双阶段目标检测算法。单阶段检测算法5-7 ，如YOLO和SSD，将分类任务和定位任务进行合并，可以在一次特征提取后获取目标的位置和类别。因此，单阶段目标检测算法在需要进行快速目标检测的场景中应用广泛，但其检测精度较低。双阶段目标检测算法8-9】，如Faster-RCNN和Mask-RCNN,则在图像中生成一系列候选区域，再对候选区域进行分类和回归，从而大大提升了检测精度，但检测速度较慢，难以满足实时检

13、测的任务需求。早期用于水面漂浮物的检测方法包括背景减法10 、帧差法1 和图像分割12 等。这些目标检测算法主要基于手工设计的特征（Hand-craftedfeatures），这些特征容易受到特征选择、对象形状和背景变化等因素的影响，从而导致检测的鲁棒性和泛化能力较差。近年来，针对不同场景下的漂浮物检测任务，越来越多的学者进行了各种算法的改进研究，以进一步提高漂浮物检测的精度和效率。其中，深度学习方法由于其优良的泛化能力和鲁棒性，在国内外已被应用到水面漂浮物的计算机视觉检测中。由于国内外对于河湖水环境问题的关注程度不同，国外学者对水面漂浮物的研究相对偏少。李国进等13-14 以人工湖水面漂浮物

14、为素材，对Faster-RCNN和YOLOv3目标检测算法进行改进，将基于边界框的定位替换为基于像素点的定位，提高了算法的识别和定位精度。刘伟等【15 通过互联网抓图建立漂浮物数据集，提出了一种基于Mask-RCNN的水面漂浮物识别方法，与基于HOG特征的传统目标检测算法相比，准确率和召回率分别提高了16%和13.8%。陈娜等人【16 提出了一种基于智能视频监控系统的河湖四乱巡检技术方案，将面向小目标的多尺度Faster-RCNN检测算法与视频监控系统集成应用。LIN等17 提出了一种改进的YOLOv5s（FM A-YO LO v 5s）算法，通过在主干网络的末端引人特征图注意力（featur

15、e-map at-tention)来增强网络特征提取能力。ZHANG等18 对Faster-RCNN目标检测算法进行改进，通过融合不同层次的特征信息提高水面漂浮物检测精度，改进算法的平均精度（mAP）为8 3.7%，检测速度为13帧/s。在背景复杂、光照变化等复杂真实环境下，漂浮物的精准检测一直是一个呕需解决的难点。目前的漂浮物检测算法虽然带来了一定程度的精度提升，但由于所涉及的深度网络模型参数过多，模型不够轻量化，需要大量的存储空间和运行资源来完成任务。因此，移动端运行规模较大的深度网络模型面临困难，迫切需要对基于深度学习的目标检测模型进行轻量化处理。为平衡检测精度、速度和网络复杂度，学者们

16、提出了一系列轻量化卷积神经网络模型，其核心在于设计更为高效的卷积方式，在少量牺牲检测精度的情况下加速模型收敛。目标检测算法的发展趋势是通过构建更深、更宽、更复杂的网络结构来提高检测精度，但这通常需要牺牲检测速度和增加网络复杂度。本文提出了一种轻量化目标检测算法，通过改进YOLOv3算法，用于视频监控下漂浮物检测任务。该算法在保持较高检测精度的同时，减少模型计算量，降低模型资源占用本文算法的主要改进如下：（1)使用轻量级网络MobileNetv319替换YOLOv3的主干特征提取网络DarkNet-53，引人深度可分离卷积来大幅度降低模型的参数量和计算量；（2)构建简化版加权双向金字塔结构（Bi

17、-FPN-tiny）【2 0】对不同尺度的特征进行加权融172水利水电技术（中英文）第54卷2023年第10 期任英杰，等/改进YOLOv3的轻量化漂浮物检测算法合，以有效提高多尺度漂浮物的检测效果；（3）通过引人Focal Loss损失函数2 1 对原始算法的损失函数进行优化，提高算法对于困难样本的挖掘能力，从而进一步提高目标检测精度1YOLOv3算法相较于主流的双阶段检测算法，YOLOv3算法具有明显的实时性优势。该算法将目标检测问题转化为单一的回归问题，无需生成候选区域，直接在图像网格中回归目标的位置和大小，从而生成最终的检测结果。2 0 18 年，REDMON等8 在YOLO及YOLO

18、v2的基础上提出了YOLOv3，采用残差单元和跳跃连接构建全卷积网络DarkNet-53作为基础特征提取网络，以解决网络加深带来的梯度消失和梯度爆炸问题。该算法还设计了多尺度预测结构，对不同维度的特征信息进行融合，以提高多尺度目标的检测精度。YOLOv3网络结构如图1所示，输人图片经过主干网络下采样后，在最后3个阶段分别输出1313、2 6 26、52 52 三种不同尺度的特征图。在预测端，YOLOv3将输人图像按照特征图尺寸划分为SS个网格，每个单元格负责预测落人其中心的待检目标。每个单元格将输出多个预测框以及每个预测框的置信度和所属类别的概率，最终通过非极大抑制确定目标的位置。YOLOv5

19、是YOLO系列算法的最新版本，由Ultr-alytics公司在2 0 2 0 年发布。尽管YOLOv5在网络结构和训练策略上进行了改进，但在实际应用中，YOLOv3已经被广泛验证，具有更为稳定和可靠的性能。因此，本文选择改进YOLOv3进行漂浮物目标检测。虽然YOLOv3在MSCOCO、PA SCA LVO C等大型公开数据集上表现出色，但在基于视频监控平台的漂浮物目标检测等实际检测任务中，仍存在以下不足之处：（1）分析YOLOv3的全卷积网络结构，发现其包含了一系列的标准卷积、上采样、残差单元等基础模块。但随着网络的加深，导致网络参数量和计算开销急剧增加，对于搭载并运行该算法的平台硬件要求较

20、高。因此，该算法的模型复杂度仍需要进一步改进，以适应更为轻量化的硬件平台。（2)在监控画面下，漂浮物的尺度变化较大，YOLOv3的多尺度预测方式在提取特征的鲁棒性上较差，尤其对于小尺度的漂浮物目标识别效果不理想。（3）漂浮物目标检测面临着曝光、遮挡等诸多背景干扰，在不同光线条件下检测目标特征差异悬殊。然而，YOLOv3对于困难样本的挖掘能力不足，导致漏检、误检情况严重。因此，该算法的进一步改进仍然具有重要意义2改进的YOLOv3算法本文对YOLOv3算法进行了三方面的改进，分别为采用轻量化的MobileNetv3主干网络19、构建简化版的加权双向特征金字塔结构（Bi-FPN-tiny）【2 0

21、】、引入Focal Loss 函数2 1。通过这些改进，改进后的算法在检测精度、速度和复杂度三方面取得了有效权衡。2.1轻量型特征提取网络设计MobileNetv3网络采用深度可分离卷积代替标准卷积，以降低模型的参数量和计算量，卷积方式如图2所示。深度可分离卷积包括逐通道卷积（DepthwiseCon-InputsConvolutionalConcatConvolutionalx5ConvConvYOLO-headResidualx1ConvolutionalResidualx2ConvolutionalResidualx8Residualx8ConcatConvolutionalx5Conv

22、ConvYOLO-head11Residualx4ConvolutionalConvolutional1Darknet-531Convolutionalx5ConvConvConvYOLO-head图1YOLOv3网络结构Fig.1Network architectureof YOLOv3173水利水电技术（中英文）第54卷2023年第10 期2任英杰，等/改进YOLOv3的轻量化漂浮物检测算法DepthwiseConv33BNReLU6Conv33PointwiseConv3x3BNBNReLUReLU6(a)标准卷积(b)深度可分离卷积图2卷积方式Fig.2Comparison of co

23、nvolution methodsvolution）和逐点卷积（PointwiseConvolution）两个步骤，前者使用单通道滤波器对每个输人通道进行卷积，后者使用N个11滤波器整合输出特征图。尽管深度可分离卷积整体效果与标准卷积类似，但计算量和模型参数量都大幅减少。在卷积核尺寸为DkDk、输人特征图尺寸为D,xDr、输入和输出通道数分别为M和N的情况下，当步长为1且存在padding时，标准卷积的计算量为F=DkXDkXMXNXD,XD(1)而深度可分离卷积的计算量为F2=DkDkM D+M ND,D,两者相互比较，可得计算量缩小为原来的FDkDkMND,DFF2DkDkMD,+MNDD

24、F11(3)+可以看出，改变卷积方式可以极大地减少模型的计算量。通常情况下，MobileNetv3采用的卷积核尺寸为33，这意味着改进后的模型计算量只有原始模型计算量的1/9 1/8。除此之外，MobileNetv3还综合了轻量级SqueezeandExcitation注意力机制以及低计算开销的hard-Swish激活函数，进一步降低了网络的计算量。2.2加权双向特征金字塔加权双向特征金字塔是一种网络结构，用于从输人图像中提取特征，并能够输出不同分辨率的特征图。在YOLOv3算法中，传统的特征金字塔网络结构(FPN)被用来实现多尺度目标检测，但是FPN结构本身受到单向信息流的限制，无法区分不同

25、贡献的输人特征。为解决这些问题，本文引入了跨尺度连接和加权特征融合方式，在传统FPN基础上添加了一条自下而上的连接通道，实现了双向特征传递。同时，通过去除一些贡献级别低的连接通道和在贡献级别高的连接处建立额外的横向连接，进一步提高了特征提取的准确性。该结构输出三种不同尺度（Featl、Fe a t 2、Fe a t 3）的特征图，简化版加权双向金字塔（BiFPN-tiny）结构如图3所示。FeatFeat.mYOLO-HeadFeatyFeatdFeatomYOLO-HeadFeatFeatomYOLO-Head3BiFPN-tiny图3车轻量化特征金字塔设计Fig.3Design of li

26、ghtweight feature pyramid network以Feat2特征图为例，其融合过程如下所述(W,Feat+W2Resize(Feat)Featy=con(01+2+8(4)Featu=(o)Featiy+w,Featd+w,Resize(Featoutcon(5)式中，Feat、Fe a t 2、Fe a t a u 分别表示自上而下第二种尺度所对应的输入特征、中间特征和输出特征；Feati为第三种尺度对应的输人特征；是用于保证数值稳定的极小值；，是对应的自动学习权重；Re-size操作通常是上采样或下采样操作。BiFPN-tiny在权重选择方面采用了快速归一化融合（Fast

27、-NormalizedFusion）策略，根据TAN等2 0 的研究结果，相比于常用的Softmax函数，Fast-Normal-izedFusion在相似精度下能够实现约30%的速度提升。Fast-NormalizedFusion的计算公式为(6)式中，i、j 为特征融合节点的输人特征图数量，i=j；I为输人特征图张量；8 是用于避免分母为零的常数；;、,为对应输入特征图的权重，初始权重介于0与1之间。2.3FocalLoss损失函数在监控画面下的漂浮物目标检测任务中，需要将174第54卷2023年第10 期水利水电技术（中英文）任英杰，等/改进YOLOv3的轻量化漂浮物检测算法2021年1

28、0 月17 日里期日16：10:2 62021年11月0 4日星期四0 5:14:16108+547万深河下游王家文通诸流河闸门金属杆枪机PO171134(a)困难样本(b)简单样本图4困难样本与简单样本示例Fig.4Examples of difficult samples and simple samples检测的水面漂浮物作为前景，其他部分视为背景。然而，由于正负样本不均衡和前景、背景复杂度不均衡的问题，这项任务变得非常困难。为了解决这些挑战，研究人员通常采用一种名为Focal Loss的损失函数。Focal Loss通过调整正负样本的权重来解决正负样本不均衡的问题，并通过降低易分样本的

29、权重来解决前景和背景复杂度不均衡的问题如图4所示，图4（a）中的漂浮物目标（标注框内）由于光线条件差、背景干扰多、拍摄距离远，导致占有像素少且特征不明显，属于前景和背景都复杂的困难样本；图4（b）中的漂浮物目标（标注框内)由于光线条件良好、背景简单、拍摄距离近，特征明显且占有较多像素，属于易分辨的样本。在这种情况下，虽然单阶段目标检测算法YOLOv3检测速度快，但是受到样本不均衡的影响较大，特别是对小目标检测效果不理想，导致检测精度无法得到进一步提升。原始的YOLOv3算法的总损失函数由分类损失、位置损失和置信度损失三部分组成，函数公式为LyOLOv3=lo+Leor+lel(7)ass式中，

30、LyoLOv3为原始算法的总损失，LyoLOv3是通过交叉熵函数与均方差函数计算的位置损失，leomr、l a l a s分别为交叉熵函数计算的置信度损失和分类损失。为了解决样本不均衡问题，本文使用了LIN等人2 1提出的Focal Loss函数，以替换原始算法中的交叉熵（Cross Entropy）函数。Focal Loss通过降低易分类样本的权重，使模型更加关注难分类样本的学习。Focal loss（FL)的公式为FL(p,)=-(1-p,)log(p.)(8)式中，P,是不同类别的分类概率。是一个用来调整正负样本数量失衡的权重系数，可以使模型更关注少数类样本的学习；是一个调节难易样本不均

31、衡问题的超参数，通过调整的值，可以让模型更加关注难以分类的样本。试验发现，当=0.2和=2 时，Focalloss函数效果最佳。在具体应用时，应根据实际情况进行超参数的优化和调整。3材料与试验3.1漂浮物数据集数据集是评估目标检测算法性能的基础，其质量和规模对模型的拟合和泛化能力产生重要影响2 2 本研究在山东省范围内采集了漂浮物样本，以构建可靠的漂浮物数据集。为提高目标检测算法的泛化能力，样本采集兼顾光线条件、拍摄距离/角度、成像背景和样本种类等因素，部分样本的图片如图6所示。共采集了7 30 0 张漂浮物样本RGB图像，像素均在2 0 0 万以上，分为“FLOTAGE-PLANT”和“FL

32、OTAGE-PLASTIC”两类。采用开源标注工具La-belimg对样本图片进行了人工标注，数据集格式为PASCALVOC，标注文件以XML格式保存，包含对应图像的路径、标注名称和边框坐标等信息。按照8：1：1的比例随机划分为训练集、验证集和测试集3.2深度学习开发环境本研究在Win10系统下建立了一个深度学习开发环境，用于漂浮物检测模型的训练和推理。该环境集成了所需的各种python库，并引人PyTorch深度学习框架。同时，配置了CUDA以获得GPU加速的便利，使用的GPU型号为NVIDIAQuadroP2200。175水利水电技术（中英文）第54卷2023年第10 期任英杰，等/改进Y

33、OLOv3的轻量化漂浮物检测算法JBi-FeaturePyramidNetworkconv3x3_s=2,BN,h-swishFeat,InputBackboneNetworkbottleneckblock_s=2bottleneckblock_s=1Conv1x1二亚二Conv3x3GvpCl,ReLiYOLO-headcaleConv 1x1YOLO-headAddYOLO-headOutput图5改进后的YOLOv3网络结构Fig.5Improved YOLOv3 network structure2021年10 月1租日#期-0 932021-11-07112854月21年10 月15

34、日至电15：7 57图6 复复杂背景下的漂浮物样本图像Fig.6Floating samples in complex background3.3参数设置本研究采用PascalVOC格式的漂浮物数据集，并对原始数据集进行筛选，选取了2 0 0 0 张高质量的样本用于漂浮物检测模型的训练和测试。为提高训练速度和模型性能，漂浮物检测模型的训练采用了迁移学习策略，引人大型数据集ImageNet预训练权重。采用了冻结训练方式以达到最佳的训练效果，其中freeze-epoch为50。参数优化过程基于随机梯度下降法进行，初始学习率设置为0.0 1，最终学习率设置为0.0 0 0 5，动量参数为0.937。

35、为进一步提高模型性能，使用StepLR优化器进行学习率调整，调整间隔step_size为1，调整倍数gamma为0.94。在冻结阶段，基于单NVIDIAQuadroP2200显卡的Batch size设置为8，解冻阶段则被调整为4，以达到最佳的训练效果。4试验结果与分析4.1性能评估指标本文使用平均精度均值（mAP）、每秒传输顿数（FPS）和模型存储大小作为评价指标，以评估改进176第54卷2023年第10 期水利水电技术（中英文）任英杰，等/改进YOLOv3的轻量化漂浮物检测算法算法的性能。通常采用准确率P（p r e c i s i o n）、召回率R（r e c a l l）、精度均值A

36、P（a v e r a g e p r e c i s i o n）及漂浮物的平均精度均值mAP（me a n a v e r a g e p r e c i s i o n）作为模型精度评价指标。AP只适用于单个类别的检测任务，而mAP适用于多个类别的检测任务。通常情况下mAP数值越高，目标识别效果越好。准确率、召回率、精度均值以及平均精度均值计算公式为TPP=(9)TP+FPTPR=(10)TP+FNAP=P(R)dR(11)0NAPi=1mAP(12)N式中，N表示漂浮物目标种类数量；TP表示漂浮物被正确检测出来的数量；FP表示非漂浮物被错误检出为漂浮物的数量；FN表示没有被检测出来的漂

37、浮物数量。4.2试验结果模型训练结果如图7 所示，其中模型损失函数包括三种：位置（box）损失、置信度（obj）损失以及分类（cls）损失，可以看出损失函数在迭代约2 50 个轮次(epoch)后达到收敛。4.2.1本文算法与YOLOv3性能对比为了验证改进YOLOv3算法的实际检测效果，进行了水面漂浮物的监控视频检测，并将改进YOLOv3算法与YOLOv3算法进行性能比较。通过表1可以看出，相较于原YOLOv3算法，改进后的YOLOv3算法在检测精度和检测速度都有了大幅度的提升。具体而言，YOLOv3算法的平均精度均值（mAP）为8 5.7%，0.0300.025results0.080.0

38、200.0250.0150.060.0200.0100.040.0150.005020002000100200轮次轮次轮次(a)位置损失(b)置信度损失(c)分类损失图7损失函数的收敛曲线Fig.7Convergence curve of loss function而改进YOLOv3算法的mAP值提升至92.8%，提升了7.1%；改进YOLOv3算法在保证精度的情况下，顿率可以达到8 6 FPS，是YOLOv3算法顿率的2.2倍。对于实际应用中的漂浮物目标检测而言，检测速度的提升具有极强的现实意义。图8 展示了改进后的YOLOv3算法在复杂背景下检测水面漂浮物的实际效果。从图8 中可以看出，改

39、进YOLOv3算法具有更高的漂浮物识别精度，能够有效减少因背景干扰、不同光照条件和漂浮物尺寸较小等因素造成的错检、漏检情况。表1复杂背景下漂浮物检测结果Table 1Detection results of floating objectsin complex background算法P/%R/%mAP/%FPS/(f.s)YOLOv3959285.739Improved YOLOv3979992.8864.2.2与其它经典算法对比为了全面评估本文改进的YOLOv3算法性能，进行了改进的YOLOv3算法与Faster-RCNN、YO L O v 5、RetinaNet和SSD检测算法的对比试验

40、，试验结果如表2 所列。由表2 可知，两阶段FasterR-CNN算法的平均精度均值（mAP）达到8 6.4%，但检测速度仅为12FPS。相比之下，单阶段的RetinaNet、SSD 和YO-LO算法具有更快的检测速度。改进的YOLOv3算法具有更高的平均检测速度，可达到8 6 FPS，并且检测精度提高到92.8%，接近于YOLOv5的检测精度。从模型大小来看，改进YOLOv3的模型体积为43.7 M，不到YOLOv5、SSD 等算法的1/2。基于这些试验结果，本文开发的目标检测模型适用于移动端应用，并且能够降低存储成本要了解影响识别算法计算速度的因素，需要考虑算法类别、模型大小、激活函数和硬

41、件设备等多个方面。不同的算法类别采用的技术和架构不同，因此计算速度会有所不同；模型大小会直接影响计算量和内存占用，模型越大则计算速度越慢；激活函数会影响模型的非线性拟合能力，某些激活函数会增加计算量，从而降低计算速度；硬件设备的不同也会直接影响计算速度，例如GPU和TPU具有更高的并行计算能力和更好的计算性能，177水利水电技术（中英文）第54卷2023年第10 期任英杰，等/改进YOLOv3的轻量化漂浮物检测算法FLOTAGE-PLASTICO.66FLCTAGEEWANTAOETAFLANT(a)YOLOv3检测结果FLOTAGE-PLAELOTAGE-PLANTO.8FLOTACFLOT

42、ACE古庄士擀柳(b)ImprovedYOLOv3检测结果图8 漂浮物目标检测对比Fig.8Comparison of floating object detection表2不同目标检测算法的检测结果Table 2Comparison of improved YOLOv3 withother target detection algorithms检测算法类别mAP/%FPS模型大小/MFaster-RCNN双阶段86.412116.3RetinaNet单阶段86.91880.5SSD单阶段82.245104.2YOLOv5单阶段93.24295.9Improved YOLOv3单阶段92.88

43、643.7可以加速模型的计算过程4.3算法复杂度分析根据表3的算法复杂度分析，改进的YOLOv3模型体积大小为43.7 M，仅为YOLOv3算法的17.7%，这意味着可以节省更多的的存储空间。改进后的算法训练时间也缩减至初始算法的40%，训练完成的权重文件仅为YOLOv3算法权重文件的2 1.7%，更小的权重文件意味着更加精巧的网络架构和更为广阔的应用空间。4.4消融试验结果分析为了评估优化策略对算法性能的影响，本文设计表3算法复杂度分析Table 3Complexity analysis of algorithm方法模型体积/M权重文件/M训练时间/hYOLOv3246.4161.513.9

44、ImprovedYOLOv343.735.15.6了一系列消融试验，试验方案如表4所列。试验结果表明，引入轻量化特征提取网络后，MobileNet-YOLOv3算法在保证较高精度的情况下，检测速度得到了大幅提升，检测顿率达到原始算法的两倍以上。引入轻量化双向金字塔结构进行特征融合之后，与MobileNet-YOLOv3相比，MobileNet-BiFPN-YOLOv3算法的检测精度（mAP）提升了4.2%。改进后的算法对小尺度检测目标的检测性能明显提高，有效改善了以往漏检小目标的情况。引人Focal Loss损失函数后，ImprovedYOLOv3算法的mAP提高了3.2%，进一步提升了算法对

45、于困难样本的挖掘能力5结论本研究提出了一种基于改进YOLOv3的轻量化目标检测算法，能够在移动终端上实现高效准确的检测表4网络架构和优化策略的有效性验证Table 4Validation of network architecture and optimization strategy算法MobileNetBiFPNFocal lossmAP/%FP/f-!YOLOv385.739MobileNet-YOLOv3V85.492MobileNet-BiFPN-YOLOv3VV89.688ImprovedYOLOv3V92.886178第54卷2023年第10 期水利水电技术（中英文）任英杰，等/

46、改进YOLOv3的轻量化漂浮物检测算法漂浮物。该算法将Darknet53结构替换为MobileNetv3网络，并引人深度可分离卷积，有效降低了网络的参数量和计算量。通过构建轻量化双向金字塔结构进行特征融合，改进后的算法在多尺度（尤其是小尺度）漂浮物目标的检测方面表现出更强的性能。引人Focal Loss损失函数加强算法对于困难样本挖掘，极大程度上改善了难易样本带来的样本不均衡问题。试验结果表明，改进后的算法检测精度和速度上都得到了显著提升，同时实现了理想检测效率下的模型轻量。因此，该算法在移动端漂浮物检测领域具有广泛的应用前景。参考文献(References):1施巍松，孙辉，曹杰，等。边缘计

47、算：万物互联时代新型计算模型 J计算机研究与发展，2 0 17，54（5）：90 7-92 4.SHI Weisong,SUN Hui,CAO Jie,et al.Edge computing-an emer-ging computing model for the internet of everything era J.Journalof Computer Research and Development,2017,54(5):907-924.2张慧，王坤峰，王飞跃。深度学习在目标视觉检测中的应用进展与展望 J自动学报，2 0 17，43（8）：12 8 9-130 5ZHANG Hui,

48、WANG Kunfeng,WANG Feiyue.Advances and per-spectives on applications of deep learning in visual object detectionJ.Acta Automatica Sinica,2017,43(8):1289-1305.3范丽丽，赵宏伟，赵浩宇，等。基于深度卷积神经网络的目标检测研究综述 J：光学精密工程，2 0 2 0，2 8（5）：1152-116 4.FAN Lili,ZHAO Hongwei,ZHAO Haoyu,et al.Survey of target de-tection based

49、on deep convolutional neural networks J.Optics andPrecision Engineering,2020,28(5):1152-1164.4程旭，宋晨，史金钢，等。基于深度学习的通用目标检测研究综述 J电子学报，2 0 2 1，49（7）：142 8-1438.CHENG Xu,SONG Chen,SHI Jingang,et al.A survey of genericobject detection methods based on deep learning J.Acta Electroni-ca Sinica,2021,49(7):142

50、8-1438.5LIU W,ANGUELOV D,ERHAN D,et al.SSD:Single shot multi-box detector C.Amsterdam:European conference on computer vi-sion,2016.6REDMON J,DIVVALA S,CIRSHICK R,et al.You only look once:Unified,real-time object detection C.Las Vegas:IEEE conferenceon Computer Vision and Pattern Recognition,2016.7RE

展开阅读全文