收藏 分销(赏)

基于改进YOLOv5模型的高速道路裂缝检测研究.pdf

上传人:自信****多点 文档编号:2256701 上传时间:2024-05-24 格式:PDF 页数:7 大小:5.57MB
下载 相关 举报
基于改进YOLOv5模型的高速道路裂缝检测研究.pdf_第1页
第1页 / 共7页
基于改进YOLOv5模型的高速道路裂缝检测研究.pdf_第2页
第2页 / 共7页
基于改进YOLOv5模型的高速道路裂缝检测研究.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 22卷 第 10期2023年 10月Vol.22 No.10Oct.2023软 件 导 刊Software Guide基于改进YOLOv5模型的高速道路裂缝检测研究闫卫坡1,王志斌1,任祖跃2,来程轩1,胡锦程1,张子雄1(1.北京市首都公路发展集团有限公司公路资产管理分公司,北京 101116;2.中央民族大学 信息工程学院,北京 100086)摘要:为解决当前高速道路裂缝的错检、漏检、精度低等问题,提出一种基于YOLOv5改进的道路裂缝识别模型。首先,通过在骨干网络中添加注意力模块(CBAM)提升算法的特征提取能力;然后,修改网络特征融合方式,采用加权双向特征金字塔(BiFPN)替换特

2、征金字塔(FPN)+像素聚合网络(PAN)结构以加强特征融合。最后,在加权双向特征金字塔尾部与检测层头部添加注意力机制,以提升网络的表达能力。实验结果表明,改进模型相较于传统YOLOv5模型在mAP0.5、mAP0.5:0.95方面分别提升33.5%、21.5%,改进后的YOLOv5算法对道路裂缝的检测效果较好,能快速、准确地识别定位高速道路上的裂缝。关键词:道路病害;YOLOv5;CBAM注意力机制;特征融合;加权双向特征金字塔DOI:10.11907/rjdk.222250开 放 科 学(资 源 服 务)标 识 码(OSID):中图分类号:TP391.4 文献标识码:A文章编号:1672-

3、7800(2023)010-0191-07Research on Expressway Crack Detection Based on Improved YOLOv5 ModelYAN Weipo1,WANG Zhibin1,REN Zuyue2,LAI Chengxuan1,HU Jincheng1,ZHANG Zixiong1(1.Road Asset Management Branch of Beijing Capital Highway Development Group LTD,Beijing 101116,China;2.School of Information Enginee

4、ring,Central University for Nationalities,Beijing 100086,China)Abstract:To address the issues of false detection,missed detection,and low accuracy of current highway cracks,an improved road crack recognition model based on YOLOv5 is proposed.Firstly,the feature extraction ability of the algorithm is

5、 improved by adding attention module(CBAM)to the backbone network;Then,modify the network feature fusion method and replace the feature pyramid(FPN)+pixel aggregation network(PAN)structure with a weighted bidirectional feature pyramid(BiFPN)to enhance feature fusion.Finally,an attention mechanism is

6、 added at the tail of the weighted bidirectional feature pyramid and the head of the detection layer to enhance the networks expression ability.The experimental results indicate that the improved model outperforms the traditional YOLOv5 model in terms of mAP0.5 and mAP0.5 0.95 by 33.5%and 21.5%,resp

7、ectively.The detection effect of improved YOLOv5 algorithm for road cracks is good,and it can quickly and accurately identify and locate cracks on high-speed roads.Key Words:road disease;YOLOv5;CBAM attention mechanism;feature fusion;BiFPN0 引言随着我国高速公路骨干网的高速建设与完善,高速公路荷载在迅速激增,道路病害问题随之浮现眼前,道路裂缝病害尤为严重1。

8、目前,在理想情况下的道路裂缝识别算法研究已取得一定的成果,但在实际道路中背景间存在灰度值重叠等因素干扰2,为识别道路裂缝带来了巨大挑战3。传统裂缝检测基于数字图像处理方法,提取、分类图像中裂缝的颜色、形状、边缘等特征。Oliveira等4利用裂缝与背景的灰度值差异进行检测,在实际道路情况下效果不佳。王兴等5使用小波变换识别复杂道路裂缝,但在高速行驶时数据采集存在大量噪声,无法较好地检测不连续的裂缝。随着深度学习技术不断发展,基于神经网络的检测方法逐渐被应用到工业领域6。游江川等7提出一种改进RCNN的沥青路面裂缝检测方法,精度达到 91.25%,但检收稿日期:2022-10-24作者简介:闫卫

9、坡(1986-),男,北京市首都公路发展集团有限公司公路资产管理分公司工程师,研究方向为目标检测;任祖跃(1997-),男,中央民族大学信息工程学院硕士研究生,研究方向为目标检测;王志斌(1991-),男,北京市首都公路发展集团有限公司公路资产管理分公司工程师,研究方向为目标检测。本文通讯作者:王志斌。2023 年软 件 导 刊测速度较慢,无法适用于快速形式场景中。徐康等8提出一种改进Faster-RCNN的沥青路面裂缝检测方法,精度达到85.64%,但需要大量参数和浮点运算,不适合资源受限的移动部署平台。顾书豪等9提出一种增强语义信息与多通道特征融合的裂缝自动检测算法,通过添加扩张卷积模块及

10、注意力机制,提升模型对特征细节的提取能力。2014 年后,基于深度学习的目标检测网络井喷式爆发,例 如 R-CNN10、Fast-RCNN11、Faster-RCNN12、Mask-RCNN13、AlexNet14等二阶段网络。现有深度学习方法在理想情况下,在道路裂缝检测中取得了不错的效果,但应用到高速行驶的实际应用场景中仍存在以下问题:网络需消耗大量资源;实时性不佳;多尺度精度低。针对以上问题,本文选择计算量少、速度快的 one-stage 检测算法YOLOv5 进行实验,其内存大小仅为14.10 M,在自带的4个版本中最轻量级。YOLOv5在检测目标时,只需将图片送入网络一次就能完成分类及

11、定位任务。综上,YOLOv5的特点非常适合低成本且对实时性有要求的工业场景。为了进一步提升网络检测能力,在YOLOv5网络模型中添加CBAM注意力机制,从通道、空间两个维度定位目标提升模型检测能力。此外,引入BiFPN结构解决多尺度精度低的问题,BiFPN相较于FPN-PAN结构可在不同尺度的特征融合过程中,自适应区分不同输入的重要程度,以此缓解多尺度融合精度低的问题,提升网络的表达能力。1 YOLOv5模型本文研究基于YOLOv5s模型进行改进,YOLOv5从小到大依次分为YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x共4个模型,网络结构主要由输入端、Backbone、nec

12、k、head组成,网络结构如图1所示。由图 1 可见,输入端对输入图像进行 Mosaic 数据增强、自适应锚框、自适应图像增强等预处理。由于Mosaic可随机选取4张图片通过拼接、缩放、翻转等操作丰富数据集,同时在新的图像中保留原本4张图片的真实框,该操作可一次计算4张图片的数据,进而节省GPU的显存,因此本文使用Mosaic方法扩容数据集。Backbone为CSPDarknet53主干网络、输入图像经过主干网络提取到丰富的特征。Neck核心则为特征金字塔网络(Feature Pyramid Networks,FPN)15和路径聚合网络(Path Aggregation Networks,PA

13、N)结构,该结构通过 Concat操作将自下而上和自上而下的Feature map横向连接,进而融合深层和浅层不同尺度的特征,融合后的特征具有高级语义信息,有助于检测小目标,提升网络表达能力。Head为YOLOv5的检测结构,网络最终输出8080、4040、2020尺寸的特征图分别检测小、中、大目标。通过交叉熵函数计算分类、置信度损失,CIoU 函数计算定位损失,并基于非极大值抑制(Non-Maximum Suppression,NMS)提升网络预测精度。2 改进YOLOv52.1改进方法为了提升模型对高速道路的裂缝病害的检测能力,本640640 3Focus(3,64,1,1)Conv(64

14、,128,3,2)C3(128,128)3Conv(128,256,3,2)C3(256,256)9Conv(256,512,3,2)C3(512,512)9Conv(512,1024,3,2)C3(1024,1024)3SPP(1024)BackboneNeckConcatUpsample(256)Concat(512)Upsample(512)Concat(512)Concat(1024)Detect Head1Detect Head2Detect Head3Conv(1024,512,1,1)C3(512,512)3Conv(512,256,1,1)C3(512,256)9Conv(25

15、6,256,3,2)C3(512,512)3Conv(512,512,3,2)C3(1024,1024)3Conv2dBNSiLUConvSplit(4)ConcatConv(1,1)FocusConv(1,1)Conv(3,3)AddBottleneckConv(1,1)Bottleneck NConcatConv(1,1)Conv(1,1)C3Conv(1,1)MaxPool(5,9,13)ConcatConv(1,1)Conv(1,1)SPP Fig.1YOLOv5 model structure图1YOLOv5模型结构 192第 10 期闫卫坡,王志斌,任祖跃,等:基于改进YOLOv5

16、模型的高速道路裂缝检测研究文提出一种基于改进的YOLOv5道路病害目标检测模型,网络结构如表 1所示。首先在主干网络中添加注意力模块(Convolutional Block Attention Module,CBAM)16加强特征提取;然后,在 Neck 中将 FPN-PAN 结构替换为双向特征 金 字 塔(Bi-Directional Feature Pyramid Network,BIFPN),为不同输入添加权重,让网络区分输入特征的重要程度进而加强多尺度融合;最后,在 BiFPN 结构中加入CBAM 模块,以在多尺度融合后进一步关注关键特征,加强对主要特征的提取,进而实现在裂缝病害密度较

17、高的道路中精准定位裂缝。2.2骨干网络改进在骨干网络中,本文首先更替Focus和SPP,将位于第一层的Focus改为66的Conv模块,两者作用等价,但对现有一些 GPU 设备,卷积层相较于 Focus更高效。然后,将SPP模块替换为空间金字塔模块(Spatial Pyramid Pooling,SPPF),将输入串行通过多个55卷积大小的Maxpool层,虽然相较于SPP而言计算结果一致,但速度更快。SPPF结构如图2所示。为了解决裂缝在图像中占比较小、与道路材质的灰度值重叠、修补裂缝形态相似等问题,本文引入CBAM特征注意力模块。该模块是一个轻量级的卷积注意力模块,适合移动部署,内部包含通

18、道和空间注意力模块,能从空间、通道两个维度定位、识别目标并细化提取的特征,避免了由卷积导致冗余信息淹没目标的问题。此外,为避免过早加入注意力机制,导致网络关注重点发生偏差,将该模块加在骨干网络的最后一层。CBAM如图3所示。由图3可见,CBAM整体运算由通道、空间注意力结构组成。首先,feature map进入通道注意力模块,经过 MaxPool和AvgPool,此时特征图大小将由CHW转为C11;然后,将变化后的特征图送入共享全连接层(Share MLP),将两个输出先后相加、Sigmoid激活,得到通道权重;接下来,再将通道权重与输入相乘,得到经通道注意力模块调整后的特征图 F 并将其输入

19、空间注意力机制,经过 MaxPool 和 AvgPool 后 F 的大小将由 CHW 转为 1HW;再之,对输出的两个特征图进行 concat操作,此时特征图大小将由 1HW 转为 2HW,同时利用 77 卷积降维 1 通道的特征图。最后,通过Sigmoid函数激活得到空间权重,并将空间权重与输入特征图F相乘得到调整后的最终feature map。2.3特征融合网络改进由于在网络卷积过程中,随着层数增加特征信息会在不同程度上逐层丢失,并且深层与浅层特征在跨尺度融合时具有不同的分辨率,将直接影响输出结果,因此本文将原有 FPN-PAN 结构替换为 BiFPN 加权特征双向金字塔,采用不同尺度间连

20、接融合的方法丰富语义信息,避免因网络层数加深导致的特征信息丢失问题。同时,BiFPN结构在不同尺度特征融合过程中引入自适应权重,可让网络自行区分输入特征的重要程度,根据权重抑制或增强输入特征,以平衡不同尺度间的特征信息。综上,相较于 FPN-PAN 结构直接对不同输入进行Concat操作,BiFPN结构具有更好的特征融合效果,能提升网络表达能力,具体加权公式如式(1)。特征输出通道注意力模块空间注意力模块特征输入 Fig.3Structure of CBAM图3CBAM注意力模块结构Table 1Network structure of improved YOLOv5表1改进后YOLOv5网络

21、结构层数012345678910111213141516171819202122232425262728From-1-1-1-1-1-1-1-1-1-1-1-1-11,6-1-1-11,4-1-1-11,6,14-1-1-11,10-1-119,23,27参数量3 52018 56018 81673 984115 712295 424625 1521 180 6721 182 72033 411656 896131 58400296 44833 024016 64574 4962 283295 42466 053296 4488 5631 180 672263 1731 182 72033 4

22、1121 576模块名称ConvConvC3ConvC3ConvC3ConvC3CBAMSPPFConvUpsampleConcat_BifpnC3ConvUpsampleConcat_BifpnC3CBAMConvConcat_BifpnC3CBAMConvConcat_BifpnC3CBAMDetect注:表1中From表示该层输入层,-1表示上一层。MaxPool2dMaxPool2dMaxPool2dConv(512,1,1)Conv(1024,1,1)ConcatSPPF Fig.2Structure of SPPF图2SPPF结构 1932023 年软 件 导 刊Out=iwi f

23、mi+jwj(1)式中:wi代表可学习的权重,随着模型不断训练,该参数值会随着优化器更新,向着使损失函数最小值的方向变更,在初始化时设定值为1;fmi代表网络结构中的输入特征图;=0.000 1;ReLU函数将权重细数规范到01。网络中某一层的融合方式如图 4 所示。由式(1)可知,特征融合过程与输出如式(2)、式(3)所示。Ptd4=Conv()w1 Pin4+w2 Resize()Pin3w1+w2+(2)Pout 4=Conv()w3 Pin4+w4 Ptd4+w5 Resize()Pout 3w3+w4+w5+(3)此外,本文还改进了 BiFPN结构,在跨尺度特征融合完成卷积后,在 B

24、ackbone 的尾部与 Head 添加 CBAM 注意力模块,以突出关注的特征,提升网络表达能力。融合CBAM模块的BiFPN结构如图5所示。3 实验结果与分析3.1实验环境与参数设置本文试验操作系统为Linux,基于GPU、Pytorch和CUDA框架完成,具体参数如图表2所示。3.2实验数据集为了让研究模型对真实道路病害情况进行训练,学习到最符合真实情况下的道路病害特征,提升算法泛化能力。本文数据集来源于北京高速交通(首发集团),使用固定在高速巡航车上的摄像头拍摄的实际高速道路,研究对象包括裂缝、修补裂缝、伸缩带3类。其中,裂缝最为常见且数量庞大;修补裂缝虽然并非为高速道路病害,但数量众

25、多且容易与裂缝病相互混淆;伸缩带并非为道路病害,但由于特征较为明显,同时也是实际工作中需要检修的重点,因此将其纳入研究对象。研究共采集图片2 164张,标注了4 916个目标,按照8 2的比例划分训练集、验证集。其中,训练集共有1 715张图片,标注裂缝2 047个、修补裂缝1 804个、伸缩带62个;验证集中共有 449 张图片,标注了裂缝 563 个、修补裂缝421个、伸缩带19个。数据集样例如图6所示。3.3评价指标本文采用精确度(Precision,P)、召回率(Recall,R)、平均精确度(Average Precision,AP)和平均精确度均值(Mean average Pre

26、cision,mAP)作为模型评测指标,具体混淆矩阵如表3所示。其中,召回率直接反映识别为正确的目标中实际为正样本(TP)占所有正样本的比值(TP+FN),如式(4)所示;精确度直接反映识别为正确的目标中实际为正样本(TP)占所有识别为正确目标的比值(TP+FP),如式(5)P4inP4tdP4outP3outw3w4w5P5inw1w2 Fig.4Cross-layer convergence architecture图4跨层融合结构注:表示add操作;wi表示不同路径上特征融合权重值;w2为Pin4到Ptd4直连路径上的权值;w3为Pin4跨尺度路径的权值;w4为Ptd4直连路径上的权值。

27、80 x8040 x40CBAMCBAMUpsample160160808040402020202040408080808040402020P2P3P4P5P4inP4tdP4outUpsampleCBAMCBAM Fig.5BiFPN incorporating CBAM modules图5融合CBAM模块的BiFPN结构Table 2Test platform parameters表2实验平台参数名称操作系统CPUGPUPythonPytorchCUDACuDNN版本ubuntu18.04Intel(R)Xeon(R)Silver 4110 CPU 2.10 GHzRTX 2080 Ti3

28、.8.131.9.011.07.6.5 194第 10 期闫卫坡,王志斌,任祖跃,等:基于改进YOLOv5模型的高速道路裂缝检测研究所示;平均精确度如式(6)所示;mAP是对所有类别的平均精度(AP)求均值后获得,如式(7)所示。R=TPTP+FN(4)P=TPTP+FP(5)AP=01P(R)(6)mAP=1cj=1cA Pj(7)式中:AP代表平均精确度;APj代表第j类目标检测的平均精度;c代表标记的类别;mAP代表平均精确度均值。mAP0.5=j=1cA P0.5jc(8)式中:AP0.5j代表交并比阈值为0.5的情况下第j类目标的平均精确度;c代表标记的类别;mAP0.5代表交并比阈

29、值为0.5时平均精确度均值。3.4实验结果实验中输入图像尺度为640640,Batch-size为16,训练200轮,初始学习率为0.01,优化函数采用随机梯度下降算法(Stochastic Gradient Descent,SGD),改进后的 P-R 曲线如图 7 所示。由此可见,裂缝、修补裂缝、伸缩带的mAP0.5 分别达到了 45.8%、62.9%、93.8%,所有类别的mAP0.5达到67.5%。改进YOLOv5模型、Precision、Recall和mAP0.5的结果如表4所示。改进YOLOv5模型和原YOLOv5模型训练200轮后的3类loss如图8所示。图 8(a)为 基 于 C

30、IoU 函 数 计 算 的 边 框 回 归 损 失(box_loss),由此可见改进模型的边框回归损失优于原模型。在训练前50轮,原YOLOv5模型表现更好,但随着网络不断学习,改进模型对网络的优化更快。其中,分类概率损失(cls_loss)和置信度损失(obj_loss)均基于交叉熵函数。由图8(b)可见,改进模型置信度损失始终小于原YOLOv5模型,但由于模型使用SGD随机梯度下降算法,会导0.120.100.080.06train/box_lossepoch0.040.02oursYolov5s0255075100125150175200(a)Border regression(a)边框

31、回归0.0350.0300.0250.0200.0150.010train/box_lossepoch0.0050.000oursYolov5s0255075100125150175200(c)Classification probability(c)分类概率0.0350.0300.025train/box_lossepoch0.0200.015oursYolov5s0255075100125150175200(b)Confidence(b)置信度Fig.8Training loss comparison function图8训练损失对比函数Table 3Confusion matrix表3混

32、淆矩阵混淆矩阵真实值10预测值1TPFP0FNTN注:TP为真阳性(True Positive),代表检测正确的正样本数量;FP为假阳性(False Positive,FP),表示检测错误的正样本数量;FN为假阴性(False Negative,FN),表示检测错误的负样本数量。1.01.00.80.80.60.60.40.4RecallPrecision0.2裂缝 0.458修补裂缝 0.629伸缩带 0.938all classes 0.675 maP0.50.20.00.0Fig.7P-R curve of YOLOv5图7YOLOv5的P-R曲线(a)Road cracks(a)道路裂

33、缝(c)Road expansion zone(c)道路伸缩带(b)Road repair cracks(b)道路修补裂缝Fig.6Sample images图6样例图片Table 4Precision,Recall and mAP0.5 results of improved YOLOv5 model表4改进YOLOv5模型Precision、Recall和mAP0.5结果(%)类型裂缝修补裂缝伸缩带AllPrecision63.368.194.175.2Recall62.543.759.184.6mAP0.545.862.993.867.5 1952023 年软 件 导 刊致整个训练过程中

34、存在轻微震荡的情况。由图8(c)可见,改进模型分类概率损失基本始终优于原模型,且在 20轮后逐渐趋于平稳,证明网络对数据集已具备较为准确的分类能力。3.5定量评价为验证改进模型的性能,本文针对当前主流的单阶段目标检测模型进行比较分析,每个模型训练环境相同,实验结果如表5所示。由表5可见,改进YOLOv5在mAP0.5指标中相较于YOLOv7-tiny-silu 模型降低 0.4%,但 mAP0.5:0.95 提升1.8%。YOLOv7虽然在以上两个指标取得了优秀的表现,但计算量、参数量非常大。改进YOLOv5算法在与其他复杂度相似的模型中,两项平均精度均值指标的表现十分优秀。在7组实验中,改进

35、YOLOv5在mAP0.5中排名第2,在mAP0.5:0.95中排名第3,在YOLOv5中加入注意力机制、改进融合网络结构后,虽然在参数量、计算量分别增加15.4%、6%,但平均精度均值提升明显。总体而言,改进YOLOv5模型在保持轻量级的同时,还具备较高的检测能力,在低成本的工业检测任务中相较于大多数模型能发挥更好的作用。为了更直观地展示原模型和改进模型的区别,随机选取部分检测结果,如图9所示。由图 9 中 Image1 可见,改进网络能提取更丰富的特征,可识别先前未能识别的裂缝,漏检率得到了改善。由图9中Image2可见,改进模型识别先前置信度低的目标的性能也具有明显提升。由图9中Imag

36、e3可见,改进模型对先前误检的目标进行了改正,识别精确度得到了显著提升。通过上述多种检测数据可知,改进模型相较于原模型提升较大,能精确检测、识别高速道路上的病害目标。3.6消融实验为继续探究改进算法的检测能力,本文在相同环境下共设计了4组消融实验,实验结果如表4所示。由表 6 可见,在引入 CBAM 注意力模块后模型的mAP0.5、mAP0.5:0.95提升十分明显,在几乎不增加网络参数的前提下,既能降低计算量,还能有效提升网络的定位及边框预测能力。检测效果证明了引入CBAM模块后,网络特征提取能力得到增加,既保留了需要关注的特征,又有效避免了由卷积冗余导致的信息丢失问题。在更换特征融合结构后

37、,模型的表现相较于仅添加CBAM模块更优秀,mAP0.5提升1.6%,mAP0.5:0.95提升0.2%。虽然更换BiFPN结构后,参数量、计算量均存在小幅度增加,但自适应权重相较于FPN-PAN结构的等价融合效果更佳,既在一定程度上区分了融合时的输入,又平衡了输入的重要程度,还提升了网络表达能力。综上,改进 YOLOv5 模型相较于原 YOLOv5s,mAP0.5、mAP0.5:0.95 分别提升 33.5%、21.5%,参数量增加14.7%,GFLOPs增加6%,模型特征提取、目标边界的回归能力得到显著增强。3.7实验分析相较于检测建筑裂缝21,裂缝检测环境更复杂、难度更大,阳光折射造成的

38、反光及高速移动造成的模糊时将增加检测难度,同时修补裂缝与裂缝灾害形态相似,易造成系统误检测。基于YOLOv5模型22检测公路灾害的精度约为45%,mAP0.5约为40%。在同等复杂背景、干扰因素更多的情况下,本文改进 YOLOv5 模型精度为 75.2%,mAP0.5 为67.5%。同时,引入Ghost模块23和ECA的YOLOv4公路路面裂缝检测方法24的参数量达到11.18 M,图片检测速度为0.083 张/s,而本文模型参数量为8.2 M,图片检测速度为0.037 张/s。然而,本文研究存在许多不足之处。例如,本文仅对3类道路灾害进行分类识别,在复杂的公路环境中还存在其Table 5Ex

39、perimentation comparison表5实验比较网络模型YOLOv5YOLOv7-tiny-silu16YOLOv717TPH-YOLOv518YOLOv3-tiny19YOLOX20改进YOLOv5输入尺寸640640640640640640640640640640640640640640参数量/1067.16.237.29.18.79.08.2GFLOPS16.513.2105.123.313.026.817.5mAP0.5/%34.067.967.566.042.064.767.5mAP0.5:0.95/%11.030.736.634.412.532.232.5Table 6

40、Comparison of target mAP by each category表6各类别目标mAP比较组别1234CBAMBiFPN参数量7 068 9367 105 3888 095 7728 107 387GFLOPs16.516.117.317.5mAP0.5/%34.065.767.367.5mAP0.5:0.95/%11.032.732.932.5FPS39.431.028.527.3注:“”表示引入该模块,“”表示未使用该模块。厂image1image2image3YOLOvS改进YOLOvSFig.9Detection results图9检测结果 196第 10 期闫卫坡,王

41、志斌,任祖跃,等:基于改进YOLOv5模型的高速道路裂缝检测研究他类别的病害25。下一步,应扩大数据集、病害研究的广度与深度,提升模型的鲁棒性与检测性能,使其能够适应更加复杂多变的高速道路环境。此外,可更换拍摄设备获取更优质的数据集,以提升模型对道路病害的检测效果。4 结语本文为解决当前高速道路裂缝的错检、漏检、精度低等问题,提出一种基于 YOLOv5 改进的道路裂缝识别模型。首先在改进YOLOv5模型的骨干网络中添加注意力机制,以此获取更多细节特征,并替换骨干网络中的Focus、SPP等模块来提升模型识别速度。具体为,在特征融合层采用BiFPN加权双向特征金字塔网络进行多尺度特征融合,并在检

42、测头处进行修改,还添加了CBAM注意力机制来强化网络表达能力。在真实道路的测试效果表明,改进算法的平均精度值能达到75.2%,FPS可达到27.3,基本满足高速检测的精确度与检测速度需求。然而,本文仅对3类道路灾害进行分类识别,仍需进一步完善数据库。此外,希望开发出具有完整界面和软硬件平台的道路灾害分类系统,以便于道路巡检工作人员检修与保养道路。参考文献:1 CHEN F B.Analysis of the causes and hazards of cracks in concrete road pavement in our country J.Sichuan Cement,2014(10

43、):18.陈发兵.浅析我国混凝土道路路面裂缝的原因及危害 J.四川水泥,2014(10):18.2 DENG Y X,ZHANG Z H,ZHANG X X.A new automatic extraction method for potting cracks in asphalt pavementJ.Science Technology and Engineering,2022,22(16):6687-6694.邓砚学,张志华,张新秀.一种新的沥青路面灌封裂缝自动提取方法J.科学技术与工程,2022,22(16):6687-6694.3 MA X L,LU J.Research on pa

44、vement crack image classification algorithm based on grayscale analysisJ.Journal of Wuhan University of Technology(Transportation Science&Engineering),2018,42(5):748-752,756.马晓丽,陆键.基于灰度分析的路面裂缝图像分类算法研究 J.武汉理工大学学报(交通科学与工程版),2018,42(5):748-752,756.4 OLIVEIRA H,CORREIA P L.Automatic road crack segmentat

45、ion using entropy and image dynamic thresholding C/2009 17th European Signal Processing Conference,2009:622-626.5 WANG X.Identification method of road cracks in complex environment based on wavelet transform directional component reconstructionJ.Shanxi Science&Technology of Communications,2021(4):52

46、-55.王兴.基于小波变换方向性分量重构的复杂环境公路裂缝识别方法J.山西交通科技,2021(4):52-55.6 LI Y D,HAO Z B,LEI H.Review of convolutional neural network research J.Journal of Computer Applications,2016,36(9):2508-2515,2565.李彦冬,郝宗波,雷航.卷积神经网络研究综述 J.计算机应用,2016,36(9):2508-2515,2565.7 YOU J C.Pavement crack detection based on improved Mas

47、k-RCNN J.Video Engineering,2022,46(6):7-9,19.游江川.基于改进Mask-RCNN的路面裂缝检测 J.电视技术,2022,46(6):7-9,19.8 XU K,MA R G.Crack detection of asphalt pavement based on improved faster RCNNJ.Computer Systems&Applications,2022,31(7):341-348.徐康,马荣贵.基于改进Faster-RCNN的沥青路面裂缝检测 J.计算机系统应用,2022,31(7):341-348.9 GU S H,LI X

48、X,WANG X Y,et al.Crack detection with enhanced semantic information and multi-channel feature fusion J.Computer Engineering and Application,2021,57(10):204-210.顾书豪,李小霞,王学渊,等.增强语义信息与多通道特征融合的裂缝检测 J.计算机工程与应用,2021,57(10):204-210.10 GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accura

49、te object detection and semantic segmentationC/Proceedings of the 2014 IEEE Conference on Computer Vision and Patten Recognition,2014:580-587.11 GIRSHICK R.Fast R-CNN C/Proceedings of the 2015 IEEE International Conference on Computer Vision,2015:1440-1448.12 REN S Q,HE K M,GIRSHICK R,et al.Faster R

50、-CNN:towards real-time object detection with region proposal networksJ.IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149.13 HE K M,GKIOXARI G,DOLLAR P,et al.Mask R-CNN J.IEEE Transactions on Pattern Analysis and Machine Intelligence,2020,42(2):386-397.14 KRIZHEVSKY

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服