收藏 分销(赏)

基于改进YOLOv5的煤矿井下目标检测研究.pdf

上传人:自信****多点 文档编号:576692 上传时间:2024-01-02 格式:PDF 页数:8 大小:15.45MB
下载 相关 举报
基于改进YOLOv5的煤矿井下目标检测研究.pdf_第1页
第1页 / 共8页
基于改进YOLOv5的煤矿井下目标检测研究.pdf_第2页
第2页 / 共8页
基于改进YOLOv5的煤矿井下目标检测研究.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于改进YOLOv5的煤矿井下目标检测研究寇发荣*肖伟何海洋陈若晨(西安科技大学机械工程学院西安710054)摘要:针对煤矿井下环境多利用红外相机感知周边环境温度成像,但形成的图像存在纹理信息少、噪声多、图像模糊等问题,该文提出一种可用于煤矿井下实时检测的多尺度卷积神经网络(Ucm-YOLOv5)。该网络是在YOLOv5的基础上进行改进,首先使用PP-LCNet作为主干网络,用于加强CPU端的推理速度;其次取消Focus模块,使用shuffle_block模块替代C3模块,在去除冗余操作的同时减少了计算量;最后优化Anchor同时引入H-swish作为激活函数。实验结果表明,Ucm-YOLOv

2、5比YOLOv5的模型参数量减少了41%,模型缩小了86%,该算法在煤矿井下具有更高的检测精度,同时在CPU端的检测速度达到实时检测标准,满足煤矿井下目标检测的工作要求。关键词:煤矿井下目标检测;深度学习;YOLOv5中图分类号:TN911.73;TP391文献标识码:A文章编号:1009-5896(2023)07-2642-08DOI:10.11999/JEIT220725Research on Target Detection in Underground Coal MinesBased on Improved YOLOv5KOUFarongXIAOWeiHEHaiyangCHENRuoc

3、hen(College of Mechanical Engineering,Xian University of Science and Technology,Xian 710054,China)Abstract:Inviewoftheundergroundcoalmineenvironment,whichusesmostlyinfraredcamerastosensethesurroundingenvironmentstemperature,theimagesformedhavetheproblemsoflesstextureinformation,morenoise,andblurredi

4、mages.ThedetectionofUndergroundtargetsincoalminesusingYOLOv5(Ucm-YOLOv5),aneuralnetworkforreal-timedetectionofcoalmines,issuggestedinthisdocument.ThisnetworkisanimprovementonYOLOv5.Firstly,PP-LCNetisusedasthebackbonenetworkforenhancingtheinferencespeedontheCPUside.Secondly,theFocusmoduleiseliminated

5、,andtheshuffle_blockmoduleisusedtoreplacetheC3moduleinYOLOv5,whichreducesthecomputationwhileremovingredundantoperations.Finally,theAnchorisoptimizedwhileintroducingH-swishastheactivationfunction.TheexperimentalresultsshowthatUcm-YOLOv5has41%fewermodelparametersandan86%smallermodelthanYOLOv5.Thealgor

6、ithmhashigherdetectionaccuracyinundergroundcoalmines,whilethedetectionspeedattheCPUsidereachesthereal-timedetectionstandard,whichmeetstheworkingrequirementsfortargetdetectioninundergroundcoalmines.Key words:Coalmineundergroundtargetdetection;Deeplearning;YOLOv51 引言目前我国煤矿开采正由综合机械化开采向智能化开采过渡,煤炭智能化理论体系

7、逐步形成1,2。Zhang等人2提出智能化煤矿系统架构,认为高速高可靠的通信内容是煤炭智能化的关键。井下目标检测作为煤矿智能化高速通信与信息获取的基础环节,主要任务以人员检测为主,机器设备为次要。大部分煤矿需要深部开采,全天使用人工光源,且有粉尘等因素的影响,因此井下的视频图像具有环境昏暗、地理环境复杂、曝光不均、细节模糊、缺乏色彩特征的特点。在煤矿井下开采活动中,采矿工人进入煤矿后,人员的实际位置、工作情况等不能及时传到控制室,因此井下作业有很大的危险性。人员、设备的安全有效管理对煤矿的安全生产,以及事故发生后的人员救援具有十分重要的意义。收稿日期:2022-06-02;改回日期:2022-

8、11-14;网络出版:2022-11-19*通信作者:寇发荣基金项目:国家自然科学基金(51775426),陕西省科技计划(2019JQ-795)FoundationItems:TheNationalNaturalScienceFoundationofChina(51775426),ShaanxiProvinceScienceandTechnologyPro-gramProject(2019JQ-795)第45卷第7期电子与信息学报Vol.45No.72023年7月JournalofElectronics&InformationTechnologyJul.2023基于红外成像的机器视觉可用于煤

9、矿井下的目标检测。文献3,4利用红外技术来实现井下人员的检测,这种利用单个红外探测器的检测技术可以实现井下人数的统计,但在多人并行或工人走动混乱时难以真正检测与计数。近些年来,深度学习和计算机视觉得到了快速发展,其相关技术已在多个领域被广泛使用57。Li等人8利用YOLOv4处理红外图像进行煤矿井下的人员检测,将迁移学习的策略应用于YOLOv4的训练,加强了网络的泛化能力,提高了YOLOv4的检测性能。但YOLOv4网络计算量与模型参数量庞大,加上超分辨率卷积神经网络对红外图像进行预处理,进一步加大了网络计算量,使得井下硬件设施无法提供充足的计算量。Jiang等人9提出一种尺度不变特征变换和均

10、值偏移的改进算法,利用特征提取的尺度不变化,建立了特征目标检测与跟踪模型。但这种模型在移动物体时会导致前景与背景混淆,分辨率降低。Du等人10提出一种基于Retinex理论和小波多尺度的边缘检测算法,利用低光度矿井图像获得边缘图像,能够为矿用机器人提供环境信息,该方法虽具有实时性,但稳定性差,容易被外部振动干扰,可靠性低。Qiu等人11通过改进YOLOv5的网络结构、增加注意力机制、数据增强等方法用来改善探地雷达误检率高的问题。但探地雷达的图像判读很大程度上依赖于研究人员的工作经验,无法解决检测效率低的问题。上述方法专注于改进特征提取网络,适应井下图像特点,得到高精度的检测效果。但除了图像上的

11、难点,煤矿井下易燃易爆的环境特点,对电子产品提出了严苛的要求与限制,比如计算机功率、内存大小等。基于深度学习的目标检测器大多数对计算机性能有极高的要求,这是限制其广泛运用的重要原因。因此在没有高性能GPU的支持下,使深度学习目标检测器在煤矿井下有效、高效发挥是重点问题。针对上述问题,本文基于YOLOv5,提出一种可用于煤矿井下实时检测的模型Ucm-YOLOv5(ThedetectionofUndergroundtargetsincoalminesusingYOLOv5,Ucm-YOLOv5)。使用PP-LCNet12作为YOLOv5的主干网络,用于加强CPU端的推理速度;取消Focus模块,使

12、用shuffle_block模块替代YOLOv5中的C3模块;优化Anchor同时引入H-swish作为激活函数。在保证模型精度和推理延迟几乎保证不变的前提下,使得检测网络变得轻量化,参数量极大地减少。满足煤矿井下目标检测的工作需求,具有实际工程意义。2 煤矿井下目标检测模型2.1 YOLOv5目标检测模型目前R-CNN(RegionwithCNNfeatures)13、SSD(SingleShotDetection)14、YOLO(YouOnlyLookOnce)1518等目标检测模型常被用于各行各业,与R-CNN和SSD模型相比较,YOLOv5利用自适应锚框计算和多语义融合检测机制,能使丰

13、富的高层语义信息与低层级的位置信息快速有效融合,从而实现目标的快速检测。YOLOv5能一次性完成目标定位与目标分类两个任务。主要由输入端、主干网、多尺度特征融合网络和检测头组成。输入端使用Mosaic数据增强、自适应初始锚框计算、图片缩放等对图像预处理;其次使用CSPDarknet53作为主干网络,在主干网络中使用Focus下采样、CSP(CrossStagePartial)结构、SPP(SpatialPyramidPooling)池化金字塔结构提取图片的特征信息;多尺度特征融合网络主要采用FNP+PAN的特征金字塔结构,该结构对高层级特征图中丰富的语义信息以及低层级特征图中丰富的位置信息进行

14、有效融合,实现了不同尺寸目标特征信息的传递,可以提高网络的多尺度预测能力,CSP结构同时用于Neck网络中,最后送入YOLO检测头进行类别和位置的回归。2.2 基于改进YOLOv5的煤矿井下目标检测模型本研究通过对YOLOv5目标检测模型进行改进,提出一种可用于煤矿井下目标检测模型,Ucm-YOLOv5。主要改进工作如下:(1)使用轻量级网络PP-LCNet作为YOLOv5的主干网络,同时剪除一些冗余操作,让整个网络轻量化。(2)优化Anchorboxes并改进其分配原则。(3)使用H-swish函数为YOLOv5的激活函数。2.2.1 Ucm-YOLOv5神经网络结构井下图像的特点是细节模糊

15、,缺乏色彩特征,曝光不均;此外由于煤矿井下特殊情况要求,没有高性能GPU,需要改进后的网络在CPU端也有优秀的检测性能。因此特征提取网络改进的主要思路是压缩特征提取网络深度,减少冗余操作,充分利用浅层卷积层的特征。浅层的卷积特征背景噪声小,对于井下非高清图像更适合提取低分辨率下的语义特征,对于井下图像具有更好的表征能力。因此在Ucm-YOLOv5神经网络中,以轻量级PP-LCNet为主干网络,去掉了Focus模块,使用shuffle_block模块代替YOLOv5中的C3模块。网络结构的改进主要包括以下3个方面:(1)使用PP-LCNet为主干网络。PP-LCNet是一种基于MKLDNN加速策

16、略下的轻量级CPU网第7期寇发荣等:基于改进YOLOv5的煤矿井下目标检测研究2643络,这是一款专门为CPU设计的网络,PP-LCNet在同样精度下,速度远超其他轻量级骨架网络。优秀的目标检测能力加上CPU端远超其他轻量级骨架网络检测速度让PP-LCNet契合在煤矿井下工作要求。PP-LCNet神经网络结构使用DepthSep-Conv作为基本块。该模块没有额外的连接和逐元素相加之类的操作,这些操作不仅会降低模型的推理速度,而且不会提高轻量级小模型的精度。(2)取消Focus结构。Ucm-YOLOv5网络中,取消了YOLOv5的Focus模块,Focus模块在YOLOv5中是进入backbo

17、ne前,对图片进行切片操作,使图片在下采样的过程中,不带来信息丢失。在不考虑偏置参数的情况下,相对比普通下采样,Focus操作的计算量和参数量是普通卷积的4倍,而将Focus换成普通卷积下采样并不会对模型结果产生大的影响,因此取消Focus结构。(3)使用shuffleblock模块代替YOLOv5中的C3模块。YOLOv5中的C3模块在增强整个卷积神经网络学习性能的同时减少了计算量。但相同顺序的数据会让网络模型过拟合或欠拟合,这对于数据量小的自制数据集会有较大影响,shuffleblock模块可以随机打乱数据,让每一轮训练数据投入顺序不同,增加了随机性,提高了网络的泛化能力,可以避免数据有规

18、律地重复出现,避免了最终模型过拟合或欠拟合。网络改进后共21个残差层,比原YOLOv5网络少了3层,达到了压缩网络深度的目的。其中在14,17,20层上生成目标检测框。Ucm-YOLOv5神经网络结构如图1所示。2.2.2 优化Anchor不同尺寸的特征对不同的Anchorboxes有不同的敏感程度,因此需要优化Anchorboxes,让优化后的Anchorboxes的尺寸范围适合新的数据集。与YOLOv5相同,通过K-means聚类算法确定Anchor个数,并生成新的Anchor尺寸。依据YOLOv5的Anchor个数,依旧指定质心数为9,即采用9个Anchor,通过K-means聚类算法得

19、到相应的尺寸。Anchors参数里面共9个数值,一共3行6列,每一行的先后顺序可以打乱,不代表任何意义。Anchor由宽高组成,用的是原图的像素尺寸,表示数据样本中样本的大概形状,同时聚类生成3组尺度,每组尺度有3种长宽比分别为:1:1,1:2,2:1,共9个Anchor。表1是原始Anchor参数和重构Anchor参数。2.2.3 YOLOv5激活函数优化激活函数的好坏往往决定着网络的性能,激活函数帮助网络学习数据中的复杂模式。引入激活函数的同时也会给神经元引入非线性因素,使得神经网络可以逼近其他任何非线性函数,这可以使神经网络运用到众多的非线性模型中。当EfficientNet19使用Sw

20、ish激活函数表现出更好的性能后,Mobile-NetV320网络将其升级为H-swish,从而避免了大量的指数运算。因此本文将主干网络中的激活函数图1Ucm-YOLOv5神经网络结构图2644电子与信息学报第45卷从ReLU替换为H-swish。可减少大量的指数运算,性能有了很大提高,而推理时间几乎没有改变。H-swish激活函数表达式和sigmoid激活函数的表达式如式(1)、式(2)所示f(x)=x sigmoid(x)(1)sigmoid(x)=11+ex(2)但是由于sigmoid函数计算复杂,于是改用近似函数来逼近Swish,选用ReLU6作为近似函数。主要有两个原因:(1)在几乎

21、所有的软件和硬件框架上都可以使用ReLU6的优化实现;(2)ReLU6能在特定模式下消除近似sigmoid的不同实现而带来的潜在的数值精度损失。H-swish函数的表达式如式(3)、式(4)所示H swish(x)=xReLU6(x+3)6(3)ReLU6(x)=min(max(0,x),6)(4)3 实验设计实验采用PyTorch深度学习框架,计算机配置为IntelCorei5-8300HCPU,2.30GHz,16GByte内存,显卡为GeForceGTX1050Ti,操作系统为Windows10,CUDA为10.1版本,CUDNN神经网络加速库版本为7.6.5。网络训练采用的动量项为0.

22、9的异步随机梯度下降,权值的初始学习效率为0.001,衰减系数设置为0.000 5。batch-size=16,共701批次,进行1 400次迭代。本文实验使用的数据集为自制的煤矿井下数据集,数据来源于某煤业井下监控视频,数据共2 336幅图像。数据集图像主要包括8个类别,包括人(Person)、轨道(Rail)、提示牌(Tipcards)、车(Truck)、机器(Machine)、管道(Pipe)、灯(Lamp)和支撑柱(Columns)共8 689个标签。本文中采用平移、水平翻转、椒盐噪声、高斯噪声和亮度增强等方式增强扩充数据集,部分图像合成结果如图2所示。经过上述数据增强处理将2 336

23、张图片扩充至14 016张,按照8:1:1的比例随机划分为训练集、验证集和测试集,各数据集中分别有11 213张、1 402张和1 401张图像。实验过程中保证训练集和测试集相互独立。扩充后训练集11 213张图像中各类别标签数如表2所示。4 实验结果与分析4.1 评价指标本文采用查准率(Precision,P)、平均精确率(AveragePrecision,AP)和所有类别AP值的平均值(meanAveragePrecision,mAP)来评估模型的性能。各指标计算公式为P=TPTP+FP 100%(5)AP=nPn(6)mAP=Ni=1APN(7)TPFPFNnN其中,是真正例,是假真例,

24、是模型所漏检的个数,是样本总数,是类别数。以召回率为横轴,查准率为纵轴,可以得到一条曲线,在该曲线下的面积即为AP值。4.2 实验1:井下目标检测效果对比实验实验1分为两个阶段,第1阶段将改进后的Ucm-YOLOv5网络与原YOLOv5网络进行对比,分析两种网络的检测性能。第2阶段,为更直观验证本文算法的有效性与先进性,考虑不同网络在不表 1 Anchor参数原始Anchor重构Anchor10,13,16,30,55,22030,61,62,45,59,119116,90,156,198,373,32630,27,53,78,172,35128,115,90,225,101,327222,1

25、52,154,316,311,243表 2 煤矿井下数据集参数类别扩充前标签数扩充后标签数Person人3 65821 948Rail轨道8124 872Tipcards提示牌3892 334Truck车3522 112Machine机器4792 874Pipe管道9135 478Lamp灯1 5019 006Columns支撑柱5853 510总计8 68952 134图2图片扩充结果第7期寇发荣等:基于改进YOLOv5的煤矿井下目标检测研究2645同光线强度下的性能不同,使用4种网络FasterR-CNN,MobileNetV3,YOLOv5,Ucm-YOLOv5进行煤矿井下自制数据集检测

26、对比。第1阶段,将自制井下数据集放入YOLOv5和Ucm-YOLOv5网络训练达到500轮次时,损失函数已基本收敛,图3为Ucm-YOLOv5网络训练时的损失函数和查准率。在YOLOv5和Ucm-YOLOv5神经网络各自完成训练后设计了井下多目标检测性能对比实验。将原始测试集分为曝光强和曝光弱两个梯度,分析两种井下识别网络在不同情况下的检测性能。将1 400幅原始测试图像分为强曝光和弱曝光2个梯度,每个梯度包括700幅图像作为测试集,分别使用YOLOv5和Ucm-YOLOv5神经网络进行检测,图4为两种网络的P关于R关系曲线。在图4中,Ucm-YOLOv5神经网络模型的PR曲线包裹的面积略大于

27、YOLOv5,表明在煤矿井下数据集中Ucm-YOLOv5的性能更优。表3为YOLOv5网络和Ucm-YOLOv5网络在煤矿井下自制数据集的性能对比结果。从表中可知在两种光照状态下,两种算法对于人类的检测均有较高的精度,但Ucm-YOLOv5对于其他类的AP值提升明显,证实了网络优化锚框与优化损失函数的有效性。结果表明,本文算法Ucm-YOLOv5具有更优的检测效果。第2阶段,使用4种网络FasterR-CNN,Mobi-leNetV3,YOLOv5,Ucm-YOLOv5在煤矿井下自制数据集上进行测试,结果如表4所示。从表4可以看出,本文算法在煤矿井下数据集中表现更好,mAP值可以达到97.5%

28、,在原始YOLOv5的基础上mAP值提高了11.7%。而FasterR-CNN和YOLOv5由于网络参数较多,在小型数据集上可能存在过拟合的问题,平均检测精度较低。4种方法的部分检测效果图如图5所示。4.3 实验2:不同模型CPU端检测性能对比实验使用4种网络FasterR-CNN,MobileNetV3,YOLOv5和Ucm-YOLOv5使用GPU训练得到模型后,分别让各模型使用GPU和CPU对验证集进行检测,统计各模型的模型大小、模型参数量和推理时间。表5为本文改进前后网络与其他网络的性能对比。Ucm-YOLOv5比YOLOv5的模型参数量减少了41%,模型缩小了86%。在CPU端的识别速

29、度相比于改进前的YOLOv5提高了20.4帧/s,达到了28帧/s,超过了实时检测的最小要求25帧/s,使Ucm-YOLOv5网络可在煤矿井下环境达到实时检测的效果。相比于轻量级网络MobileNetV3快12%;与FasterR-CNN网络相比,少了生成候选区域这一步,在CPU端的检测速度明显快于FasterR-CNN。结果表明,Ucm-YOLOv5显著地缩减了网络规模,提高了网络在CPU端的识别速度,满足实时检测的要求。4.4 实验3:Ucm-YOLOv5网络鲁棒性实验在实际煤矿井下环境中,工人和机器往往处于表 3 网络检测结果对比(%)曝光状态APmAP人类轨道提示牌车机器管道灯支撑柱强

30、曝光YOLOv589.688.289.584.585.289.489.383.588.2Ucm-YOLOv599.399.698.799.499.599.698.296.198.8弱曝光YOLOv593.784.385.682.982.787.281.679.583.4Ucm-YOLOv598.896.697.395.794.596.694.996.196.3图3Ucm-YOLOv5网络的损失函数和查准率图4YOLOv5和Ucm-YOLOv5神经网络的PR曲线2646电子与信息学报第45卷工作状态,复杂的工作让工人经常处于遮挡状态,加上各种光源的不定时转动,得到的图像很容易造成曝光过强和光线昏

31、暗。为了验证Ucm-YOLOv5网络和YOLOv5网络在煤矿井下复杂环境的网络鲁棒性,使用3段不同工作场景下的作业视频,分别为井下综采工作面场景883帧、往井下送风工作场景498帧、对设备和固定装置进行修理工作场景687帧。对3段测试视频共2 018帧中的目标平均精确率、误检率、平均检测率、平均检测速度做出统计,统计结果如表6所示。由表6的测试结果可见,Ucm-YOLOv5网络在煤矿井下复杂环境中具有优秀的目标检测能力,鲁棒性良好,对正在进行煤矿井下作业的复杂环境场景下,平均目标检测率为45.8%,平均检测速度达到21.1帧/s,相较于YOLOv5网络平均目标检测率提高了4%,平均检测速度提高

32、4.8帧/s。图6是Ucm-YOLOv5网络和YOLOv5网络对井下综采工作面工作场景的检测效果对比,在井下综采工作面场景833帧视频中随机提取6帧,随机提出的6帧图像分别是第252帧,第387帧,第407帧,第498帧,第659帧与第722帧。其中第252帧和第498帧存在运动和遮挡。在第252帧图像中,Ucm-YOLOv5网络成功识别两个目标物人,而YOLOv5网络漏检其中一个遮挡目标;第387帧和第407帧图像中存在光源直射、曝光过强的问题,两种网络都存在漏检。第659帧和第722帧图像中目标物正在快速移动和存在较大程度的遮挡,本文算法成功识别,YOLOv5对两帧图像都有漏检。由上述对比

33、检测结果可见本文所提出的Ucm-YOLOv5网络在煤矿井下复杂环境中对物体识别检测中具有优势。5 结束语本文利用轻量级网络PP-LCNet,重新设计YOLOv5的基础网络与特征提取网络,提出一种可用于煤矿井下的实时目标检测算法Ucm-YOLOv5。本研究分别从井下目标检测精度提升、CPU端性表 4 煤矿井下数据集不同方法结果比较模型LossmAP(%)FasterR-CNN0.041980.6MobileNetV30.011986.2YOLOv50.020685.8Ucm-YOLOv50.017197.5表 5 不同模型网络性能对比结果模型模型大小(MByte)模型参数量(MByte)平均检测

34、速度(帧/s)GPUCPUFasterR-CNN17025.37.02.4MobileNetV3485.43725YOLOv590.47.3857.6Ucm-YOLOv512.54.35128图5不同模型检测效果第7期寇发荣等:基于改进YOLOv5的煤矿井下目标检测研究2647能提升、煤矿井下复杂环境鲁棒性等方面进行实验验证。实验结果表明,Ucm-YOLOv5比YOLOv5的模型参数量减少了41%,模型缩小了86%;在静态图像检测中,模型准确率达到了97.5%;动态实时作业场景下mAP为45.8%,相比改进前提高了11.7%,平均检测速度为21.1帧/s,相比改进前提高了4.8帧/s。实验结果

35、验证了改进模块的有效性,Ucm-YOLOv5在保证模型精度和推理延迟几乎不变的前提下,使得网络变得轻量化,参数量减少,实现煤矿井下目标物体的检测与定位。煤矿井下目标物体易被遮挡,从而导致检测效果不理想,今后工作将围绕井下目标遮挡问题进一步展开。参 考 文 献LIAiling,ZHANGJixiong,ZHOUNan,et al.Amodelfor1evaluatingtheproductionsystemofanintelligentminebasedonunascertainedmeasurementtheoryJ.Journal ofIntelligent&Fuzzy Systems,20

36、20,38(2):18651875.doi:10.3233/JIFS-190329.ZHANGKexue,KANGLei,CHENXuexi,et al.AreviewofintelligentunmannedminingcurrentsituationanddevelopmenttrendJ.Energies,2022,15(2):513.doi:10.3390/en15020513.2HEYunze,DENGBaoyuan,WANGHongjin,et al.Infraredmachinevisionandinfraredthermographywithdeeplearning:Arevi

37、ewJ.Infrared Physics&Technology,2021,116:103754.doi:10.1016/j.infrared.2021.103754.3WEIDong,WANGZhongbin,SILei,et al.Onlineshearer-onboardpersonneldetectionmethodfortheintelligentfullymechanizedminingfaceJ.Proceedings of the Institution of4表 6 煤矿井下复杂环境中Ucm-YOLOv5网络与YOLOv5的鲁棒性对比类别目标出现总帧数目标检测总帧数目标错误检测

38、总帧数 平均精确率AP(%)误检率(%)平均检测率mAP(%)平均检测速度(帧/s)Ucm-YOLOv5YOLOv5Ucm-YOLOv5YOLOv5Ucm-YOLOv5YOLOv5Ucm-YOLOv5YOLOv5Ucm-YOLOv5YOLOv5Ucm-YOLOv5YOLOv5Person1 9861 0638850053.544.60045.840.821.116.3Rail651329277263350.542.545Tipcards566265236131846.841.72.33.2Truck496213178162342.938.83.24.6Machine56626321622294

39、6.438.23.95.1Pipe6482982690045.941.500Lamp8424153870042.345.900Columns594227198182538.233.334.2图6复杂环境下Ucm-YOLOv5网络和YOLOv5网络检测性能的对比2648电子与信息学报第45卷Mechanical Engineers,Part C:Journal of MechanicalEngineering Science,2022,236(6):30583072.doi:10.1177/09544062211030973.RYUJandKIMS.Datadrivenproposalandde

40、eplearning-basedsmallinfrareddronedetectionJ.Journal of Instituteof Control,Robotics and Systems,2018,24(12):11461151.doi:10.5302/J.ICROS.2018.18.0157.5FANTao.ResearchandrealizationofvideotargetdetectionsystembasedondeeplearningJ.International Journal ofWavelets,Multiresolution and Information Proce

41、ssing,2020,18(1):1941010.doi:10.1142/S0219691319410108.6李宝奇,黄海宁,刘纪元,等.基于改进SSD的水下光学图像感兴趣目标检测算法研究J.电子与信息学报,2022,44(10):33723378.doi:10.11999/JEIT210761.LIBaoqi,HUANGHaining,LIUJiyuan,et al.UnderwateropticalimageinterestedobjectdetectionmodelbasedonimprovedSSDJ.Journal of Electronics&InformationTechnol

42、ogy,2022,44(10):33723378.doi:10.11999/JEIT210761.7LI Xiaoyu,WANG Shuai,LIU Bin,et al.ImprovedYOLOv4networkusinginfraredimagesforpersonneldetectionincoalminesJ.Journal of Electronic Imaging,2022,31(1):013017.doi:10.1117/1.JEI.31.1.013017.8JIANGDaihong,DAILei,LIDan,et al.Moving-objecttrackingalgorithm

43、basedonPCA-SIFTandoptimizationforundergroundcoalminesJ.IEEE Access,2019,7:3555635563.doi:10.1109/ACCESS.2019.2899362.9DUYuxin,TONGMinming,ZHOULingling,et al.EdgedetectionbasedonRetinextheoryandwaveletmultiscaleproductformineimagesJ.Applied Optics,2016,55(34):96259637.doi:10.1364/AO.55.009625.10QIUZh

44、i,ZHAOZuoxi,CHENShaoji,et al.ApplicationofanimprovedYOLOv5algorithminreal-timedetectionofforeignobjectsbygroundpenetratingradarJ.RemoteSensing,2022,14(8):1895.doi:10.3390/RS14081895.11CUICheng,GAOTingquan,WEIShengyu,etal.PP-LCNet:AlightweightCPUconvolutionalneuralnetworkJ.arXivpreprintarXiv:2109.150

45、99,2021.12GIRSHICKR,DONAHUEJ,DARRELLT,etal.Rich13featurehierarchiesforaccurateobjectdetectionandsemantic segmentationC.2014 IEEE Conference onComputerVisionandPatternRecognition,Columbus,USA,2014:580587.doi:10.1109/CVPR.2014.81.LIUWei,ANGUELOVD,ERHAND,etal.SSD:SingleshotmultiboxdetectorC.The14thEuro

46、peanConferenceonComputerVision,Amsterdam,TheNetherlands,2016:2137.doi:10.1007/978-3-319-46448-0_2.14BOCHKOVSKIYA,WANGCCY,andLIAOHYM.YoLOv4:OptimalspeedandaccuracyofobjectdetectionJ.arXivpreprintarXiv:2004.10934,2020.15REDMONJ,DIVVALAS,GIRSHICKR,etal.Youonlylookonce:Unified,real-timeobjectdetectionC.

47、2016IEEEConferenceonComputerVisionandPatternRecognition,LasVegas,USA,2016:779788.doi:10.1109/CVPR.2016.91.16REDMONJandFARHADIA.YoLOv3:AnincrementalimprovementJ.arXivpreprintarXiv:1804.02767,2018.17REDMONJandFARHADIA.YOLO9000:Better,faster,strongerC.2017IEEEConferenceonComputerVisionandPatternRecogni

48、tion,Honolulu,USA,2017:72637271.doi:10.1109/CVPR.2017.690.18TANMingxingandLEQV.EfficientNet:RethinkingmodelscalingforconvolutionalneuralnetworksC.The36thInternationalConferenceonMachineLearning,LongBeach,USA,2019.19HOWARDA,SANDLERM,CHENBo,etal.SearchingforMobileNetV3C.2019IEEE/CVFInternationalConferenceonComputerVision,Seoul,Korea(South),2019.doi:10.1109/ICCV.2019.00140.20寇发荣:男,教授,博士,研究方向为车辆系统动力学、智能汽车技术.肖伟:男,硕士生,研究方向为智能车辆环境感知技术.何海洋:男,硕士生,研究方向为智能车辆路径规划算法.陈若晨:男,硕士生,研究方向为智能汽车技术.责任编辑:马秀强第7期寇发荣等:基于改进YOLOv5的煤矿井下目标检测研究2649

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服