1、交通世界TRANSPOWORLD0 引言列车的维护检修是一项需要大量人力物力的工作,目前的列车维护检修大多仍在使用传统的人工检测手段,由于工作环境恶劣、列车数量众多,人工检测的方法效率较低且可靠性不高,易导致列车发生质量问题,影响列车安全运行。目前,铁路领域对于动车防松铁丝的检测越来越重视。动车防松铁丝折断故障是一种可能危及行车安全的故障,因此对防松铁丝的故障检测至关重要。随着深度学习与人工智能的不断发展,YOLO、Faster-RCNN1检测网络被广泛用于目标检测中,但是在检测过程中还是会出现错检和漏检的问题,原因可能是由于目标的尺寸较小,能够提取的特征有限,在不断的卷积过程中致使特征消失,
2、导致算法对防松铁丝的故障检测率低。本文针对采集到的数据样本,研究一种高识别率的智能检测算法。1 防松铁丝断裂故障识别流程该技术主要是用于动车组运行故障图像检测系统中,利用轨道两旁搭建的高速摄像设备获取过车图像,挑选含防松铁丝部位的图像作为样本图像,前期需要通过人工标注的方式借助标注软件将图片中故障信息形成相应的标注文件,网络会依据标注的信息进行特征学习。由于列车上的防松铁丝部位图像会受光照影响,使部件特征不明显,需要在样本输入网络之前加入图像增强处理。接着要设置好合适的超参数,加载样本图像到 YOLOv5 网络中进行训练,训练完保存模型文件,再对新过车的故障进行检测,如有异常及时报警。防松铁丝
3、断裂故障识别流程如图 1 所示。图1 防松铁丝故障检测流程图2 基于YOLOv5的防松铁丝故障识别算法YOLOv5是Ultralytics公司的开源YOLO版本,且完全基于PyTorch实现,在目标检测领域应用效果良好,该算法的特点主要表现在以下几方面。2.1 数据预处理对图片进行翻转、缩放、色域变化、马赛克增强2等操作,把原数据和增强数据拼接后传入卷积神经网络学习。这种方式丰富了检测数据和背景,提升了对小目标的检测能力,加强模型的鲁棒性。自适应锚框计算:在模型进行训练前,会自适应计算训练集中的最佳锚框值,使检测框更加贴合故障的形态,使定位更精准。通过K-mean聚类方法对数据集中的目标尺寸重
4、新计算得到的,其中小尺度是负责收稿日期:2023-03-01作者简介:张闽东(1979),男,福建泉州人,高级工程师,研究方向为机器视觉与人工智能。基于YOLOv5的动车防松铁丝故障自动检测方法张闽东,王盼盼,武慧杰,苏胜龙(北京京天威科技发展有限公司,北京 100085)摘要:为提高动车防松铁丝的检测准确性,减少错检和漏检问题,研究一种高识别率的智能检测算法。采用深度学习算法YOLOv5对防松铁丝断裂类故障进行检测,并对该算法进行部分模块的优化,调整了核心参数和网络框架,并加入增强技术。经测试,该技术能对防松铁丝断裂类故障有明显的提升效果,可供同类工程参考。关键词:图像增强;神经网络;YOL
5、Ov5算法;深度学习;防松铁丝断裂中图分类号:U269.3文献标识码:A13总660期2023年第30期(10月 下)检测图像中的大目标,中尺度负责检测中等大小的目标,大尺度负责检测小目标。自适应图片缩放:输入网络前需要将原始图像缩放到固定大小,该技术能自适应添加最少的黑边,减少了推理时的计算量。2.2 网络模型的改进主干网络中采用Focus结构,流程是先对输入图像每隔一个像素取一个值,得到4张图片,再进行通道拼接,目的是将图像的宽高信息集中到通道空间,此时的图像相对于原先的RGB三通道模式变成了12个通道,然后将得到的新图像经过卷积操作,最终得到无信息丢失情况下的二倍下采样特征图,可减少计算
6、量,提高速度。主干网络中使用带有残差结构的CSP1,由于主干网络较深,增加残差结构可以增强层与层之间反向传播的梯度值,避免因加深网络导致的梯度消失,同时可以解决网络退化的问题,得到的特征粒度更细。主干网络中的CSP1模块如图2所示。图2 主干网络的CSP1模块图 2 中,CBL 包含 Conv、BN、Leaky ReLU 三个步骤。Conv表示卷积,用来进行特征提取。BN特征归一化,用来平滑特征输入的分布,将输入值缩放到均值为 0 方差为 1 的标准正态分布,避免了梯度消失的问题,也很大程度加快了训练速度。Leaky ReLU激活函数,给所有负值赋予一个非零斜率,作用是解决特征在传递过程中造成
7、的梯度消失问题。Res Unit(2 个CBL卷积+残差)中,残差结构3有两个分支,一条分支对特征进行卷积,另一条分支直接作为特征传递,然后将两个分支融合后的特征作为输出。本文的改进点是将YOLOv5中主干网络替换成EfficientNetB2网络,通过使用一个固定比例来实现对网络的深度、宽度以及分辨率三个维度的同时缩放,为模型提供了兼具准确性与快速性的高效卷积神经网络。其与缩放的关系如式(1)(3)所示:depth=(1)width=(2)resolution=(3)式(1)(3)中:为组合缩放系数,需要手动设定;为深度;为宽度;为图像分辨率。缩放基数分别为、和。EfficientNet4网
8、络的核心结构为 MBConv 模块,其中还融入了注意力机制,其结构如图3所示。图3 MBConv模块MBConv模块中,首先对输入进行11的逐点卷积,输出通道维度根据扩展比例变化,然后通过kk的深度卷积(本文中k为3),再经过SE权重注意力模块,接着通过11的逐点卷积将输出通道维度统一成与输入通道维度一样大小。最后随机失活部分神经元,并在模块输入输出之间建立跳跃连接。模块中的每个卷积操作后均紧跟批归一化,并使用swish激活函数进行激活。SE模块可以自动搜集每个特征通道的重要性并根据所搜集的特征的重要性排序,对有用特征增强并抑制无关的特征。该方法使用全局平均池化提取通道间的特征,将结果和后层特
9、征融合,起到对不同通道的注意力加权机制。进一步将SE替换成SimAM注意力机制,SimAM是2021年提出的一种简单且非常有效的注意力机制模块。如图4所示为SimAM注意力机制,其独特优势在于无需增加额外参数,即可直接为特征图推导出三维权值(即空间和通道维度),使网络学习更多有辨别性的神经元以提高网络的特征提取能力。基于神经科学理论提出优化能量函数以挖掘神经元的重要性,从而更加专注于图像的重要特征信息的提取与重建,有效抑制非重要特征的干扰,提升网络识别精度。同时,该注意力机制的大部分操作均基于优化能量函数选择,避免了过多的结构调整,加速了注意力权值的计算,从而在确保注意力机制SimAM融合Ef
10、ficientNet模型后能够保持网络轻量化的同时,更好地发挥注意力机制SimAM的有效性和灵活性。图4 SimAM注意力机制特征加强网络包括FPN结构和PAN结构,如图5所示为特征融合结构,通过增强特征层之间上下关联,将位置信息传递给浅层,再将更强的语义特征融合到深层,实现对特征的多尺度融合,进一步加强对图像中目标的检测。该结构可兼顾图像中的大中小目标。图5中,FPN结构是对主干网络最后三个特征层进行融合,先将最后一层特征经过上采样把特征图扩大1倍后,与主干网络的倒数第二个特征层通道叠加,再经过上采样与主干网络倒数第三个特征层通道叠加。PAN结构就是对特征再进行下采样,即在提取特征的14交通
11、世界TRANSPOWORLD过程中与FPN输出的三个特征依次进行融合,最后获得三个特征层。特征加强网络中使用了CSP2模块,结构如图6所示,相较于 CSP1模块,将 Res Unit换成了 CBL,减少了计算量。图6 特征加强网络的CSP2模块为持续关注有用特征,本文用 MBConv 模块代替CSP2模块,并将深度卷积中的k值设为5,通过更大的感受野,学习目标与周围信息的关联性,提升目标的边界框回归。3 实验结果及分析本文参考了欧洲科技期刊 European Journal of Science and Technology(后简称为EJOSAT)的文章内容5,结合自主实验,测试YOLOv5相
12、较于v3和v4的提升。EJOSAT 2022年第38期的文章中,不同版本的YOLO算法被应用于对家禽种类的识别上,实验使用Ubuntu 18.04操作系统,CUDA版本为11.3,在PyCharm框架下,使用918张图片作为数据集,以82的比例分为训练集和测试集,得出的结果如表1所示。在自主实验中,操作系统采用Ubuntu18.04,在PyTorch框架下,CUDA版本为11.3,数据集是通过以往过车时所收集的防松铁丝部件图像,共有6 133张图像,其中训练的正样本有3 283个,负样本7 032个,设置模型超参数,初始学习率为0.01,使用SGD随机梯度下降6,batch_size 为 64
13、,epoch 为 300,分别在 YOLOv3 和 YOLOv4的算法上做了测试,实验对比结果如表2所示。表1 EJOSAT的实验结果模型YOLOv3 tinyYOLOv4 tinyYOLOv5s精确率Precision(%)939699.7召回率Recall(%)837999.853平均精度均值mAP5(%)90.386.299.5表2 自主实验结果模型YOLOv3 tinyYOLOv4 tinyYOLOv5s主干网络Darknet53CSPDarknet53CSPDarknet53精确率Precision(%)78.581.686.2召回率Recall(%)78.380.184平均精度均值
14、mAP50(%)82.185.690.3模型大小/MB17.523.614.5从实验数据可以看出,YOLOv5s在精确率、召回率、平均精度和模型大小的表现方面都超过了YOLOv3tiny和YOLOv4 tiny。虽然EJOSAT的文章指出YOLOv5s在训练时间上慢于V3和V4的tiny模型,但对于列车识别的影响并不大。更高的准确率和召回率说明 YOLOv5s不仅拥有更高的平均精度,在面对不平衡的数据集时,表现也超过了实验中的其他算法。4 结束语本文对动车组防松铁丝故障进行了研究,由于该故障目标较小,通过分析故障特征,同时保证算法的可靠性和效率,最后采用YOLOv5对故障进行识别,并加入了优化
15、策略,增强了图像对比度,识别率显著提升,且相较于旧版本的算法,该模型占用空间更小,更易于部署,具有较高的灵活性。在实际过车中,所发生的故障样本少,会带来数据不平衡的问题,实验显示,YOLOv5的数据平衡性相较于旧模型也有一定的提升,但对于不平衡模型的处理还有待进一步完善。后续可以通过不断丰富样本集等方式,使模型的鲁棒性更加稳定。参考文献:1 罗会兰,陈鸿坤.基于深度学习的目标检测研究综述J.电子学报,2020,48(6):1230-1239.2 郭磊,王邱龙,薛伟,等.基于改进YOLOv5的小目标检测算法J.电子科技大学学报,2022,51(2):251-258.3 郝培旭.基于Efficie
16、ntNet与YOLOv4网络的绝缘子故障检测D.河北:石家庄铁道大学,2022.4 陈正斌,叶东毅,朱彩霞,等.基于改进YOLOv3的目标识别方法J.计算机系统应用,2020,29(1):49-58.5Ouzhan KIVRAK,Mustafa Zahid GRBZ.Perfor-mance Comparison of YOLOv3,YOLOv4 and YOLOv5Algorithms:ACaseStudyforPoultryRecognitionJ.Euro-peanJournalofScienceandTechnology,2022,38(7):3-4.6 Darken C,Chang J,Moody J.Learning rate schedulesfor faster stochastic gradient searchC.Neural Net-works for Signal Processing.IEEE,1992:3-12.图5 特征融合结构15