基于多通道输入和1DCNN-LSTM的道岔转辙机故障诊断.pdf

资源描述

1、第45卷第11期2023年11月铁道学报JOURNALOFTHE CHINA RAILWAY SOCIETYVol.45No.11November2023文章编号：10 0 1-8 36 0(2 0 2 3)11-0 0 9 8-0 9基于多通道输人和1DCNN-LSTM的道岔转辙机故障诊断付雅婷1.2 3，温世明1-2.3，杨辉1-2.3，伍迎节4（1.华东交通大学电气与自动化工程学院，江西南昌330 0 13；2.华东交通大学江西省先进控制与优化重点实验室，江西南昌330 0 13；3.华东交通大学轨道交通基础设施性能监测与保障国家重点实验室，江西南昌330 0 13；4.中国铁路上海局集

2、团有限公司南京电务段，江苏南京2 10 0 11）摘要：针对三相交流道岔转辙机故障诊断问题，提出一种基于多通道输人和一维卷积神经网络（1DCNN）-长短期记忆神经网络（LSTM）的故障诊断方法。首先使用经验模态分解算法对动作功率信号进行分解，获得若干个尺度特征不同的固有模态函数信号；其次建立基于1DCNN和LSTM的组合故障诊断模型，使用1DCNN提取功率信号中的局部特征，使用LSTM选择性提取局部特征中的长距离特征；然后通过所建模型诊断出道岔转辙机的故障类型，并结合t-分布随机近邻嵌入展示诊断效果；最后与经典的诊断方法进行对比分析。对比实验结果表明：本方法在道岔转辙机故障诊断中具有较高的准确

3、性和稳定性，且具有较好的泛化性。关键词：道岔转辙机故障诊断；多通道输入；卷积神经网络；长短期记忆网络；t-分布随机近邻嵌入中图分类号：U284.92Fault Diagnosis of Switch Machine Based on Multi-channelFU Yating-2-3,WEN Shiming-23,YANG Huil-23,WU Yingjiea(1.School of Electrical and Automation Engineering,East China Jiaotong University,Nanchang 330013,China;2.Key Laborat

4、ory of Advanced Control and Optimization of Jiangxi Province,East China Jiaotong University,Nanchang 330013,China;3.State Key Laboratory of Performance Monitoring and Protecting of Rail Transit Infrastructure,East China Jiaotong University,Nanchang 330013,China;4.Nanjing Signal&Telecommunication Dep

5、ot,China Railway Shanghai Group Co.,Ltd.,Nanjing 210011,China)Abstract:Aiming at the problem of fault diagnosis of three-phase AC switch machines,a fault diagnosis method based onmulti-channel input and one-dimensional convolutional neural network(1DCNN)-long-short term memory(LSTM)net-work was prop

6、osed.Firstly,the action power signal was decomposed by empirical mode decomposition algorithm toobtain several intrinsic mode function signals with different scale characteristics.Secondly,a combined fault diagnosismodel was built based on the 1DCNN and the LSTM,which used 1DCNN to extract local fea

7、tures in the power signal,and LSTM to selectively extract long-distance features in local features.Finally,the fault type of the switch machine wasdiagnosed by the model,and the diagnosis effect was demonstrated by t-distributed stochastic neighbor embedding.Sim-ultaneously,the model was compared wi

8、th the classical diagnosis method.The results of the experiment show that thismethod has relatively high accuracy,stability as well as good generalization in fault diagnosis of switch machines.Key words:fault diagnosis of switch machine;multi-channel input;convolutional neural network;long-short ter

9、mmemory network;t-distributed stochastic neighbor embedding道岔转辙机作为铁路基础设施被应用于引导列车收稿日期：2 0 2 2-12-12；修回日期：2 0 2 3-0 1-2 8基金项目：国家自然科学基金（U203421152162048，6 2 0 0 3138）：江西省技术创新引导类计划（2 0 2 0 3AEI009）；辽宁省科学技术计划（2 0 2 2-KF-21-03）作者简介：付雅婷（19 8 8 一），女，江西南昌人，副教授，博士。E-mail:文献标志码：Adoi;10.3969/j.issn.1001-8360.20

10、23.11.012Input and 1DCNN-LSTM到达预定的路线，从而确保每列列车的平稳运行!然而，运输繁忙、客货运输密度大等工作环境常使道岔转辙机的动作杆、表示杆、齿轮等关键部件发生故障，影响列车的安全可靠运行。现有故障识别方式主要是利用集中监测系统实时监测转辙机动作时的工作电流和第11期工作功率，通过与正常动作时的参考数据进行对比来处理道岔隐患2。这种方式具有一定的人为主观因素,在复杂多变的工作环境下很难实现对转辙机故障的快速定位和及时维修。因此,研究道岔转辙机智能故障诊断对保障高速列车的安全可靠运行和降低维修成本具有重要意义，是适应新形势下铁路运维智能化发展的方向。近年来，国内外

11、专家学者在道岔转辙机智能故障诊断方面已经开展了一些研究,并取得了一定的成果。文献3提出模糊神经网络的道岔故障诊断，通过某种特征提取方法提取特征，采用前馈神经网络完成故障类型的诊断，但是该方法的特征提取方式过于复杂且需要人工整理得到特征向量集，在实际应用中很难对转辙机故障快速定位。文献4提出一种自生成故障样本的智能故障诊断方法，通过LeNet卷积神经网络有效检测道岔故障，但是该方法以图像的形式输入，消耗大量计算机资源，对设备硬件要求较高。文献5提出一种半监督学习算法的道岔故障诊断方法，采用支持向量机对道岔进行故障分类，但该方法需要提取分段特征的预处理，相对来说比较繁琐。文献6 提出一种基于深度学

12、习的道岔故障诊断方法，采用卷积神经网络-门控循环单元组合模型对道岔进行故障诊断，具有较好的诊断率，但该方法的数据为单通道输人，相比多通道输人不能全面挖掘信号的信息。上述文献主要是对信号在时域特征上和单通道输人上进行分析。虽然时域特征7 能从不同角度反映道岔转辙机的故障状态，但是转辙机的动作功率存在突变性，具有非线性非平稳的特点。单通道输人是直接分析原始的功率信号，相对来说不能充分挖掘功率信号中的隐藏信息。考虑到经验模态分解（EmpiricalModeDecomposition，EM D）算法适用于非线性、非平稳的动作功率信号分析处理 1，能表达出不同频率的信息特征；一维卷积神经网络（One-

13、dimensional Convo-lutional NeuralNetwork，1D C NN）在功率信号的卷积和池化操作过程中具有强大的特征学习能力，表现出更高的诊断精度10；长短期记忆神经网络（Long-ShortTermMemory，LST M）可以对功率数据信息进行选择性保留，深层挖掘内部信息。因此，本文提出一种基于多通道输人（Multi-channel Input，M C）和1DCNN-LSTM的道岔转辙机故障诊断方法（以下简称“MC-1DCNN-LSTM），主要对道岔转辙机动作时的工作功率进行诊断并完成故障分类，实现对转辙机故障的快速定位。首先利用EMD算法对功率信号进行不同频率

14、分解，通过方差贡献率筛选出最有效的3个固有模态函数（Intrinsic ModeFunction，I M F）信号作为多通付雅婷等：基于多通道输人和1DCNN-LSTM的道岔转辙机故障诊断F=9 950R.nm式中：n、n、R。分别为转辙机电机的转速、转换效率、等效力臂，其值均为常数，故工作拉力F与输出功率P呈线性关系。在道岔转换过程中，F的变化能反应出转辙机的运行状态，从而可以根据P的曲线变化来判断转辙机的工作状态，因此本文通过动作时的工作功率数据来对S700K转辙机的工作状态进行故障诊断。1.2正常动作功率状态S700K转辙机正常动作功率曲线见图1。1.5启动解锁转换锁闭缓放1.0MV本0

15、.500图1SS700K转辙机正常动作功率曲线由图1可知，S700K转辙机正常动作功率曲线共分为5个阶段：启动阶段、解锁阶段、转换阶段、锁闭阶段、缓放阶段。其中，启动阶段，机械解锁需要把锁闭块顶出，故功率曲线快速上升并达到峰值，机械解锁后功率值下降至稳定值；解锁阶段，动作杆移动6 0 mm时，外锁闭装置解锁完成；转换阶段，电机开始推动尖轨动作，尖轨与基本轨实现密贴后结束；锁闭阶段，尖轨与基本轨实现密贴，此时表示杆的缺口中已经插人了锁闭杆；缓放阶段，启动电流只剩下A、C两相电流，此时会出现“小台阶”。当曲线的功率值保持为0 kW时，道岔的整个转换过程就已全部完成。1.3故障动作功率状态通过相关调

16、查研究，本文选取S700K道岔转辙机99道输人；然后将多通道信号输人到1DCNN中进行局部特征提取，利用LSTM从已提取的局部特征中选择性提取长距离特征；最后利用所建模型诊断出故障的类型，通过对比损失值、准确率、混淆矩阵诊断效果和t-分布随机近邻嵌人（t-distributed Stochastic NeighborEmbedding，t-SNE）诊断效果,来评估模型的有效性。1道岔转辙机动作过程分析1.1输出功率与工作拉力的关系本文选取S700K道岔转辙机为研究对象。S700K道岔转辙机采用三相交流电动机，在道岔转换过程中输出功率P与工作拉力F之间的关系【12 为(1）12P345时间/s6

17、71005种常见的故障类型进行诊断，其相应的动作功率曲线见图2。2.5启动解锁转换锁闭缓放2.01.00.502.5启动、解锁2.01.00.501.5启动_解锁M/率1.00.50(c)转辙机内部和道岔连接部分发生故障1.5启动解锁转换1.00.50001.5启动解锁转换锁闭缓放1.00.5图2S700K转辙机常见故障动作功率曲线铁道学报2MC-1DCNN-LSTM模型为更好地挖掘功率数据中隐藏的故障信息和提高道岔故障诊断精度，本文提出的MC-1DCNN-LSTM模型具有以下特点：通过EMD算法分解动作功率信号，得到若干个IMF,其中仅有少数IMF与故障信息相关程度较高，将相关程度较高的IM

18、F信号作为多通道输人，可以更有效地关注重点故障信息；1DCNN具12345时间/s(a)电路二极管损坏转换12(b)动作杆被外来物卡死转换123456时间/s锁闭12(d)转辙机齿轮与齿轮块之间卡死2345时间/s(e)断相保护器发生故障第45卷67345时间/s34时间/s有局部连接和权值共享等特点，能自动提取输人的IMF信号数据特征，实现更高效的局部特征提取；将1DCNN提取到的局部特征输人到LSTM网络中,利用LSTM捕捉局部特征中的长距离特征,可以更进一步挖掘功率数据中的关联特征和提高故障诊断精度。2.1经验模态分解EMD作为一种自适应时频分析方法，有效地解决了基函数缺乏自适应的问题，

19、根据输人信号的局部特征信息可以自适应分解为若干个尺度特征不同的IMF677566信号，因此EMD算法非常适用于非线性、非平稳信号的分解，具有很明显的优势13-41本文通过EMD算法对动作功率数据进行自适应分解。假设待分解功率信号为P（t），先确定P（t）所有的局部极值点，再用三次样条插值法对所有极值点进行拟合得到上包络线g（t）和下包络线k(t），进而得到上下包络线的平均值m（t）为m(t)=6()+(c)2用P(t）减去m(t）得到第一个分量h(t)。h.（t）成为IMF需要满足2 个条件：极值点数和零点数必须相等或相差最多不能超过1个；上、下包络线相对时间轴局部对称。若不符合,则把h（t）

20、作为待分解信号重复以上步骤直至满足IMF条件。此时第一个IMF信号记为c,（t），残余分量ri（t）为ri(t)=P(t)-c(t)将（t）作为待分解信号重复以上步骤，直至r，（t）成为单调函数,即EMD分解结束。则功率信号P(t)可表达为P(t):2.2一维卷积神经网络1DCNN适用于分析具有固定长度周期的一维信号，能从其中自动学习特征，并具有局部连接和权值共享等特点，极大程度上降低了故障诊断模型的复杂程度，从而可以节省计算机资源，实现更高效的故障诊断。1DCNN151网络通常由输人层、卷积层、池化层、全连接层和输出层构成，其结构见图3。（2）（3）Ec,(t)+r,(t)(4）第11期HF

21、f=sigmoid(wrhi-1,x,+br)动作功率信号Fj=sigmoid(w,ht-1,x,+b,)G,=tanh(o,ht-1,x,+b,)c,=Ff*Cc-I+Fi*G,样本输入卷积层池化层卷积层池化层全连接层输出层F=sigmoid(o。h r-1,x,+b.)图3一维卷积神经网络结构h,=F*tanhc,式中：i,。为对应的权重矩阵；brb,b,b。考虑到信号微机监测系统监测的动作功率信号为为对应的偏置向量；,、h,为t时刻的输人；ht-1为t-1一维信号，故本文将功率信号分解得到的IMF信号作时刻的输出；C,vCt-1为对应时刻的内部状态值；F、F、为1DCNN16网络的输人,

22、对其进行特征提取。F为对应门状态的输出；G,为t时刻状态记忆的候卷积层是对功率数据特征提取的关键，具体运算为选值。X=f(ZX-1*0+b)(5)式中：x,为第h层第i个输出；xi-为第h1层第j个输出；为第h层对应的卷积核；b为第h层偏置；*为卷积符号；为激活函数。池化层是在对数据降维的同时保留最大信息量，本文选择最大池化的方式，具体运算为M(i）=(j-1)U+1kjU式中：M(i）为经过d（h）最大池化后传给第h层对应神经元的值；q-（k）为第h1层第i个特征矢量中第k个神经元的激活值；U为池化范围的宽度。2.3长短期记忆网络LSTM是循环神经网络的一个变种,有效解决了循环神经网络遇到的

23、梯度消失和梯度爆炸的问题，非常适用于处理与时间序列相关的问题，使故障诊断模型更具优势。LSTM17将1DCNN所提取的局部特征向量作为输人，学习其内部的特征变化规律并提取出长距离特征向量，从而挖掘功率信号内部的关联特征，进一步提高模型的诊断精度。LSTM的传输状态通过3个门结构来控制,分别是遗忘门、输入门和输出门。LSTM网络结构见图4,各变量具体表达为18-9 1编号0123453.2多通道输入构建多通道输人将具有代表性的挑选样本输人到特征图的多个通道内，多个通道融合后的特征图能够充分挖掘数据的有效信息2 0。通过2.1节中的EMD算法付雅婷等：基于多通道输人和1DCNN-LSTM的道岔转辙

24、机故障诊断G遗忘门。输入门tanhmax(6)表1S700K转辙机6 种状态样本状况状态样本长度正常运行1350表示电路二极管损坏1350动作杆被外来物卡死1350转辙机内部和道岔连接部分发生故障1350转辙机齿轮和齿轮块之间卡死1x350断相保护器发生故障1350对动作功率数据进行自适应分解，可以得到对应的IMF信号，本文仅给出动作杆被外来物卡死的功率信号分解，见图5。由图5可知，共有5层IMF信号，考虑到不同层对101(7)(8)(9）(10)(11)(12)htanhFfFX图4LSTM网络结构3实验结果与分析3.1数据采集实验平台为某电务器材公司提供的S700K转辙机故障模拟平台，共设

25、置5种常见转辙机故障，分别采集转辙机正常运行，以及表示电路二极管损坏、动作杆被外来物卡死、转辙机内部和道岔连接部分发生故障、转辙机齿轮与齿轮块之间卡死、断相保护器发生故障，共6 种状态下的动作功率数据，转辙机转换时间为7s,采样间隔为0.0 2 s，每个样本长度为350,每个状态下的样本量为150 0 组，6 种状态下的样本总量为9000组，各种状态样本状况见表1。训练集/组验证集/组900300900300900300900300900300900300输出门。测试集/组300300300300300300102M/率0.0250-0.0250MV率虹0.50-0.500.10-0.100.

26、50mMV率中0.250-0.250M/率?00.50图5EMD分解的时域信号所分解的功率信号影响不同，本文通过方差贡献率筛选出最有效的IMF21。方差贡献率由各IMF信号方差与功率信号方差的比值构成，比值越高表示该IMF与功率信号相关程度越高。各层IMF信号的方差贡献率见表2。表2 各层IMF信号的方差贡献率信号方差贡献率IMF10.009 2IMF211.123 0IMF30.291 7由表2 可知,IMF2、I M F4、I M F5与功率信号相关6431铁道学报0.050程度较高，所包含的故障信息最重要，故将其作为多通道输人，即本文所构建的为三通道输人，可以充5010050100501

27、00(c)IMF350100(d)IMF450100(e)IMF5信号IMF4IMF533264x1第45卷150200样本长度(a)IMF1150200250300350样本长度(b)IMF2150200样本长度150200样本长度150200样本长度250300350250300350250300250300350%方差贡献率5.175 850.290.6分让1DCNN网络提取重要故障特征，提高诊断精度。多通道输人之间的卷积操作见图6。图6 中，展示了所构建的三通道输入特征融合过程，筛选的3个IMF信号先在各自的通道内完成一维卷积操作，再通过卷积后的输出进行求和操作，此刻卷积层开始对融合后

28、的特征进行特征提取。通道1通道2350输入特征图6 多通道输人之间的卷积操作3.3MC-1DCNN-LSTM模型建立本文提出的基于MC-1DCNN-LSTM的道岔转辙机故障诊断模型见图7。图7 中，诊断模型由3个卷积层、3个池化层、2 个LSTM层、1个展平层和3个全连接层组成，主要结构参数见表3。表3中，CS、C、N、S、P分别为卷积层卷积核的形状、通道数、数量、步幅、零填充的数量；Size、St r i d e 分别为池化层卷积核的形状、步幅;Input_size、h i d d e n _s i z e、n u m_l a y e r 分别为LSTM输人层的特征维度、隐藏层的输出特征维度

29、、隐藏层的数量；n为全连接层神经元数量。1283x1通道3卷积核动动作功率信号多通道输入1卷积层池化层卷积层池化层卷积层池化层iinputiP11-C2P2C3P3图7 基于MC-IDCNN-LSTM的道岔故障诊断模型本文采用Pytorch的深度学习框架搭建MC-1DCNN-LSTM故障诊断模型：输人层为筛选出的IMF信号；卷积层的数量逐层叠加，通过观察卷积层输出特征图的效果和模型最终诊断效果来确定层数；为更好LSTM展平层金连接层输出层IL4FlattenSFCo-FCFCS提取故障特征，逐层翻倍增加卷积层卷积核的数量来增加网络宽度；LSTM层采用2 层的网络结构，均含100个隐藏层，能够充

30、分学习故障数据中的长距离特征;Flatten5展平层用于将多维输出展平成一维；输出第11期结构InputC1P1C2P2C3P3L4Flatten5FC6FC7FC8层采用全连接方式将模型的输出向量转换为诊断类别标签的维度。模型训练采用Adam优化器更新参数，学习率设为0.0 0 1,该值通过观察模型学习速度和收敛速度得到最优解；为防止过拟合和梯度爆炸，权值衰减weight_decay由经验值设为0.0 0 0 5；采用交叉损失函数来衡量模型的诊断性能，批训练样本数量batch_size根据模型训练速度和精度设为32 个样本，模型训练轮次Epoch设为10 0 轮。3.4结果对比与分析3.4.

31、1不同诊断模型对比实验将本文建立的模型与5种经典的诊断方法进行对比分析，具体为：LeNet41,包含2 个卷积层，2 个池化层和2 个全连接层；DenseNet2，前面所有层都作为下一层的额外输入，即实现特征重用；VG G 19 2 3，下一层通过上一层的输出特征来提取更加复杂的特征；ResNet5024，包含49 个卷积层和1个全连接层，其解决了深度过大训练困难的问题；LST M-A t t e n t i o n 2 5】，长短期记忆神经网络和自注意力机制组合，更加关注重要信息。6 种模型分别在5400组训练集上进行训练，故障诊断准确率、损失值见图8。准确率为不同模型诊断正确的样本数量占训

32、练集样本数量的比例；损失值为通过交叉摘损失函数计算的各模型中真实类别概率分布与诊断类别概率分布之间的差距。由图8(a)可见,6 种模型随着迭代次数的增加均有着较高的故障诊断准确率，而本文模型相较于另外5种模型收敛效果和收敛速度都是最佳的，具有更强的特征学习能力和适应性。由图8(b)可见,本文所建的诊断模型相较于其他诊断模型有着更平稳的损失值变化，具有较好的鲁棒性。为调整各模型的相关参数，本文在训练集训练的付雅婷等：基于多通道输人和1DCNN-LSTM的道岔转辙机故障诊断表3模型主要结构参数参数一CS=64x1;C=3;N=32;S=2;P=1Size=2xl;Stride=2CS=31;C=3

33、2;N=64;S=2;P=1Size=2xl;Stride=2CS=3x1;C=64;N=128;S=2;P=1Size=2x1;Stride=2Input_size=128;num_layer=2;hidden_size=100一n=400n=10n=6103100r90输出大小803350170321451327216436164 18x11288x11284141004001066MC-1DCNN-LSTMDenseNet一LeNet50一VGG1940LSTM-AttentionResNet5030201005101520253035选代次数1.4(a)准确率1.2F1.0F0.80.

34、40.20图8 不同模型故障诊断准确率和损失值同时加人验证集进行验证，并以最小损失值为标准挑选最优的模型和参数。为衡量各自最优诊断模型的性能和诊断能力，分别在18 0 0 组测试集上进行测试。通过混淆矩阵对各类诊断结果进行可视化展示，可以更直观地展示各模型测试诊断效果，混淆矩阵可视化诊断结果见图9。图9 中,每一列为测试诊断类别,每一行为实际类别,对角线方块为各类诊断正确样本数量,其余为错误样本诊断数量。各种方法测试准确率比较结果见表4。表4中，平均准确率值为各类混淆矩阵内总的正确样本数量占测试集样本数量的比例。由图9 可见，相较于其他5种模型，本文所提出的MC-1DCNN-LSTM方法在诊断

35、精度上更高，错误分类的数目最少。由表4的对比数据可知：本文方法准确率为9 9.2 8%，测试时间为0.2 8 s，相较于DenseNet、LeNet、V G G 19、Re s Ne t50,准确率分别增加了0.6 1%2.45%、1.17%0.0 6%，主要原因是本文方法加人了多通道输人和LSTM网络，多通道输人把主要故障信息作为输人，LSTM使各类的时间序列特征联系更加紧密;ResNet50诊断准确率与本文模型接近，但测试时间相对较长，主要原因是ResNet50网络卷积层层数较多,提取特征过程耗时大;LeNet的测试时间最短，但准确率相对不高，主要原因是模型结构较简单，提取特征能力稍弱；本

36、文方法相较于LSTM-Attention准确率提升0.11%,LSTM-Attention也具有较高的准确率，但测试时间消耗较大，主要原因是LSTM后连接注意MC-1DCNN-LSTMDenseNet一+-LeNetVGG19LSTM-Attention-ResNet50510152025303540选代次数(b)损失值104力机制网络，捕捉长序列中的依赖关系消耗时间较多。综合比较,本文建立的模型具有较高的诊断准确率和16.67%0%0%0%0%0%030000%16.67%0%0%0%0%103000%0%16.67%0%0%0%003000000%0%0%16.67%0%0%0030000

37、%0%0%0%16.28%0.39%400002930%0%0%0%0.33%16.33%500。012345诊断类别(a)MC-1DCNN-LSTM016.67%0%0%0%0%0%300000%16.67%0%0%0%0%1030000000%0%15.94%0.72%0%0%5200287130%0%0.50%16.17%0%0%09291000%0%0%0%16.44%0.22%400%0%0%0%0.44%16.22%50000012345诊断类别(d)VGG19表4各方法测试准确率比较诊断方法平均准确率/%标准差/%测试时间/sMC-1DCNN-LSTM99.28DenseNet9

38、8.67LeNet96.83VGG1998.11ResNet5099.22LSTM-Attention99.173.4.2消融实验为进一步从内部结构的变化来验证本文所提算法的有效性和可行性，在保持其他实验设置不变的情况下，将单通道输入、多通道输人、1DCNN、LST M 进行组合搭配，通过不同网络的组合搭配来进行消融实验，消融实验产生的准确率比较结果见表5。表5中，SC为单通道输人。表5消融实验产生的准确率比较诊断方法SC-IDCNNSC-1DCNN-LSTMMC-1DCNNMC-1DCNN-LSTM由表5的对比数据可以发现：当1DCNN中的输人方式由单通道输入变为多通道输人时，准确率提高铁道

39、学报较好的鲁棒性，且对计算机硬件要求不高，验证了本文方法的有效性和泛化性。16.67%0%0%0%0%0%0。00007629400002968292第45卷样本量300016.67%0%0%0%0%0%0300000%16.33%0.33%0%0%0%29460%0.11%16.56%0%0%0%0229800%0%0%16.06%0.61%0%000289110%0%0%0.28%16.39%0%450000%0%0%0%0%16.67%50012345诊断类别(b)DenseNet16.44%0%0%0%0%0.22%02960%16.67%0%0%0%0%1030000000%0%16

40、.67%0%0%0%52003000000%0%0%16.67%0%0%0003000%0%0%0%16.67%4400003000.56%0%0%0%0%16.11%510012345诊断类别(e)ResNet50图9混淆矩阵可视化诊断结果0.65%，说明多通道输人把主要故障信息作为输入能进一步挖掘功率数据中的信息；在以上网络中分别0.150.280.353.510.520.230.322.350.293.210.258.32%平均准确率98.2199.1098.8699.28000。00029500030000004000%00000290加人LSTM网络，模型的准确率分别增加了0.8 9

41、%和0.42%，即LTSM网络把动作功率数据中的长距离特征信息联系得更加密切,进一步提高了模型的准确率。3.4.3t-SNE可视化分析t-分布随机近邻嵌人（t-SNE）2 6 是一种将高维数据转换为低维数据的方法，其基本思路是在二维或三维空间形成一个t分布，使其在高维空间构造概率分布一致。为观察MC-1DCNN-LSTM模型对 S700K转辙机故障诊断效果,直观地展现模型各层中的特征学习能力，将18 0 0 组测试样本作为模型的输人，利用t-SNE将模型中各层所学习的高维特征降到二维空间进行可视化，t-SNE特征可视化结果见图10。由图10（a）图10（c）可见，经过3个卷积-池化操作后,6

42、种状态具有一定的可分性；由图10（d）可见,经过LSTM层后各状态之间聚在一起,有更加明显的可分性；由图10（e）可见，经过全连接层FC8后，类与类之间距离较大，6 种状态之间是完全可分的。从图10 可以得出，本文所建立的模型具有较强的特征学习能力，随着网络层数的增加能够逐渐区分6种状态，具有较强的故障诊断能力，验证了本文方法的有效性和优越性。3000%15.94%0%0%0.72%0%1028700130%0%15.89%0.78%0%0%0286140%0%1.11%15.56%0%0%020280000%0.56%0%0%16.119%0%40100%0%0%0%0%16.67%5000

43、0030001234 5诊断类别(c)LeNet16.67%0%0%0%0%0%0300000000%16.67%0%0%0%0%130000。00%0%16.06%0.61%0%0%00289110%0%0.22%16.44%0%0%004296000%0%0.22%0%16.67%0%400403000%0%0%0%0%16.67%50012345诊断类别(f)LSTM-Attention00000000290000003002502001501000500样本量30025020015010050L0第11期80r60F40200F-20-40-60F(a)第1个卷积-池化输出604020

44、0-20-40-60560-40-20204060维度1(c)第3个卷积-池化输出8060400-20F-40-60-50-250255075维度1(e)全连接层FC8层输出图10 t-SNE特征可视化结果4结论本文根据S700K交流道岔转辙机的动作功率曲线为一维信号的特点，提出基于MC-1DCNN-LSTM的特征学习方法，很好地解决了S700K转辙机故障诊断问题。通过实验验证得出以下结论：1)EMD算法将动作功率曲线自适应地分解为若干个频率不同的IMF信号，通过MC-1DCNN网络可以有效地将IMF信号融合在一起,并可以有效地挖掘动作功率信号的关键故障信息。2）引人1DCNN-LSTM组合诊

45、断模型，先用1DCNN网络提取转辙机功率数据中的局部特征,再用LSTM网络选择性保留信息来提取局部特征中的长距离特征，从而更深层挖掘功率信号内部的关联特征。3)与传统的卷积神经网络模型相比较,本文所构建的模型对计算机的性能要求较低，且诊断时间短，显示出更好的故障特征学习能力和诊断能力，也验证了本文方法的有效性和优越性。付雅婷等：基于多通道输人和1DCNN-LSTM的道岔转辙机故障诊断80r60F4020020-40-60-500维度1105参考文献：1 GROSSONI I,HUGHES P,BEZIN Y,et al.ObservedFailures at Railway Turnouts:

46、Failure Analysis,PossibleCauses and Links to Current and Future Research J.Engi-neering Failure Analysis,2021,119:104987.2欧阳征，张俊兴：铁路信号集中监测典型案例分析M.5075-5080(b)第2 个卷积-池化输出60400-20-40-60-50-250255075维度1(d)LSTM层输出0维度15075北京：中国铁道出版社有限公司，2 0 2 0：18 1-18 2.OUYANG Zheng,ZHANG Junxing.Typical Case Analysis o

47、fCentralized Monitoring of Railway Signal M.Beijing:ChinaRailway Publishing House,2020:181-182.3田健.基于模糊神经网络的高速铁路道岔故障诊断方法研究D.北京：北京交通大学，2 0 15：11-56.TIAN Jian.Research on Fault Diagnosis Method of High-speedRailway Turnout Based on Fuzzy Neural Network D.Beijing:Beijing Jiaotong University,2015:11-56.

48、4 HUANG S Z,YANG L Y,ZHANG F,et al.Turnout Fault Di-agnosis Based on CNNs with Self-generated Samples J.Journal of Transportation Engineering Part A-Systems,2020,146(9):04020105.5 SHI Z S,DU Y M,DU T,et al.The Turnout Abnormality Di-agnosis Based on Semi-supervised Learning MethodJ.Inter-national Jo

49、urnal of Software Engineering and Knowledge Engi-neering,2020,30(7):961-976.6何宗博.基于深度学习的铁路道岔转辙机故障诊断D太原：中北大学，2 0 2 1：12-6 0.HE Zongbo.Fault Diagnosis of Railway Switch Machine Basedon Deep Learning D.Taiyuan:North University of China,2021:12-60.7 AIYT,GUAN J Y,FEI C W,et al.Fusion InformationEntropy

50、Method of Rolling Bearing Fault Diagnosis Based on n-Dimensional Characteristic Parameter Distance J.MechanicalSystems and Signal Processing,2017,88:123-136.8 MA H G,JIANG Q B,LIU Z Q,et al.A Novel Blind SourceSeparation Method for Single-channel Signal J.Signal Pro-cessing,2010,90(12):3232-3241.9 张

展开阅读全文