收藏 分销(赏)

基于深度学习的列车轴承故障诊断研究.pdf

上传人:自信****多点 文档编号:3075539 上传时间:2024-06-15 格式:PDF 页数:3 大小:1.58MB
下载 相关 举报
基于深度学习的列车轴承故障诊断研究.pdf_第1页
第1页 / 共3页
基于深度学习的列车轴承故障诊断研究.pdf_第2页
第2页 / 共3页
基于深度学习的列车轴承故障诊断研究.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、中国新技术新产品2024 NO.1(下)-45-高 新 技 术我国轨道交通行业取得了飞速发展,列车的稳定运行是保障行车安全的重要一环,也是目前国内、外行业内的研究热点,但目前应用于列车轴承故障诊断的模型在识别准确率、识别速度方面还有待提升。如何在列车高速运行下保障行车安全成为轨道交通行业的难题,因此有必要对列车轴承故障诊断进行研究。目前国内许多专家学者已就轴承诊断问题进行了研究。铁科院研发的“JSC-206 机车车辆轴承诊断仪”1仪器可以对检修解体后的轴承进行检测,但系统的抗干扰能力较弱,无法满足列车实际运行中的故障诊断需求2;刁宁昆、马怀祥基于 MPE 和 PSO-SVM 建立了轴承故障诊断

2、模型3;王贵勇、刘韬通过联合 MOMEDA 进行故障特征提取;周志恒、贺德强基于 GA-BP 神经网络并针对轴承状态建立了预防模型。但国内目前研究结果还不能应用到轴承故障预测中,如果能够实时感知轴承状态、跟踪潜在故障并进行针对性维修,将会有效降低列车发生故障的概率。综上所述,本文将针对数据集不均衡、应用场景复杂多变的问题进行研究,以搭建并优化列车轴承故障诊断模型。1 胶囊神经网络卷积神经网路衍变历程漫长且坎坷。作为深度学习的代表算法,其在特征提取方向上具有良好的表象能力。与常规特征提取模型相比,卷积神经网络的池化层可有效降低数据特征维度,泛化能力更突出。但是卷积神经网络需要庞大的数据集训练模型

3、,不能很好地应对模糊性,池化层也会丢失大量信息,使空间分辨率降低。胶囊神经网络的提出解决了卷积神经网络的这一难题。2017 年 10 月,深度学习之父“Hinton”提出了胶囊神经网络。胶囊神经网络摒弃了传统神经网络复杂的特征提取方式,提出胶囊的概念,利用胶囊表示一个事物整体的一个局部特征,并进行高纬度分类。具体核心思路如下:第一,与传统神经网络不同,胶囊神经网络的基本单元是胶囊(Capsule),其中包括多个神经元。胶囊的输入、输出均为向量,向量的长度代表传统神经元中的概率,向量方向则用来表示其他信息(位置、颜色等信息)。第二,胶囊神经网络的动态路由机制替代了传统卷积神经网络的最大池化方法。

4、2 胶囊神经结构胶囊神经网络结构分为编码结构和解码结构。2.1 编码结构以手写体数字识别为例,如图 1 所示。编码结构共包括三层网络,第一层为卷积层(Conv1 层),数据传入胶囊神经网络先进行卷积计算,初步提取特征,手写体数字识别模型中,卷积核的大小为 99,包括 256 个通道,输出为 259 个 2020 的特征。此卷积层的激活函数为 ReLU,卷积层初步提取特征后传递到下一层基础胶囊层中。图 1 编码结构25683220卷积基础胶囊层数字胶囊层61610与卷积神经网络的采样层功能类似,编码结构中卷积层后面为基础胶囊层(Primary Caps)和数字胶囊层(Digit Caps)。基础

5、胶囊层可看作特殊的卷积层。利用多个卷积核来获得数据中多维实体特征,将这些特征整合为矢量(81)并输入数字胶囊层中。数字胶囊层与全连接层相似,接受来自基础胶囊层的输出矢量,其耦合系数决定每个输入特征的接受程度。由于该模型用于识别数字手写体,因此最终输出 10 个胶囊,胶囊维度为 16,每个胶囊的长度代表其数字识别的概率,长度越大,即该数字的可能性越大。模型的最终结果输出为概率最大的数字。动态路由机制仅在基础胶囊层和数字胶囊层之间进行。2.2 解码结构胶囊神经网络的解码结构共包括 3 个全连接层,如图2 所示。先将原始数据输入编码结构中,经过数字胶囊层得到每种结果的预测概率。概率最高的被送入解码结

6、构进行重建,获得重建损失。2.3 训练过程作为胶囊神经网络的激活函数,Squashing 函数将输出基于深度学习的列车轴承故障诊断研究王华勇郭占广田贺(青岛杰瑞工控技术有限公司,山东 青岛 266520)摘 要:作为列车运行的重要部件,轴承的健康状态是决定列车安全运行的重要因素。轴承的故障诊断一直是行业研究热点。本文针对传统模型提取特征不足、特征信息丢失严重、模型准确率低以及分析识别时间长等问题,结合胶囊神经网络的特征结构,提出了基于深度学习的列车轴承故障诊断研究方法。模型以凯斯西储大学的轴承故障数据为数据集。改进后的神经网络模型在识别准确率、识别速度方面均有提升,本文算法具有一定的先进性。关

7、键词:人工智能;胶囊神经网络;轴承故障诊断中图分类号:TP207文献标志码:A中国新技术新产品2024 NO.1(下)-46-高 新 技 术向量长度归一化。如公式(1)所示。221jjjjj=+SSVSS(1)式中:Vj为 j 个胶囊的总输出向量;Sj为 j 个胶囊的总输入向量。传统网络通过加权求和的方式获得网络的输出,胶囊神经网络在传统加权求和的基础上增加了耦合系数 cij,如公式(2)、公式(3)所示。Sj=iCijuj|i(2)uj|i=Wijui(3)式中:ui表示第 l 层的第 i 个胶囊,为储存局部信息;Wij代表第 l 层的第 i 个胶囊和第 l+1 层的第 j 个胶囊的权重矩阵

8、;uj|i代表 l+1 层的第 j 个胶囊在第 l 层的第 i 个胶囊下的整体信息预测结果;Cij为每个底层胶囊与之相对应的高层胶囊之间的权重。通过仿射变换,将 ui储存的局部信息映射为整体信息。Cij由采用的动态路由算法中的 softmax 函数决定,如公式(4)所示。Cbbijijkijexpexp?(4)式中:bij为胶囊 i 与胶囊 j 相互耦合的先验概率,bij只依赖于 2 个胶囊的位置与类型。动态路由算法的具体计算过程如图 3 所示。2.4 胶囊神经网络损失函数胶囊神经网络的损失函数为 SVM 中的 Margin Loss 函数,如公式(5)所示。Lk=Tkmax(0,m+-|vk

9、|)2+(1-Tk)max(0,|vk|-m-)2(5)式中:Tk为分类指示函数(k 类存在即为 1,不存在为 0);vk为网络输出数据;m+为上界,惩罚假阳性,本文选取经验值 m+=0.9;m-为下界,惩罚假阴性,m-=0.1;为比例系数,调整两者比重,默认初始值为 0.5。3 试验与分析3.1 试验环境基于胶囊神经网络的轴承故障诊断模型结构复杂,为保证模型准确率,需要庞大的数据集支撑,因此试验所用服务器 CPU 型号为 i912900KF,显卡采用 RTX3090Ti,内存 32GB,操作系统为 Windows10 64 位。模型由 Python 语言编写,采用 tensorflow 框架

10、搭建。3.2 数据集本试验模型训练采用的数据集为美国凯斯西储大学(Case Western Reserve University,CWRU)的滚动轴承数据集。该数据集是目前轴承故障诊断领域里公认的最权威的用于研究测试的数据集,顶级期刊Mechanical Systems and Signal Processing中有超过 41 篇文章是基于该数据集做的研究。凯斯西储大学轴承数据主要由电动机、功率测试计、电子控制器及扭矩传感器组成。数据集共包括 8 个正常样本,53 个外圈故障样本,23 个内圈故障样本及 11个滚子故障样本。3.3 数据集预处理本试验选取 4 种数据集用于训练模型,每种状态共包

11、括 10 万条数据。具体故障类型及编号见表 1。表 1 本文试验数据说明故障类型采样频率(kHz)数据样本容量(万)正常状态1210轴承内圈故障1210轴承外圈故障1210滚子故障1210为消除试验数据中不同量纲带来的影响,加快网络模型的训练速度,本试验采用 Max(Min-Max Normalization)标准化方式对每种数据个传感器数据进行归一化处理。计算方法如公式(6)所示。min*maxminxx=(6)将处理后的数据集按 4 1 的比例划分为训练集和验证集,即每组数据训练集包括 8 万条数据,验证集包括 2万条数据。3.4 网络结构训练神经网络需哟啊设置好超参数,包括学习率、迭代次

12、数、隐含层数、神经元数量、训练批次以及激活函数等。神经网络的超参数对其训练过程和得到的网络模型适用能力具有重要影响。通常增加神经网络的网络层数能提升训练模型的准确率,拟合效果也会更好。但网络层数过多时,模型也会存在过拟合风险,因此试验选取合适的网络层数,在避免过拟合的同时尽可能提升模型准确率。胶囊神经网络中卷积核大小和步长对模型的特征提取具有十分重要的影响。卷积核决定模型的感受野,卷积核越大,可提取的特征越多,但同时也增加了模型的计算量,不利于模型的深度扩充。而更小的卷积核可以捕捉到更细节的特征,通过多个小卷积核的堆叠来代替大卷积核,可减少模型参数计算并提升效率。但卷积核过小,则会导致数据集图

13、 2 解码结构图 3 胶囊神经网络路由算法运算流程中国新技术新产品2024 NO.1(下)-47-高 新 技 术容量较少时,不能有效提取特征信息。因此选取合适的卷积核及其他超参数对模型的适用质量十分重要,需要不断进行测试。为提取原始数据中更丰富的时域特征信息,增强模型的特征识别能力,本试验在原有的胶囊网络中增加了注意力机制。注意力机制将 3 个本征模函数重构、融合为三通道信号,对原始信号降噪,再输入卷积层中进行特征提取。经过 2 个卷积层、2 个胶囊层后,输出判定结果。与原始的 CapsNet 相比,模型网络结构更深,提高了分类精度。具体网络结构如图 4、表 2 所示。基础胶囊层与数字胶囊层之

14、间为全连接,所有权重由动态路由算法确定。表 2 网络结构及参数层名卷积核尺寸通道步长胶囊尺寸Conv1551281-Conv2332561-Primary Caps333218Digit Caps-4-323.5 试验结果与分析训练效果如图 5 所示。本文构建的模型经过 5h 的训练,迭代次数为 6000 次,模型训练集准确率达 95.37%,验证集准确率高达 93.58%。由此可见,该模型对列车轴承故障的诊断能力较高且泛化能力良好。本文模型与其他轴承故障诊断算法的识别准确率比较见表 3。可以看出,同在 CWRU 数据样本下,本文构建的轴承故障诊断模型识别率明显高于其他算法。4 结语本文通过试

15、验验证了基于胶囊神经网络的轴承故障诊断模型比其他方法更适合列车轴承故障诊断,该模型结构简易,识别速度快。胶囊网络模型特有的空间结构更大限度地挖掘出了振动信号特征,提升了模型的识别准确度。目前,深度学习仍处于起步阶段,今后还需要在和已经成熟的模型相结合方面继续探索,进一步改进其应用场景。表 3 本文算法与其他算法比较模型识别率EMD-AR80.00%DE-CNN493.10%本文模型93.58%参考文献1 吴春复JSC206机车轴承诊断仪的应用与体会 J铁道机车车辆,1998(3):53-572 张生玉,冯庚斌JL601机车走行部检测系统 J铁道机车车辆,2000(5):18-203 刁宁昆,马怀祥,王金师,等.基于 MPE 与 PSO-SVM的滚动轴承故障诊断 J.电子测量技术,2021,44(21):44-48.4 孙祺淳,李媛媛.DE 算法优化 CNN 的滚动轴承故障诊断研究 J.噪声与振动控制,2022,42(4):165-171,176.通信作者:郭占广(1996-),硕士,主要研究方向为人工智能、故障诊断等。电子信箱:。图 4 网络结构图 5 训练效果0.960.950.940.930.920.91迭代次数(次)0100040005000600020003000训练验证图 4 网络结构准确率

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服