1、第39 卷 第1 3期802023年农业工程学报7月Transactions of the Chinese Society of Agricultural EngineeringVol.39No.13July 2023多特征融合的滚动轴承故障诊断赵小强1,2.3,郭海科1(1 兰州理工大学电气工程与信息工程学院,兰州7 30 0 50;2 甘肃省工业过程先进控制重点实验室,兰州7 30 0 50;3.兰州理工大学国家级电气与控制工程实验室教学中心,兰州7 30 0 50)摘要:针对滚动轴承变工况条件下卷积神经网络在特征提取过程中无法充分提取全局特征信息的问题,该研究提出一种MSCNN-Swin
2、T滚动轴承故障诊断方法。首先,在数据处理模块中利用连续小波变换(continuouswavelet transform,CWT)将一维振动信号转化为二维时频图像,以保留原始信号的时频特性;然后,在局部感知模块中利用多尺度卷积神经网络(multiscaleconvolutional neural networks,M SCNN)对故障信息的局部特征进行提取,并使用卷积块注意模块(convolutional block attention module,CBAM)提取关键信息;进一步构建特征提取模块,引入残差连接提高前后特征信息的利用效率,通过SwinT网络(swin transformer)学习
3、故障信息的全局特征;最后使用全局平均池化代替全连接层进行故障识别。使用美国凯斯西储大学轴承数据集与自制数据集进行试验验证,试验结果表明,本文方法在可视化试验中的故障识别准确率为99.6 7%,在变工况试验中的故障识别准确率为95.0 1%99.6 6%,不同编码方式试验中的故障识别准确率为1 0 0%。在自制数据集中,故障诊断准确率达到99.1 8%。与CWT-LeNet5、C W T-V G G 1 6、C W T-R e s Ne t 1 8 和CWT-SwinT相比,本文方法在变工况条件下的平均故障识别准确率分别提高8.7 9、8.6 4、3.49 和3.1 8 个百分点,在自制数据集中
4、分别提高5.2 3、2.7 4、1.40 和1.2 6 个百分点。本文方法实现了变工况等复杂条件下滚动轴承不同故障状态的识别,能够充分提取轴承故障的全局特征信息,具有较高的故障诊断准确率和良好的泛化能力,可为变工况条件下的滚动轴承故障诊断提供参考。关键词:故障诊断;小波变换;特征融合;滚动轴承;残差连接;变工况doi:10.11975/j.issn.1002-6819.202302116中图分类号:S237;T H 1 33.3赵小强,郭海科.多特征融合的滚动轴承故障诊断J.农业工程学报,2 0 2 3,39(1 3):8 0-8 8.doi:10.11975/j.issn.1002-6819
5、.202302116 http:/www.tcsae.orgZHAO Xiaoqiang,GUO Haike.Fault diagnosis of rolling bearings using multi-feature fusionJJ.Transactions of the ChineseSociety of Agricultural Engineering(Transactions of the CSAE),2023,39(13):80-88.(in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.202302116
6、http:/www.tcsae.org0引 言随着制造业信息化的要求与无人制造等多方要素推动下,现有旋转机械设备的发展方向朝着信息化、智能化的方向前进,而滚动轴承作为机械设备中最常见的零部件,使用条件十分苛刻,这也导致其很容易发生故障1-2 。据不完全统计,旋转机械的故障约有45%55%是由滚动轴承引起的,滚动轴承的故障可能会使机械设备工作异常,甚至造成严重的经济损失与人员伤亡3-5。因此,为了确保旋转设备的正常运行,对滚动轴承进行迅速高效的故障诊断是十分重要的。近年来,随着深度学习的蓬勃发展,包括卷积神经网络(convolutional neural networks,CNN)6-8 在内的
7、诸多网络模型被应用到故障诊断领域,并取得了良好的诊断效果。例如,李恒等9 通过短时傅里叶变换,将原始振动信号转化为时频谱图作为CNN网络的输入,取得了良收稿日期:2 0 2 3-0 2-2 1 修订日期:2 0 2 3-0 3-1 3基金项目:国家自然科学基金项目(6 2 2 6 30 2 1);甘肃省教育厅产业支撑项目(2 0 2 1 CYZC-02);甘肃省科技专项项目(2 1 YF5GA072)作者简介:赵小强,博士,教授,博士生导师,研究方向为图像处理、故障诊断。Email:文献标志码:A文章编号:1 0 0 2-6 8 1 9(2 0 2 3)-1 3-0 0 8 0-0 9好的诊断
8、效果。景艺等1 0 提出了一种多尺度一维深度卷积神经网络的诊断方法,构建了多个含有不同尺寸卷积核通道的特征提取层,最后进行故障识别。董绍江等采用奇异值分解与经验模态分解对原始信号进行降噪处理,然后将其输入到带注意力机制的CNN网络模型中进行故障识别与分类。尽管上述方法取得了良好的诊断效果,但是由于CNN网络具有局部连接与权值共享的特点,导致其无法获得特征信息的全局感受野,因此YU等1 2 提出了空洞卷积的概念。相比于普通卷积而言,空洞卷积可以增大感受野,让每个卷积输出都包含较大范围的信息。段浩明等1 3 提出了一种端到端基于一维注意力混合卷积神经网络的滚动轴承故障诊断方法,引入空洞卷积以增加感
9、受野,并加入注意力机制实现对滚动轴承的智能诊断。乔美英等1 4 提出了一种改进稀疏滤波与深层空洞门卷积网络相结合的故障诊断模型,利用空洞门卷积与双向LSTM网络进行故障分类识别。然而,空洞卷积在增大感受野的同时,也造成了边缘信息的丢失,并且损失了信息的连续性。Swin transformer网络是LIU等1 5 提出的一种基于移动窗口自注意力机制的网络,解决了Transformer网络1 6 第1 3期中计算量巨大的问题,已经在自然语言处理领域(naturallanguage processing,NLP)取得了巨大成功,该网络模型通过层次化的结构,既能获得全局感受野,又能提高运行效率。基于以
10、上分析,针对变工况条件下CNN网络在特征提取过程中无法充分提取特征全局信息的问题,本文提出一种MSCNN-SwinT的滚动轴承故障诊断方法。首先设计数据处理模块,利用连续小波变换保留原始信号的时频特性,将一维振动信号转化为二维时频图像;然后设计局部感知模块,构建多尺度卷积神经网络,利用不同尺度的卷积核对故障信息的局部特征进行提取,并使用卷积块注意模块(convolutional block attention module,CBAM)剔除允余信息,提取更重要的故障特征;之后设计特征提取模块,引入残差连接提高前后特征信息的利用效率并缓解梯度消失现象,通过SwinT网络学习故障信息的全局特征;最后
11、,为减少参数量和抑制过拟合现象,使用全局平均池化层代替全连接层进行故障识别。局部感知模块Local perceptionmodule(11)(33)(55)(11)(55)(33)(11)赵小强等:多特征融合的滚动轴承故障诊断阶段2CABM224224x3融合层注意力一输出机制81使用美国凯斯西储大学轴承数据集和自制数据集进行试验验证,并与几种相关网络模型进行对比,验证本文方法的有效性。1MSCNN-SwinT故障诊断方法滚动轴承通常工作在十分复杂的环境中,在故障诊断过程中,特征提取的充分与否将直接影响诊断效果。本文首先使用无重叠方式将采集到的原始轴承振动信号构造数据样本,通过连续小波变换将一
12、维信号转化为二维时频图像作为模型输入,利用所设计的多尺度卷积神经网络提取故障信息的局部特征,同时引入CBAM注意力机制,提取更重要的信息;之后通过卷积残差连接将原始二维时频图像和局部感知图像进行融合,通过Swintransformer网络学习故障信息的全局特征;最后使用全局平均池化来代替全连接层,减少参数量,加快训练速度,对故障信息进行分类并输出识别结果。图1 为本文网络结构图。特征提取模块Feature extraction module阶段1Swin输入transform层阶段3Swin二transform层阶段4SwinSwintransformtransform层层X6输出数据处理模块
13、一维振动信号小波变换图图 1 Multiscale convolutional neural networks-Swin transformer诊断网络结构Fig.1 Multiscale convolutional neural networks-Swin transformer diagnostic network architecture1.1楼数据处理模块连续小波变换1 7 是将一维振动信号转换为二维时频图的有效方法,具有强大的时频特征提取能力。对于连续小波变换而言,小波基函数的选择至关重要。Morlet小波是一种双边指数衰减余弦信号,与滚动轴承产生的脉冲故障特征十分相似。而Morle
14、t小波中的Cmor小波表示具有强适应性的特点,因此选择Cmor小波作为本文小波变换的基函数,其表达式为,(t)=exp(-t/fi)cos(2元 f t)V元f式中!,()为小波基函数;t为时间,s;f 为带宽参数;exp()为指数函数;f为小波中心频率,Hz。参考文献1 8-1 9,本文取fi=3,f=3H z。1.2局部感知模块传统卷积神经网络通常使用单一尺度卷积层进行特征提取,提取的特征信息有限。因此,为了最大程度地故障1故障2多尺度卷积Swintransformer卷积层神经网络残差连接Residualconnection获取故障数据的特征信息,本文设计了一种多尺度的卷积神经网络,其结
15、构如图2 所示。第一层使用1 个1 1的卷积层对故障数据进行特征提取,通道数设置为32;第二层使用33,55,1 1 的卷积层,其通道数分别为8、1 6、32;第三层使用55,33,1 1 的卷积层,其通道数分别为8、1 6、32。为了提升网络性能,每一个卷积层后面都使用BN层和ReLU激活函数,然后通过Concat层将不同通道的特征维度拼接到一起,最后通过(1)卷积块注意模块2 0 提取关键信息并输出特征图。1.3特征提取模块CNN网络因局部连接与权值共享,在特征提取的过程中总是通过卷积层提取局部特征,而后将局部特征进行整合,最终得到包含特征信息的特征图,会导致部分关键信息丢失。因此,本文基
16、于Swintransformer网络构建特征提取模块。首先在Swin transformer网络之前使用一个卷积核大小为1 1 的卷积层,在减少参数量的同时网络故障9故障1 082增加了通道间信息的交流;其次引入残差连接将局部特征提取模块的输入与1 1 卷积层的输出进行融合,提高前后特征信息的利用效率,并将融合后的特征图作为Swin transformer网络的输入,最后通过Swin tran-sformer网络对特征信息的全局特征进行提取,具体结构如图3所示。11x32BN+Relu注:BN表示批量归一化,Relu表示非线性校正单元,CBAM表示卷积块注意模块。Note:BN means b
17、atch normalization,Relu means nonlinear correction unit,andCBAM means convolutional block attention module.Fig.2 Multiscale convolutional neural network structureScaled dot-product attention线性层线性层LinearlayerLinear layer查询矩阵0键矩阵KQuery matrixQKey matrix K注:h表示多头注意力的数量。Note:h represents the number of m
18、ulti-head attention.图3多头注意力机制结构图Fig.3 Structure diagram of multi-head attention mechanism在图3中,多头注意力机制的输入为多个查询矩阵、键矩阵和值矩阵,查询矩阵、键矩阵、值矩阵为固定的单个值,经过多个线性层和缩放点积注意力层,然后通过融合层进行融合并利用线性层输出,所得到的注意力农业工程学报(http:/www.tcsae.org)输入Input338BN+Relu5516BN+Relu11x32BN+Relu融合层Concat layerCBAM注意力机制CBAM attentionmechanism输出
19、Output图2 多尺度卷积神经网络结构输出Output线性层Linear layer融合层Concat layer缩放点积注意力值矩阵VValuematrix V2023年如式(2)。QKTAttention=SoftmaxVVak式中Attention代表注意力机制函数,Softmax代表归一化函数,dk代表键矩阵维度。本文Swintransformer网络分为4个阶段,对应的多头注意力数量分别为3、6、1 2 和2 4,除第一阶段由线性嵌入层和Swin transformer块组成之外,其余3个阶段均由切片合并层和Swintransformer块组成。1.4MSCNN-SwinT模型训练
20、流程5x5x8BN+Relu3316BN+Relu11x32BN+Relu线性层hLinear layer(2)本文方法的具体流程如下:首先采用连续小波变换将一维原始振动信号转化为二维时频图,并按照7:3的比例将数据集划分训练集与测试集,之后将训练集输入到MSCNN-SwinT模型中进行训练,获取最优参数并保存模型,最后将测试集输入到训练好的模型中,实现对滚动轴承的故障诊断。图4为本文方法的流程图。轴承故障信号采集对数据进行无重叠划分采用连续小波变换生成二维时频图像划分数据集训练集建立网络模型并设置相关参数网络模型训练模型参数优化否是否收敛是完成训练保存网络模型参数图4MSCNN-SwinT模
21、型训练流程Fig.4MSCNN-SwinT model training process2试验验证为了验证所提方法的有效性和泛化能力,本文选择美国凯斯西储大学轴承数据集(casewesternreserveuni-versity,C W R U)和自制数据集进行试验。2.1CCWRU数据集验证结果与分析2.1.1数据集及数据处理CWRU滚动轴承数据集的试验平台由一个1.5kW电机、一个扭矩传感器、一个功率测试仪和电子控制器组成。被测轴承型号SKF6205,采样频率1 2 kHz,选用轴承驱动端数据进行试验验证,采集4种不同工况状态下的加速度数据集,在本文中,将电机载荷0 kW、电机测试集已经训
22、练好的网络模型轴承故障诊断故障分类结果第13期转速17 97 r/min所获取的数据标记为数据集0,将电机载荷0.7 5kW、电机转速17 7 2 r/min所获取的数据标记为数据集1,将电机载荷1.5kW、电机转速17 50 r/min所获取的数据标记为数据集2,将电机载荷2.2 kW、电机转速17 50 r/min所获取的数据标记为数据集3。将采集到的4种数据集根据轴承损伤程度及位置用10 种状态标签进行表示,具体标签与对应的故障状态如表1所示。表1CWRU数据集标签及对应故障Table 1 CWRU dataset labels and corresponding faults标签Lab
23、el0123456789每段的采样点数设置为7 8 4,生成50 0 个样本,对于每一类故障状态生成50 0 张时频图,并按照7:3的比例划分训练样本和测试样本。具体而言,在4个数据集20 0002000015 000150010010.0005 000500000.0050.0100.0150.020时间Time/sa.标签0a.Label 0ZH/Aouanbaid率源20.0001500100500000.005 0.010 0.015 0.020时间Time/sf.标签5f.Label 5100.0099.9599.9099.8599.80051015202530批次Batcha.识别
24、准确率a.Identification accuracy图6 本文方法在CWRU数据集的验证结果Fig.6 Validation results of method in this paper onCWRU dataset从图6 中可以看出,在经过30 次训练后,训练集和赵小强等:多特征融合的滚动轴承故障诊断对应故障Correspondingtofailures直径为0.17 7 8 mm的滚动体故障直径为0.17 7 8 mm的内圈故障直径为0.17 7 8 mm且故障为3点钟方向的外圈故障直径为0.3556 mm的滚动体故障直径为0.3556 mm的内圈故障直径为0.3556 mm且故障为
25、6 点钟方向的外圈故障直径为0.5334mm的滚动体故障直径为0.5334mm的内圈故障直径为0.5334mm且故障为3点钟方向的外圈故障直径为0.7 112 mm的滚动体故障20.00000.005 0.010 0.0150.020时间Time/sb.标签1b.Label 120000150010.0005.00000.0050.0100.015 0.020时间Time/sg.标签6g.Label 6图5不同故障状态的小波时频图Fig.5Wavelet time-frequency plot of different fault states测试集的准确率均达到10 0%,训练集的损失函数值
26、从0.78338一训练集Training set0.2一测试集Testing set0.10051015202530批次Batchb.损失b.Loss83中,每个数据集的训练样本和测试样本分别为350 0 个和150 0 个。使用连续小波变换将样本转化为二维时频图像,生成图像的像素分辨率为2 2 42 2 4,图5为10 种故障样本的时频图,从图中可以看出,由于样本信号中含有的频率成分以及对应的时间区间不同,不同故障的时频图中相同位置的颜色深浅均不相同,表明连续小波变换可以很好地保留原始样本信号的时频特性。2.1.2试验结果与分析试验在pycharm的pytorch框架下完成,电脑配置为Win
27、dows10系统、i7-11800H处理器、16 GB内存。选取Adam优化器优化网络参数,批次设置为16,代批数为30,学习率为0.0 0 1。选用CrossEntropyLoss交叉熵作为损失函数,表达式如式(3)所示。L=-Zyilgyi1式中L表示误差损失值,K表示故障类别的数量,y表示第i个类别的真实标签,表示模型判定可能为第类故障的预测概率值。图6 为本文方法迭代30 次的故障识别准确率曲线与Loss函数变化曲线。20 00015.00015.00010.0001000050005000000.0050.0100.0150.020时间Time/sc.标签2c.Label 22000
28、015 00010 0005.00000.005 0.010 0.015 0.020时间Time/sh.标签7h.Label 70.6672降低至0.0 0 5以下,测试集的损失函数值从0.0 357降低至0.0 0 3以下,模型训练至第2 个批次时,准确率达到10 0%,损失函数值降低至0.0 1以下,模型达到完一训练集Training set一测试集Testing setK00.0050.0100.0150.020时间Time/sd.标签3d.Label 32000015.00010 0005.00000.0050.0100.015 0.020时间Time/si.标签8i.Label 8全
29、收敛,之后准确率与损失函数值趋于稳定。为了进一步验证本文方法的特征提取与分类能力,采用T-SNE降维技术,对本文网络模型的分类结果进行三维立体可视化,结果如图7 所示。从图7 中可以看出,在原始数据中,10 类故障数据杂乱无章,相互混叠,难以区分,而经过本文所提方法的特征提取和分类输出之后,故障数据已经完全聚集,相互分离,这表明本文方法具有很强的故障分类能力,最终分类准确率达到了99.6 7%。(3)20 00015 00010 0005 00000.0050.0100.0150.020时间Time/se.标签4e.Label 420000150010 000500000.0050.010 0
30、.0150.020时间Time/sj.标签9j.Label 9working conditions84标签0 LabelO标签5 Label5维度2 Dimension2a.原始数据a.Raw data图7 原始数据与分类层的特征可视化结果Fig.7 Results of feature visualization of raw data andclassification layer2.1.3变工况条件下的试验验证变工况试验是对诊断方法是否具有良好泛化性能的一种检验,本文选取数据集0、数据集1、数据集2、数据集3中的一种作为训练样本,其余3种为测试样本,例如0 1、0 2、0 3代表的是以数
31、据集0 为训练样本,数据集1、数据集2、数据集3为测试样本。为了验证连续小波变换与MSCNN-SwinT网络结合的优势,进一步选择 LeNet521、V G G 16 2 2 、Re s Ne t 18 2 3、Sw i n T 网络进行对比,为了避免偶然误差,试验进行5次,结果取平均值,如表2 所示。由表2 可知,在变工况条件下,CWT-LeNet5、CWT-VGG16、C WT-Re s Ne t 18 和CWT-Swin的平均故障识别准确率分别为8 9.15%、8 9.30%、9 4.45%和9 4.7 6%,本文方法的故障识别准确率为97.94%,较其他4种方法分别提高8.7 9、8.
32、6 4、3.49和3.18 个百分点。相比于其他几种方法,本文方法的准确率变化趋势较为平缓,例如,CWT-LeNet5方法的最高平均准确率为96.12%,最低平均准确率为7 7.40%;本文方法的最高平均准确率为99.66%,最低平均准确率为95.0 1%,这表明本文方法在变工况条件下具有更好的诊断效果和泛化性能。001002520050300754001001255001506001757002000200时间Time/sa.递归图a.Recursion plotsFig.8 Feature images generated by different encoding techniques将
33、3种方法生成的特征图像分别作为MSCNN-SwinT网络模型的输入,为避免偶然现象,试验进行农业工程学报(http:/www.tcsae.org)标签1Label1标签2 Label2标签6 Label6标签7 Label 7 uorsuawa I4002023年标签3Label3标签4Label4标签8 Label8标签9Label9维度2 Dimension2b.分类结果b.Classification results6000图8 不同编码技术生成的特征图像5次,结果取平均值,如表3所示。由表3可知,同一种图像生成方式下,本文模型的表2 变工况条件下不同方法的诊断结果Table 2Diag
34、nostic results of different methods under variable工况WorkingCWT-conditionsLeNet50195.320291.840381.011090.901295.521394.182086.832193.312396.123079.143177.403288.23注:0 1、0 1、0 3分别表示以数据集0 为训练样本,数据集1、数据集2、数据集3为测试样本;10、12、13分别表示以数据集1为训练样本,数据集0、数据集2、数据集3为测试样本;2 0、2 1、2 3分别表示以数据集2 为训练样本,数据集0、数据集1、数据集3为测试样
35、本;30、31、32 分别表示以数据集3为训练样本,数据集0、数据集1、数据集2 为测试样本。Note:0-1,0-1,0-3 means that dataset 0 is used as the training sample,and dataset 1,data set 2,and data set 3 are the test samples,respectively;1-0,1-2,1-3 indicate thatdataset 1 is used as the training sample,and dataset 0,data set 2,and data set 3 aret
36、he test samples,respectively;2-0,2-1,2-3 indicate that dataset 2 is used as thetraining sample,and dataset O,dataset l,and data set 3 are the test samples,respectively;3-0,3-1,and 3-2 indicate that dataset 3 is the training sample,anddataset O,dataset 1,and data set 2 are the test samples,respective
37、ly.2.1.4特征图像生成方式对诊断结果的影响为了进一步验证小波变换与MSCNN-SwinT模型结合的故障识别分类能力,对比了其他几种图像生成方法:文献 2 4 使用递归图编码技术(recurrence plots,RP)将一维振动信号转化为二维纹理图像输入到ResNet网络中对滚动轴承进行故障诊断;文献 2 5 使用马尔可夫转移场编码技术(markovtransferfield,MT F)将一维原始振动信号转化为具有时间相关性的二维特征图像,然后输入到CNN网络中实现故障分类;文献 2 6 采用格拉姆角场法(gramian angular field,G A F)将一维信号转化为二维图像作
38、为PAM-ResNet网络的输入,验证小样本环境下方法的可行性。本文将相同数据集应用于上述3种方法,图8 为0.0 14-Ball故障状态下3种方法生成的特征图像。10020030040050060070050100150200时间Time/sb.尔可夫转移场b.Markovtransferfield准确率 Accuracy/%CWT-CWT-VGG16ResNet1892.9897.3295.3897.7281.8887.4393.9895.3897.9397.8684.8997.5987.2392.5190.7798.7986.0297.2686.5687.2383.1587.5690.8
39、496.7200c.Gramian angularfieldCWT-SwinT96.5997.1287.7097.1996.3995.5195.4597.9298.2681.8894.0599.06200400时间Time/sc.格拉姆角场CWT-MSCNN-SwinT98.0698.0597.7298.7298.2797.9696.1298.8298.8595.0197.9999.66600第13期故障诊断准确率均高于其他4种方法。不同图像生成方式下,RP-MSCNN-SwinT、MT F-MSC NN-Sw i n T 和GAF-MSCNN-Swin的准确率分别为9 6.37%、9 4.2
40、 6%和95.47%,本文方法的故障识别准确率达到10 0%,相比于其他3种方法分别提高3.6 3、5.7 4和4.53个百分点,表明本文模型与连续小波变换结合具有更强的故障学习能力。表3不同特征图像的故障诊断准确率Table 3 Fault diagnosis accuracy of different feature images图像生成方式Image generation method递归图Recursion plots马尔可夫转移场Markovtransferfield格拉姆角场Gramian angular field连续小波变换Continuous wavelet transfor
41、m2.2自制数据集验证结果与分析2.2.1数据集及数据处理自制数据集的试验平台如图9 所示,主要由三相交流异步电机、加负载装置、不同故障种类轴承、变频控制器、传感器、DHDAS动态信号采集分析系统组成。轴承固定在主轴上,并将主轴与联轴器连接,最终将轴承定位在轴承锁圈中。21.变频控制器2.电机3.加载装置4.测试轴承5.y轴传感器6.x轴传感器1.Inverter controller 2.Motor 3.Loading device 4.Tested bearing 5.Sensor ony-axis 6.Sensor on x-axis试验中被测轴承为M-BFK-3/4的深沟球轴承(内径1
42、9.05mm,外径2 5.4mm,滚动体9 个,接触角0),包含正常,滚动体故障,内圈故障,外圈故障,混合故障5种状态。试验使用的是剪切加速度传感器型号为333B30,灵敏度为10 2.7 mV/g,剪切加速度传感器分别固定在轴承座的9点钟(x轴)方向和12 点钟(y轴)赵小强等:多特征融合的滚动轴承故障诊断方法准确率Accuracy/%MethodsRP-LeNet5RP-VGG16RP-ResNet18RP-SwinTRP-MSCNN-SwinTMTF-LeNet5MTF-VGG16MTF-ResNet18MTF-SwinTMTF-MSCNN-SwinTGAF-LeNet5GAF-VGG1
43、6GAF-ResNet18GAF-SwinTGAF-MSCNN-SwinTCWT-LeNet5CWT-VGG16CWT-ResNet18CWT-SwinTCWT-MSCNN-SwinT3图9 试验台Fig.9Test platform85方向。本试验使用的是固定在9 点钟方向的剪切加速度传感器采集到的振动信号数据,通过变频控制器调节电机频率,分别为2 0、30 和40 Hz。在固定的电机频率上使用加载装置通过单一控制变量法采集负载分别为0、0.745、1.49 0、2.2 35和2.9 8 0 kW共5种工况的数据,样本数据的采集频率为2 56 0 0 Hz。本文选择其中10 类故障状态作为试
44、验数据集,具体标签及对应故障如表4所示。每段样本的采样点为7 8 4,每种故障的样本为50 0,共生成50 0 0 张时频图,按照7:3的比例划分训练集与测试集。86.6393.2190.8394.3996.3777.7586.3583.7388.6794.2678.5488.5879.9190.7495.4797.8998.9798.6199.72100.006表4自制数据标签及对应故障Table 4 Self-made data labels and corresponding faults标签 负载LabelLoad/kW Motor frequency/Hz Sampling freq
45、uency/Hz Failure status0011.49020.74532.98041.49052.98062.235708091.4902.2.2故障诊断结果分析本部分试验除试验数据与凯斯西储大学数据集不同以外,所有网络模型参数均相同。为了验证本文方法的有效性与良好的泛化性能,将本文方法与已有方法进行对比,试验结果如表5所示。表5各种方法诊断结果Table 5 Diagnostic results by various methods方法MethodsCWT-LeNet5CWT-VGG16CWT-ResNet18CWT-SwinTCWT-MSCNN-SwinT从表5中可以看出,本文方法的
46、准确率达到99.18%。较其他4种方法分别提高5.2 3、2.7 4、1.40 和1.2 6 个百分点。这是因为 CWT-LeNet5、C WT-V G G 16 和 CWT-ResNet18均采用卷积神经网络进行特征提取,虽然利用了卷积神经网络在图像分类中的强大能力,但是并没有从根本上突破卷积神经网络无法提取故障数据全局特征的局限,导致准确率不佳;而CWT-SwinT单纯使用Swintransformer网络,虽然对故障信息的全局特征进行了提取,但是其对于微小特征的学习能力不足。而本文方法通过多尺度卷积神经网络提取故障信息的局部特征,采用Swintransformer网络学习故障信息的全局特
47、征,有效提高了故障诊断的准确率。为进一步验证所提方法的泛化性能,本文对上述10种故障做了混淆矩阵试验,结果如图10 所示。由图10 可知,本文所提方法只有1.0%标签为0 的故障和4.0%标签为3的故障出现误分现象,其他故障状电机频率20302040204020302030采样频率2560025 60025 60025 60025 60025 600256002560025 60025 600准确率Accuracy/%93.9596.4497.7897.9299.18故障状态正常正常滚动体故障滚动体故障内圈故障内圈故障外圈故障外圈故障混合故障混合故障86态的分类效果良好,整体故障诊断准确率达到
48、了99.33%,这表明本文方法在不同数据集上有较高的故障识别能力和良好的泛化能力。099.00.01.00.00.00.00.00.00.00.0一0.0100.00.00.00.00.00.00.00.00.020.0 0.0100.00.00.00.00.00.00.00.00.0 0.01.096.03.00.0.0.00.00.00.00.00.00.00.0100.00.00.00.00.00.050.00.00.0 0.00.0100.00.00.00.00.060.00.00.00.00.00.0100.00.00.00.070.00.0.0.00.00.00.00.0100.0
49、0.00.080.00.00.00.00.00.00.00.0100.00.00.00.00.00.00.00.00.00.00.0100.00123456789预测标签Predictedlabel图10 混淆矩阵图Fig.10Confusion matrix diagram3结 论为了解决变工况条件下卷积神经网络无法充分提取全局特征信息的问题,本文提出了一种基于MSCNN-SwinT的滚动轴承故障诊断方法,主要结论如下:1)本文利用连续小波变换将一维振动信号转化为时频图像,保留了原始信号的时频域特征,设计了多尺度卷积神经网络捕捉时频图像的局部特征,同时引入CBAM注意力机制提取更关键的特征信
50、息,通过残差连接加强前后信息的利用效率,并通过Swintrans-former网络捕获特征图的全局信息,解决了卷积神经网络无法学习全局特征的问题。2)针对CNN网络无法提取全局信息的问题,结合Swin transformer网络的优点,本文提出MSCNN-Swin-T模型,并与几种典型网络模型进行试验对比,结果表明,在变工况条件下本文方法的平均故障诊断准确率达到97.94%,较对比方法分别提高8.7 9、8.6 4、3.49和3.18个百分点,这说明本文方法在复杂条件下仍具有很高的诊断准确率。3)试验表明,在不同图像编码方式下,本文方法的故障诊断准确率为10 0%,较其他几种对比方法分别提高3