1、基于一维轻量化 CNN 的山地索道轴承故障诊断段洁利1,2,于世伟1,解明坤1,何俊宇1,王豪杰1,李伟希1,杨洲1,2,3(1.华南农业大学工程学院,广州510642;2.岭南现代农业科学与技术广东省实验室,广州510600;3.广东海洋大学机械工程学院,湛江,524088)摘要:为保证山地果园索道安全稳定运行,并在网络环境较差的山地果园实现对索道驱动系统轴承故障诊断,该研究提出了一种一维端对端轻量化 CNN 检测方法 1D-MRL-CNN(one-dimensionalmountainropewayslightweightconvolutionalneuralnetwork),直接对采集到
2、的一维振动信号进行检测。基于残差结构(residualstructure)和深度可分离卷积(deepseparableconvolution),引入 BN(batchnormalization)层,在保证检测精度的同时大幅度降低模型的参数量和复杂度,并提升鲁棒性和泛化能力,适用于索道的变负荷工作状态;采用改进 stemblock 模块、h_swish 激活函数并在主体模块最后一层添加通道注意力机制(squeezeandexcitation,SE),提高网络模型的特征提取能力。为了验证模型的综合性能、变负荷工况下的稳定性以及抗噪声干扰性能,利用帕德博恩大学(paderbornuniversity
3、,PU)和凯斯西储大学(casewesternreserveuniversity,CWRU)数据集进行试验验证。PU 数据集试验结果表明,该方法故障分类准确率达 99.43%,相比同类最优网络分类准确率提高 0.97 个百分点;参数量为 83.44kB,分别是 Resnet18、VGG16、MobileNetV3-large和 ShuffleNetV1 模型的 2.19%、0.83%、2.84%和 3.32%。CWRU 数据集试验结果表明,该方法在变负荷工况下的平均准确率达 96.70%,比 Resnet18、WDCNN 和 MobileNetV3-large 网络分别高 9.1、4.7 和
4、10.5 个百分点;在 4 种噪声工况下的平均识别准确率达 99.14%,比 Resnet18、WDCNN 和 MobileNetV3-large 网络分别高 4.74、1.24 和 5.51 个百分点。最后通过自建数据集对模型的实际工况故障分类效果进行验证,1400 个样本中仅有 2 个故障样本预测错误,准确率达99.86%。本研究的网络模型参数量小、准确率高,在变负荷和有噪声的工况下鲁棒性较高,适用于山地果园运输索道的轴承故障检测。关键词:轴承;故障诊断;振动;轻量化;深度可分离卷积;山地果园索道doi:10.11975/j.issn.1002-6819.202304173中图分类号:S2
5、29+1;S24文献标志码:A文章编号:1002-6819(2023)-14-0070-10段洁利,于世伟,解明坤,等.基于一维轻量化 CNN 的山地索道轴承故障诊断J.农业工程学报,2023,39(14):70-79.doi:10.11975/j.issn.1002-6819.202304173http:/www.tcsae.orgDUAN Jieli,YU Shiwei,XIE Mingkun,et al.Fault diagnosis of mountain ropeway bearings based on one-dimensionallightweightCNNJ.Transact
6、ionsoftheChineseSocietyofAgriculturalEngineering(TransactionsoftheCSAE),2023,39(14):70-79.(inChinesewithEnglishabstract)doi:10.11975/j.issn.1002-6819.202304173http:/www.tcsae.org0引言中国是世界上最大的水果生产国和消费国,而国内南方大部分果园分布在丘陵山地,运输不便,所以山地果园运输机械化需求越来越高1,在南方丘陵山地很多地方已经应用了山地架空索道。运输机械部署在丘陵山地,工作环境相对恶劣,因此索道驱动端电机、减速器及
7、主轴轴承容易发生故障和损坏,据统计,轴承故障占电机故障的 30%40%2,对于这种大型运输旋转机械,轴承状态检测显得尤为重要,一旦发生故障,不仅会对运输的水果造成损害,给果农造成经济损失,同时架空索道位处山地,维修成本高,通过故障诊断方法及时诊断出故障信息,在初期将故障排查解决意义重大。随着工业物联网的发展,对架空索道驱动端的关键部件状态监测可以通过基于互联网远程监测系统实现。但是山地网络环境较差,所以算法分析计算依赖于智能边缘网关设备,为了减少计算资源的消耗,研究一种轻量化的诊断模型尤为重要,同时,货运索道工作过程中处于连续的加载卸载变负荷工况,网络模型需要有较高的鲁棒性和泛化性能3。传统的
8、轴承故障诊断系统包括信号测取、特征提取、状态识别、诊断分析和决策干预4,通过人工提取特征,再经过机器学习算法进行故障分类。周士帅等5提出将局域均值分解(localmeandecomposition,LMD)与最小熵反褶积(minimumentropydeconvolution,MED)结合的方式,成功提取了滚动轴承的故障特征。王志坚等6通过排列熵优化改进变模态分解算法成功提取出了齿轮箱的故障特征。以上人工特征提取方法依赖深厚的专业知识,而且特征提取相对低效。相比传统的机器学习方法,目前深度置信网络、自收稿日期:2023-04-21修订日期:2023-05-29基金项目:岭南现代农业实验室科研项
9、目(NT2021009);“十四五”广东省农业科技创新十大主攻方向“揭榜挂帅”项目(2022SDZG03);财政部和农业农村部:现代农业产业技术体系建设专项资金(CARS-31-11);广东省现代农业产业技术体系创新团队建设专项资金(2023KJ109)作者简介:段洁利,博士,教授,研究方向为智能农业装备。Email:通信作者:杨洲,博士,教授,研究方向为水果生产机械化与信息化。Email:第39卷第14期农 业 工 程 学 报Vol.39No.14702023年7月TransactionsoftheChineseSocietyofAgriculturalEngineeringJuly2023
10、动编码器、递归神经网络和卷积神经网络等深度学习技术应用研究越来越广泛。李滨等7提出一种改进的深度置信网络电主轴承故障诊断方法,该方法实现了对滚动轴承的特征提取和故障分类,且提出一种新的激活函数,具有较高的故障识别能力。JIA 等8通过堆叠自动编码器对三层神经网络进行预训练,然后对网络进行微调,获得轴承和行星齿轮箱故障诊断的预测结果。YUAN 等9利用长短期记忆(longshort-termmemory,LSTM)神经网络对航空发动机进行故障诊断,在混合故障和强噪声下取得良好的诊断性能。这些方法相对容易实现,但收敛速度慢,迁移学习能力弱。卷积神经网络(convolutionalneuralnet
11、work,CNN)可以自动提取抽象特征并进行分类,具有强大的表征能力,目前已成为故障诊断领域的研究重点。根据对原始数据处理的方式不同,卷积神经网络可以分为一维和二维信号模式。WANG 等10通过将短时傅里叶变换与深度学习结合,将异步电机采集来的原始信号通过短时傅里叶变换进行预处理,得到时频图,然后输入到卷积神经网络模型中进行故障识别,取得不错的效果。GUO 等11通过将连续小波变换和卷积神经网络结合,通过小波变换分解不同尺度的旋转机械的振动信号形成连续小波变换标量图,然后将标量图直接输入到 CNN 中进行故障分类,提出的方法能够准确的诊断故障。SUN 等12采用双树复小波变换(double-t
12、reecomplexwavelettransform,DTCWT)获取多尺度信号的特征,然后利用卷积神经网络从多尺度特征中自动识别故障特征,通过齿轮故障数据集的试验验证了这种方法的可行性和有效性。施杰等13提出一种将希尔波特-黄变换的改进算法(hilbot-huangtransform,HHT)与卷积神经网络相结合的诊断方法。首先,通过多种群差分进化改进的集合经验模式分解和敏感固有模态函数筛选方法改进 HHT,提取出时频信号并生成时频图输入 AlexNet 卷积神经网络中进行故障分类,得出不错的识别效果。ZHUANG 等14提出一种新型深度卷积神经网络,直接对原始振动信号进行操作,提出的 MS
13、-DCNN 模型拓宽了神经网络,通过多尺度卷积层学习更加鲁棒性的特征表达,同时减少了网络参数和训练时间,在测试集中获得了较高的准确率。ZHANG 等15提出一种端到端的深度学习网络模型TICNN(convolutionneuralnetworkswithtraininginterfere-nce),直接将原始时间信号作为输入,并在凯斯西储大学的轴承数据集上进行测试,并对它进行添加噪声,在噪声条件下获得很高的分类精度。王琦等16提出一种改进的一维卷积神经网络的滚动轴承故障识别方法,通过引入小卷积核增强非线性表达能力,最后在 CWRU 数据集上实现了比较好的故障分类,并通过泛化性能试验,在不同的负
14、载数据下进行测试,证明模型有较好的鲁棒性。上述方法大多借鉴了图像处理领域的经验,在研究和实践中大多集中于提高模型的性能,网络结构相对复杂,计算量和模型参数量相对较大,不适合在山地索道智能边缘设备上部署。本研究针对山地索道关键部件轴承故障诊断的需求,提出一种基于新构建块 basicblock的端对端一维 CNN 方法。basicblock 基于深度可分离卷积(deepseparableconvolution)和残差结构建立,为了弥补使用深度可分离卷积造成的精度损失,提出改进stemblock 模块,同时引入 h_swish 激活函数提升网络的性能,并在 basicblock 中添加 SE 模块1
15、7,以增强有用特征的表达。融合以上方法,拟得到一个适合山地索道关键部件故障检测的轻量化、高性能 CNN 模型。1轻量化 CNN 搭建1.1理论基础1.1.1深度可分离卷积标准卷积层有两个主要功能:提取输入数据的局部特征,并将这些特征线性组合,一步生成新的特征,计算过程如图 1a 所示。使用深度可分离卷积是一种实用的设计轻量化结构的方法,通过替换成深度可分离卷积,解耦标准卷积的一步计算过程,可以大幅度降低模型的参数量和计算量。如图 1b 所示,深度可分离卷积的计算过程由深度卷积和逐点卷积两个步骤构成,首先是深度卷积,在进行卷积时,一个卷积核负责一个通道,一个通道只被一个卷积核卷积,降低卷积过程的
16、计算量和参数量。但是,这样按通道的卷积操作阻碍了通道间的信息交流,无法融合在相同空间位置提取到的信息,因此在深度卷积之后,再使用逐点卷积操作来实现不同通道间的信息融合。逐点卷积的运算方法与常规卷积类似,使用 11 大小的卷积核对深度卷积的结果进行卷积融合。深度卷积Deepthwise convolution逐点卷积Pointwise convolutionb.深度可分离卷积b.Depth separable convolutionsa.标准卷积a.Standard convolutionDiDiDiMDkDkDkDoDoDoDoDk111DiDiMXMXNMNMDkN注:Di、Dk、Do分别代
17、表输入矩阵宽度、卷积核宽度以及输出矩阵宽度。M、N 分别表示卷积核深度与数量。Note:Di,DkandDorespectivelyrepresentthewidthofinputmatrix,convolutionkernelandoutputmatrix.MandNrepresentdepthandnumberofconvolutioncoresrespectively.图 1标准卷积和深度可分离卷积计算过程Fig.1Calculationprocessofstandardconvolutionanddepthseparableconvolution如图 1 所示,对于标准卷积,输入大小为
18、 DiDiM的张量,使用 N 个大小为 DkDkM 的卷积核进行卷积运算时,输出矩阵的尺寸为 DoDoN,参数量 Pconv和计算量 Fconv如下:Pconv=DkDkMN(1)第14期段洁利等:基于一维轻量化 CNN 的山地索道轴承故障诊断71Fconv=DkDkMDoDoN(2)对于深度可分离卷积,首先是深度卷积计算,输入大小为 DiDiM 的张量,使用 DkDk1 的卷积核对每一个通道进行卷积操作,得到和输入张量通道数一致的输出,共有 M 个卷积核,输出矩阵大小为 DoDoM,然后逐点卷积通过 N 个 11M 的卷积核对深度卷积获得的张量进行卷积操作,得到输出矩阵尺寸为 DoDoN。经
19、过深度卷积和逐点卷积的深度可分离卷积的参数量 Pds和计算量 Fds是 2 个计算过程相加,可由式(3)(4)表示。Pds=DkDkM+MN(3)Fds=MD2o(N+D2k)(4)深度可分离卷积和标准卷积的参数量和计算量比值可由式(5)(6)表示。PdsPconv=1N+1D2k(5)FdsFconv=DkN+1D2k(6)一般情况下,大多数网络卷积核数目 N 都较大,所以 1/N 和 Dk/N 对参数量比值和计算量比值影响不大,按照目前使用较多的 33 卷积核,得到相同结果时,使用深度可分离卷积的参数量和计算量大约是标准卷积的1/9。1.1.2残差网络网络越深,所提取的特征越丰富,网络性能
20、越好。然而,随着卷积神经网络层数的叠加,模型的准确率会趋于饱和不再上升,并且继续加深时会出现准确率下降的问题。所以,网络越深越容易出现梯度消失和梯度爆炸的现象,为了解决这些问题,HE 等18提出了残差结构,并应用到实际的分类问题中。如图 2 所示,残差结构直接将上层特征 X 作为部分输出的结果,跨层添加到高层特征里,这样不会增加模型的参数量和计算量。本研究模型的主卷积采用的是深度可分离卷积,在大幅度减少模型参数量和复杂度的同时,也会造成模型性能的下降,为了弥补特征信息在传递过程中的损失,提升模型性能,基于残差结构的优越性,后文提出的基础块正是基于此结构搭建。ConvConvXF(X)+XF(X
21、)注:X 表示输入,F(X)表示经过卷积操作后的输出。Note:Xrepresentsinput,F(X)representsoutputafterconvolutionoperation.图 2残差结构Fig.2Residualstructure1.1.3h_swishswish 激活函数已经被证明是比 ReLU 更佳的激活函数,但是相比 ReLU,swish 的计算代价太大,不适合在移动设备上部署,不符合本研究轻量化设计初衷。为了提升模型性能,且在智能边缘计算设备上应用 swish 并降低计算量,采用 HOWARD 等19提出的 h_swish,函数表达式如下:h_swish(x)=xRe
22、LU6(x+3)6(7)1.1.4批量归一化批量归一化(batchnormalization,BN)是一种流行且有效的神经网络技术,主要用在激活函数之前防止过拟合。模型训练过程中,每层的输入分布不断变化,为了让下一层适应新的数据分布,使用 BN 层利用小批量的均值和方差调整神经网络的输出,从而使得各层之间的输出都符合均值、方差相同的高斯分布,使得数据更加稳定、网络更容易收敛且能有效防止过拟合,提高模型的训练速度及泛化性能。本研究将 BN 层添加到基础块网络中可以有效提高模型在变负荷工况下的稳定性。1.2CNN 结构综上,本研究基于残差结构,运用深度可分离卷积、h_swish 激活函数和批量归一
23、化组成轻量化网络的基础块,并通过基础块的堆叠使网络的感知范围更大,具体结构如图 3 所示。DS31BNh_swishAddBNh_swishConv 11输入Input输出OutputDS31注:DS 代表深度可分离卷积,Conv 代表标准卷积,add 表示特征相加,BN 表示批量归一化。Note:DS stands for deep separable convolution,Conv stands for standardconvolution,addrepresentsfeatureaddition,BNisbatchnormalization.图 3基础块结构Fig.3Basicblo
24、ckstructure为了有效提取原始振动数据的特征信息,网络结构的第一层仍然采用标准卷积,同时借鉴文献20 的 stemblock 结 构 并 进 行 改 进。原 stem block 结 构 如 图 4a所示,在接收输入特征后经过 1 个卷积核大小 31、步长为 2 的卷积完成 1 次下采样操作,然后分 2 个支路,一部分进行 11 的卷积降低一半的通道数,进入 31、步长为 2 的卷积进行第二次下采样操作,这样先降低通道数再进行下采样可以有效降低网络结构的参数量;另一部分进入最大池化层,后再将两部分进行拼接,这样的操作可将输入中的部分信息进行传递,在保证减少参数量的基础上仍然具备足够的语
25、义信息。改进后的 stemblock 结构如图 4b 所示,将改进的 stemblock 结构放在第一层标准卷积后,接收其输出后,进入 2 个分支结构,只进行一次下采样操作,这样可以进一步减少网络结构的参数量,在进行池化和下采样操作并进行拼接后,添加 BN 层和 h_swish 激活函数,进一步加强网络结构的稳定性和特征提取能力。为了后续网络结构的阐述方便,将第一层标准卷积层与改进的 stemblock 结构一起记为stemblock 层。72农业工程学报(http:/www.tcsae.org)2023年MaxpoolingBNh_swishInputOutputb.改进stem block
26、结构 b.Improved stem block structure输入输出Conv11Conv31Conv11Conv11Conv31Conv31Maxpooling2121Concatenate输出Input输入a.原stem block结构 a.Original stem block structure OutputStrides=2Strides=1Strides=2Strides=1Strides=2Strides=1Strides=1Conv11Concatenate注:Strides 代表步长,concatenate 表示特征融合。Note:Stridesstandsforste
27、psize,concatenaterepresentsfeaturefusion.图 4Stemblock 及其改进结构Fig.4Stemblockandimprovedstructure基于上述理论以及构建的网络模块,建立了山地索道轴承一维端到端轻量化 CNN 结构(1D-MRL-CNN),网络的整体结构如图 5 所示,具体网络结构参数如表 1所示。10241326411C11C166486441281128Stem blockBasic block1Basic block2Basic block3SE+Avg_pooling100Softmax14123456891011FCHWHCCWC
28、onv激励层ExcitationCWHInputOutputInputOutputDS 31128 Conv Add11128 DS 31128 BNh_swishBNh_swishSEStrides=2Strides=2Strides=1SENet模块SENet module融合SE的基础块Basic block of SE are fused整体结构 Overall structure 输入输出输入挤压层Squeeze比例层Scale输出1213147注:C、H、W代表输入特征的通道数、高度和宽度;C、H、W 代表输出特征的通道数、高度和宽度;FC 为全连接。Note:C,H,Wrepre
29、sentthenumberofchannels,heightandwidthentered;C,H,Wrepresentthenumberofchannels,heightandwidthoftheoutput;FCisfullyconnected.图 51D-MRL-CNN 结构示意图Fig.5Schematicdiagramof1D-MRL-CNN表11D-MRL-CNN 结构参数Table11D-MRL-CNNstructureparameters网络模块Networkmodule层Layer通道数channels步长Stride输出尺寸OutputshapeStemblock641,C
30、onv3216326411,Conv16131,Conv32221,Maxpooling211,Conv641Basicblock131,DS642166431,DS64111,Conv642Basicblock231,DS64286431,DS64111,Conv642Basicblock331,DS1282412831,DS128111,Conv1282Classification77,Avg_pooling1128100,Fully_connected,softmax14注:每个卷积前面的数字代表卷积核的大小,在表中只说明了每个模块中的卷积组成。SE 模块即插即用,不影响输出尺寸,表中未
31、添加。Note:Thenumberinfrontofeachconvolutionrepresentsthesizeoftheconvolutionkernel,onlytheconvolutioncompositionineachmoduleisexplainedinthetable.TheSEmoduleisplug-and-playandhasnotbeenaddedtothetablesinceitdoesnotaffecttheoutputsize.网络输入为 10241 的一维原始振动信号,由 stemblock 模块、3 个 basicblock 模块、平均池化层以及全连接层堆叠
32、构成。为了进一步提升网络的性能,在网络中添加 SE 注意力机制(图 5)。将 SE 模块与最后一层 basicblock 结合14,SE 模块简单高效,即插即用,通过全局平均池化压缩特征图,使每个通道仅保留一个平均值作为其特征,然后与全连接层连接生成每个通道的注意力权重,每个注意力权重与对应通道处的输入特征图相乘,获得最终的输出特征图,生成的输出特征图与原始特征图具有相同的维度。根据其重要性为各通道分配不同的权重能够增强有用特征的表达,有助于提高网络的性能,为了适应本文一维振动信号分类任务,将 SE 模块修改为适合一维数据的结构,将模块中的全局平均池化变为一维。2验证试验2.1试验数据为了验证
33、本文所提方法的综合性能及在变工况下的稳定性,选取 2 个公开的轴承数据集进行试验,并在实际索道进行试验验证。首先为了更好的探究模型的综合性能,选取分类难度较高的帕德博恩大学(PU)数据集,试验设备由电动机、扭矩测量轴、滚动轴承测试模块、飞轮和负载电机组成,测试轴承型号均为 6203 型号滚动轴承,损伤类型分为人工损伤和真实损伤,振动信号的采集频率 64kHz,真实损伤数据是在加速寿命试验下仿真实损坏的轴承,更接近实际设备工作下的轴承故障。本研究选取在工况为转速n=1500r/min、负载扭矩0.7Nm、轴承上的径向力 1000N 下获取的真实损伤振动数据进行分类评估,分为 13 种故障状态和
34、1 种正常状态。试验时,将振动数据进行分割,每 1024 个采样点为一个样本,每类数据构造 2000 个样本,并按照 7:2:1 的比例将样本随机分为训练集、验证集和测试集,样本数量分别为 1400、400 和 200。采用独热编码方式为每个故障类型赋标签,具体如表 2 所示。由于应用对象是架空索道,索道在工作过程中不断加载卸载,驱动装置轴承处于变负荷工作状态,为了探究模型在不同负载工况下的鲁棒性和泛化性能,选取不同负载工况振动数据的凯斯西储大学(CWRU)数据集中 12kHz 下的驱动端轴承振动数据进行试验,电机载荷分别为 0.735、1.47、2.205kW,数据包含正常轴承数据、第14期
35、段洁利等:基于一维轻量化 CNN 的山地索道轴承故障诊断73滚动体故障轴承(rollingelementfailurebearings,BF)数据、内圈故障轴承(innerringfailurebearings,IF)数据、外圈故障轴承(outerringfailurebearings,OF)数据,每种类型有 3 种损伤直径,分别为 0.177、0.355 和 0.533mm,共有 10 种类别。将数据集分为 3 个子数据集 A、B、C,分别对应 0.735、1.47、2.205kW 三种电机负载。表2PU 数据集Table2Paderbornuniversity(PU)dataset代号Co
36、de故障类型Faulttype代号Code故障类型FaulttypeK001正常KB24外圈内圈随机多处损伤 3KA04单一外圈损伤 1KB27外圈内圈随机多处损伤 1KA15单一外圈损伤 1KI14多处内圈损伤 1KA16重复外圈损伤 2KI16单一内圈损伤 1KA22单一外圈损伤 1KI17多处内圈损伤 1KA30重复随机外圈损伤 1KI18单一内圈损伤 2KB23外圈内圈多处损伤 2KI21单一内圈损伤 1数据处理方法与 PU 数据集相同,将振动数据进行分割,每 1024 个采样点为一个样本,每类数据构造2000 个样本,3 个子数据集 A、B、C 同样处理,按照7:2:1 划分训练集、
37、验证集和测试集,样本量分别为1400、400 和 200,具体参数如表 3 所示。为了直观展示不同负载状况及不同损伤直径下轴承的振动情况,通过 MATLAB 将内圈故障轴承(IF)的原始振动数据输出为时域振动信号图,如图 6 所示。由图 6 可以看出,在相同内圈损伤直径下,轴承在不同负载下的振动信号具有相似性,这也证明了本研究变负荷试验的可行性。表3CWRU 数据集Table3Casewesternreserveuniversity(CWRU)dataset损伤种类Typeofinjury损伤尺寸Damagesize/mm损伤种类Typeofinjury损伤尺寸Damagesize/mm正常0
38、外圈损伤0.355内圈损伤0.177外圈损伤0.533内圈损伤0.355滚动体损伤0.177内圈损伤0.533滚动体损伤0.335外圈损伤0.177滚动体损伤0.533a/(ms2)a/(ms2)a/(ms2)a/(ms2)a/(ms2)a/(ms2)a/(ms2)a/(ms2)a/(ms2)时间Time/s时间Time/s时间Time/s0.177 mm 0.355 mm 0.533 mm 20220220200.51时间Time/s20200.51时间Time/sa.0.735 kW 20200.51时间Time/sb.1.47 kW 20200.51时间Time/s20200.51时间T
39、ime/s20200.51时间Time/sc.2.205 kW 20200.5100.5100.51注:0.177、0.355 和 0.533mm 表示内圈损伤直径;a 为振动加速度。Note:0.177,0.355and0.533mmrepresentinnerringdamagediameters;aisthevibrationacceleration.图 6不同负载下的内圈故障振动信号Fig.6Innerringfaultvibrationsignalunderdifferentloads为了验证所建模型在真实索道上的表现,在图 7a 所示的索道试验台进行试验数据采集。12341.电机2
40、.加速度计3.驱动端轴承端盖4.单片机a.索道电机振动采集装置a.Ropeway motor vibration acquisition deviceb.轴承故障示意正常轴承Normal bearing内圈损伤Inner ring damage外圈损伤Outer ring damage滚动体损伤Rolling element damageb.Indication of bearing fault图 7试验设备与轴承故障示例Fig.7Testequipmentandexampleofbearingfault数据采集于梅州市梅江区振声科技工业园,索道电机轴承型号为 6306-2RS,转速为 142
41、0r/min,使用加速度计和单片机采集轴伸端轴承振动数据,采样频率为12kHz,采集时间 240s,共获得 120000 个采样点。如图 7b,使用电火花技术对轴承进行单一损伤,试验数据包含正常轴承、内圈故障轴承、外圈故障轴承及滚动体故障轴承,每类损伤加工 0.3 和 0.6mm 两个深度,共有7种类别,具体参数如表 4 所示。试验数据处理与前文一致。表4索道数据集Table4Ropewaydataset损伤种类Typeofinjury损伤尺寸Damagesize/mm代号Code正常0N内圈故障0.3IF3内圈故障0.6IF6外圈故障0.3OF3外圈故障0.6OF6滚动体故障0.3RF3滚动
42、体故障0.6RF62.2训练策略2.2.1数据增强在 PU 数据集里,振动信号采样频率为 64kHz,每个故障状态下的采样点为 260000 个,以 1024 个采样点为一个样本的数据处理方法下:一个故障数据提供 250个数据样本;同样地,在 CWRU 数据集里,12kHz 采样频率下,每个故障状态下的采样点为120000 个,共120 个样本,索道数据集与 CWRU 一样,鉴于试验数据有限,采用重叠采样对振动数据进行增强处理,具体过程如图 8 所示。重叠长度Overlapping length步长Step50974图 8重叠采样Fig.8Overlappingsampling74农业工程学报
43、(http:/www.tcsae.org)2023年设定步长长度为 50,重叠长度为 974,按每次步长进行数据切片,得到 5000 个 PU 数据集样本、2500 个CWRU 数据集样本和 2500 个索道数据集样本,符合本研究样本需求。2.2.2Adam 优化器本研究采用 Adam21优化器,Adam 优化器结合AdaGrad 和 RMSProp 两种优化算法的优点,每一次迭代学习率都有一个确定的范围,能够减少参数更新的波动,使得模型收敛更加平稳,同时 Adam 优化算法通过梯度的一阶矩估计(firstmomentestimation,即梯度的均值)和二阶矩估计(secondmomente
44、stimation,即梯度的未中心化的方差)综合调整每个参数的学习率,目前针对一维深度学习故障检测的方法大多都采用 Adam 优化器优化损失函数。2.3试验设置2.3.1试验环境本研究仿真试验基于 64 位 Windows10 操作系统,处理器为 AMDRyzen7PRO1700Eight-CoreProcessor3.00GHz,运存为 16GB,配置 Python3.9 编程语言,所 有 算 法 均 采 用 深 度 学 习 框架 tensorflow-2.2.0 和keras2.3.1 搭建网络模型。2.3.2参数设置PU 数据集由于数据特征较复杂,分类难度相对较高,训练轮数(Epoch)
45、设置为 200 次。CWRU 数据集和索道数据集分类相对简单,特征较为单一,为了防止过拟合,训练轮数(Epoch)设置为 100 次。训练都采用Adam 优化器优化损失函数,使用 Adam 默认的初始学习率 0.001。损失函数采用交叉熵损失函数。在前期进行单变量试验中发现在 batchsize 为 128 时模型的识别准确率最好,同时参考文献 14-16,将试验的 batchsize 设置为 128。重叠采样的步长(Step)为 50。2.4评价指标为了有效评价模型的综合性能,采用准确率(Accuracy)、参数量(Params)、模型大小(Modelsize)和浮点计算量(FLOPs)。参
46、数量表示网络模型中可以训练的参数个数,浮点计算量是浮点运算的次数,浮点计算量越大,模型越复杂,模型大小表示模型在训练完之后的.h5 文件的大小。识别准确率 Ac计算式如下:Ac=PrPa100%(8)式中 Pr表示故障种类被正确预测的样本数量,Pa表示故障种类总体的样本数量。3试验结果与分析3.1模型综合性能对比3.1.1与标准 CNN 架构对比用 提 出的 1D-MRL-CNN 与 Resnet18、Resnet34、Resnet50、VGG1622、WDCNN、1D-Lenet5 及1D-Inception等 CNN 架构进行性能对比,由于本研究针对端对端的轴承故障分类,输入 10241
47、的振动信号,为了适应一维数据的输入,将几种网络架构中的二维卷积替换为一维卷积进行计算,并将几种网络架构在 PU 数据集上进行训练。1D-Inception 是用于一维故障诊断的 CNN,由Inception 结构组成;WDCNN 是 ZHANG 等23提出的用于一维振动信号进行故障诊断的 CNN,由 5 层一维卷积层和一个全连接层组成,在 CWRU 数据集故障分类上取得了很好的效果;1D-Lenet5 是 ABDELJABER 等24提出的改进 Lenet5 网络,用于对机械结构的损伤检测。为了避免试验的偶然性,对每种算法进行 10 次试验,结果取平均值,比较结果如表 5 所示。表5标准 CN
48、N 在 PU 数据集性能对比Table5PerformancecomparisonofstandardCNNonPUdataset方法Method准确率Accuracy/%参数量Params/kB浮点计算量FLOPs/M模型大小Modelsize/MBResnet1898.873802.89120.1444.80Resnet3498.257084.39204.3783.50Resnet5098.1411142.61411.07127.41VGG1697.6410073.45346.10121.631D-Lenet595.3113491.2717.21WDCNN98.4641.400.340.6
49、21D-Inception88.43274.451.244.741D-MRL-CNN99.4383.440.201.22表 5 结果表明,本研究提出的网络结构的参数量为83.44kB,是 Resnet18、Resnet34、Resnet50 和 VGG16的2.19%、1.18%、0.75%和 0.83%。1D-Lenet5 和 1D-Inception 的参数量分别是 1D-MRL-CNN 的 16 和 3.3 倍,浮点计算量分别是 1D-MRL-CNN 的 6.4 和 6.2 倍。虽然参数量相比 WDCNN 略高,但是计算负载更有优势。从准确率的角度看,残差结构网络(Resnet18、Re
50、snet34、Resnet50)都达到了 98%以上,相比 VGG16 的故障分类准确率更高,这也证明了残差结构的优越性;在同类型网络中,1D-Inception 和 1D-Lenet5 在 PU 数据集上的分类准确较低,仅有 88.43%和 95.31%,相比之下WDCNN 分类准确率更高,达到 98.46%,本研究提出的网络在 PU 数据集上的分类准确率最高,达到 99.43%,比 Resnet18、VGG16、1D-Lenet5 和 WDCNN 高 0.56、1.79、4.12 和 0.97 个百分点,因为本文模型拥有更深的网络深度,所以相比同类型的几种故障识别算法有着更强的特征提取能力