1、第 51 卷 第 2 期2024 年北京化工大学学报(自然科学版)Journal of Beijing University of Chemical Technology(Natural Science)Vol.51,No.22024引用格式:关晓晴,卫炳坤,牛东圣,等.基于多源域数据与机器学习算法的转子不平衡故障诊断J.北京化工大学学报(自然科学版),2024,51(2):109-119.GUAN XiaoQing,WEI BingKun,NIU DongSheng,et al.Rotor unbalance fault diagnosis based on multi鄄source dom
2、ain da鄄ta and machine learning algorithms J.Journal of Beijing University of Chemical Technology(Natural Science),2024,51(2):109-119.基于多源域数据与机器学习算法的转子不平衡故障诊断关晓晴1摇 卫炳坤2摇 牛东圣3摇 焦瀚晖2摇 胡东旭2摇 张雪辉2*(1.国华能源投资有限公司,北京摇 100007;2.中国科学院 工程热物理研究所,北京摇 100190;3.中国电建集团西北勘测设计研究院有限公司,西安摇 710065)摘摇 要:国内能源生产装置规模大型化发展趋势
3、明显,与其配套的旋转机械设备发生故障导致的非计划停机将会造成严重的经济损失与重大安全问题。转子不平衡贯穿了旋转机械设备的整个生命周期,服役转子的状态诊断格外重要。针对大型旋转机械振动测点较多,振动信号具有非平稳特征等问题,提出基于多源域数据提取与机器学习算法的转子不平衡故障诊断模型。首先以多源振动监测数据为驱动,根据互相关系数提取故障信息丰富的振动信号,融合时域、频域、时频域等多域特征构建高维混合特征空间;其次利用基于 t 分布的随机邻域嵌入方法揭示高维空间的特征信息,反映为可视化的三维空间;最终通过最邻近节点算法进行故障分类,判断转子的不平衡质量与相位。本文提出利用互相关系数表征多源数据的故
4、障信息丰富程度,并结合机器学习手段判断转子不平衡类型。通过设计不同附加质量的转子在多转速下不平衡状态实验,验证了所提模型的有效性,解决了转子在线诊断和现场动平衡问题。关键词:转子不平衡;多源域数据;智能故障诊断;旋转机械中图分类号:TH17摇 摇 DOI:10.13543/j.bhxbzr.2024.02.012收稿日期:2023-05-31基金项目:内蒙古重大科技专项(2020ZD0017);陕西省创新能力支撑计划(2023KJXX-086)第一作者:女,1974 年生,硕士,工程师*通信联系人E鄄mail:zhangxuehui 引摇 言在“碳达峰、碳中和冶的发展战略大背景下,国内能源生产
5、行业快速发展1,与之配套的高速旋转机械也向大型化、高速化和高精密方向发展。转子不平衡导致的设备非计划停机,不仅会造成经济财产损失,且可能带来灾难性的火灾、爆炸等安全事故2。高速转子在出厂时需要做动平衡实验,减少由于加工制造等因素造成的工频振动。但转子在长期服役状态下,由于积碳、积垢等原因,会发生渐发性不平衡故障,或由于转子零部件脱落、叶轮上有异物附着等,发生突发不平衡故障。如何在线监测并识别转子的故障状态并识别不平衡位置是目前国内外的研究热点3。随着计算机水平的发展和传感器技术的提升,基于机器学习的智能故障诊断方法成为目前研究领域的一个热点,其在诊断过程中减弱了专家经验的影响,更符合智慧电厂的
6、应用环境4。该诊断方法的一般流程为提取信号的故障特征,采用监督学习或者无监督学习的分类器最终给出分类。许多学者利用机器学习方法在转子不平衡诊断方面做出了卓有成效的研究工作。文献5-8基于转子的故障类型和故障机理,利用经验特征提取和机器学习相结合的方法提高了故障诊断的精度。孙斌等9提出了一种基于局部切空间排列和 k 最邻近节点(k鄄nearest neighbor,kNN)的转子故障诊断模型。万周等10针对转子不同故障类型的诊断问题,提出了一种基于参数优化对称点模式分析的智能诊断方法,该方法通过卷积神经网络模型对时域信号在极坐标系的散点图进行分类,从而判别转子的故障状态。肖幸鑫等11利用互补经验
7、模态分解结合支持向量机的方法对离心泵转子进行了故障诊断。钟志贤等12利用变分经验模态提取故障特征,采用模糊聚类分析判断不平衡状态,该方法可以识别变转速工况下的不平衡状态。Yan 等13利用振动信号产生轴心轨迹图,并引入深度置信网络模型对多源异构信息进行处理和分类,来判断转子的不平衡状态,该方法通过轴心轨迹考虑了多数据源融合问题。文献5-18采用机器学习的方法为转子故障诊断的进一步研究提供了极具价值的理论与实验基础,但依然存在以下问题:(1)以上算法均是针对单一的已知故障位置的测点进行振动信号的分析,然而大型旋转机械的振动监测位点较多,如果针对每一个测点都进行数据提取,监测系统负担过大,监测成本
8、过高;(2)特征参数受转速变化影响较大,以上文献并未对多转速状态进行分析;(3)对于工程实际而言,仅诊断出转子处于不平衡状态无法有效帮助设备的运行与维护,重点在于确定不平衡质量的位置、重量、相位等信息。考虑到上述问题,本文提出一种基于多源域数据提 取(multi鄄source domain data extraction,MS鄄DDE)的高速转子不平衡故障诊断方法。首先,利用相关系数选取所有测点中的故障敏感测点,剔除冗余信息。然后,对故障敏感测点的振动数据进行时域、频域、时频域特征提取,构建高维混合空间;利用t 分布的邻域随机嵌入(t鄄stochastic neighbor embed鄄din
9、g,t鄄SNE)算法对高维特征数据进行降维和可视化。最终,采用 kNN 算法进行故障分类,实现故障智能识别。该算法能够有效地筛选多源测点信息,对采集的数据进行多域特征融合,从而综合智能地判断转子的故障状态。1摇 多源域数据提取与机器学习算法诊断模型1郾 1摇 多源数据筛选机械零部件在长期服役过程中,随着运行状态劣化,其振动信号中会出现周期性的分量14,自相关系数也随之增大。对于同源数据,即同一传感器在不同时间段采集的数据而言,随着设备的故障状态的劣化,其正常状态的数据与故障状态的数据的互相关系数会小于正常状态数据之间的互相关系数。因此计算得到同源数据之间的互相关系数,互相关系数较小的数据即为包
10、含故障信息较多的数据。互相关系数计算公式如式(1)所示15。R(Cx,y(子)=maxCx,y(子)滓x滓y(1)式中,下标 x 表示该传感器采集的正常振动数据,下标 y 表示该传感器采集的故障振动数据;Cx,y(子)表示正常振动信号与故障振动信号之间的正协方差函数;滓x表示正常振动数据的标准差,滓y表示故障振动数据的标准差。R(Cx,y(子)沂0,1,R 越小代表相关性越差,即所存在的故障信息越多。在王庆锋等16通过统计学习方法建立的机械设备健康状态评价准则中,互相关系数小于 0郾 5 时设备已偏离正常状态,因此在实际工程环境中可以选择最小互相关系数的信号源或利用文献16提出的机械设备健康状
11、态评价准则对源信号进行筛选。1郾 2摇 多域数据融合对振动信号提取时域特征17、频域特征18、时频域特征19是原始信号分析的常用技术手段。如表 1 所示,时域特征是信号原始波形的统计学处理。1 6 号特征为有量纲参数,与此时的振动幅值有较大关系,其中特征 1 为信号的绝对平均值,特征 2 表征信号的离散程度,特征 3、4 对冲击成分较敏感,特征 4 是离心机组与汽轮机组常用的监测参数,特征5、6 反映振动的能量,特征 7 12 为无量纲参数,对故障的早期特征比较敏感,且不受转速等因素的影响20。摇 摇 频域分析是对振动波形信号进行傅里叶变换,得到特征频率,根据故障的特征频率来判断设备的故障类型
12、。频域特征是对振动信号的频域成分进行的统计学处理,特征指标见表 2,其中 f1表征频域信号的平均能量;f2 f5主要表征频域信号能量的集中程度以及能量集中的位置;f6、f10 f13主要表征频域信号的频率谱功率收敛情况;f7 f9主要表征频域信号的频率的分布情况21。摇 摇 大型旋转机械由于结构复杂,其采集的振动信号往往是非平稳信号,而单纯地提取时域特征、频域特征不能反映某种频率分量出现的时刻以及相应的变化情况22。经验模态分解方法(empirical modedecomposition,EMD)由 Huang 等23提出,可以揭示某种频率分量出现的时刻及其变化状况。相较于小波分解,EMD 算
13、法基于信号本身的局部特征尺度,无需设置基函数,将振动信号分解后,即可求出每一011北京化工大学学报(自然科学版)摇 摇 摇 摇 摇 摇摇摇 摇 摇 摇 摇 摇 摇 摇 2024 年表 1摇 时域特征参数Table 1摇 Time domain characteristic parameters序号时域特征特征表达式1整流平均值t1=1N移Ni=1|xi|2方差t2=1N移Ni=1(xi-x)3峰值t3=max|xi|,(i=1,2,N)4峰峰值t4=maxxi-minxi,(i=1,2,N)5有效值t5=1N移Ni=1x2i6方根幅值t6(=1N移Ni=1|xi)|27峭度t7=1N移Ni=(
14、1xi-x)滓48歪度t8=1N移Ni=(1xi-x)滓39裕度因子t9=t3t610峰值因子t10=t3t511脉冲因子t11=t3t112波形因子t12=t5t1摇 摇 x 为采集到的振动信号幅值,N 为采样点数,滓 为振动数据的标准差。本征模态函数随时间变化的瞬时频率和瞬时幅值。对 EMD 分解后的振动信号求取特征值,便可提取时频域的相关特征。图 1 为本次实验转子模拟不平衡故障状态下采集的振动信号经过 EMD 分解后的各分量波形图。内涵模态分量(intrinsic mode functions,IMF)与残余模态分量(residual mode functions,Res)能够将原信号
15、完全复原。振动信号经过 EMD 分解之后得到具有周期且逐渐平稳的子序列,该子序列又与振动原始信号特征是相互对应的。IMF 分量的实际物理意义为各分量分别代表原始信号的各频率分量,并且按照从高频到低频的顺序依次排列。然而实际采用的信号不会保持完全稳定的频率和振幅。利用样本熵、相关系数以及峭度指标或其他综合性指标选择其中某一 IMF 分量进行重构并分析,选择结果也通常为前几阶频率变化明显的分量。从图 1 中可以看出9 个子分量中前3 个 IMF 的频率是最高的并且变化也是最为明显的,后面的子分量逐渐平稳化,由此可提取前 3 组分量,并计算其波形的有效值,将方表 2摇 频域特征参数Table 2摇
16、Frequency domain characteristic parameters序号频域特征特征表达式1频谱幅值样本均值f1=移Kk=1X(k)K2频谱幅值样本方差f2=移Kk=1(X(k)-f1)2K-13频谱幅值偏度系数f3=移Kk=1(X(k)-f1)3K(f2)34频谱幅值峭度系数f4=移Kk=1(X(k)-f1)4Kf25平均频率f5=移Kk=1(fkX(k)移Kk=1X(k)6频率均方根值f6=移Kk=1(fkX(k)移Kk=1X(k)7频率方差f7=移Kk=1(fk-f5)2X(k)K8主频带位置f8=移Kk=1(fkX(k)移Kk=1(f2kX(k)9频率能量集中度f9=移
17、Kk=1(fkX(k)移Kk=1(f4kX(k)移Kk=1X(k)10变异系数f10=f6f511频率偏度f11=移Kk=1(fk-f5)3X(k)Kf3612频率峭度f12=移Kk=1(fk-f5)4X(k)Kf4613标准化频谱均值f13=移Kk=1|fk-f5|X(k)Kf6摇 摇 X(k)为频谱幅值,fk为频率,K 为频谱的谱线数。差、有效值、峰峰值作为时频域的特征,如表 3 所示,共计 9 组。1郾 3摇 数据降维与可视化对振动信号提取 12 个时域特征、13 个频域特征、9 个时频域特征后并不能直接反映转子的不平衡信息,且高维度的特征矩阵增加了分类器的计算111第 2 期摇 摇 摇
18、 摇 摇 摇 摇 摇 摇 摇 摇 关晓晴等:基于多源域数据与机器学习算法的转子不平衡故障诊断图 1摇 IMF 分量及残差时域图Fig.1摇 Time domain waveforms of each IMF and residual表 3摇 时频域特征参数Table 3摇 Time鄄frequency domain characteristic parameters序号时频域特征特征表达式1IMF 方差i1=1N移Ni=1(xi-x)2IMF 有效值i2=1N移Ni=1x2i3IMF 峰峰值i3=maxxi-minxi,i=1,2,N过程,容易导致分类器陷入过拟合状态。数据降维是利用机器学习手
19、段,得到一组可以表示高维度信息的维度较小的变量。振动信号本身具有非线性和非平稳性,对其提取后的多域特征之间也存在非线性关系。t鄄SNE 算法是一种非线性的降维算法,由随机邻域嵌入算法改进而来,SNE 算法更关注于映射中数据的局部结构,容易陷入局部拥挤问题且优化困难。因此,Hinton 等24于 2008 年提出了 t鄄SNE 算法,利用 t 分布取代原低维空间的高斯分布,通过这种方式减轻了拥挤问题。它构建了一个高维对象之间的概率分布,使得相似的对象有更高的概率被选择,因此在高维度空间中接近的类别,在低维度空间中也更靠近。式(2)表示低维空间中的联合概率分布函数 qij,式(3)表示高维空间中的
20、联合概率分布函数 pij。qij=(1+椰yi-yj椰22)-1移k屹l(1+椰yl-yk椰22)-1(2)pij=exp(-椰xi-xj椰2/2滓2i)移k屹iexp(-椰xi-xk椰2/2滓2i)(3)式中,yi、yj为低维空间中的任意点对,椰yl-yk椰为任意不同两点间的距离。利用 KL 散度评判高维度数据和低维度数据之间的分布差异,采用梯度下降法优化目标函数,如式(4)所示。啄C啄yi=4移j(pij-qij)(yi-yj)(1+椰 yi-yj椰2)-1(4)1郾 4摇 故障分类与辨识t鄄SNE 算法作为可视化和降维手段并不能对数据的类别进行判断,因此本文利用分类算法进行故障判别。t鄄
21、SNE 算法本身降维后的结果为高维数据分布的低维分布,在空间上相同的分布更靠近。kNN 算法的原理是当预测一个数据的类别时,采用与它最近距离的 k 个样本点的类别来定义,这与 t鄄SNE 降维后的相同分布的数据点更靠近的原理较接近,因此利用 kNN 算法来定义 t鄄SNE算法降维后的数据类别是合理的。kNN 算法判断距离的公式为d(x,y)=(x1-y1)2+(x2-y2)2+(xn-yn)2=移ni=1(xi-yi)2(5)根据多数投票原则在所述低维特征空间中找出与待测数据特征向量最接近的 k 个样本点。k 值是kNN 算法的超参数,应小于单个样本容量且大于 1。t鄄SNE 算法不同类别的空
22、间分布更大,因此 k 值的选择可以较小,根据实践经验,k 值选择单个样本容量的 10%即可。1郾 5摇 模型框架基于多源域数据提取与机器学习算法的转子不平衡诊断模型的流程图如图 2 所示。首先,获取监测多个振动传感器的历史正常数据,计算各传感器历史正常数据与故障数据之间的互相关系211北京化工大学学报(自然科学版)摇 摇 摇 摇 摇 摇摇摇 摇 摇 摇 摇 摇 摇 摇 2024 年数,选取相关度最小的传感器数据作为模型的监测数据源。然后,对该数据源的数据提取时域、频域和时频域特征,构建高维混合特征空间。最后,利用 t鄄SNE 算法对高维特征数据进行降维和可视化,在三维空间内采用 kNN 算法进
23、行故障分类,输出故障类型。图 2摇 基于多源域数据提取和机器学习算法的高速转子不平衡故障诊断模型流程图Fig.2摇 Flow chart of high鄄speed rotor unbalance faultdiagnosis model based on MSDDE andt鄄SNE algorithm2摇 实验验证2郾 1摇 转子动力学实验如图 3 所示,转子动力学实验台由高速电机带动换挡齿轮箱与实验齿轮箱组成。高速电机通过变频器控制,转速在 0 3 000 r/min 可调。换挡齿轮箱与电机通过膜片式联轴器连接,低速档变速比为1颐 1郾 3,高速档变速比为 1颐 2郾 5。换挡齿轮箱通过
24、膜片式联轴器与传动比 1颐 5郾 32 的实验齿轮箱连接,实验齿轮箱高速轴设计转速 0 30 000 r/min。图 3摇 转子不平衡模拟实验台Fig.3摇 Rotor unbalance simulation test bench该高速轴轴端设计有两个配重轮盘,结构形式如图 4 所示。通过增加配重质量块来模拟转子不同的不平衡状态。实验齿轮箱分布有 8 个 8 mm 电涡流位移传感器,传感器采样频率 5 000 Hz,采样点数5 000。用于采集低速轴与高速轴振动的传感器分布如表 4 所示。图 4摇 配重盘结构形式Fig.4摇 Counterweight plate structure表 4摇
25、 实验齿轮箱传感器分布Table 4摇 Distribution of test gearbox sensors传感器编号位置A1低速轴驱动侧摇+45毅A2低速轴驱动侧摇-45毅A3低速轴盲端摇+45毅A4高速轴电机侧摇+45毅A5高速轴电机侧摇-45毅A6高速轴非电机侧摇+45毅A7高速轴非电机侧摇-45毅A8低速轴键相摇 摇 设计 3 个实验如下:实验一不增加配重质量块,转子本身动平衡等级为 G1郾 0 级,按照图 5 所示的高速轴升速曲线做升速实验,在各转速停留采集数据后进入下一转速;实验二在高速轴靠近电机侧的配重轮盘上的 0毅相位处增加 3郾 17 g 的配重质量块,按图 5 所示的高
26、速轴升速曲线升速;实验三在高速轴靠近电机侧配重轮盘上 90毅相位(相对于 0毅相位沿轴旋转方向)处增加 3郾 17 g 配重质量块,按图 5所示的高速轴升速曲线升速。将实验一在8 460 r/min 下 7 个振动传感器采集的某一组信号看作正常信号,选取实验二与实验三在8 460 r/min 转速下的各 10 组振动信号作为测试信号,计算正常信号与这10 组信号的互相关系数,并求取各传感器的互相关系数平均值,结果如图6 所示。从图中可以看出,A5 传感器采集的振动信号与正常状态下的正常信号互相关系数最低,即信号中存在的周期性频率更高,也就意味着其包含的故障信息更丰富。此外,本次实验二与实验三增
27、加的配311第 2 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 关晓晴等:基于多源域数据与机器学习算法的转子不平衡故障诊断图 5摇 高速轴升速曲线Fig.5摇 High鄄speed shaft lift curve图 6摇 各数据源互相关系数Fig.6摇 Correlation coefficients for each data point重质量块位于高速轴靠近电机侧的配重盘上,A4、A5 传感器更靠近故障发生位置,因此其互相关系数远低于其他传感器。A6、A7 为轴另一端的传感器,其互相关系数较高,A1、A2、A3 为低速轴上的传感器,其互相关系数最高。由此可以看出本文提出的利用互相关系数
28、筛选得到故障敏感测点的方法符合实际情况,所筛选数据更靠近故障发生位置,包含故障信息更多。2郾 2摇 同转速工况下的不平衡诊断2郾 2郾 1摇 常规频谱判断在高速轴转速为 8 460 r/min 时,采集实验一数据、实验二数据、实验三数据各 110 组。选取 3 组实验中 A5 传感器的某一时刻振动信号进行频谱分析,结果见图 7。从图 7 可以看出,实验一与实验二、三之间振动信号差别较大,实验一振动峰峰值在 20 滋m,实验二与实验三振动峰峰值在 30 滋m。同时构成振动的主要频率分布不同,实验一的主要频率幅值较低,峰值未高于 5 滋m;实验二与实验三工频频率峰值为12 滋m,是构成振动的主要特
29、征频率,明显图 7摇 时域波形与频域波形图Fig.7摇 Time domain waveforms and frequencydomain waveforms发生了不平衡故障,但实验二、三之间的频域波形一致。因此,常规频谱分析仅能判断实验二、三发生了不平衡故障,无法对不平衡故障的位置和相位进行判断。2郾 2郾 2摇 基于 t鄄SNE 与 kNN 的模型诊断选取实验一、二、三在 8 460 r/min 转速下的 100组数据作为训练数据,提取时域、频域和时频域特征后,利用 t鄄SNE 算法进行降维。如图 8 所示,训练数据经过降维后 3 种实验数据在空间中分割开来。利用 kNN 算法对测试数据4
30、11北京化工大学学报(自然科学版)摇 摇 摇 摇 摇 摇摇摇 摇 摇 摇 摇 摇 摇 摇 2024 年图 8摇 同转速实验数据可视化Fig.8摇 Visualization of experimental data atthe same rotational speed进行故障分类,实验一测试数据被分类为正常状态,3 种测试数据更靠近各自实验组别的训练数据区域。根据 kNN 算法,将 30 组测试数据进行分类,从分类后的混淆矩阵(图 9)可以看出,分类的准确率为 100%,即相同转速下的实验数据类别都可以准确识别。图 9摇 分类混淆矩阵Fig.9摇 Classification confusi
31、on matrix2郾 3摇 不同转速工况下的不平衡诊断对于有量纲参数,转速的变化会使数据产生较大波动。为验证模型对不同转速、不同不平衡质量的辨识有效性,设计了多转速、多不平衡质量的对比方案。该方案训练数据、测试数据的组成结构如表5、6 所示。摇 摇 按表 5、6 中数据结构提取 900 组数据后,计算特征并利用 t鄄SNE 算法降维与可视化。从图 10 中可以看出,“银冶代表的不同转速下的正常实验数据位于三维空间的左下方,3 种转速之间有一定间隔;表 5摇 多转速多不平衡质量训练数据Table 5摇 Training data of multi鄄speed and multi鄄unbalan
32、ce转速/(r min-1)无配重0毅配重 3郾 97 g90毅配重 3郾 97 g7 020100 组100 组100 组8 460100 组100 组100 组10 560100 组100 组100 组表 6摇 多转速多不平衡质量测试数据Table 6摇 Test data of multi鄄speed and multi鄄unbalance转速/(r min-1)无配重0毅配重 3郾 97 g90毅配重 3郾 97 g7 02010 组10 组10 组8 46010 组10 组10 组10 56010 组10 组10 组“姻冶 代表的“0毅配重3郾 97 g冶位于三维空间的中部;“绎冶代
33、表的“90毅配重 3郾 97 g冶位于三维空间的右后方。从训练数据的分布状态中可以看出,相同转速的 3 种实验数据在空间中分开,而相同实验的不同转速数据互相靠近。利用 kNN 算法对 3 种不平衡状态进行训练,测试数据的分类状态如图 11 所示,对于不平衡状态的分类准确率为 100%,表明本文提出的方法对转速并不敏感,融合后的多域特征表达了故障状态。图 10摇 不同转速实验数据可视化Fig.10摇 Visualization of experimental data atdifferent rotational speeds2郾 4摇 性能分析为了进一步验证基于多源域数据与机器学习算法的高速转
34、子不平衡故障诊断模型性能,设计实验与其他算法进行对比。2郾 4郾 1摇 不同数据源之间的对比采集互相关系数较高的低速轴驱动侧传感器511第 2 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 关晓晴等:基于多源域数据与机器学习算法的转子不平衡故障诊断图 11摇 实际类别与预测类别对比Fig.11摇 Comparison of actual categories andpredicted categoriesA2、低速轴非驱动侧传感器 A3 的振动数据,提取多域特征后进行 t鄄SNE 降维与 kNN 分类处理。不同数据源的分类识别准确度如图 12 和表 7 所示,可以看出 A2、A3 数据源的识别
35、准确度低于 A5 数据源。由此可得出,多源数据的选择是影响模型准确率的关键性因素,本文提出的利用互相关系数来选择数据源进行分类的方法的准确率更高。同时,3 组信号源对于正常数据均判断正确,对于故障数据的判别,A2、A3 数据源对不平衡相位之间识别的判断较差。图 12摇 不同数据源之间的对比Fig.12摇 Comparison between different data sources表 7摇 不同数据源的分类识别准确度Table 7摇 Classification recognition accuracy fordifferent data sources数据源总体准确率/%正常状态识别为不
36、平衡状态组数不平衡状态识别为正常组数不平衡状态之间识别错误组数A2+t鄄SNE+kNN93郾 3005A3+t鄄SNE+kNN82郾 20016A5+t鄄SNE+kNN1000002郾 4郾 2摇 不同分类算法之间的对比对 A5 传感器采集的数据,提取多域特征值后采用随机森林算法、主成分分析(principal compo鄄nent analysis,PCA)+kNN 算法进行分类。从图 13和表 8 中可以看出,同数据源情况下,基于 t鄄SNE与 kNN 算法的分类识别准确度高于其他两种算法,另外两种分类算法对不同不平衡状态之间的识别存在错误。图 13摇 不同分类算法之间的对比Fig.13摇
37、 Comparison between differentclassification algorithms表 8摇 不同算法的分类识别准确度Table 8摇 Classification recognition accuracy fordifferent algorithms分类算法总体准确度/%正常状态识别为不平衡状态组数不平衡状态识别为正常组数不平衡状态之间识别错误组数A5+PCA+kNN97郾 8002A5+随机森林97郾 8002A5+t鄄SNE+kNN1000002郾 4郾 3摇 参数敏感性分析机器学习方法分类准确度容易受参数的影响,本文采用的 t鄄SNE+kNN 算法涉及到的参数
38、有 t鄄SNE 算法的分类维度与 kNN 算法的 k 值大小。分类维度由于可视化要求一般选择 2 维或 3 维,经计算两种分类维度的准确率均为 100%,因此可根据需求选取。对于 k 值的选择,本文推荐为样本容量的 10%,一方面减小了计算复杂度,另一方面不会影响分类准确度。如图 14 所示,计算了 k 值从 1 到300 时的分类识别准确度。可以看出,随着 k 值从 1增至 199,识别准确度并不随着 k 值选择而变化;当k 值在 200 以上取值时,样本准确度逐渐下降。综合考虑计算复杂度与准确度,本文推荐 k 值选择为611北京化工大学学报(自然科学版)摇 摇 摇 摇 摇 摇摇摇 摇 摇
39、摇 摇 摇 摇 摇 2024 年样本容量的 10%。图 14摇 k 值变化对准确度的影响曲线Fig.14摇 Influence curve of k鄄value change on accuracy3摇 结论(1)本文提出利用互相关系数来表征故障信息的丰富程度,解决了大型转子振动测点多、多源信息识别困难等问题。对多源数据筛选后,提取时域、频域和时频域特征,构造高维度的特征空间。利用 t鄄SNE 算法揭示高维数据在低维空间的分布,通过kNN 算法实现故障的智能分类与诊断。对比其他数据源采集的信息,故障诊断准确率更高,证明该方法提取的数据源包含的故障信息更多。(2)提出的分类模型对不同转速、不同程
40、度的不平衡量均有良好的识别效果。通过实验对比其他转子不平衡诊断模型,所提模型具有更高的准确率,能够识别不同转速下的不平衡故障,具有更好的鲁棒性。本文提出的方法能够判断设备的不平衡故障,随着模型库的丰富,对不平衡质量与相位的识别可用于指导现场动平衡工作的开展。参考文献:1摇 陈海生,李泓,马文涛,等.2021 年中国储能技术研究进展J.储能科学与技术,2022,11(3):1052-1076.CHEN H S,LI H,MA W T,et al.Research progress ofenergy storage technology in China in 2021J.EnergyStorag
41、e Science and Technology,2022,11(3):1052-1076.(in Chinese)2摇 卫炳坤.旋转机械预测性维修支撑技术研究D.北京:北京化工大学,2021.WEI B K.Research on predictive maintenance supporttechnology for rotating machineryD.Beijing:BeijingUniversity of Chemical Technology,2021.(in Chinese)3摇 张雪辉,焦瀚晖,胡东旭,等.旋转机械现场动平衡方法研究进展J.机电工程,2021,38(11):1
42、367-1377.ZHANG X H,JIAO H H,HU D X,et al.Research pro鄄gress on field dynamic balancing method of rotating ma鄄chineryJ.Journal of Mechanical&Electrical Engineer鄄ing,2021,38(11):1367-1377.(in Chinese)4摇 徐波.基于机器学习的旋转机械故障诊断方法的研究D.武汉:武汉科技大学,2019.XU B.Research on fault diagnosis of rotating machinerymetho
43、d based on machine learningD.Wuhan:WuhanUniversity of Science and Technology,2019.(in Chi鄄nese)5摇 李谦.基于深度学习的转子故障诊断研究D.宜昌:三峡大学,2021.LI Q.Research on fault diagnosis of rotor based on deeplearningD.Yichang:China Three Gorges University,2021.(in Chinese)6摇 王煜轩.基于循环神经网络的转子系统故障诊断方法研究D.郑州:河南工业大学,2022.WANG
44、 Y X.Study on fault diagnosis method of rotor sys鄄tem based on recurrent neural networkD.Zhengzhou:Henan University of Technology,2022.(in Chinese)7摇 尹项根,乔健,贺儒飞,等.基于 FFT鄄LSTM 的变速抽蓄机组转子绕组短路故障和偏心故障诊断方法J.电力系统保护与控制,2023,51(6):73-81.YIN X G,QIAO J,HE R F,et al.FFT鄄LSTM鄄basedfault diagnosis method for a r
45、otor winding short circuitfault and rotor eccentricity fault of a variable鄄speedpumped storage unitJ.Power System Protection andControl,2023,51(6):73-81.(in Chinese)8摇 杨敬娜,郝克明,朱霄珣,等.激励下齿轮-转子系统故障模糊 C 聚类诊断J.机械设计与制造,2023(4):296-299.YANG J N,HAO K M,ZHU X X,et al.Fuzzy C鄄clus鄄tering diagnosis of gear鄄ro
46、tor system fault under excitationJ.Machinery Design&Manufacture,2023(4):296-299.(in Chinese)9摇 孙斌,刘立远,牛翀.基于局部切空间排列和 K鄄最近邻分类器的转子故障诊断方法J.中国机械工程,2015,26(1):74-78.SUN B,LIU L Y,NIU C.Rotor fault diagnosis methodsbased on local tangent space alignment and K鄄nearestneighbor J.China Mechanical Engineering,
47、2015,26(1):74-78.(in Chinese)10 万周,何俊增,姜东,等.基于参数优化 SDP 分析的711第 2 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 关晓晴等:基于多源域数据与机器学习算法的转子不平衡故障诊断转子故障诊断方法J.振动与冲击,2023,42(1):81-88.WAN Z,HE J Z,JIANG D,et al.Rotor fault diagnosismethod based on parametric optimization SDP analysisJ.Journal of Vibration and Shock,2023,42(1):81-88.
48、(in Chinese)11 肖幸鑫,宋礼威,张翊勋,等.基于 CEEMD 与 SVM的离心泵转子不对中故障诊断方法研究J.流体机械,2022,50(7):85-92.XIAO X X,SONG L W,ZHANG Y X,et al.Researchon fault diagnosis method of centrifugal pump rotor mis鄄alignment based on CEEMD and SVMJ.Fluid Machin鄄ery,2022,50(7):85-92.(in Chinese)12 钟志贤,马李奕,蔡忠侯,等.基于 VMD_MPE 和FCM 聚类的变转
49、速工况下转子不平衡故障诊断方法J.振动与冲击,2022,41(14):290-298.ZHONG Z X,MA L Y,CAI Z H,et al.Method of rotorunbalance fault diagnosis under variable鄄speed conditionsbased on VMD_MPE and FCM clusteringJ.Journal ofVibration and Shock,2022,41(14):290-298.(inChinese)13 YAN J H,HU Y Y,GUO C Z.Rotor unbalance fault di鄄agnos
50、is using DBN based on multi鄄source heterogeneousinformation fusionJ.Procedia Manufacturing,2019,35:1184-1189.14 屈梁生,何正嘉.机械故障诊断学M.上海:上海科学技术出版社,1986.QU L S,HE Z J.Mechanical fault diagnosis M.Shanghai:Shanghai Scientific&Technical Publishers,1986.(in Chinese)15 何正嘉,曹宏瑞,訾艳阳,等.机械设备运行可靠性评估 的 发 展 与 思 考 J.