1、第 卷第 期 年 月机 电 工 程 .收稿日期:基金项目:国家自然科学基金资助项目()作者简介:刘文()男山东威海人硕士研究生主要从事船舶动力装置管理与保障方面的研究:.通信联系人:周智勇男博士教授硕士生导师:.:./.基于 的异步电机轴承故障诊断研究刘 文周智勇蔡 巍(海军潜艇学院 动力操纵系山东 青岛)摘要:针对异步电机轴承故障诊断问题提出了一种融合最大相关最小冗余特征选择算法()和自组织映射神经网络()的故障诊断方法并将其应用于轴承故障诊断的不同阶段 首先在实验室环境下搭建了异步电机故障诊断试验平台在不同电机状态下分别采集振动、电流和电压信号利用统计学方法获取了高维混合特征集然后以互信息
2、为背景利用 根据特征与状态标签间的相关性和特征间的冗余性筛选了具备强区分能力的特征以避免计算冗余和后验诊断性能下降最后采用 对异步电机健康和轴承故障状态进行了分类识别验证了 对异步电机轴承故障诊断的有效性以及 对故障诊断结果的影响 研究结果表明:基于 的异步电机轴承故障诊断方法能够准确地区分健康和故障状态测试集分类准确率达到使用 特征筛选能够将 维特征降低至 维缩短.的网络收敛时间并将分类准确率由 提升至 试验结果验证了基于 的异步电机轴承故障诊断方法对于异步电机轴承故障诊断问题的有效性且证实其具备良好的诊断效果关键词:自组织映射神经网络最大相关最小冗余特征选择算法互信息特征降维特征选择神经网
3、络算法 矩阵中图分类号:.文献标识码:文章编号:()():()().:()()()引 言异步电机是一种的重要电气设备其用途非常广泛 因此确保其安全稳定运行具有重要的意义 异步电机的潜在故障隐患会造成设备损伤 而轴承故障是异步电机故障类型中最常见的种类其占比可以达到 左右 因此对轴承故障进行诊断尤为重要目前轴承故障诊断的经典方法是提取振动信号故障特征进行分析判断陈宗祥等人将小波包分解、方差贡献率检验与经验模态分解方法相融合利用双谱分析的方法提取了调制在高频信号中的故障特征频率达到电机轴承故障诊断的目的但该方法的准确性易受到电机固有特性的影响 宿文才等人将极点对称模态分解算法、信息熵与相关性筛选方
4、法和 变换相结合提取了轴承关键特征并进行了故障诊断但轴承故障特征分量易淹没于基波和噪声易造成误诊和误判针对此类问题 等人提出了将深度学习和信息融合方法相结合采用了决策级信息融合技术对所有卷积神经网络的信息进行融合达到了对轴承故障进行精确诊断的目的但卷积神经网络结构复杂且需要大量训练样本才能达到较好的诊断精度此外电机电流信号分析法()也被应用于轴承故障诊断杨江天等人对定子电流进行了小波包分解通过对比各节点系数的均方根值和峭度指标变化情况判断电机是否存在轴承故障但该方法与振动信号分析方法类似 同样易受到环境因素和电机固有特性等问题的干扰 为了解决这一问题 等人提出了将振动信号、电流信号和温度信号相
5、融合的方法提取故障特征用于轴承故障诊断能够避免部分特征淹没于噪声的问题但高特征维度会导致计算冗余或掺入无用特征特征降维技术成为故障诊断方法十分重要的环节常用的特征降维方法有主成分分析法()和核主元分析法()等 但 方法可能存在筛除核心元素的问题造成诊断准确率下降而 对非线性关系特征不敏感需要人为调整核函数以取得较好的降维效果最大相关最小冗余特征选择()算法是以互信息为计量准则的特征降维方法能够筛选出与标签相关度最高且特征间冗余度最低的特征从而达到强化区分能力和提升精度的效果自组织映射神经网络()能够将高维空间中相似的样本点映射到网络输出层中的邻近神经元训练速度快具有良好的自组织性和鲁棒性基于此
6、笔者采用一种基于 的异步电机轴承故障诊断方法并在实验室环境搭建异步电机故障诊断试验平台首先笔者采集不同状态下的电机振动、电流和电压信号对信号进行时域和频域分析提取统计特征量然后利用 对特征重要性进行评估以互信息为评价准则在保证分类器准确率的前提下筛选强区分能力特征最后使用 对测试样本进行分类验证该诊断方法的有效性和正确性 基于互信息的特征降维笔者采用以互信息为基本背景的 算法对特征集进行降维处理.互信息的基本概念互信息的概念脱胎于信息论是变量间相互依赖程度的度量依据表示两个变量相同部分所占的比例下面笔者对基于互信息的特征降维算法中涉及的基本概念分别进行介绍)信息熵 信息熵是使用统计学的方法用于
7、体现随机变量所蕴含信息量大小的工具设随机变量 其信息熵的表达式为:()()()()式中:()为 发生的概率()在极限情况下当随机变量 中的变量均为 时()此时信息熵()表明该样本集包含的信息量为零因为随机变量 中仅含有变量 信息熵的引入能够帮助人们更好地理解数据的不确定性一般来说一件事情发生的可能性越高则代表信息熵越低说明该事件包含的信息量越少)联合熵 与信息熵类似联合熵是信息熵的一种推广 当有两个随机变量时使用信息熵的公式就可以得到联合熵它表示两个随机变量包含的信息总和假设有两个随机变量 和 其分布满足联合概率分布函数()则其联合熵的表达式为:()()()()条件熵 条件熵()表示在给定 变
8、量的第 期刘 文等:基于 的异步电机轴承故障诊断研究条件下 变量的不确定程度定义如下:()()()()()互信息 互信息可以用来衡量两变量间的相关程度假设有两个随机变量 和 它们满足联合概率分布()则变量 和变量 之间的互信息()表示为:()()()()()()由互信息定义可知当两变量间的相关性越大其互信息值也就越大反之当两个变量之间完全无关时互信息的值应当为 因此借由互信息值的大小即可判断变量间相互依赖的程度此外互信息还可以用熵进行表示公式如下:()()()()当互信息由熵值表达时可以看出变量 和变量 之间的互信息值的大小可以理解为变量 在变量 已给定的情况下其未知程度的减少量 如果在 能够
9、完全确定 则()此时两变量的互信息()()若 与 互不相关则()()此时()的值为 可见互信息可以理解为用于度量变量间独立程度的衡量标准)相关性 假设 为待选特征集合 为类标签集合 相关性用于表征特征集中的特征与标签集中的标签的关联程度采用互信息()直观体现()越大则特征向量与类标签关联度越高)冗余性 假设 为已选择的特征集合则冗余性表示待选的特征向量与 的相关性同样以互信息为衡量标准 若 与 的互信息值越大则表明待选特征 与已选择的特征集合 的冗余度越高该方法可以用于对冗余特征的筛除.算法流程 算法计算特征与类标签的互信息和特征与特征间的互信息以达到对特征进行筛选降维的目的 其算法流程如下:
10、步骤 初始化特征集合 假设 为已选特征集为待选特征集 为标签集步骤 对 中的特征执行下列步骤:)计算最大相关度 遍历 寻找与 间的最大相关性其评价准则为:()()()计算最小冗余度 遍历 寻找特征间的最小冗余度其评价准则为:()()()获取最大相关最小冗余特征:()()将所得特征放入 中并从 中删除该特征步骤 判断 中的特征数量是否已满足规定的终止条件若满足条件则输出 否则重复步骤.基于 的特征选择特征选择的目的是在不降低原有特征集包含信息量的基础上选择出能够表征电机运行状态的特征降低原有特征集维度提高运算效率笔者使用 算法进行特征选择其具体步骤如下:)采用增量选择的方法从原始特征集中选择 个
11、连续特征得到 个连续特征集)对比所有 个连续特征集()并将所有待选特征集送入分类器中进行对比选择出能够获得高分类准确率的 并将其纳入一个备选集合)在 中选择分类准确率最高的那部分 其中 值最小的待选集合即为特征选择后的最优特征集 基于 故障诊断方法.的概念及结构 是由芬兰学者 模拟人脑神经元自主学习的能力开发出的一种无监督、自学习的神经网络 它能够在庞大的样本空间中找到相似的部分并映射到低维空间中形成聚类并记住这种逻辑关系训练后的网络能够对输入样本进行自动分类 具有将高维数据映射至低维空间并保持原有数据拓扑结构不变的特点网络由输入层和输出层组成 与其他神经网络不同 不包含隐含层其结构更为简单算
12、法复杂程度低且有效 输入层与输出层间直接使用权值向量进行连接输出层中的每个神经元均与所有输入向量连接以保证输入向量能够在输出层上进行良好的映射 网络结构如图 所示图 中下层为输入层上层为输出层通过权值连接后相同类型的输入向量能够在输出层中进行自动聚类 图 输出层中不同颜色的神经元即代表不同的数据类别机 电 工 程第 卷图 网络结构示意图.神经网络算法步骤 神经网络属于竞争型学习神经网络 训练开始后输入向量会计算与之连接的所有输出层神经元之间的欧式距离以距离的远近作为神经元获胜的依据输出层中与该输入向量距离最小的神经元即为获胜神经元其有权利会同邻域范围内的所有神经元进行权值的更新使其与输入向量间
13、的距离进一步减小不同的输入向量可能在输出层中对应不同的获胜神经元因此输出层中不同位置的神经元均有可能被激活其算法步骤如下:步骤 设置输出层神经元个数、初始权值向量、学习率、邻域尺寸等参数以使网络初始化步骤 设数据样本集 中的输入向量()为 维 为迭代次数每次迭代从 中随机抽取()步骤 计算输出层中每一个神经元的权值和输入向量的欧式距离并找到输入向量()所对应的获胜神经元:()()()式中:为获胜神经元()为权值向量步骤 同步更新获胜神经元 及其邻域范围内的其他节点的权值:()()()()()()式中:()为邻域函数邻域内不同的节点根据距离的远近其权值更新的幅度不同步骤 更新网络参数:()()(
14、)/()()式中:()为学习率函数()为邻域尺寸函数二者均是时间(也即迭代的次数)的单调递减函数()的取值范围一般在()之间()为获胜神经元 与邻域内节点 之间几何距离的平方随着迭代的不断进行邻域函数也会不断地更新以使网络逐渐趋于收敛步骤 检查结果是否满足既定要求不满足则继续迭代满足要求则循环结束训练完成.可视化 矩阵()可对 的分类结果进行展示它以距离作为度量标准以二维网络结构显示结果 中的每个网格点表示该神经元与周围神经元之间的距离由聚类的性质可知聚类是利用数据的相似性对混乱的原始数据集进行聚合和分离从而划分出一定的类别 即是利用距离度量的方法使 分类结果可视化 可储存 中每一个神经元与其
15、邻近神经元间的距离数值的大小表示距离的远近为了更形象地表征这种距离度量方式笔者在 中引入 颜色并对不同的颜色赋予不同数据值:深色表示距离远、数值大浅色则代表距离近、数值小根据颜色的深浅即可判断距离的大小 相似性高(即距离小)的数据即属于同一类数据相似性小(即距离大)的数据即属于不同类数据 实际上只起到了存储 中神经元相对距离的作用并没有改变神经元位置 因此采用这种方法不但使 可视化还保留了原始数据的拓扑结构 试验验证.试验平台及试验设计笔者设计了一个异步电机轴承故障诊断试验台该试验台主要包括异步电机、直流发电机、电阻负载箱、传感器、数据采集仪和上位机等试验台总体布置图如图 所示图 故障诊断试验
16、平台.第 期刘 文等:基于 的异步电机轴承故障诊断研究该次试验中笔者所用异步电机型号为 轴承型号为 为了模拟轴承外圈故障笔者使用线切割机在轴承外圈处开贯穿型凹槽其中开槽宽度为.深度为.如图 所示图 开贯穿型凹槽的故障轴承.故障轴承安装于异步电机输出端试验过程中笔者设置健康和轴承故障两种运行状态分别采集振动、电流和电压信号 每种状态分别采集 组数据共计 组试验样本笔者按照 的比例对训练样本与测试样本进行分割如表 所示表 数据分组情况 电机状态训练样本/组测试样本/组健康轴承故障.信号分析及特征选择判断电机是否发生轴承故障需要选择合适的特征当出现轴承故障时原有的稳定运行状态被破坏其振动特性和电流特
17、性均会发生改变在不同运行状态下振动信号的时域波形对比图如图 所示图 振动信号故障前后时域对比图.机 电 工 程第 卷 由图 可以看出:轴承故障发生后 路振动信号均呈现出不同程度的幅值变化其中位于电机输出端的两路振动信号增幅明显位于电机上平面的振动信号增幅次之而位于基脚处的振动信号幅值增长幅度最小同时不同位置处的振动加速度传感器对于轴承故障的敏感度各不相同因此依靠其进行故障检测的可信度也不相同在不同运行状态下三相电流信号的时域波形对比图如图 所示图 三相电流故障前后时域对比图.由图 可以看出:当异步电机出现轴承外圈故障后三相定子电流幅值出现同步增长且增加幅度基本一致振动信号和电流信号均能在一定程
18、度上反映异步电机运行状态 笔者分别对振动信号和电流信号进行时域、频域处理提取统计特征形成高维混合特征集 其中时域特征包括最大值、平均值、方差、均方根、标准差、均方根形状因子、方均根值、方均根形状因子、偏度、峰度、波峰因子、纬度因子、脉冲因子频域特征包括平均频率、频率方差、偏态功率谱、峰度功率谱、频率重心、频率标准差、频率峰度、频率偏度此外笔者将部分电流信号的常用特征一并纳入特征集包括正序电流、负序电流、三相电流基波分量、正序阻抗和负序阻抗共得到 维特征 高维度特征集中可能含有部分冗余特征或无关性特征且会增加训练时间降低使用效能因此需要进行降维处理笔者采用 算法对原始特征集进行特征选择不同特征集
19、对应的分类准确率如表 所示表 不同特征集尺寸对应分类准确率对照表 特征集尺寸 准确率/()表 中列举了分类准确率高于 的待选特征子集其中当 时分类准确率均可达到 因此可以将特征集维度降低至 各特征所对应的互信息值如图 所示图 得到的特征互信息.由图 可以看出:互信息值各不相同反映出特征与类标签的相关性不同不存在同等相关性的特征即选出的特征间相关度较低 分类结果分析笔者利用 对训练样本进行迭代训练将样本特征映射到神经网络的不同区域再将测试样本输入并映射到已经训练完成的 平面中进行故障类型的判别 观察映射区域间的距离可使故障诊断可视化以原始高维混合特征集作为输入向量由此得到的 映射结构如图 所示图
20、 分别表示两种状态下的 组训练样本的原始特征和对应的状态标签在 上的映射拓扑结构其中图()中的数字表示每个被激活的神经元所对应的样本数量对应于图()的状态标签分布情况第 期刘 文等:基于 的异步电机轴承故障诊断研究图 原始特征在 上的映射与分布.经过筛选后得到的特征集在 上的映射结构如图 所示图 筛选特征在 上的映射与分布.由图 和图 对比可知:原始特征训练样本在 上的分布较为松散相同状态所代表的神经元之间的关联性不强电机两种状态间区分效果不明显经过筛选降维后特征样本在 上的映射更为均匀且被激活的神经元之间联系紧密区分效果明显笔者使用 图表现不同电机状态样本间的距离度量 中的每一个单元格均代表
21、了一种距离度量这种距离度量根据颜色的深浅进行直观展现单元格中的颜色越深代表距离越大也即两个相邻神经元之间的相似度越差浅色区域即代表相邻神经元具有高相似度笔者将原始特征和筛选后特征的训练样本分别在 中训练得到 图如图 所示图 不同特征下的 图.图 中白色区域代表相同状态样本聚集形成的子空间深色区域则是不同状态间因相对距离较远而形成的分界线图()和图()中两侧白色空间分别对应于图 和图 中对应标签状态的区域但图()中左侧白色区域中仍存在部分深色区域影响最终分类效果图()中左右两侧白色空间深色区域分界线明显且白色区域内部几乎不存在深色区域表明 在使用筛选得到的特征进行训练后能够获得更好的分类能机 电
22、 工 程第 卷力具备更强的状态区分能力为了验证测试样本在 训练集上的分类效果笔者使用原始特征和筛选后强区分能力特征分别对两种电机状态各 组测试样本进行 分类分类精度和时间参数如表 所示表 特征筛选前后 分类准确对比 特征集分类准确率/网络收敛时间/原始特征集筛选后特征集 由表 可知:笔者使用强区分能力特征进行 分类的测试样本明显拥有更好的分类准确精度且其网络收敛时间缩短.笔者将使用筛选后得到的强区分能力特征的测试样本投射到 上并观察其分类情况得到强区分能力特征测试集 分类图如图 所示图 强区分能力特征测试集 分类图.图 中的“”和“”对应图 中的健康和轴承故障标签两种状态类别能够从 图上进行直
23、观的区分分类效果十分明显图 中左侧白色子空间即对应健康状态右侧白色子空间则对应故障状态两者间由一条深色分界带分隔 但从图 中仍可发现部分测试样本落在深色分界带附近为了比较 模型的分类性能笔者分别建立支持向量机分类模型()和反向传播()神经网络分类模型在相同的训练样本和测试样本下进行识别分类比较得到了 种网络分类结果如表 所示表 种网络分类结果对比 诊断方式分类准确率/神经网络 由表 可知:与传统的 神经网络和 相比基于 的网络模型具有更高的分类准确精度 结束语笔者采用了 算法对多信号提取的高维混合特征进行了筛选并将其作为输入向量采用 进行了异步电机轴承故障诊断最后根据试验结果对 方法的有效性进
24、行了验证研究结果表明:)对比原始特征集和经过筛选的强区分能力特征在 上的映射拓扑结构可知 能够有效保留原始特征集包含的电机状态信息并可对两种状态进行有效区分)从强区分能力特征的测试集的 分类结果看分类准确率得到了显著提升达到 验证了该方法的有效性)观察保留强区分能力特征的测试集的 分类图可以发现该方法能够明显区分两种状态类别且分类边界清晰)相比于传统的 神经网络和支持向量机 拥有更高的分类准确率目前基于 的诊断方法能够有效解决异步电机轴承故障诊断问题 但异步电机还存在如匝间短路、轴不对中等故障情况因此笔者将在后续研究工作中考虑这些情况以增强该方法的普适性参考文献():陈宗祥陈明星焦民胜等.基于
25、改进 和双谱分析的电机轴承故障诊断实现.电机与控制学报():.():.宿文才张树团贺英政.基于 和快速谱峭度的电机轴承故障诊断.微电机():.第 期刘 文等:基于 的异步电机轴承故障诊断研究.():.():.杨江天赵明元张志强等.基于定子电流小波包分析的牵引电机轴承故障诊断.铁道学报():.():.():.():.李 平李学军蒋玲莉等.基于 和 的异步电机故障诊断.振动.测试与诊断():.():.:.():.():.汪开正黄亦翔张旭东等.基于 方法的电机故障诊断.机械设计与研究():.():.张 尧.基于互信息的特征选择方法研究.西安:西安理工大学自动化与信息工程学院.:.科弗托马斯.信息论基础.北京:机械工业出版社.:.():.雍菊亚周忠眉.基于互信息的多级特征选择算法.计算机应用():.():.权 伟魏豪马晨等.基于自适应增强形态滤波的滚动轴承复合故障分离法.轻工机械():.():.():.():.:():.():.本文引用格式:刘 文周智勇蔡 巍.基于 的异步电机轴承故障诊断研究.机电工程():.():.机电工程杂志:/.机 电 工 程第 卷