资源描述
基于EMD和SVM的传感器故障诊断方法
摘 要:为了解决自确认压力传感器的故障诊断问题,提出了一种基于经验模式分解(EMD)和支持向量机(SVM)的传感器故障诊断方法,该方法对传感器输出信号进行经验模态分解,将其分解为若干个固有模态函数(IMF),对每个IMF通过一定的削减算法增强故障特征,然后计算每个IMF和残余项的能量以及整个信号的削减比作为特征向量,以此作为输入来建立支持向量多分类机,判断传感器的故障类型。通过压力传感器的故障诊断结果表明,该方法能有效的应用于传感器的故障诊断中。
关键词:经验模态分解;支持向量机;特征提取;传感器故障诊断
Sensor fault diagnosis based on empirical mode decomposition and support vector machines
Abstract: To solve the fault diagnosis problem of self-validating pressure sensor, a sensor fault diagnosis approach based on empirical mode decomposition (EMD) method and support vector machines (SVM) is proposed. The EMD method is used to decompose the sensor output signal into a number of intrinsic mode function (IMF) components and a residue component. With some cutting algorithm, the IMFs with fault character are strengthened. After that, the energy of each IMF and residue component, and the average cutting ratio of all the IMFs and residue component are calculated, which are regarded as the feature vector. Then, the support vector machines for multi-classification used as fault classifiers are established to identify the condition and fault pattern of the sensor. Practical example of pressure sensor shows that the proposed approach can be applied to the sensor fault diagnosis effectively.
Key words: Empirical mode decomposition; Support vector machines; Feature extraction; Sensor fault diagnosis
传感器作为信息获取的源头,在自动的、智能的系统中发挥着重大的作用。它的测量结果直接影响系统的运行,影响分析、决策的正确性,特别是在化工,航天测试系统中,一旦传感器发生故障,后果将不堪想象,因此,对传感器故障进行检测和诊断就显得非常重要。
当传感器发生故障时,传感器输出信号主要表现为以下几种形式:偏差,冲击,周期性干扰,噪声干扰,漂移和输出恒定值。此时,传感器输出信号是非平稳的,信号频率成分比较丰富,采用单纯的时域分析或者频域分析都不能有效的检测出信号的故障特征。为此国内外学者将时-频分析方法应用于传感器故障信号的特征提取中,文献[1]对传感器输出信号进行小波变换,在不同的尺度上计算信号发生故障前后能量的变化率来检测压力传感器的各种故障。文献[2]利用小波包分解提取各个节点的能量,然后利用RBF(径向基函数)神经网络进行传感器故障诊断。经验模态分解方法(empirical mode decomposition, EMD)[3]是最近提出的一种新的信号时-频分析的方法,该方法基于信号的局部特征时间尺度,可以把信号分解成若干个固有模态函数(intrinsic mode function, IMF)之和,分解出的各个IMF分量突出了数据的局部特征,对其分析可以更准确有效的把握传感器信号的故障特征信息,并且EMD分解方法已经成功的应用于机械故障诊断的特征提取中[4,5]。本文利用EMD方法,将传感器输出信号分解为若干个IMF分量,对每个IMF分量通过一定的削减算法增强故障特征,计算每个IMF分量和残余项的能量以及整个信号的削减比作为特征向量,然后利用支持向量多分类机识别传感器故障类型,该方法有效的改善了传统分类方法的缺陷,如文献[2]中神经网络结构的选择、易陷入局部极小点、过学习问题等,具有非常优异的泛化、推广能力,特别是在小样本输入情况下,体现出更大的优势。
1 经验模态分解与特征提取
1.1 经验模态分解
EMD方法由Norden E. Huang 于1998年提出[3],该方法适用于分析和处理非线性、非平稳随机信号,并且迅速在水波研究、地震学及机械设备故障诊断中得到了应用。该方法可将任意信号分解为若干个本征模态分量和一个残余项,使本征模态分量成为满足以下2个条件的函数或信号:
(1) 在整个数据序列中,极值点的数量与过零点的数量必须相等或者至多相差一个。
(2) 在任何一点,由数据序列的局部极大值点确定的上包络线和由局部极小值点确定的下包络线的均值为零,即信号关于时间轴局部对称。
EMD分解的本质是一个筛选过程,具体的步骤见文献[3-4]。经过分解后,原始信号可表示为:
即EMD可将任何一个信号分解为个基本模态分量和一个残余项之和,分量分别包含了信号从高到低不同频率段的成分,则表示信号的中心趋势。
1.2 特征提取
本文以传感器故障时,输出信号的六种典型形式为例进行研究,包括:偏差(bias),冲击(spike),周期性干扰(cyclic),噪声干扰(erratic),漂移(drift)和输出恒定值(stuck)。具体的信号表现形式如图1所示。
图1 传感器故障时输出信号的六种典型表现形式
传感器发生故障时,输出信号会产生一些瞬变,表现在频域上就是某种或者某几种频率成分能量的改变,因此可以提取EMD分解后各个IMF分量的能量作为特征。图2是具有偏差故障的传感器信号经过EMD分解后各个IMF分量和残余项的波形图。可以看出偏差信号特征在各个IMF分量上都有反映,为了增强特征,对分解后的各个IMF分量和残余项进行了削减,图3是对图1的削减结果,可以看出,偏差信号的特征在各个IMF分量上都得到了增强。
图2 具有偏差故障的传感器信号EMD分解波形图
图3 IMF分量和残余项经过削减后的波形图
为了使提取的特征不受传感器输出信号幅值的影响,在进行EMD分解之前,对信号进行了标准化。具体的特征提取步骤如下:
(1) 对传感器信号进行标准化:
其中,表示传感器输出信号序列,为对应的均值,为的标准差。
(2) 对进行EMD分解,提取前5个IMF分量,以分别表示5个IMF分量序列,以表示残余序列。
(3) 为了增强IMF分量的故障特征,对IMF分量和残余项进行了削减。
a) 计算各个IMF分量和残余项的削减阈值:
其中表示IMF分量和残余项的长度,表示第个IMF分量第点的取值。
b) 对各IMF分量和残余项进行如下削减处理,并且求取各IMF分量和残余项的削减比。
,
其中为削减后的IMF分量和残余项,为对应分量的削减比,为其被削减掉的点数与其总点数之比。
(4) 计算各IMF分量及残余项的总能量,并且进行归一化,得到归一化能量,以利于模式分类。
,
(5) 计算总的削减比,构造特征向量,用于传感器故障诊断。
1.3 特征评估
为了对所选特征对于故障类型的可分性进行评估,计算了特征间的距离大小来对特征敏感度进行评估,其评估原则是:同一类的类内特征距离最小,不同类的类间特征距离最大,即某一特征同一类的类内距离越小,不同类的类间距离越大,则这一特征越敏感,该特征区分这些类别的能力就越强[6]。特征评估的步骤如下:
(1) 计算第类第个特征的类内距离:
其中表示样本个数,表示特征个数,表示类别个数,和分别表示第类第个和第个样本的第个特征值。由此可计算第个特征值个类的类内距离的平均值:
(2) 计算第类个样本第个特征值得平均值:
然后,可得第个特征个类的类间距离的平均值:
其中和分别表示第个和第个类个样本的第个特征的平均值。
(3) 计算第个特征的评估因子:
的大小反映了第个特征对个类进行分类的难易程度,越大,表示第个特征越敏感,越容易对个类进行区分。
按照以上方法利用训练样本对所选取的特征进行了评估,可得对应的七个特征的评估因子为:,均大于2,即能将七个类别区分开。同时也对文献[2]中的小波包能量特征进行了评估,其对于正常和输出恒定值故障两类的类间平均距离为0.0038,而对于正常类的类内平均距离为0.017,对于输出恒定值故障类的类内平均距离为0.028,所以文献[2]中的特征不能区分正常和输出恒定值故障。本文所提特征削减比对于正常和输出恒定值故障两类的类间平均距离为0.150,对于正常类的类内平均距离为0.013,对于输出恒定值故障类的类内平均距离为0.057,类间平均距离大于类内平均距离之和,所以能够区分正常和输出恒定值故障,随后的实验结果也证明了这一点。
2 支持向量多分类机设计
支持向量机(SVM)方法由Vapnik等人提出[7],被看作是对传统学习分类方法的一个好的替代,特别是在小样本、非线性情况下,具有较好的泛化性能。SVM方法建立在统计学习理论的VC维(Vapnik-Chervonenkis Dimension)理论和结构风险最小化原理基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折中,以获得最好的泛化能力。作为一种新的学习分类方法,SVM已经在故障诊断领域得到了成功的应用[4,5]。关于支持向量分类机的基本原理可参考文献[7,8,9]。
支持向量机是针对两分类问题提出的,对于多分类问题,主要有两种解决方案,一是一次性求解法,即直接建立多分类目标函数,进行优化求解,该种方法在求解最优化问题过程中使用的变量非常多,因计算复杂度过高而不实用。二是将多分类问题转化为多个两分类问题进行求解。该种方案主要包括一类对余类法,成对分类法,纠错输出编码方法和层次SVM多类分类法[10,11]。前三种方法都需要构造较多的SVM两分类机,并且存在不可识别域,因此本文针对传感器故障诊断问题设计了层次支持向量机多类分类机。
本文所研究的传感器状态包括正常,偏差,冲击,周期性干扰,噪声干扰,漂移和输出恒定值七种,所以需要建立了六个支持向量两类分类机(SVM1-SVM6),利用k-均值聚类算法,确定了层次多分类支持向量机的拓扑结构如图4所示。其中,SVM1为偏差与漂移对对其它类分类机,SVM2为偏差对漂移分类机,SVM3为冲击与周期干扰对剩余其他类分类机,SVM4为冲击对周期干扰分类机,SVM5为正常与输出恒定对噪声干扰分类机,SVM6为正常对输出恒定分类机。将六个两类分类机按照图4所示的形式组合,便成为1个可以分离七种状态的多分类机。该种多类分类机不存在不可识别域,分类时也不需要遍历所有的两分类机,具有较高的分类效率。
图4 支持向量多故障分类机
3 应用实例与分析
基于EMD和SVM的传感器故障诊断方法框图如图5所示,首先将原始信号标准化,然后采用EMD方法对标准化后的信号进行分解,对每一个IMF分量和残余项进行削减,计算削减后各个分量的归一化能量和总的削减比组成特征向量,最后利用设计的支持向量多分类机对传感器故障类型进行识别。
图5 基于EMD和SVM的传感器故障诊断流程图
本文以对所设计的自确认压力传感器的七种状态进行识别为例来对提出的算法进行验证。得到了压力传感器在七种状态下的各50组数据,按照1.2节中的步骤提取特征向量,随机选取七种状态下的数据各30组对所建立的支持向量多分类机进行训练,表1给出的是七种状态下传感器输出信号的各一个特征向量。
表1 传感器各种状态下的特征向量
传感器状态
特征向量
正常
[0.518,0.368,0.499,0.414,0.292,0.288,0.676]
偏差
[0.079,0.064,0.085,0.090,0.100,0.981,0.764]
冲击
[0.365,0.308,0.470,0.439,0.381,0.434,0.824]
漂移
[0.008,0.006,0.007,0.007,0.009,0.999,0.736]
周期干扰
[0.328,0.550,0.658,0.272,0.184,0.173,0.700]
噪声干扰
[0.729,0.457,0.338,0.257,0.189,0.197,0.764]
输出恒定
[0.526,0.369,0.491,0.413,0.290,0.285,0.757]
对余下的七种状态各20组数据输入到由七个支持向量机组成的多分类机中进行故障模式识别,结果表明,可以准确地区分出七种传感器故障状态,验证了该方法的有效性。
为了比较本文所提取特征与文献[2]中所提取特征的分类性能,对七种状态下各50组数据进行了3层小波包分解,提取了8个能量特征,然后利用七种状态下各10组对支持向量多分类机进行训练,利用余下的各40组进行验证,与本文方法的比较结果如表2所示。
表2 不同特征分类结果比较
特征提取方法
训练样本
测试样本
分类结果
正常
偏差
冲击
漂移
周期干扰
噪声干扰
输出恒定
本文方法
各10组
各40组
40
40
39
39
40
39
39
文献[2]方法
各10组
各40组
32
40
37
38
40
38
19
比较结果可以看出,文献[2]所提出的小波包能量特征不能区分正常与输出恒定两种传感器状态,而本文提出的特征可以区分,这与1.3节中,特征评估给出的结果相同。
为了比较支持向量机与RBF神经网络的收敛速度和分类性能,取相同的30组训练样本对两种分类器进行训练,然后对剩下的20组测试样本进行检验,结果如表3所示。所给结果是在奔腾2.0GHz处理器上,Matlab编程实现的环境下给出的。结果表明,在训练样本较多的情况下,支持向量机和RBF神经网络对故障类别的识别率相当,但支持向量机与RBF神经网络相比,收敛速度较快。
表3 支持向量机与RBF网络分类性能比较
分类方法
训练样本
测试样本
训练时间
分类结果
正常
偏差
冲击
漂移
周期干扰
噪声干扰
输出恒定
SVM多分类机
各30组
各20组
0.47 s
20
20
20
20
20
20
20
RBF网络
各30组
各20组
2.53 s
19
20
19
20
20
20
19
为了说明支持向量机更加适应小样本分类情况,取相同的10组训练样本对两种分类器进行训练,然后对剩下的40组测试样本进行分类,结果如表4所示。结果表明,当训练样本减少时,RBF网络分类性能急剧下降,而支持向量机仍然能够对测试样本具有较高的识别率,这也验证了支持向量机在小样本情况下仍然具有良好的预测和推广能力。
表4 小样本情况下支持向量机与RBF网络分类性能比较
分类方法
训练样本
测试样本
训练时间
分类结果
正常
偏差
冲击
漂移
周期干扰
噪声干扰
输出恒定
SVM多分类机
各10组
各40组
0.16 s
40
40
39
39
40
39
39
RBF网络
各10组
各40组
0.52 s
22
22
26
39
38
22
15
4 结论
1)对传感器输出信号进行EMD分解,分解出的各个IMF分量突出了信号的局部特征,通过对各IMF分量和残余项进行削减,进一步增强了传感器输出信号的故障特征,本文在此基础上计算各IMF分量和残余项的归一化能量和削减比作为特征向量,用于传感器状态识别。特征评估的结果表明,所提取的特征对于所研究的七种传感器状态具有很好的可分性。
2)设计了支持向量多分类机对七种传感器状态进行识别,将所设计方法应用于自确认压力传感器的故障诊断中,对本文所设计的特征提取方法与小波包分解特征提取方法进行了比较,结果表明基于EMD分解的特征提取方法在传感器故障状态识别中是有效的、实用的。
3)对支持向量机与RBF网络的分类性能进行了比较,结果表明,支持向量机与神经网络相比,具有训练时间短和鲁棒性强等优点,并且能有效的解决故障诊断中少样本问题。
参考文献:
[1] ZHANG Jian Qiu,YAN Yong. A wavelet-based approach to abrupt fault detection and diagnosis of sensor[J]. IEEE Transactions on Instrumentation and Measurement. 2001, 50(5): 1389-1396.
[2] 徐涛,王祁. 基于小波包神经网络的传感器故障诊断方法[J]. 传感技术学报. 2006,19(4): 1060-1064.
[3] HUANG N E, ZHEN Shen, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proc. R. Soc. Lond. A. 1998, 454: 903-995.
[4] PENG Zhi Ke, PETER W.T. A comparison study of improved
Hilbert–Huang transform and wavelet transform:Application to fault diagnosis for rolling bearing [J]. Mechanical Systems and Signal Processing. 2005,19(5): 974-988.
[5] 程军圣,于德介,杨宇. 基于内禀模态奇异值分解和支持向量机的故障诊断方法. 自动化学报[J]. 2006, 32(3): 476-480.
[6] 雷亚国,何正嘉,訾艳阳,湖桥. 基于特征评估和神经网络的机械故障诊断模型[J]. 西安交通大学学报. 2006,40(6): 558-562.
[7] VAPNIK V. The nature of statistics learning theory[M]. New York: Springer Verlag, 1995: 20-60.
[8] ZAHO Qun, PRINCIPE J C. Support vector machines for SAR automatic target recognition[J]. IEEE Transactions on Aerospace and Electronic Systems. 2001, 37(2): 643-654.
[9] GENTON M G. Classes of Kernels for Machine Learning: a Statistics Perspective[J]. Journal of Machine Learning Research. 2001,2: 299-312.
[10] 宋乃华,邢清华. 基于支持向量机的空中目标大类别分类[J]. 系统工程与电子技术. 2006,28(8): 1279-1281.
[11] 赵晖,荣莉莉,李晓. 一种设计层次支持向量机多类分类器的新方法[J]. 计算机应用研究. 2006,6: 34-37.
需要说明的是:
(1)摘要的撰写:摘要内容(200字左右),杜绝背景信息,直奔目的、方法、结果、结论。(小五仿宋)
目的——研究、研制、调查等的前提、目的和任务,所涉及的主题范围。
方法——所用的原理、理论、条件、对象、材料、工艺、结构、手段、装备、程序等。
结果——实验的、研究的结果、数据,被确定的关系,观察结果,得到的效果、性能等。
结论——结果的分析、研究、比较、评价、应用,提出的问题等。
(2)篇幅:全文(计空格、图表占位)一般不超过6000汉字。
展开阅读全文