一种基于非线性流形学习的故障特征提取模型

文件大小：416.94KB
浏览次数：
发布时间：2017-07-31

文件介绍：

本资料包含pdf文件1个，下载需要1积分

A fault feature extraction model based on nonlinear manifold learningJIANG Quan-sheng ，LI Hua-rong ，HUANG Peng(1.School of Electrical Automation，Chaohu University，Chaohu 238000，China；2.School of Mechanical Engineering，Southeast University，Nanjing 21 1 189，China)Abstract： Manifold learning is one of effective methods to obtain geometric distribution feature in high-dimensionalnonlinear data，it can be used for fault signal feature extraction and diagnosis.Aiming at the diagnostic problems withnonlinearity and complex failure symptoms in mechanical fault diagnoses，a feature extraction model based on manifoldlearning method was proposed.With the model，aiming at different processing cases of the collected sample，LaplacianEigen-maps algorithm and its incremental，and a supervision algorithm were applied to implement feature extraction andclassification of fault samples.As a result of the non-linear dimension reduction method，the model greatly retained theoverall geometry information of fault signals，it significantly enhanced the classifcation performance of fault patternrecognition.The test results of fault diagnosis of an air compressor demonstrated the feasibility and effectiveness of theproposed mode1。

Key words：nonlinear manifold learning；feature extraction；fault diagnosis；Laplacian Eigen-maps目前，大型机械设备的结构与工作状况的复杂性及其非线性特性日益突出，设备运行监测数据蕴含了机械设备在整个运行历程中的所有信息，如何从这些数据中提取有效特征信息，判定设备的运行状态并对所发生的故障进行准确诊断，对于现有的故障诊断方法提出了新的考验。

特征提取是机械故障诊断的核心问题，也是进行故障模式识别的基矗如何选择和提取最有效的故障特征，不仅可以节省测试成本，还直接影响故障诊断的精度。随着现代信号处理方法的不断发展，-些新的特征提取方法相继被提出。魏中青等采用基于 MLE基金项目：国家自然科学基金资助项目(51005025)；安徽省自然科学牲金资助项目(11040606M114)收稿日期：2012-02-28 修改稿收到日期：2012-06-21第-作者蒋全胜男，博士，副教授，1978年7月生阈值规则的小波特征提燃术对气阀早期故障弱冲击变化信号进行特征提取，实现了气阀故障的早期预警。

夏天等对柴油发动机曲轴轴承采用基于高阶累积量的故障特征提取方法，能够有效地抑制噪声的干扰，较好地反映曲轴轴承的技术状态。潘宏侠等针对齿轮传动箱故障特征选择问题，提出了基于粒子群优化算法的特征提取方法，进-步提高了诊断精度。栗茂林等采用局部切空间排列算法对最优小波系数矩阵进行非线性约简，提出了-种基于连续小波系数非线性流形学习的冲击故障特征提取方法，有效提取出机械设备故障引发的冲击成分。

当前，虽然故障诊断理论和方法的研究取得了较大的进步，但对于不确定的、非线性的复杂故障诊断问题，采用基于统计或信号处理的特征提取方法，其诊断效果十分有限。2000年在 Science上发表的三篇关于流形学习的研究成果，极大地推动了流形学习第23期蒋全胜等：-种基于非线性流形学习的故障特征提取模型 133的发展。流形学习作为-种非线性的数据维数约简方法，能有效地揭示高维数据中蕴含的非线性结构，充分挖掘数据中的内在几何特征，具有良好的非线性复杂信息处理能力，从而为复杂机械设备的故障特征提取提供了新的思路。

本文采用非线性流形学习方法进行机械故障特征的提取与诊断，通过构建基于流形学习的故障特征提取模型，准确提取故障数据内在的非线性结构信息，以提高故障诊断的精度。

1 流形学习原理及方法1.1 流形学习定义流形是现代数学的概念，它以微分几何学为基础，本质上是局部可坐标化的拓扑空间，可以看作是欧氏空间的非线性推广。流形学习的数学描述如下 ]：假设为嵌入在D维欧氏空间中的d维参数化流形，《D，.厂：McR - ，为 R 上的紧致连接开子集。对于给定的高维观测数据集 X ，，，，i 1，2，，n，其中X 厂(Y )CR ，服从某种潜在分布P。这里，YY ，y ，，Y cR 是包含在R 欧式空间的d维域。流形学习的任务即从观测数据集中重构映懿f和 Y由流形学习的定义可知，流形学习去除了更多的先验假设，比如观测变量之间相互独立、分布近似满足正态分布等，是-种-般意义上数据集的本质属性。

流形学习具有在不依赖这些先验假设的情况下，发现并学习高维数据集的内在规律与性质的能力，这为故障特征提取提供了-个新的思路。

1.2 流形学习算法典型的流形学习方法有局部线性嵌入算法(LocalLinear Embedding，LLE)。、等距映射算法 (IsometricMapping，ISOMAP) 、拉普拉斯特征映射算法(Lapla-clan Eigenmaps) 、局部切空间排列算法(Local Tan-gent Space Alignment，LTSA) 等。其中 LaplacianEigenmaps算法的基本思想是利用图拉普拉斯算子的谱性质进行求解，寻找在某种意义上最优地保持局部邻域信息的低维表述。

Laplacian Eigenmaps作为-种典型的流形学习方法，以保持局部几何结构信息不变为目标，能挖掘嵌入在高维故障数据中的内在几何分布特性，具有良好的学习非线性复杂数据的内在几何结构能力，可用于故障的特征学习和提龋Laplacian Eigenmaps算法具体步骤如下：(1)构造近邻图。给定邻域 k，用 k近邻或占邻域的方法计算每个样本点的邻域 Jr1(i)，1 i n。

(2)使用热核方式给每条边赋予权值，构建邻接权值矩阵；Wi：。 -f- / ) ∈，( (1) xp( Xi 0 otherwise其中参数t为热核宽度，其取值与邻域 k相适应。

(3)特征映射，计算图拉普拉斯算子的广义特征向量，求得低维嵌入。求解广义特征值问题，Lf aDfo其中D为对角矩阵，且 D ∑ ，得到的第 2个到第 d1个特征值对应的特征向量，即为样本集的低维嵌入坐标。

2 基于流形学习的故障特征提取模型在机械故障诊断过程中，特征提取是其中最重要而又最困难的环节，好的特征提取手段能够给出设备运行状态的准确描述，获得更好的故障诊断精度和速度。因此，寻求合适的特征提取方法成为提高机械故障诊断精度的关键。

本文基于流形学习方法，提出-种新的机械故障特征提取模型，该模型利用流形学习的非线性结构学习能力，对故障样本进行特征提取，将提取到的的低维流形特征作为分类特征，用于解决复杂机械系统的故障模式识别问题。所构建的基于流形学习的故障特征提取模型如图 1所示。

与传统的故障特征提取方式不同，该模型充分利用了流形学习挖掘数据非线性特性的优势，从故障样本的内在几何分布角度进行故障的特征提韧识别，可有效解决高度非线性、非结构化、高维度样本的故障诊断问监测设备对象i数据采集与预处理l初始高维样本集/ 无/il》 f。亨 l有 l有I 增量流形基于流形基于临督I 学爿的学习的流形学爿的I 特征提取特征提取特征提取i i if 低维儿何分布特，正 il分类别l Il诊断决策l流形 i学爿沦；jj图 1 基于流形学习的故障特征提取模型Fig.1 Fault feature extraction model based on manifold learning134 振动与冲击 2012年第 31卷题，为解决复杂的故障诊断问题提供了-条新的途径。

在基于流形学习的故障特征提取模型中，重点关注于如何获取有效的特征信息，解决故障分类问题。

该模型主要针对以下三种不同的应用诚：无标签故障样本的特征提取问题、故障样本不断更新情况下的特征提取问题以及含有标签故障数据的监督学习问题，采用不同的流形学习方法，进行故障样本的特征提韧模式分类。

2.1 基于Laplacian Eigenmaps的特征提取针对采集到的无标签故障样本的特征提取问题，采用基于 Laplacian Eigenmaps的特征提取方法，获得故障样本的低维几何分布特征，以利于故障分类和识别。

基于 Laplacian Eigenmaps算法的故障特征提取过程包含以下步骤：(1)将监测设备采集到的各种模式样本数据经信号预处理得到原始观测样本集，构成观测样本的模式空间；(2)用 Laplacian Eigenmaps算法对观测样本进行学习，获取其内在的几何分布特征，从而将样本从复杂高维的模式空问转化为低维的特征空间；(3)根据学习到的故障流形特征，将特征空间样本进行模式分类构成类别空间，并构造分类器；(4)对于未知故障样本，与原样本-同投影到故障类别空间，依据构造的分类器进行类别判别及分类。

Laplacian Eigenmaps算法从数据集的几何性质出发，能够挖掘数据的内在结构信息及其蕴含的整体几何特征，可以将提取到的流形特征应用于机械的故障特征识别，为故障分类提供客观依据。

2.2 基于增量 Laplacian Eigenmaps的特征提取针对故障样本不断更新情况下的特征提取问题，采用增量流形学习方法，以提高流形特征提取的自学习能力。

- 般流形学习算法采用批处理方法学习样本特征，不具有增量处理能力，需要解决增量流形学习问题。本文采用增量 Laplacian Eigenmaps算法进行故障样本的特征提龋增量 Laplacian Eigenmaps算法的实现步骤如下：(1)首先用 Laplacian Eigenmaps算法对原始样本集进行学习，得到对应的低维嵌入坐标 y。

(2)对于任-新增样本。，X 。∈ ，在原始样本中寻找的k个近邻点。其近邻点在低维空间相应的邻域为，y ，，y 。

(3)假定邻域内每个样本的映射关系不变，计算与其个近邻点间的权值矩阵 w，采用如下热核形式计算： exp(-l Ⅳ1- l /t)。

(4)对新增样本小保持其邻域局部映射关系不变，可计算其在低维空问的坐标 Y 为：Y ∑ N (2) 1该算法较好的保持了新增样本的邻域局部映射关系，以邻域内样本的权值矩阵求得新样本对应低维空间的位置坐标。当数据集实时更新的情况下，可保证提取的特征信息能够随新数据的增加而动态更新，从而有利于更新故障样本的诊断分析。

2.3 基于监督Laplacian Eigenmaps的特征提取如果采集到的故障样本是有标签的，可以充分利用样本的类别标签信息，进行基于监督流形学习的特征提取，进 - 步提高分类性能。故可对 LaplacianEigenmaps算法进行监督式扩展，采用监督 LaplacianEigenmaps算法完成有标签故障样本的特征提韧故障分类。

采用的监督 Laplacian Eigenmaps算法描述见文献[12]，该算法充分利用数据的局部几何信息和类别信息，将原始故障样本映射到新的特征空间，该空间在保持类内样本局部几何结构的同时，使得不同类样本在映射后的特征空间中具有可分离性，从而更有利于不同故障模式的分类处理。

基于监督 Laplacian Eigenmaps算法的特征分类方法实现如下：首先采用监督 Laplacian Eigenmaps算法将训练样本集映射至-个低维特征空间，并采用最近邻分类器构建故障分类器，再用 GRNN网络对训练集的低维映射过程进行估计，以获得未知测试样本的低维坐标，从而实现对测试样本的分类决策。监督流形学习算法充分利用了数据的类别信息，能提取有效的判别特征，获得更好的分类性能。

3 工程应用实例分析选取某公司动力厂现场运行的-离心空气压缩机组作为实例应用对象。该对象是-个多因素、强耦合、强非线性和难以建模的复杂系统。从运行的压缩机组采集到故障振动信号作为样本实例集，包含了三种类别故障：机械松动、油膜涡动及转子不平衡。数据集样本总数 N210，每类故障样本各 70个，以 1 024个采样点作为样本维数。数据集的点数少，维数高，呈现了较强的非线性特征。

3.1 应用实验通过建立的故障特征提取模型进行了如下三种情形的实验分析和应用：(1)无监督特征学习情况：分别用 PCA及 Lapla，eian Eigenmap算法对数据集进行特征提取，获取嵌人流形特征以进行模式识别分析。没定算法参数邻域因子 6，嵌入维数 d2。实验结果如图2所示。

(2)样本不断更新情况下的增量式学习情况：采用增量 Laplacian Eigenmaps算法对实例集进行特征提韧第23期蒋全胜等：-种基于非线性流形学习的故障特征提取模型故障分类，将实例集的210个样本点分成两个子集，随机选取各类的80%作为原始数据集进行训练，剩下的20%作为新增样本集进行测试。算法参数设定为：邻域因子 6，嵌入维数d2。实验结果如图3所示。

(3)有标签故障样本的监督特征学习情况：采用监督 Laplaeian Eigenmaps、PCA及 LDA方法对实例集进行特征提韧分类，随机选取各类的80%作为有标签训练集进行学习，剩下的20%作为测试集进行识别分类。算法参数设定为：邻域因子 10，嵌入维数d2。实验结果如图4所示。

图2 流形特征提取情况Fig.2 Feature extraction using manifold methodl35图 3 增量流形特征提取情况Fig.3 Feature extraction using incremental manifold method3.2 诊断结果对原始故障样本经过三种不同应用诚的流形特征提取，将各方法特征提润的特征样本均采用最近邻分类器进行故障分类，结果如表1所示。

由图2和表 1可以明显看出，用 PCA方法提取的2维特征分布中存在较严重的混叠，用最近邻分类器分类的正确率为59.92%，其分类效果较差；Laplacian Eigen-maps提取的流形特征有较好的类别可分性，其分类正确率为93.33%，可有效实现故障类型的分类判别。

图4 监督流形特征提取情况Fig.4 Feature extraction using supervision manifold method振动与冲击 2012年第 31卷在图3提取的 2维特征分布中，PCA提取到的 2维分布特征中三类样本有较大混叠，用最近邻分类器分类的正确率为51.36%；增量 Laplaeian Eigenmaps算法提取的特征类别可分性较好，其中仅有少量样本被错分，其分类正确率为 90.58%，在新增样本情形下也表现出良好的分类性能。

从图4和表 1可以看出，PCA和 LDA中有三类样本存在较大混叠，其类别可分性较差，各分类正确率分别为59.92%、71.55%；而监督 Laplaeian Eigenmaps算法的类别可分性得到明显改善，其分类正确率达到98.62%，表现出更佳的分类能力。

表 1 用最近邻分类器对各特征提取算法的分类正确率Tab.1 Classifcation accuracy of feature extractionmethodsusing nearest neighbor classifier通过前面的实验可以看出，采用基于 LaplacianEigenmaps、增量 Laplacian Eigenmaps和监督 LaplacianEigenmaps三种流形学习算法的故障特征提取方法，通过对高维故障样本进行学习，能够较好的获取数据内在的整体几何结构信息，对获取的结构特征易于进行故障分类器的构造与模式识别，表现出了较好的分类性能，实现了故障分类识别与诊断，其识别效果明显好于 PCA方法。

基于流形学习的故障特征提取模型在处理高维复杂故障样本时，经流形学习算法特征提取之后，极大地保存了原始的整体几何特征信息，更有效地反映出特征与故障之间的关系，使得故障诊断精度高于其它方法，实验证明是-种有效的故障特征提取方法。

4 结论针对机械故障诊断中高维度、非线性数据难以有效处理的问题，将流形学习方法应用于故障样本的特征提取，提出了-种基于非线性流形学习的故障特征提取模型。该模型针对三种不同的应用诚，分别采用不百j的流形学习方法，对于不断更新的故障样本采用增量算法，对于有标签故障样本采用监督算法，进行故障样本的特征提韧分类，具有良好的学习非线性数据内在几何结构能力～该模型应用于空气压缩机故障振动信号的诊断分析，能够有效地进行故障信号的特征提韧诊断，提高了故障诊断的有效性和诊断精度。

在应用的三种流形特征提取方法中，其提取特征的效果-定程度上受到邻域因子和嵌入维数等参数选取的影响，如何选认适的算法参数，将是下-步研究工作的重点。

文件列表

正在加载...请等待或刷新页面...

发表评论

更多..相关推荐

更多..最近更新