热门关键词:

基于流形学习和K-最近邻分类器的旋转机械故障诊断方法

  • 该文件为pdf格式
  • 文件大小:390.54KB
  • 浏览次数
  • 发布时间:2014-11-22
文件介绍:
本资料包含pdf文件1个,下载需要1积分

Fault diagnosis method for rotating machinery based onmanifold learning and K-nearest neighbor classifierSONG Tao ,TANG Bao-ping ,LI Feng(1.The State Key Laboratory of Mechanical Transmission,Chongqing University,Chongqing 400044,China;2.School of Manufacturing Science and Engineering,Sichuan University,Chengdu 610065,China)Abstract: Considering the disadvantages existing in conventional fault diagnosis methods for rotating machinery,such as necessity of manual intervention,low accuracy and dificulty to obtain fault samples,a fault diagnosis method wasproposed based on manifold learning and K-nearest neighbor classifier(KNNC).Multi-domain information entropy ofvibration signal was extracted to reflect fully the working status and construct high-dimensional characteristic sets.Thenthe second feature extraction propey of the nonlinear manifold learning algorithm ,oahogonal neighborhood preservingembedding(ONPE),was used for dimensionality reduction and to make the features get beter clustering property。

Finally,improved KNNC was used for pattern classification.The method is more suitable for smal sample classification。

A diagnostic case of a bearing proves the effectiveness of the mode1。

Key words:manifold learning;ONPE;inform ation entropy;dimensionality reduction;pattern recognition大型旋转机械均存在多部件耦合振动、振动噪声干扰巨大、信号非平稳、非线性,早期故障征兆不明显等特点,导致故障诊断精度低,需人工干预诊断等问题。通常先利用时、频域分析对信号进行特征提取,人工特征选取,再利用神经网络或人工智能等技术进行识别 J。在特征提取上,无论单个特征或单域特征,均难以全面准确地刻画复杂工况下机械状态特性,需进行多域特征融合才能提高诊断精度 I4j。但多域特征中存在部分特征冗余,部分特征出现冲突等问题 ,流形学习算法可在尽量保证数据间几何关系和距离测度不变前提下对高维特征集进行维数约简 J,降低特征冗余和冲突,再进行模式识别即能有效回避人为特基金项目:国家自然科学基金资助项 目(51275546);重庆市自然科学基金杰出青年基金项 目(CQ cstc201ljjq70001)收稿日期:2012-01-O5 修改稿收到 日期:2012-04-09第-作者 宋 涛 男 ,博士生,1987年7月生通讯作者 汤宝平 男 ,博士,教授,1971年9月生征选韧提高精度。模式识别常用的神经网络或人工智能等方法计算复杂,结果不稳定,且不适用于小样本模式识别。

为此,本文提出基于多域特征融合 -维数约简 -模式识别的故障诊断模型。先从时、频域上构建多种信息熵 提取高维特征集,再用 ONPE流形学习算法 进行维数约简,最后,基于 KNNC 9 并对其进行改进,扩充原训练样本并剔除部分噪声数据,进行分类和识别,从而实现旋转机械故障诊断。

1 基于信息熵的多域特征提取设 E为信号序列 Z的某-广义表示形式,e ,e:,,eN为信号 Z的正交特征划分,即:E e ,且 ei n , Vi ,N为该正交划分下的特征子空间个数,则该正交划分下 的信息熵表示为:N - N日(E) ,piln 1p - pilnp ( )振 动 与 冲 击 2013年第 32卷其中:p P(e )(i1,2,, )表示特征子空间 e 的~组分概率,且∑p 1。当各子空问之间分配均匀时,即p P P 1/N时,信号的不确定程度最大,信息熵也最大,值为 lnN∩见信息熵取值范围依赖于所划分的子空问数量,不利于进行信号的定量分析与比较。

因此,对计算所得信息熵进行标准化为:- ∑P l(e) (2)对振动信号在时、频域进行不同的正交特征划分,分别提取奇异谱熵、幅值谱熵、功率谱熵、倒谱熵、自相关特征熵、小波能谱熵,如表 1所示。对每组数据分别构建六种信息熵值作为维数约简的输入高维特征,表示为:X (e), (e),H3(e), (e), (e),H6(e)(3)表 1 多域信息熵构建Tab.1 Multi-domain information entropy construction信息熵类型 特征子空间组分概率 特征子空间含义2 基于ONPE的特征约简设多域特征提润的特征集为 XX ,X ,,X ∈R。 ,即样本数为 rt,特征维数为 D,降维后的特征集为 Y:Y ,Y ,,Y ∈R ,即维数为 d,d

2.1 非奇异处理很多情况下,D>n,即原数据的特征数大于样本数,此时矩阵XX ∈R胁。为奇异矩阵,不利计算,为此,可在不损失任何信息条件下将数据点 X 投影到 PCA子空间,丢弃对应特征值为0的成分,使矩阵 XX 为非奇异。设 PCA投影矩阵为A ,为描述方便,经 PCA转换后特征集仍用 表示。

2.2 构造邻接图 G对输入特征集任-节点X ,找出距离最近的 个邻域节点xj,从X 到xj连-条有向的边,设权值为 ,每个节点 X 可通过其 个最近邻线性重构,权值 描述节点 对节点 i的重构贡献,X 与 Xj越近,则 越大,若节点 i与节点 之问无边界,则 Wi. , 0。权值矩阵可通过最携重构误差函数得到:(w)∑ -∑Wixi l (6)增加约束条件∑ :1,( 1,2,,n)。重构误差可对每个数据点分别最携含约束的权重矩阵,解析解为:∑(G, )其中: ( -xj) (X -X ),Xj、X 为X 的k近邻点,G (X -X ) (X -X ),X 、X 为 X。的 k近邻点。权值矩阵 w表征了高维特征集内在邻域结构几何关系,后续降维过程基于此邻域结构求解低维特征集,可保证数据间几何关系不变。

2.3 计算ONPE正交投影向量令正交映射矩阵为A。Ⅲ咂(口 ,Ⅱ:,,o ),考虑极限情况,将高维数据集 映射到-维直线上,映射结果表示为Y( ,y:,, )∈R ,YaTX。根据降维后数据几何结构不变性,直线上每个数据均可表示为其邻域点的线性重构,基于重构误差最小的原则,最携代价函数:咖( )∑( -∑W ) (8)其中: ,为已知,需优化 。定义:Z -Wy (,-W)y ,则:ck(y)zTz (,-W) (I-W)y aTXMX n(9)其中:M:(I-W) (I-W),增加约束 aTxx n:1。令aTXMX ⅡAAaTXXTa,则:(XX )-XMX nAa (10)矩阵(XXT) XMX 的最小特征值 A表征了最小重构误差,即降维后数据结构最大保护程度,对应的特征向量即为 。.。

推广到多维情况,定义-个描述映射邻域保护能力函数 -邻域保护函数,(。)a。TX MXnTa,则:. Ⅱ XMX 0 、 rgm ( )第 5期 宋 涛等:基于流形学习和 K-最近邻分类器的旋转机械故障诊断方法 151其中:aTxx 01,由映射矩阵正交性得 0 Tn10 T02 口T 口 0。利用拉格朗日乘数法,构造辅助函数:C aTXMX a -A(0 TXX 。 -1)-1nT口 l - --10T口- 1 (12)显然,C a ,最携f(a)(即最携 C 。

令: 2 口 -2AXX n - 1口1-- a 0 (13)整理得 :I-(XX ) A [ ] [A ] ·(XX )~XMXTa Aa (14)其中:A [a1,,0 ],S [A ](XX )- A - ,(k2,3,,d)。

则式(14)最小特征值对应的特征向量即为 a ,式(14)迭代可求得标准正交基向量A。NPE,变换矩阵AAPcAA ,由式(4)即可求得低维特征集 l,。

3 基于 KNNC的模式识别最近邻分类器基本思想为先计算测试样本与各状态训练样本的余弦距离,根据距离划分最近的k个近邻,再确定测试样本对训练样本各状态的隶属度,隶属度最大的即为测试样本所属状态。KNNC计算方法为:设待测样本经约简后的低维特征向量为Y。,Y。与训练样本 ,之间的余弦距离为:。 (15)定义待测样本为Y。与 c 类样本的隶属度:score(y。,Ci) ∑ D 。 (j,。, )6( ,Ci)(16)其中:KNN(y。)为Y。的最近邻域集, (y ,C )为 关于c 的类属性,即:6( ,c ) 主 ,则使y。与之隶属度最大的 C即为Y。所属分类,即:Carg maxscore(y0,C ) (17)以上为传统 KNNC方法,若训练样本较少,可能因k值选取不当或样本集分布不适合降低分类精度。为适用小样本识别,本文改进后的方法为:(1)构建七-最近邻有向图 F。以 ONPE输出特征集y(包含训练样本和测试样本)中每个节点Y 为图F顶点,形成有 n个顶点的稀疏有向图,计算与其最近的 k个节点距离表达式为:F ∈KN c 8(2)划分有向子图。步骤(I)构建的有向图F中可能出现F ≠ ,即Y 与Yj不互为 k-最近邻或非近邻,为此做处理:若F 0,则置 0。有向图被划分为多个互不相连的有向子图S5 ,.s:,,s ,各子图内所有数据点具有非常高的相似度,两两互为后-最近邻。

(3)扩充训练样本集。对集合 y中的每个节点Y ,设其所属有向子图集合为 ,,Js,中可能包含训练样本和测试样本,其中训练样本类别已知,若 s中所有数据类别未知,则留作后续处理,若其中部分节点类别已知,则确定其所属类别表达式为:c(y )maxN[C(yj)] y,∈S (19)其中:C(Y )为 Y 所属类别,J、[C(y )]为 Js,中各类别节点数量,数量最多的类别即为 Y 所属类别,数量较少的类别节点可视为噪声,将其剔除。

(4)经步骤(3)可剔除训练样本中的部分噪声数据,部分类别确定性高的待测样本划入训练样本,再对剩余待测数据用扩充后 的样本集进行传统 KNNC分类。

4 应用实例4.1 故障诊断流程基于 ONPE和 KNNC的故障诊断流程见图 1。

图1 故障诊断流程Fig.1 Fault diagnostic process图 1诊断流程包括:(1)收集每种故障状态对的多组振动数据,各选其中部分构建样本库,其余数据作为测试样本。

(2)对所有训练样本数据和测试样本分别按第 1节方法从时域、频域、时频域提取多域信息熵,构建高维特征集。

(3)将训练样本和测试样本的多域特征集作为ONPE算法的高维输入,用第 2节方法进行维数约简,输出低维特征集用于作模式识别。

(4)用第 3节改进最近邻分类器将待测样本中类别确定性高的进行分类,划入训练样本集,扩展原训练样本集容量,并剔除部分样本集中可能存在的噪声,再用传统KNNC对剩余待测样本进行模式识别,输出最终识别结果。

152 振 动 与 冲 击 2013年第 32卷4.2 诊断实例选用具有6种故障类型的深沟球轴承6205-2RS,轴承内径 25 iIlm,外径 52 mm,厚度 15 mm。实验由转子试验台、加速度传感器、电荷放大器、转速计、采集设备等组成。由电机带动输入轴,输出轴带动负载。在转速为1770 r/rain工况下用 48 kHz采样频率进行振动信号采集,6种故障分别为外圈轻微裂纹、内圈轻微裂纹、滚动体轻微裂纹、内圈中度裂纹、内圈严重裂纹、滚动体严重裂纹。对每种故障类型的轴承分别采集50组数据,每组数据4 096点。振动采集试验台如图2所示。

图2 故障轴承测试试验台Fig.2 Fauh bearings testing test-bed(1)选择内圈中度裂纹故障轴承为例按照上述流程进行识别,从各种故障数据中各选 10组作为训练样本,从内圈中度裂纹数据中选择 20组作为测试样本,提取6个时、频域信息熵,即原始特征集维数为6,部分测试数据高维特征集如表2所示。

表2 测试数据高维特征集Tab.2 High-dimensional characteristic sets of test data样本编号 高维特征值1 0.0131,0.0304,0.0583,0.012,0.0644,0.0042 0.0073,0.0187,0.0023,0.0132,0.0127,0.01013 0.0093,0.0279,0.0247,0.0134,0.0331,0.00664 0.0054,0.0123,0.0214,0.0126,0.0027,0.01215 0.0033,0.0144,0.0300,0.0128,0.0146,0.O1 136 0.0106,0.0230,0.0259,0.0128,0.0387,0.00807 0.0092,0.0159,0.0062,0.0126,0.0243,0.01078 0.0060,0.01 17,0.0190,0.0126,0.0006,0.0123用 ONPE进行维数约简,约简后维数表征高维数据集本征维数 d<6,设 d3,ONPE采用有监督模式构建邻域图,邻域值太小,较难保证数据的整体几何性质;太大会致流形空间相距较远的点化为邻域,从而扭曲降维结果。邻域大小应满足小于各类故障样本数、大于高维数据的本征维数,即3

、 V外圈轻微裂纹: 、-,k内圈轻微裂纹图3 维数约简三维分布图Fig.3 3D distribution of dimensionality reduction用 KNNC进行模式识别,其近邻大小 含义与ONPE邻域大小 K类似,但值与 值相互独立,主要取决于测试样本点的低维空问分布与训练样本点分布的结构关系,设K 5,部分测试数据约简后的特征量和识别结果如表 3所示,三维数据节点间距和邻域线性重构关系与原始六维数据基本保持-致,即降维不改变数据邻域结构。输出标示 1,2,,6依次对应上述 6种故障,结果表明内圈中度裂纹故障识别完全准确。

表 3 维数约简与模式识别结果Tab.3 The result of dimensionalityreduction and patern recognition(2)将 ONPE算法与其它维数约简算法效果对比。取内圈轻微裂纹数据分别用 ONPE,PCA,LLE三种维数约简方法进行约简,邻域大小,约简维数设置保持-致,用 PCA,LLE方法,内圈轻微裂纹与滚动体轻微裂纹振动状态过于接近,部分待测数据分布在两种状态之间,无法区分,导致最终分类识别率下降,用ONPE方法能有效将各种状态分开。而用维数约简直接将高维特征集输入到分类器进行识别效果更差。用第 5期 宋 涛等:基于流形学习和 K-最近邻分类器的旋转机械故障诊断方法 153不同维数约简方法及不作维数约简直接进行模式识别四种方法对 6种状态各取 50组数据分别测试,结果如表 4所示。从实验结果看,基于多域特征提取 -维数约简 -模式识别的故障诊断较基于特征提取 -模式识别精度更高,而用 ONPE流形学习方法较其它方法准确率高,平均识别率大于90%。表明原始信息熵存在特征冗余 ,特征敏感性不足,误导识别过程,通过维数约简能有效提高特征聚类特性,而 ONPE算法较其它降维算法更能维持高维数据集的内在数据结构,降低后续识别压力,提高故障诊断精度。

表4 不同维数约简方法诊断准确率Tab.4 The diagnosis accuracy rate of diferentdimensionality reduction methord(3)为验证本文对 KNNC改进方法的有效性,另构建-组训练样本,每种故障设8组样本,其中6组为该类实际故障数据,另两组为其它类故障数据,作为噪声数据加入故障样本,分别使用传统 KNNC方法和本文改进方法对剩余52组数据进行模式识别,其诊断准确率见表5♂果表明改进的KNNC效果明显好于传统的 KNNC,平均准确率保持在 80%以上。故障样本少、样本不均匀或含有噪声等问题都会影响模式识别效果,而通过改进 KNNC算法,剔除原训练样本噪声,从测试样本中扩展训练样本在-定程度上弥补样本缺陷,提高故障诊断准确率。

表 5 传统 KNNC和改进 KNNC诊断准确率Tab.5 The diagnosis accuracy rate oftraditional KNNC and improved KNNC5 结 论本文针对传统单域特征提取 -人工特征选择 -模式识别模式存在需人工干预、精度不高等缺陷提出基于多域特征融合 -维数约简 -模式识别故障诊断模型,充分发挥流形学习 ONPE算法在特征约简聚类方面优越特性,结合信息熵在反应复杂机械状态方面优势及多域特征融合的全面性和 KNNC在模式识别上适用性,既实现了全 自动故障诊断,又有效地提高了诊断精度和稳定性,且适用于小样本故障诊断,并在实测案例中取得很好效果。为存在多部件耦合振动,信号非平稳、非线性的旋转机械故障诊断提供了参考。

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败