热门关键词:

基于等距映射与加权KNN的旋转机械故障诊断

  • 该文件为pdf格式
  • 文件大小:437.82KB
  • 浏览次数
  • 发布时间:2017-02-12
文件介绍:

本资料包含pdf文件1个,下载需要1积分

Rotating machinery fault diagnosis based on isometricmapping and weighted KNNChen Fafa,Tang Baoping,Su Zuqiang(The State Key Laboratory of Mechanical Transmision,Chongqing University,Chongqing 400030,China)Abstract:Aiming at the problem that rotating machinery high dimension complex fault features are dificult to beidentifed quickly and accurately,a rotating machinery fault diagnosis method based on isometric mapping nonlinearmanifold learning and weighted K-nearest neighbor(KNN)classifer is proposed.In the original feature space con-structed from time domain statistics and intrinsic mode energy component,the isometric mapping nonlinear manifoldlearning algorithm is used to extract the essence features of rotating machinery fault state variation and carry out non·linear multi-dimensionality reduction;then,the extracted low-dimensional fault features are transmitted to the weigh-ted KNN classifier for rotating machinery fault mode identifcation.The analysis of the experimental data for a gearboxshows that this method not only has good dimensionality reduction performance for high·-dimensional complex non-lin-ear fault features,but also significantly improves the fault recognition accuracy compared with traditional method.Thismethod can effectively identify the nonlinear fault features existing in high dimensional feature space。

Keywords:manifold learning;isometric mapping;weighted K-nearest neighbor(KNN);rotating machinery;fault di·agnosis1 引齿轮箱作为旋转机械的变速传动部分,-旦出现故障,将会导致整个传动系统停机停产。在旋转机械的故障诊断过程中,基于振动信号从时域、频域 、时频域等多个方面提取反映旋转机械运行状态的量化指标,可以有效地辨识旋转机械的运行状态。然而随着特征参数的多元化,诊断过程中需要处理的信息量急剧增加,因此,如何从高维数、非线性”的多元特征数据中提取最能反映收稿 日期 :2012-O4 Received Date:2012-04基金项 目:国家自然科学基金(51275546)、重庆市自然科学杰出青年基金(CQcstc20lljjq70001)资助项目l目216 仪 器 仪 表 学 报 第 3 4卷旋转机械运行状态的本质特征显得尤为重要。

传统的约 简降维方法包 括主成分分析 (principlecomponent analysis,PCA)与多维尺度分析 (multidimen-sional scaling,MDS)等 ,此类方法对具有线性结构的高维特征能够有效地进行约简降维处理,但是对于旋转机械非线性分布的高维特征数据显得十分脆弱。等距映射(isometric mapping,ISOMAP)作为-种经典的流形学习算法,采用局部邻域距离对数据点问的全局流形测地线距离进行估计,通过建立原数据与降维数据之间的对等关系,能够有效地对旋转机械高维特征数据进行约简降维处理 。然而,由于等距映射并未建立高维流形空间与低维表示空间之间的映射模式,使得旋转机械复杂故障的准确诊断难以快速实现。为了快速准确地得到新输入高维特征数据的分类决策属性,必须集成高效的模式识别算法。研究表明,当等距映射算法用于故障识别问题时,尤其适合与 K近邻分类器(KNN)相结合 。

由此,本文提出基于等距映射非线性流形学习与加权 KNN的旋转机械故障诊断方法,首先基于振动信号的时域统计指标和内禀模态分量能量构造多元特征向量,基于 ISOMAP非线性流形学习对原始特征向量进行特征降维处理,获取最能反映旋转机械运行状态变化的敏感特征,随后将获取的低维敏感特征输入给加权 KNN进行故障模式的分类辨识。

2 非线性流形学习与等距映射2.1 非线性流形学习流形学习是-种新的非线性数据降维方法 。其基本思想是:高维观测空间中的点由少数独立变量共同作用在观测空间张成-个流形,通过展开观测空间卷曲的流形进而探寻内在的主要变量,从而实现对高维数据集的约简降维处理。

设 、y是 2个拓扑空间,厂: - l,是 1个连续映射,如果.厂有逆映射,且逆映射也是连续的,则 X与 l,同胚 厂是1个同胚映射。若 1个Ⅳ维的拓扑空间M内的任意-点都存在1个邻域U∈M使得该邻域是Ⅳ维欧氏空间的同胚映射,则称该拓扑空问 M为流形 J。

令 y是包含在欧氏空问R 的d维域 厂:y- R 为光滑嵌入,其中N >d。数据点Y c Y是随机生成的,经厂映射形成观察空间的数据 .厂( )c R 。-般称 y为隐空间,Y 为隐数据。流形学习的目标是要从观测数据 中重构.厂和Y 。

2.2 等距映射算法等距映射ISOMAP是基于邻域图与经典的MDS算法的具有全局特l生的非线性流形学习算法 。其基本思想是利用局部邻域距离对数据点问的全局流形测地线距离进行估计,通过建立原数据间测地距离与降维数据间空间距离的对等关系从而实现数据降维。其算法流程描述如下:1)构建邻域图 G:对于观测空间数据集 中的所有数据点 ,i1,2,,It, R。,计算所有数据点对之间的欧氏距离 d ( , ,),以 近邻定义点对点之间的邻域关系,得 邻域点 , ,, ,记为Ⅳ ~采样点之间的邻域关系表示为-个以采样点为节点、以欧氏距离为边的邻域图G。

2)计算测地距离矩阵D:基于邻域图,令d ( ,xj)d ( ,Xj)初始化测地距离矩阵,应用最短路径算法计算邻域图G中任意两点的 ,xi的最短路径 d ( ,xj),即:dV ∈Niorxi∈ (1)mjnd d d目,其他得到测地距离矩阵D。

3)应用 MDS算法对 进行降维:构造矩阵 BHDH使测地距离矩阵D中心化,其中日J- 址 ,由此可得矩阵元素 6.为:n - n -音 alj alj(2)由谱分解得 BHDHXX l/t ,其中A diagA.,A:,,A ,A。,A:,,A 为 的 d个正特征值,相应的特征向量 YY ,i1,2,,rt,Y ∈R (d

ISOMAP方法中,任意两数据之间的测地距离是通过邻域点扩展的方法近似求得的。假设流形上的两节点足够近,其原始距离与其低维嵌入距离即满足如下条件:1im 2二。 : :1v-w l Y-Y l式中:y,Y ∈R。。

3 加权 KNN近邻分类器(3)加权 KNN算 法是-种 基于数 理统计 的分类 方法 。没X ( ,Z ), E R ,i1,2,,It是-个由n个样本组成的训练集,每个样本 的类别标识 f 均已知,f ∈fl,2 ,,z 。 为待测样本,它的类别 z 待测。

加权KNN分类的基本思想是:对于给定的测试样本 ,在训练集中找出它的 个最近邻 ,根据 个最近邻的分类属性投票确定测试样本 的分类属性 z 。分类的目标是使分类误差 M最小,即对于每-个取值 f L,分类误差(Z )为:( )∑P(2 1 PCt) (f , ) (4)式中:P(Z I )为将测试样本 分类为 Z 的概率 ,R(f ,Z,)为将属性 2 分类为Z,产生的误差,加权 KNN设定所有误分类的误差均相同,即:第 1期 陈法法 等 :基于等距映射与加权 KNN的旋转机械故障诊断 217R(1 , ) 0 (5)l, 产 J加权 KNN实现分类的具体步骤如下:1)对于测试样本 ,利用欧氏距离计算公式计算与每个训练样本 之间的距离 d( , ):d( ,Xi)(∑ l - l ) (6)根据距离大小,从训练集 中找出 ,的 1个近邻样才 t.1 , .2 , , 1. l。

2)从 k1个近邻样本中选择与 ,距离最大的样本设为 m小 相应的距离为 d( , ),利用 d( , 。)对其他k个近邻样本与 的距离进行标准化 ,即:D( , ) ; 1,2,, (7)3)对于标准化后的距离 D( , ),利用高斯核函数将其转化为 与 的同类概率P( I ),即 :,:去xp(- ) ㈦4)根据 与k个近邻样本的同类概率P( f ),求出 为类别 Z (i1,2,,r)的后验概率 P(z l ),即:---、 信号 厂---寓 旋转机械- 兰 (齿轮箱) 1/嗣墨 删 目别空问 轮箱故障诊断图 l 基于等距映射与加权 KNN的旋转机械故障诊断模型Fig.1 Rotating machinery fault diagnosis modelbased on ISOMAP and weighted KNN在旋转机械故障诊断中,诊断精度在-定程度上取决于故障特征向量的选龋依据旋转机械典型故障的诊断特点,在时域波形中选择对故障敏感的平均幅值、均方根、标准差、偏度 、峭度、峰值指标 、波形指标、裕度指标等8个时域统计指标归-化处理,来全面反映旋转机械振动信号的时域微弱变化。针对时域统计指标的局限,采用经验模式分解(empirical mode decomposition,EMD)方法 对原始振动信号进行 自适应地分解处理,提取分解后的前 8个 内禀模态 分量 (intrinsic mode function,IMF)并计算其能量作为旋转机械故障诊断的时频域统计指标。经过分析,前 8个 IMF分量能量已经涵盖了旋转机械最主要最重要的故障特征。由此共构造 16个统计特征指标来反映旋转机械的状态变化。

(9) 5 诊断实例分析加权 KNN方法尚未精确的计算出 的分类属性值,而是给出最有可能的分类属性值,即:KNN( )armaxP(Z I )J (10)式中:KNN( )表示加权 KNN方法对应被测试样本 的分类结果。

加权 KNN根据各近邻样本与测试样本问的相似程度对近邻样本赋予不同的权重,使得测试样本的分类结果更加接近于相似程度更高的训练样本。从而进-步弱化 值选择的敏感性 ,强化分类结果的鲁棒性。

4 基于等距映射与加权 KNN的齿轮箱故障诊断模型基于非线性流形学习 ISOMAP与加权 KNN的旋转机械故障诊断思想可以概括为:首先利用等距映射算法将原始高维特征数据 l。c R 降维到低维特征空间Y 。c R ;对于低维空间上的训练样本 Y , 。,利用加权 KNN算法进行学习训练,得到相应的分类决策规则;对于低维空间上的测试样本 Y ,利用加权 KNN算法计算出Y 最有可能的分类决策值作为相应的诊断结果。整个故障诊断的算法流程图如图 1所示。

5.1 实验系统实验室搭建齿轮箱振动测试试验台如图2所示,输入轴齿轮齿数为 55,输出轴齿轮齿数为 75,轴承型号为N205,电机驱动转速为 1 200 r/min,电机输出轴经传送皮带与齿轮箱的输入轴相连,经过齿轮箱传动,传递动力于负载轮。振动信号由安装在齿轮箱箱盖上的加速度传感器来拾取,采样频率为 10 kHz,故障是通过激光切割输入轴齿轮齿面、齿轮齿根以及轴承外圈开槽位置来设置的。依照时间顺序以9 600个连续采样值为 1个单位,分别测取齿轮箱在正常状态、齿轮齿面磨损、齿轮齿根断裂以及轴承外圈损伤共 4种状态各 60组振动信号数据。

图 2 齿轮箱振动测试试验台Fig.2 The gearbox vibration measurement systemIl、 问征 - 空特本 维建样低构ll、J Z / P 218 仪 器 仪 表 学 报 第 3 4卷正常状态0.10 0 15 O 20时间 s时问 s图3 4种状态下的齿轮箱振动信号时域波形Fig.3 The gearbox vibration signal waveforms in four conditions5.2 故障诊断与结果分析为了验证非线性流形学习ISOMAP的特征降维效果,选择传统降维方法主成分分 PCA和多维尺度分析 MDS作对比分析。在降维过程中,嵌入空间的维数要求嵌入变量能够充分涵盖原始变量的本质信息,根据文献[15],有效的嵌入维数应为已知的类别数减 1,因此齿轮箱故障诊断在3维嵌入空间中实现是有效的。齿轮箱的4种状态样本在邻域设为7时(a)PCA降维后的三维图(a)3D diagram after dimensionality reduction with(b)MDS降维后的三维图(b)3D diagram after dimensionality reductionwith Multidimensional Scaling0.30.2O·10- 0.1O 1(c)ISOMAP降维后的三维图(c)3D diagram after dimensinnality reductionwith Isometric Mapping图4 3种方法降维得到的初始流形结构对 比Fig.4 Initial manifold structure comparison for threedimensionality reduction methods由图4可见,在 PCA和MDS的3维嵌入空间分布图中,各类故障状态样本分布较分散,正常状态、轴承外圈损伤的状态样本分布较远,断齿故障与齿面磨损故障的部分样本均呈现交叉重叠现象。这是由于 PCA和 MDS基于特征样本位于线性子空间的假设,使得提取出的齿轮箱 3维状态数据聚类性较差,不能得到直观的分类识别效果。而非线性流形学习 ISOMAP特征降维算法通过建立样本之间的测地线距离代替欧氏距离,使得同类样本具有更加相近的嵌入取值,从而聚类效果优于传统降维方法,实现了4种状态样本数据的完全分离,并且各类状态样本由于平稳性较好基本聚集在同-个局部区域。

为了定量地认识非线性流形学习ISOMAP的特征聚类效果,采用文中的欧氏距离公式(6)对各个状态样本在3维嵌入空间中的类内距进行统计,计算各类状态样本在PCA、MDS和ISOMAP下的平均类内距,其结果如表1所示。由表 1可以看出,非线性流形学习ISOMAP的特征聚类效果明显优于其他 2种方法,对于齿轮箱的同类状态,各个状态样本基本上都聚集在同-个边界区域内,而 PCA和 MDS聚类效果相对较差,各类状态样本的类内距远远大于 ISOMAP方法。

表 1 3种降维方法得到的嵌入样本类内距统计Table 1 The distance statistic within the embedded samplesfrom three dimensionality reduction methods为了验证不同的特征降维方法对齿轮箱故障辨识结果的影响,基于加权 KNN分类器,采用 5折交叉验证,共曼飞 景 - ∞自 幽景 - ∞Ⅲ- 幽景 - ∞自 越 器第 1期 陈法法 等:基于等距映射与加权 KNN的旋转机械故障诊断 219验证5次。每次从不同状态样本中选择 30组样本用于训练,另外 30组样本用于测试,其中测试样本的选取规则如图5所示。分别利用 PCA、MDS和 ISOMAP提取嵌入的本质流形特征输入给加权 KNN进行故障模式辨识 ,辨识结果如表2所示。

第2次的测试样本, ------ -- -----1 1 lO 2O 3O 4O 5O 6O图5 测试样本的选取规则示意图Fig.5 The schematic diagram of test sample selection rule表 3 3种故障诊断模型的诊断结果对比Table 3 Fault diagnosis result comparison forthree fault diagnosis models %喜 急 模型消噪正常状态齿面磨损断齿故障 , -诊断平均 准确率表2 不同降维方法的故障诊断结果对比 6 结 论TaMe 2 Fault diagnosis result comparison for diferentdimensionality reduction methods %由表 2可以看出,齿轮箱的正常状态由于特征信号表现比较平稳,3种方法降维后均能完全识别,断齿故障由于信号中包含有明显的冲击特征,3种方法降维后也能有效识别。对于齿面磨损故障和轴承外圈损伤故障,状态信号表现为时变非线性的特质且特征不明显,此时通过 PCA和 MDS降维后,各个状态之间的分界边际不是十分明晰,导致故障状态识别效果欠佳。而非线性流形学习ISOMAP通过测地线距离替代欧氏距离,实现了嵌入变量的稳健估计 ,提取了诊断能力最优的本质特征,诊断效果最优。

实际的工程应用中,由于齿轮箱个体之间的状态发展差异以及背景噪声导致的故障特征模糊性,难以建立统-的辨识标准,这就要求故障诊断模型具备-定的包容度和-定的抗噪能力,使得建立好的故障诊断模型能够在-定范围内移植和推广。为了验证本文方法的包容度和抗噪能力,先后利用未经过降噪处理的原始振动信号以及经过小波降噪后的提纯信号,进行故障特征提娶ISOMAP降维,随后将提取的本质特征输入给加权 KNN、传统 KNN、径向基核 SVM进行故障模式识别,识别结果如表3所示。由表 3可以看出,加权 KNN的诊断精度明显优于传统诊断方法,不仅具有较高的诊断精度,而

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败