热门关键词:

基于稀疏表示的故障敏感特征提取方法

  • 该文件为pdf格式
  • 文件大小:509.08KB
  • 浏览次数
  • 发布时间:2017-02-22
文件介绍:

本资料包含pdf文件1个,下载需要1积分

Sensitive Feature Extraction of Machine Faults Based onSparse Representati0nLI Maolin , LIANG Lin WANG Sunan(1.School ofMechanical Engineering,Xial Jiaotong University,Xian 710049;2.Engineering Workshop,Xian Jiaotong University,Xian 710049)Abstract:To treat the feature selection for mechanical fault diagnosis.a novel method IS proposed to find the lOWdimensionalnon-negation sparse principal component representations from the feature set of the meased sign als.In facilitating the interpretationof the extracted principal components,combine non-negative and sparse constraints with the L 1-norm varian ce,the non-negativesparse components can be selected.The cumulative percentage of varian ce explained is used to select the optimal spa'rsity of theprincipal components,and the number of principal components is decided by the deman d of sparsity in fault diagnosis.Th eexperimental results from simulation data and the ball bearing vibration analysis show that the proposed method is more efective formachine fault diagn osis than principal component analysis method.Analysis of the optimal sparsity parameters and the sensitivefeatures,suggests that the proposed method not only self-adaptively obtains the deee of sparsity,but also efectively determines thesensitivity ofthe origmalfeatures。

Key words: Sparse representation Principle component an alysis Feature extraction Fault diagn osis0 前言在机械设备故障诊断中,为了全面描述设备运行状态,需要从不同方面提取多个特征,如时域均值、方差指标等[1,频域频谱特征和能量等[2,以及时频能量指标等 。-。这些特征提供了极其丰富的·国家自然科学基(51075323)和中央高校基本科研业务费专项资金( 20100066)资助项目。20120309收到初稿,20121009收到修改稿运行状态信息,却使状态特征空间变得庞大,给信号处理带来了困难。为此,提取低维敏感特征是诊断特征提韧选择研究中的-个关键问题。

主分量分析(Principal component analysis,PCA)是常见的多元统计方法,基于数据的二阶统计性质来发现其内部线性结构,并通过低维主分量来反映原始特征信息 ~。但由于主分量包含了全部原始特征,使其可解释性变差,无法了解主分量与特征间的关联性。且由于权系数小的特征往往对分类贡献74 机 械 工 程 学 报 第 49卷第 1期也小 ,如 果在方差 最大化 的 目标 下将主分 量(Principal component,PC)稀疏化,将使主分量有更好的解释性,也更加适合诊断分析的需求。

稀疏主分量分析(Sparse PCA,SPCA)是基于这个 目的受到越来越多的重视,相继提出了多种方法。如基于非.凸约束的SCoTLASS算法 J、DSPCA算法 和转化为 Lasso回归问题的 SPCA算法 J。上述研究是从数学角度出发,提取的权系数有正有负,但对于诊断特征选择来说,负系数不具有实际意义。

ZASS等 通过非负约束提出了-种非负稀疏主分量分析算法,但和其他研究相同,均是在 2.范数下求取最大方差,对噪声较敏感,容易偏离真实主方向。而设备运行状态中的信息量往往具有相当成分的噪声分量,为了提高SPCA的鲁棒性,MENG等L1 用 1 范数替换 2.范数,使得 SPC具有较好的适应性,符合了故障诊断中的特征选择需求。

因此,本文针对 1-范数优化目标,结合非负稀疏主分量约束提出了-种基于非负稀疏表示的敏感特征提取方法(Non-negation SPCA,NSPCA),通过稀疏度的白适应选择,实现了敏感特征的优化提取,并通过仿真数据及实例进行了验证分析。

1 非负稀疏主分量分析原理SPCA是在方差最大化基础上将 PC值稀疏化,即非零特征个数最少,可描述成如下的优化问题W ar gmax W CxWI2IlWs.t.W WIm l1wl0

在诊断中稀疏权系数反映的是各个特征的贡献情况,负值没有实际意义。因此,考虑非负稀疏表示,通过增加非负约束 W >0来获取非负稀疏 PC,即NSPC,相应的非负稀疏主分量优化描述如下W arg max W X,W ” 。

s.t.W W I1wl10 (2)显然,在式(2)中求解 m>1下的优化解也是-个较困难的问题,为此,采用传统计算稀疏主分量的思路,即先优化搜索出第-主分量 1),然后通过投影再进行其余主分量的优化搜索。

2 非负稀疏表示的敏感特征提取方法2.1 敏感特征提取算法基于非负稀疏主分量分析思路,提出了-种在描述设备运行状态的原始特征中提取出有效的低维敏感特征方法,即NSPCA,算法步骤如下。

(1)对每个原始波形数据进行变换,提取出 d维特征 , ,, ,如时域参数、频域参数等。

(2)将 d维特征的 n个样本组成原始特征集 (vi, ,, ) ,设稀疏度 k和稀疏主分量数 。

(3)初始化 .,(0)(取值为全 0或全 1矢量);令(o)w(oflw(o)l 和t0。

(4)计算 (',。,',:,, ) -Zp (f) ,其中l 譬(5)令r等于l l的第(抖1)个最大值。

(6)计算 sgn( )(Il, l,), 1,2,, ,其中,阈值函数∽ 符号函数f 1 >0sgn(x)0 0-1 <0(7)令 , 2, , d1则州 以及t件1(8)如果 w(t)≠w(t1),返回步骤(4),否则继续。

2013年 1月 栗茂林等:基于稀疏表示的故障敏感特征提取方法 75(9)如果w(t)<0,重新设 ( 为随机矢量并归- 化M,(f)w(OII1.,(t)l:,返回步骤(4),否则继续。

(10)如果存在I sgn(w (f)l sgn(x)l≠0,f1,2,,d,且W (t)xi:0,则W (t)(W ( )aw)/lW (f)Awl1 ,返回步骤(4),否则继续,其中Aw为小的随机矢量。

(11)计算主分量 w(t)在子空间中的投影Xixi- (f)·(M,( ) Xi),i1,2,t9 d且 ml,返回步骤(4),提取下-个稀疏主分量NSPC,直到NSPC的个数为 m。

由算法可知,稀疏化处理可获取特征的敏感性, 1-范数间接反映出类内距和类间距的关系,即同类样本坐标分布相似,不同类样本坐标分布区域不同,因此,在类内样本基本不变的情况下,能够反映较大类间距的特征自然被优化选择出来。

另外,采用局部优化解代替全局优化解,使搜索的权系数不-定非负,而通过 w(f)>0进行非负判断,如果不是则要重新搜索新的局部解。

2.2 稀疏度k的自适应选择参数 k决定了特征的稀疏性,k值太大,即稀疏分量中包含较多特征,不利于稀疏表示和解释;k值太嗅导致样本在新特征中由于信息缺乏产生重叠。为此,本文提出了-种利用 PCA特征累积方差进行稀疏度自适应选择的方法,其步骤如下。

(1)计算特征数据集 .的主分量特征方差 ,且从大到小4列。 ,/三(2)根据累计方差变化率 / ≥P,确定出, i1稀疏度 k的大校通过调节参数 P的大小确定出稀疏主分量的稀疏度,通常 取 90%以上,这样可以保证稀疏主分量中有足够的信息量。

2.3 稀疏分量数 m的选择在状态识别中,仅依靠第-主分量往往难以表达原始特征的空间分布,可考虑第二稀疏主分量NSPC2,即对原始数据在主分量空间中的投影提取第二稀疏线性组合,依此类推可提取出其他稀疏主分量。稀疏主分量数m的选择没有通用法则。从故障诊断角度来看,参数m应旧能少,因为新主分量的引入必然包含新的原始特征,降低了稀疏表示的意义,也不利于可视化。因此,m-般取2或3,这样在尽量保留多的信息情况下,可以用较少的特征空间来描述原始数据分布。

3 仿真数据分析选择UCI数据库中的IRIS数据进行仿真分析,该数据包含3类对象(每类 50组)共 150个样本,每个对象有4个条件属性(萼片长度和宽度、花瓣长度和宽度分别对应特征 1、特征2、特征3和特征4),决策属性为对象的分类。

图 1所示为条件属性集的主分量累积方差变化曲线,设P95%,则稀疏度k2。若m2,则利用NSPCA 提取出两个非负稀疏主分量 NSPC1和NSPC2,其权系数分别为[0,0,0.838 2,0.545 2]和[0.694 2,0.719 8,0,0∩见 NSPC1与特征 3和 4有关,NSPC2与特征 1和 2有关。图 2所示为样本在 NSPC空间中的数据分布,显然类 2和类 3的样本有重叠。为了讨论方便,在NSPC1特征轴上采用线性分类器,如分类阈值设置为 0.88,会产生4个样本点的误判。

-qU山 ∽ Z碍极磲主分量特征图 1 主分量特征的累积方差变化率图2 NSPC二维空间的数据分布采用PCA特征提萨行对比,其PC二维空间的分布如图3所示。3类样本数据的分布同图2较相似,但在PC1特征轴上采用线性分类器,无论取值如何,误判数均高于NSPC1特征中的4个。

另外,由 NSPC1的组成可知该特征是特征 3∞ % % 舛 ∞ 黯l O 0 O O O 0 O O 76 机 械 工 程 学 报 第 49卷第 1期图3 PC二维空间的数据分布和特征 4的线性组合,但在特征 3和 4组成的二维空间分布中,无论线性分类器如何取值,误判的样本点仍大于4个。另外,特征 3和 4的分类性能优于特征 1和2。由此可见,通过NSPCA不仅有效地提取出这两个敏感特征,且数据聚类效果更佳。

4 实例分析4.1 试验对象选择美国凯斯西储大学电气工程实验室的滚动轴承试验数据进行分析验证。试验对象为SKF6205滚动轴承,选择损伤尺寸为0.036 cm下的四种状态数据进行分析。采样频率为 48 kHz,四种状态的时域波形如图4所示,图4中从上至下分别为内环故障、滚动体故障、外环故障以及正常状态。其中,内环故障表现出典型的冲击特征,滚动体故障的波形中随机出现单个冲击分量,而外环故障和正常状态的时域波形则非常类似。

5广。 --- -- - ---- -斗- - 5........J.。.。. ...。.。1....。...。.1 .... .。. .。.。. . . .1...。

(a)内环故障5厂。 ----------.-·.-----0.--- 5L--L-L J- -L---L---J(b)滚动体故障j霉 1馨 IHII.lI-I--I-Il-IlII IlI- - 1----------.L.---,----.--- L---.-.--.-.1 . . ,.. -.. 1 .-- .. .. ..L . 。

(c)外环故障0 5l-o 啪 --II- I1.I IlI-lI- 0.5 I........J.........I.。. .。.。....1。 . ....。 .J.........I. .。

0 OO5 0 1O O.15 0 2O O 25 0 30时间(d)正常状态图4 四种状态的时域波形在常见时域指标中,峭度对冲击特征具有敏感性,四种状态数据的振动信号峭度值分布如图5所示。其中,内环故障和滚动体故障的峭度值分布有重叠,滚动体故障与外环故障的峭度值部分有重叠。

由此可见,虽然峭度指标对冲击故障具有敏感性,但仅依靠峭度指标区分故障具有-定的局限性,还要考虑其他的特征。

署图5 四种状态样本的峭度分布4.2 样本原始特征提取首先,依据滚动轴承的振动特点,在时域波形中选择对冲击敏感的峭度指标、其他典型指标以及量纲-指标,以此来全面反映振动波形的时域微弱变化。其次,从频域角度提取特征:采用 8个频带信 号 的 能 量 比 作 为 频 谱 特 征 指 标 , 即土 [E,/E,E2/E,, /E],其中E (卢1,2,,i18), 为频带的信号能量,具体如表 l所示。

表 1 特征维数和原始特征列表特征序号 统计指标 特征序号 统计指标标准差 F9 /E,2 峭度 F10 E3/E方均根 Fu E E平均幅值 F12 E5/E凡 峰值指标 F13 E0E波形指标 Fl4 E1fE裕度指标 F15 Es/EF8 ElfE由此,每种状态下抽取 50组样本,则原始特征空间 为NxD,其中N200为全体状态样本数,D15为原始特征数。

4.3 敏感特征提取的对比分析4-3.1 基于 PCA的特征提取分析为了验证NSPCA的有效性,选择PCA进行对比分析,其中空间数据分布均进行了归-化处理。

图6所示为基于PCA的二维样本空间分布,其中正2013年 1月 栗茂林等:基于稀疏表示的故障敏感特征提取方法常状态样本分布为平稳状态,具有较好的聚类性能,50个样本基本聚集在-起,而滚动体故障和外环故障样本不仅分布分散,而

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败