热门关键词:

基于灰关联信息熵的SVM决策树轴承故障分类

  • 该文件为pdf格式
  • 文件大小:309.06KB
  • 浏览次数
  • 发布时间:2014-09-03
文件介绍:

本资料包含pdf文件1个,下载需要1积分

在机械系统运行时,其部件及零件的故障 3O是由轴承故障引起的,若能较快地发现并预测轴承故障和类型,及时采取相应的措施,将故障消除在萌芽状态,对设备完善、人员安全都将有很强的实际意义↑年来各种故障识别研究方法 中,支持向量机(SVM)是-种仅用少样本情况 下,对机器学 习问题所开展的-种先进的智能故障识别理论体系,该系统的特点是能够针对小样本数据、高维及非线性等实际问题]进行故障识别。正因为其所具有的这些优势,支持向量机 目前正在成为设备智能故障识别理论体系的新方向。最初支持向量机是为了解决二类分类问题而建立的模型,为了使其能够解决多分类问题 ,已经提出了多种处理思路,主要有 :-对- 分类、-对多分类、有向非循环图支持向量机、决策树支持向量机等。虽然支持向量机决策树方法从训练速度还是分类精度都优于其他方法,但是也存在故障辨识率不高等问题L1],尤其无法满足实际中遇到的多类故障问题。

为了进-步提高 SVM 决策树故障分辨率,笔者采用灰色关联理论融合信息熵理论的方法对轴承故障样本进行特征属性信息提取,并采用改进的-对-决策树结构,构造支持向量机多分类器,以改善在轴承多故障辨识中的分类精度不高的现状,提高其故障辨识率。最后,通过轴承故障模拟实验对该分类器的分类精度进行了验证,证实了该研究方法 国家 自然科学基金资助项目(61175080)收稿 日期:2012-12-26;修改稿收到 日期:2013-02-26的有效性 。

1 信息熵理论目前,基于信息熵理论的特征属性提取算法是国际上最有影 响的分类学 习方 法之-。Claude EShannon把信息(熵)定义为离散随机事件的出现概率,表示信息的不确定性,可以作为对信息价值的判断标准 ]。信息熵分类算法采用分枝策略,在决策过程中,以所提取的信息特征的增益大小作为其属性选择的启发式函数 ,该算法如下 。

假定 S是 S个样本数据 的集合 ,设定有 m个不同的类别 C (i-1,2,, ),s 为类 别 C 的样本数 ,对于 C 这样-个样本分类 ,最终的期望信息为m I(s ,sz,,s )- - ( logp ),也称样本熵 ,其z 1中 P 为样本 S属于 C 的概率,-般可以用 Si/s来估计 。

若设定具有 个不同的值a ,。 ,,a ),其属性为 A,则可用 A将 S进行划分 ,划分成 个子集S ,S。,,S ,其 中 S 包含 S中在属性A 上值为a的样本 。若设定 A 为最好的分裂属性作 为测试 属性,则 个子集对应于集合 S的节点所生长出来的分支 。

设 S 是子集 S,中属于样本分类 C 的样本熵数 ,则根据 A划分的子集的熵n E(A):- >:硼 · (s1,S2 ,,Smj) (1)第 3期 陈 伟,等:基于灰关联信息熵的 SVM决策树轴承故障分类 5O5其中:W,-s ,5。,s ,/s为第J个子集的权;m I(s s ,s )- - (P log2P )为给定 子集 1s,的期望值,P -5 /s,为S,中的样本,属于样本分类 c 的概率熵越小的子集所划分的类别纯度越高。

通过所期望的信息及熵值求得所对应的信息增益,则在 A上分支将能得到的信息增益为G(A)- (S1,52, ,S )- E(A) (2)使用式(2)就可以计算出每个子集 5的属性 G(A)的增益,然后选取其中最高的信息增益的属性作为给定集合 s的测试属性,对被选取的测试属性创建-个结点,并以该属性为标记,对该属性的每个属性值创建-个分支,并以此来划分样本。

基于信息熵的分类算法虽然有效,但该算法有- 定的局限性 ]。应用中在分类决策时通常偏向选择取值较多 的属性 ,而实际 中取值较多 的属性往往并不是最重要的,即按照信息增益最大的原则,被分类算法列为应选取的属性有时对其进行测试不会提供太多的信息,因此需要将其进行改进再加以应用。

2)将测取的待检轴承的故障特征参数 x 构成待检模式D 为DTXT-[-Xr(1),XT(2),,Xr( )] (4)3)计算待检模式与标准模式中各类故障类型的关联度定义第 J个特征的绝对差为 A ,-l X ( )-X ( )1,则可得待检特征数列 X ( )与故障特征数列 X ( )的关联系数为min minz lD max maxA(J)- !:...... !..................! ..... △lD m ax m axA 0(5)其中:P的取值范围为[O,1],通常取 p-0.5;minminA 为两级最小值,maxmaxA 为两级最大差。

由于关联系数结果较多,不便于比较,因此通常采用关联度这个概念,记为 r(X。,X )。在计算目标灰色关联度时,各特征的重要性不同,应该分配不同的权重 a( ),可定义加权关联度为Ⅳ R 8( )口( ) ( : 1.2, ,M)2 灰色关联理论改进信息熵分类算法 过 旗N 体现了待如果要改进信息熵分类算法,首要考虑的就是优化对属性的选择标准,可以通过对信息熵的公式加权来加强重要属性的标注,降低非重要属性的标注。灰色关联理论是通过分析数据列因素之间的相似或者相异程度来衡量数据行接近的程度,其分析过程和结果反映了不同特征在分类决策中的重要性4],因此,通过灰色关联分析来改进信息熵分类算法是可行 的。

2.1 灰色关联度的计算采用相对灰色关联度来标定属性的权值,将滚动轴承的运行过程作为-个灰色系统,进行其关联度分析时,所采取 的基本思路是依照灰色关联度 的大小,来加强其重要属性的标注,同时还要降低非重要属性的标注,轴承运行状态的灰色关联度计算步骤如下。

1)首先针对正常状态和故障状态的轴承的所呈现的振动信号中提取其特征参数 x ,建立其特征向量矩阵作为标准故障模式 B 为B。:B ] X (1) X (2)B2;BX2(1)X (1)X2(2)X (2) X1( ) X2( ) X ( )(3)序列的每个属性与样本的相关程度,而灰色关联度则从整体上反映了研究序列与样本的相关性。

2.2 信息熵分类算法的改进利用灰色关联度对属性信息熵的计算公式加权,以加强重要属性的标注,将式(1)(2)改进为E(A)--∑W R (5 ,,s2 ,,5 ) (7J1G(A)- (s1,S2, ,s )-E(A)-∑ R ∑(户 log )-∑(p 1og p )(8J1 1 1其中:R 为各子属性与根属性之间的相对灰色关联度 。

改进后的分类准则可以在分类器训练时有效地提取样本中的重要属性信息,在分类时以样本重要属性作为优先决策因素,以此提高故障辨识精度。

3 支持向量机多分类器模型建立构建多分类故障分类器,通常多采用-对-方法、-对多方法。

1)-对-方法在所有N 类之间构造所有可能的两类分类器,通常采用投票方法来确定分类结果,此时需要构造 N (N-1)/2个两类分类器。-对-506 振 动、测 试 与 诊 断 第 33卷方法分类方法简单,效果比较好 ,但对于分类类型较多时,计算量增大导致代价太大。

2)-对多方法构造 N 个两类分类器,通过 比较 N个分类器的输出值来判定分类结果,该方法计算代价较小,但是其分类效果-般5 ]。

鉴于以上方法的缺陷 ,笔者拟在-对-”多分类算法的基础上,结合上述提 出的灰色关联理论改进信息熵理论的决策算法,构造-种既能够提高已知少量样本的重复利用度 ,又能显著提高分类精度的多分类器。

建立分类器之前首先对样本属性进行灰关联信息熵处理 :样本包括轴承的 4类状态,正常状态 X 、内圈故障 X 、外圈故障 X。、滚动体故障 X ;以 X样本为参考标准 ,X ,X ,X 的每项特征属性代入式(5)与样本集 x 进行灰关联分析;使用式(8)求得其每项特征属性的灰关联信息增益,对特征属性进行数值到信息熵的转换。然后,假设要区分 类故障:a.根据故障类型的平均分配原则,把样本按照不同的故障类型先分为两组,训练-个二类分类器;b.把故障类型的在进行分组变换后 ,重新训练-个新的二类分类器,依次循环,可知第-级共可以训练11 2个分类器:SVM1,SVM2,;c.在每-个 SVM厶中,继续 以平 均 分 配原 则 的方 式训 练下 - 级 的SVM,当出现单个故障类型时停止训练(如果所训练的故障类型比较多时,在第 1级分组中,可以不必每种分组情况都训练,只训练 3或 5个,这样可以减少 SVM 的数量,从而节省 了训练 和分类 的时间)。

笔者以4分类器为例构造起-个分类器,构造过程如图 1所示 。首先,在第 1级将通过式(7)求得的四类样 本 熵 分 成 x ,X 和 X。,X 两 大 类 训 练SVM ;然 后 ,在 第 2级用 样本 熵 x 和 x 训 练SVM 用样本熵 X。和 X 训练 SVM 完成第 1部分分类器的训练 。改变样本排列顺序,用相 同的方法完成第 2部分和第 3部分分类器的训练。

4ge类别样本墨第1级 圆审 ~、置 f 五第2级 圃A 阜 圃A圃A 圃A置 五 : 五 :第1级 : 第2级 : 第3级图 1 支持向量机故障诊断四分类器训练完毕完成了支持向量机决策树的建立▲入故障分类测试阶段:当有-个待分类数据 x ,仍然需要首先代入式(5)与样本集进行灰关联分析,使用式(8)求得特征属性值对应的灰关联信息熵。然后,输入到上面训练好的多分类 SVM 中,数据会同时在每-部分的分类器中从上向下运算,并得到-个分类结果。

由于训练样本数据、待分类数据本身的好坏 ,以及分类累积误差的存在,每部分分类器得出的分类结果可能不尽相同。在确定故障类型时,分类器训练时有效地选择重要属性信息,可以提高故障辨识精度。

4 实 验本实验所搭建的轴承故障模拟试验台,是由机械驱动装置、加载机构、固定装置和机座 4部分组成。电机型号为 Y100L2-4;额定功率为 3 kW;额定转速为 1 420 r/min。轴承型号为 2612,该轴承在实验时其外圈是固定不动的。利用加速度传感器拾取4种情况 (正常轴承 、轴承外 圈故 障及 轴承 内圈故障、轴承滚动体故障)下的轴承振动信号。采样频率为f -2 kHz。振动信号采集装置包括加速度传感器、藕合器、数据采集分析仪等。振动传感器的响应频率为 22 kHz。测量滚动轴承所在主轴的实际转速所采用的传感器是 电涡流位移传感器 ,实验台如图 2所示。

人为在 轴承 内外 圈及 滚动体 上加工 出 0.15,0.30,0.45 mm3种故障孔,用以模拟轴承的局部故障信号,轴承运行状态如表 1所示。

由于轴承振动信号的各种时、频域特征参量对故障信息的表达能力各有侧重,只有进行综合分析才能得到比较完整的故障信息。诊断模型选用 4个时域特征参量 :峰值指标 、峭度指标、裕度指标、波形指标;3个频域特征参量:功率谱重心、功率谱方差、图2 滚动轴承故障模拟实验台示意图第 3期 陈 伟,等 :基于灰关联信息熵的SVM决策树轴承故障分类表 1 轴承的运行状态数据集 运行状态 训练样 测试样 故障点直 转速/本个数 本 个数 径/mm (r·rain )正常内环故障外环故障滚动体故障1O1O1O1O 2O谐波因子。由于这些特征参量存在着量纲差别,因此首先进行归-化处理,然后使用式(8)进行特征参数的灰关联信息熵计算,部分计算后的数据如表 2所示。

在非线性条件下,支持向量机分类问题的最优分类函数为厂(z)sgn∑。 P( z)b] (9) -1 -其中:P(x, )称为核函数。

目前所用的核函数有:线性核函数、多项式核函数、径向基核函数和 Sigmoid函数等。其中径向基函数由于其待定参数少,并且对应的特征空间可以是无穷维的,有限的数据样本均可取得良好的分类效果,因而使用最为广泛l7 ]。

表 2 轴承测试 特征参数灰关联信息熵部分数据外圈故障(X。)0.472 7 0.287 7 0.408 2 0.178 8 0.646 7 0.114 6 1.00 000.888 5 1.000 0 0.871 7 0.559 6 0.830 2 1.000 0 0.158 3滚动体故障(X ) 0.584 1 0.792 1 0.640 6 1.000 0 1.000 0 0.579 8 0.000 00.104 7 0.174 1 0.075 3 0.064 1 0.711 3 0.565 1 0.091 3选择使用径 向基核函数计算支持 向量 内积 ,径向基函数形式为K(z, )-exPl- l (1o)L 厶D确定误差惩罚参数 c和核参数 。经过分析比较,将误差惩罚参数 C选为 100,核参数 选为 0.1时,此时多故障分类器的推广能力最好。

将所采集的正常轴承 2O组,滚动体故障 2O组,外圈故障 20组,内圈故障 20组共 80组特征向量,选其中6O组作为训练样本,另 2O组作为验证样本。

带入灰色关联理论与决策树理论相融合的四分类的多分类器支持 向量机中,训练完毕后进入测试阶段 ,把剩下的 120组测试数据分为 6个数据集,做 6次测试 ,每次测试 20组数据 ,训练样本数为 4O。分类结果见表 3所示。

表 3 基于 SVM 的滚动轴承 多故障分 类结果表数据集 测试样本数 正确分类数 正确率2O2O2O2O2O20利用数理统计的知识可以计算出,此多分类器构造的支持向量机针对本研究课题的分类正确率达到(95.8±0.82) 。由此证明,笔者所建立的轴承多故障分类器具有良好的分类能力和分类精度。

5 结束语构建了支持向量机与信息熵理论、灰色关联理论相融合的故障诊断识别技术。通过实验证实了所建立的根据灰色关联度的大杏强决策树重要属性的标注,降低非重要属性的标注的 SVM 多故障分类器 ,算法简单 ,分类效果好 ,且只需要较少 的样本就能达到分类的要求。由于重复有效利用了有限样本,提高了少样本的重复利用率,近似于增加了样本的数量 ,增加了识别的精确性。该方法不但可 以识别诊断滚动轴承故障,还可以适用其他机械设备的故 障类型的诊断与识别中。

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败