多信息技术在船舶装置故障诊断中运用

多信息技术在船舶装置故障诊断中运用

摘要:船舶动力装置工作过程中会产生大量多域故障信号,通过收集、挖掘隐藏的关联信号,可以解决船舶动力装置在故障诊断中面临的诊断时长问题。文章采用K-均值聚类算法(K-means)对数据进行聚类,聚类结果输入BP神经网络进行模型训练,并在此基础上,设计了主成分分析法(PCA)对模型进行优化。结果显示,2种算法都能有效降低网络诊断时长,而且经PCA优化的算法更能有效地提升神经网络诊断的收敛速度和准确性。说明PCA能为智能故障诊断算法提供可行的优化方案。

关键词:K-均值聚类算法;数据挖掘;主成分分析法;BP神经网络;故障诊断

信息技术的发展,促使船舶动力系统变得复杂,基于多信息融合的智能诊断技术已经成为现代船舶故障诊断领域一个新的分支。目前,国内外学者在船舶智能故障诊断领域中多采用的是BP神经网络算法。陈兴权等[1]将主成分分析法(PCA)和改进的BP神经网络相结合,用于形变监测数据处理,有效提升了神经网络的收敛性。本文采用K-means和BP神经网络训练诊断模型,并利用PCA对样本进行优化,从而建立更精确的诊断模型。

1基于数据挖掘技术的故障诊断

本文基于数据挖掘技术,结合K-means和BP神经网络这2种算法,以MANB&W5L23/30H型主机为实验对象构建诊断模型,并利用PCA优化模型。智能诊断流程如图1所示。

1.1K-means算法

假设训练样本集为{x1,x2,…,xn},第i个样本xi的特征矢量有m个特征值,即xi={x1i,x2i,…,xmi},xi∈Rn,Rn为实数,算法过程如下。1)随机选取第j类聚类中心为zj,j为自然数,zj∈Rn,Rn为实数。对zj进行初始化。2)计算样本xi与zj的欧式距离dj。dj=‖xi-zj‖。(1)3)根据最小欧氏距离Dj对xi归类,假如Dj=min{dj},则xi∈j'。4)更新原有聚类中心第j'类聚类中心为zj'。zj'=1Nj'∑j'i=1xi,(2)式中,Nj'为第j'类所含样本数。然后,返回公式(1)进行下一样本的分类。5)n个样本全部分类完成时,计算各样本到其所属类别中心的距离平方和为J,J为畸变函数。J=∑ji=1∑nj=1‖xi-zj‖2。(3)K-means算法要将J值调整到最小,来终止分类。如果没有,返回步骤1)重新初始化值和聚类中心。

1.2BP神经网络

BP神经网络的拓扑结构如图2所示。图2中,P1,P2,…,Pn为网络训练的输入,wnm为输入层、隐含层神经元间的连接权重,wmk为隐含层、输出层神经元间的连接权重,bm为隐含层第m个神经元,θk为输出层第k个神经元,a1,a2,…,ak为网络的预测值。图2中,输入信号Pn经隐含层传递出的结果y与经输出层传递出的结果a的计算公式分别为:y=f1∑n1wnm(+b)m,(4)a=f2∑k1wmk(y+θ)k,(5)式中,f1和f2分别为输入关系和输出关系的传递函数。

1.3基于K-means和BP神经网络的PCA优化算法

在动力系统智能故障诊断中,经常会遇到一种装置故障表征的背后有多种故障原因的情况。多种故障之间会存在冗余,而PCA可以有效减少样本数据的冗余和噪声,避免过拟合问题的出现。算法优化流程示意图如图3所示。

1.42种算法的比较

第1种算法,即BP神经网络算法,先进行K-means聚类,其结果直接作为BP神经网络的输入量,进行模型训练。第2种算法,即基于K-means和BP神经网络的PCA优化算法,先用PCA对高维度征兆数据进行降维,使其变为两两不相关的主成分,再K-means聚类。上述2种算法的最终结果都输入BP神经网络,分别对柴油机进行工况识别,对比输出结果,判断诊断精度是否提升。

2实例分析

本文以MANB&W5L23/30H型柴油机为主要研究对象,收集了柴油机在89%负荷时的5种常见工况(正常、燃油雾化不良、排气阀漏气、进气阀滞后开启、活塞缸套磨损)下测得的数据。每种工况收集了5组数据,每组数据设置了8个征兆参数,分别为:燃油消耗率,g/(kW•h);排气总管温度,℃;爆发压力,MPa;压缩压力,MPa;排气气管压力,MPa;进气气管压力,MPa;转速,r/min;平均有效压力,MPa,用集合{S1,S2,S3,S4,S5,S6,S7,S8}来表示。

2.1数据预处理

进行预处理的目的是为了降低噪声,以此加快网络收敛速度。先将数据标准化,然后进行K-means聚类,K值的选取通过J函数的计算来获取。初始聚类中心选取结果见表1。限于篇幅,仅列出每种工况经K-means算法聚类后的2个样本结果,样本聚类结果(部分)见表2。表2中,A、B、C、D、E分别代表工况正常、燃油雾化不良、排气阀漏气、进气阀滞后开启、活塞缸套磨损。

2.2BP神经网络诊断故障

本系统利用MATLAB2016b神经网络工具箱进行过拟合训练。具体实现过程为:选取K-means聚类后的样本征兆作为神经网络的输入量,反复训练,以工况模式输出矩阵为目标向量,即正常为[1,0,0,0,0]T、燃油雾化不良为[0,1,0,0,0]T、排气阀漏气[0,0,1,0,0]T、进气阀滞后开启[0,0,0,1,0]T、活塞缸套磨损[0,0,0,0,1]T。接着,选定BP神经网络的结构数为8-9-5,即对应的输入节点数为8,隐含层数为9,训练迭代数为5。然后进行多组实验,得到PCA优化前的网络训练误差曲线如图4所示。由图4知,当训练次数达到8次时,已满足目标误差的要求,此时模型训练精度高。选取每种工况下的随机一组数据构成训练样本集来检验训练模型,主机分析预测结果见表3。分析表3知,正常工况下,燃油雾化不良、活塞缸套磨损,神经网络的训练精度接近期望值。而排气阀漏气和进气阀滞后开启2种工况,隶属度分别为0.581和0.792,较其他工况,期望结果误差过大,要求诊断精度进一步提高。

2.3算法优化处理

PCA降维通过使一部分非线性相关数据丢失,能有效减少信息冗余和降低数据噪声。PCA的实质是保留主要成分和剔除非必要部分,所以通过计算主成分的累计方差贡献率来选取主成分的个数。数据标准化后,计算得到各组数据的特征值、方差贡献率和累计方差贡献率,见表4。由表4知,前4组特征值对应的累计方差贡献率超过0.95。一般要求累计方差贡献率大于0.95,才能保证计算后的变量包含原始数据的绝大多数数据特征,故前4个变量能最大限度包含样本中95%的数据特征。然后依次计算前4组特征值的主成分。对计算后的主成分样本进行K-means聚类,主成分新样本K-means聚类结果见表5。K值依据类之间明显的区别和类别的数量来确定。经过PCA优化后的数据结果作为BP神经网络的输入,选定网络结构数为5-7-4,得到PCA优化后的网络训练误差曲线如图5所示。由图5知,当训练次数达到7次时,已满足目标误差的要求。选取各工况下随机一组数据作为训练样本集,来检验训练模型,主机分析预测结果见表6.分析表6知,PCA优化后的新样本输入神经网络时,预测精度明显提高。

2.4实验结果分析

分析2种算法的实验结果,PCA在降低样本间关联性和复杂性和改善网络神经元间的训练误差方面有显著作用。2种算法对比结果见表7。基于上述比较结果,PCA在优化样本网络结构和维度上有显著作用,同时还能提升模型精度,减少平均误差和迭代数,使系统的总体性能得到发挥。

作者:叶树璞 孙俊 单位:武汉理工大学 能源与动力工程学院