基于ReliefF-PNN的发动机气路系统故障诊断

2018-09-19 08:57:08蒋丽英彭昌毅崔建国于明月林泽力
沈阳航空航天大学学报 2018年4期
关键词:气路子集特征参数

蒋丽英,彭昌毅,崔建国,于明月,张 瑞,林泽力

(1.沈阳航空航天大学 自动化学院,沈阳 110136;2.中国航发沈阳发动机研究所 12室,沈阳 110015;3.中航工业上海航空测控技术研究所 PHM实验室,上海 201601)

航空发动机做为飞机飞行时的动力来源,它工作时的好坏会直接影响到飞机的飞行安全。而气路系统做为航空发动机的核心子系统,它在飞机飞行时的故障与否将会对发动机的工况产生重要影响。因此,实现高效的航空发动机气路系统故障诊断,对于提高出行安全,降低飞行风险,减少发动机视情维修的成本,具有重要的实际工程意义。

以神经网络为代表的智能算法被广泛应用于航空发动机故障诊断研究中。文献[1]针对航空发动机气路系统诊断过程中出现的相似故障提出了一种基于SVM和SNN相结合的航空发动机气路系统故障诊断,在诊断过程中使用了多级SVM诊断模型和SNN协同学习模式识别,有效地提高了诊断率。文献[2]根据航空发动机气路系统数据非线性、非高斯的特点,提出了SANNWA-PF算法,显著提高了诊断的速度。文献[3]提出了一种基于LVQ网络对航空发动机气路系统进行特征提取方法,并达到了91%的平均诊断准确率,该文献针对高维度的航空发动机气路系统参数所做的特征降维与特征选择提供了较好的思路。文献[4]提出了基于灰色关联分析的航空发动机气路系统关键部件的故障诊断方法,取得了很好的诊断精度。借鉴以上学者研究航空发动机故障诊断的经验,本文引入一种新的人工神经网络模型——概率神经网络(Probabilistic Neural Network,PNN)。PNN是径向基神经网络(Radial Basis Function Neural Network,RBF)的一种扩展。PNN采用基于待分类样本的后验概率估计方法进行类型识别。对于具有足够多的有代表性的样本数据,可以直接通过算法学习,生成相应的模型。从而避免了反复训练,而且训练很快收敛。由于在输出层采用了竞争机制,这样有效地避免了样本被拒绝识别[5]的情况。

本文针对航空发动机气路系统特征参数具有高维度、高冗余,并且特征参数之间相关性强等特点,并结合现有成熟的基于神经网络的诊断方案,提出了一种基于ReliefF-PNN的发动机气路系统诊断策略。使用ReliefF算法选择得到最优特征参数子集,将原始特征降低至6个维度。利用最优特征参数子集训练生成基于PNN的诊断模型,最终诊断实验得到100%的精度。

1 ReliefF特征选择理论

特征选择是指按照某一评价准则从给定系统中的原始特征数据集中筛选出能够表征系统的最优特征子集。

已知某一系统的数据集X,具备n个特征,记为:X={x1,x2,…,xn}。给定一个特征选择方法Feature-Selection-Method,在评价准则Judge下,评价每一个特征xi(i∈n),从中筛选出能够表征原始系统的最优特征子集Y,其中Y满足Y⊆X。

1.1 Relief算法

Relief算法[6]是一种经典的特征选择算法,也是目前普遍公认的最好的过滤(Filter)式算法。所谓Filter是指不依赖任何其他算法的指导,仅使用原始数据集内在的特性来进行特征选择[7]。

Relief算法具有较快的计算效率,且对数据的类型和规模没有限制。其本质是利用特征对于分类的影响来评价特征权重,通过特征权重的大小获得对应的最优特征子集[8]。特征权重大意味着对应的特征有助于区分类别。当特征的权重足够小到接近0时,表明这个特征与类别相关性极低。当特征权重计算结果出现负值时,表明同一类别的邻近样本距离比不同类别邻近样本距离大,那么说明该特征对类别区分是起到负面作用的。

对于随机选取的m个样本x,Relief算法通过计算样本在各个属性上的假设间隔[9],并累加起来作为最终特征属性的权重。属性p的权重更新可表示为

(1)

式(1)中,H(x)表示与样本x处于同一类别中的最近邻样本点;M(x)表示与样本x处于不同类别中的最近邻样本点。

当属性为离散时,函数diff()定义如下

(2)

当属性为连续时,函数diff()定义如下

(3)

式(3)中,max(p)和min(p)分别是属性p的最大值和最小值,对应权重的上界和下界。

1.2 ReliefF算法

仅能针对两分类的问题作特征选择是Relief算法的局限性。在传统的Relief算法基础上Kononenko提出了能够解决多分类和回归问题,以及应对数据缺失的ReliefF算法[10]。

ReliefF算法的权重更新公式为

(4)

对于含有噪声的特征数据会在原有的基础上产生微小的偏移,从而干扰特征对类别的准确表示。当噪声的影响波及到多个属性时,会严重影响对非同一类别中近邻样本的判定。ReliefF算法选择使用k近邻样本而不是最近邻样本,通过计算k个样本的平均,在一定程度上减少了噪声对原始数据的影响。

2 PNN故障诊断模型

概率神经网络[11](Probabilistic Neural Network,PNN)是一种用于模式识别的分类器。其本质是基于贝叶斯最小风险准则发展而来的一种并行计算方法。目前已经广泛应用于故障诊断[12-13]、电力保护[14-15]及模型评价[16-17]等各个领域中。

基于PNN的故障诊断方法实际上是概率统计学中被广泛接受的一种决策方法。假设有两种已知的故障模式Y1和Y2,对于要判断的故障特征的样本数据集X={x1,x2,…,xn},若满足下式

if(P1·L1·F1(x)>P2·L2·F2(x)),then(x∈Y1)

if(P1·L1·F1(x)

(5)

L1表示将原本属于模式Y1的故障样本错误的划分到模式Y2所产生的代价因子。同理L2意为将原本属于模式Y2的故障样本错误的划分到模式Y1所产生的代价因子。

F1和F2表征故障模式Y1和Y2的概率密度函数(Probability Density Function, PDF)。通常PDF值不能够精确的获得,普遍的做法是根据现有的故障样本数据集求其统计值做近似代替。Parzen[18]提出了从已知随机样本中估计PDF的方法

(6)

式中:D表示训练样本集的维度,对应训练样本集中特征参数的个数;σ为平滑因子,σ值的大小决定了以样本点为钟形曲线的宽度;x1j表示故障模式Y1类的第j个中心矢量。同理可以计算出F2(x)。

PNN是包含四层结构的网络模型,分别是输入层、模式层、求和层和输出决策层。神经网络的输入层接收来自给定集合的数据。模式层的激活函数定义为高斯函数,其神经元个数是训练样本的个数。求和层将模式层的输出按类别相加,相当于加法器,在求和层中计算所得结果即为故障模式的估计概率密度函数值,其神经元个数等于类别的数目。神经网络的输出由竞争层判决,在各个故障模式的估计概率密度中选择出最大的后验概率密度的神经元作为整个网络的输出值,输出结果只有一个1,其余结果都是0,其中概率值最大的那一类将输出1。PNN网络模型正是通过模式层和求和层的计算实现了贝叶斯决策,这一点也可以将式(6)代入式(5)中得到验证。

3 基于ReliefF-PNN的气路系统故障诊断

3.1 发动机气路系统故障诊断存在的问题

在实际工程领域中,航空发动机气路系统故障诊断所面临的问题是,如何从高维度的样本中选择出具有代表性的特征进行诊断识别,进而达到提高诊断效率与诊断精度的目的。所以对气路系统进行特征参数选择必然成为诊断前的第一步工作。特征选择是指从系统原始特征数据集中选择出一个能表达系统的特征子集,并且这个特征子集能够在所使用的选择方法中达到最优的评估结果。一般称所选的特征子集为最优特征子集。对于一个模式识别问题,优秀的机器学习样本是训练出好的分类器模型的关键。样本数量的庞大,样本特征之间的冗余性以及不相关性都会使得训练生成分类模型时产生混乱,进而影响最终的测试结果。因此,选择较好的特征,降低样本的规模去除冗余性,对于加速机器学习速度和提高模型分类性能起到重要的作用。

3.2 基于ReliefF-PNN的气路系统故障诊断流程

为提高航空发动机气路系统故障诊断的精度,本文结合气路系统采集的数据维度高及相关性强等特点,提出了一种基于ReliefF-PNN的气路系统故障诊断方法,算法的流程图如图1所示,建立的PNN诊断模型如图2所示。

图1 基于ReliefF-PNN的发动机气路系统故障诊断

图2 气路系统故障诊断的PNN网络结构

3.3 基于ReliefF-PNN的气路系统故障诊断主要步骤

基于ReliefF-PNN方法的气路系统故障诊断主要步骤如下:

步骤2: 利用ReliefF算法选择得到S个具备表征气路系统的参数,其中s=1,2,…,S,表示第s个特征。以这S个参数构建气路系统的最优特征参数子集,记为SubF={f1,f2,…,fS}。

步骤3: 设置PNN网络平滑因子σ,一般取值σ∈(0,1]。

步骤9: 通过对最终输出的C(X)来分析气路系统的诊断结果。

4 发动机气路系统故障诊断分析

本次实验采集某型航空发动机气路系统的14个特征参数。具体是:低压转子相对物理转速(N1)、高压转子相对物理转速(N2)、高压转子按25截面的相对转换速度(N2c25)、大气压强(Pla)、高压导叶实际温度(Alfa2)、发动机进口温度(T2)、低压涡轮后温度(T6)、25界面压气机进口温度(T25)、发动机进口压力(P2)、压气机出口压力(P3)、低压涡轮后压力(P6)、落压比反馈值(EPR)、主燃油流量给定值(WfmDem)和喷口喉道面积反馈值(A8)。这14个特征参数构成的数据集对应航空发动机气路系统的3种故障模式,定义为发动机温度故障(M1)、发动机转子故障(M2)和发动机扇叶故障(M3)。分别在每种故障模式下采集数据300组。部分数据显示如表1所示。

表1 发动机气路系统特征参数原始数据集(部分)

4.1 基于ReliefF的气路系统特征参数选择

参见表1中的数据样本,定义全特征参数样本集为:AllFeatures={N2,N2c25,Alfa2,P3,T25,N1,WfmDem,A8,ERP,T6,P6,T2,P2,Pla}。使用ReliefF算法对AllFeatures集合中三类故障模式下的14个特征参数,做特征选择。本文实验环节中选取ReliefF算法中近邻样本个数为k=100。实验所得结果为AllFeatures集合中每个参数的特征权重。按从大到小对特征权重排序,如下表2所示。

从表2的特征参数权重排名可以看出前6个参数的特征权重明显大于0,说明这几个特征对于区分不同的故障类别起到正向的积极作用。其

表2 特征参数权重排名

他特征参数的特征权重出现了负值,表明同一故障状态下的邻近样本距离比不同状态的邻近样本距离大,这些特征对故障状态的诊断会起到负面的作用。本次实验最终选择特征权重大于0的前6个特征参数,创建最优特征参数子集为:BestSubFeatures={T2,T25,T6,N2c25,Alfa2,N1}。

4.2 基于PNN的气路系统故障诊断

将最优特征参数子集BestSubFeatures中的特征参数,共计900组数据,分为训练集和测试集两组。其中训练集使用600组数据,测试集使用300组数据。使用训练集数据训练得到基于PNN的气路系统故障诊断模型,使用测试集数据测试模型的准确性。采集对应BestSubFeatures集合中的传感器参数300组,验证PNN模型的诊断精度,结果如图3所示。可以看出诊断精度高达100%。对于未经ReliefF算法选择的全特征参数集AllFeatures,使用同样样本规模的训练和测试数据,进行网络的训练与测试,最终验证模型的精度,结果如图4所示。诊断精度虽然也能达到94.67%。但是在实验的过程中发现,生成基于PNN的诊断模型后,使用全特征参数集的数据做诊断验证,所得到的结果并不稳定。多次实验观察,原因是第三个故障模式的识别得不到较好的效果。实验结果记录参见表3。

图3 ReliefF特征选择后PNN诊断结果

图4 ReliefF特征选择前PNN诊断结果

序号诊断样本及模型诊断精度M3的诊断精度1BestSubFeatures-PNN100%100%2AllFeatures-PNN94.67%84%3AllFeatures-PNN92.67%78%4AllFeatures-PNN94.33%83%5AllFeatures-PNN95%85%

在最优特征子集BestSubFeatures中逐一减少特征参数,减少规则按表2中的前6个参数的特征权重排名从小到大依次减少。训练生成PNN的诊断网络并测试,得到如表4的验证结果。

表4 减少最优特征子集中特征参数的实验对比

表4结果说明,本文实验时依据特征权重大于0为准则,选取全部大于0的特征参数创建得到的最优特征参数子集,为最好的气路系统故障诊断依据。

在最优特征子集BestSubFeatures中逐一增加不属于本集合中的特征参数。增加特征参数的规则为:从表2中的第7个特征参数开始,按特征权重排名从大到小的规则依次增加。训练生成PNN诊断网络并测试,得到如下表5的验证结果。

表5 增加非最优特征子集中特征参数的实验对比

表5结果说明,本文研究的航空发动机气路系统故障诊断,可以使用最少的特征参数,也即使用最优特征子集BestSubFeatures中的全部参数,达到诊断精度很高的效果。

根据PNN故障诊断的理论模型可知,对于具备表征故障模式的充足样本,PNN可以直接通过算法学习,避免反复训练,以较快的速度达到收敛,最终生成相应的诊断模型。为了验证PNN的诊断效率,本文分别设计了BP神经网络和RBF神经网络的诊断模型与之进行对比,采用最优特征子集中的实验数据进行建模、测试与诊断验证。得到如下表6结果。

表6 诊断模型的实验对比

从表6的对比结果可以看出,使用最优特征样本集获得的BP诊断模型得到的诊断精度远不符合工程需求。分析得知,BP网络在训练模型时出现了过拟合,导致在诊断分析的过程中陷入了局部最优解的困境,从而出现大量当前故障模式样本被错误的划归为邻近模式中。相较于BP神经网络,RBF网络的诊断精度和网络收敛时间要好很多。但是和PNN网络对比,可以看出,PNN模型能够更快的达到收敛结果,而且诊断精度也大幅提升。

5 结论

(1)本文利用ReliefF算法对3个类别的发动机气路系统数据进行特征选择。有效地选择出能够反应气路系统故障状态的6个最优特征参数。实现了特征降维的目的,提高了故障诊断精度。

(2)通过对比PNN、RBF和BP神经网络的诊断模型分析。可以看出,在样本数据量相同的情况下,使用PNN训练最优特征子集得到的诊断模型,在诊断精度和诊断效率上有很大的优势。

(3)在今后的实际应用中,可以利用ReliefF算法选择得到某型发动机气路系统的最优特征参数,并在离线状态下训练生成基于PNN的诊断模型。通过训练好的诊断模型实现气路系统实时状态的故障诊断。

猜你喜欢
气路子集特征参数
由一道有关集合的子集个数题引发的思考
拓扑空间中紧致子集的性质研究
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
双向LSTM模型在航空发动机气路故障诊断的应用
航天控制(2020年5期)2020-03-29 02:10:34
关于奇数阶二元子集的分离序列
一种高压气路接触件密封结构改进设计
机电元件(2018年4期)2018-08-09 12:17:38
基于PSO-VMD的齿轮特征参数提取方法研究
统计特征参数及多分类SVM的局部放电类型识别
电测与仪表(2015年7期)2015-04-09 11:40:04
每一次爱情都只是爱情的子集
都市丽人(2015年4期)2015-03-20 13:33:22