张燕飞,李赟豪,王东峰,孔令飞
(1.西安理工大学 机械与精密仪器工程学院,西安 710048;2.洛阳轴承研究所有限公司,河南 洛阳 471039)
滚动轴承是旋转机械中应用最广泛的机械部件,其运行状态直接影响整机的性能、效率和精度[1]。滚动轴承长时间运行在恶劣的工作环境中,很容易产生损伤,滚动轴承故障在旋转机械故障中的占比达30%[2],因此对轴承的故障诊断及状态监测尤为重要。
目前,常见的滚动轴承状态监测方法以故障特征提取为基础,如将时域特征统计指标作为轴承是否存在故障缺陷的判断依据,经过傅里叶变换获取轴承振动信号频谱图中的频率成分组成以及各个频段内幅值的大小等故障信息[3]。轴承状态特征指标的计算中,利用时域、频域及时频域特征所组成的多维特征矩阵能够更全面地表征轴承状态的变化[4],但往往需要进行降维以提高计算效率。考虑到多特征指标之间的冗余线性和相关性对轴承故障监测精度的影响,采用主成分分析法(Principal Component Analysis,PCA)计算最优的特征指标,该算法能够将高维的数据映射到低维的空间中,依据特征贡献率的大小对特征进行重构,从而实现较少维度数据提供较高贡献率的目的,同时也较好地保留原数据点的特性。
随着工业化和信息化的不断发展,机械装备的智能水平得到了进一步提升,新一代信息技术的不断创新也为机械装备状态监测和故障诊断的发展提供了巨大的推动力[5]。在滚动轴承状态监测研究中,单一类型数据提供的状态信息囿于其局限性,难以精确反映轴承故障状态[6]。为实现更精确的监测功能,需利用多源信息对轴承状态进行分析,以获得更全面的监测结果[7]。然而,由于不同类型传感器的数据结构不同,其蕴含的轴承状态信息对诊断结果的贡献率也有差异,需采取有效措施对多源信息进行融合,才能得到可靠的监测结果。
D-S证据理论是一种常用的信息融合方法,不仅满足比概率论更弱的条件,还具有更严谨的推理过程[8],近年来被广泛应用于多传感器信息融合、目标识别、状态监测等领域[9-11]。然而,D-S证据理论在融合含有冲突证据的信息时往往得出有悖常理的结论,国内外学者针对此问题提出了一些改进方法:文献[12]将单一传感器的支持度与目标信息的距离作为权重对D-S组合规则进行改进,并通过仿真试验验证了该方法的有效性;文献[13]通过pignistic算法重新定义了证据冲突的评估指标,对证据源进行了权重计算,提出了新的证据组合规则,并通过仿真算例验证了算法的有效性;文献[14]基于可信度函数对D-S证据信任模型进行改进,并通过仿真分析验证了该模型的合理性和准确性。上述方法通过计算证据源之间的相似度、证据支持度等确定各自的权重系数,一定程度上取得了比较满意的效果;但权重分配具有一定的主观性,且随着证据源的增加,在权重分配的结果中会造成原始证据特征信息的丢失;因此,关于权重的计算可以做进一步的优化。信息熵是度量系统有序程度的重要指标,能够很好地区分不同价值程度的信息源,熵值越小,表示信息的价值越大;反之,熵值越大,表示信息的价值越小[15]。根据信息熵的定义,可以使用熵值判断轴承特征指标的离散程度,熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)就越大:因此,本文采用熵权法对每个信息源进行权重计算,对证据源进行修正并结合新的证据源计算每个证据源中的目标不确定度,构建新的D-S识别框架。
综上所述,本文提出一种基于多源信息融合滚动轴承故障监测方法,首先,对多类型数据进行时域、频域及时频域特征的提取,获得多维的故障特征矩阵;然后,结合PCA算法进行降维及特征指标的筛选,并采用基于熵权法的权重计算方法对各个数据源的初始证据进行修正;最后,利用孙全组合规则对融合决策进行改进,得到新的证据合成规则。
降维是从高维度数据中保留最重要的特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。主成分分析是一种使用最广泛的数据降维算法,其能够在原有N维特征的基础上重新构造出全新正交的K维特征(即主成分),PCA算法流程如图1所示。
图1 主成分分析算法流程
时域统计特征可分为峰值、均方根值、峭度等有量纲指标,以及峰值指标、峭度指标、斜度指标等量纲一化指标。频域分析方法具有更高的精度,信号经过快速傅里叶变换后的频谱图中的频率成分组成及其幅值大小则包含了更精确的状态信息,本文提取平均频率、均方频率、均方根频率、频率方差和频率标准差这5种频域特征进行分析。时频域分析方法能够结合时域、频域信息更好的反映数据的特征,并能够描述信号的局部细节特征,从而有效处理非平稳信号。小波包分解能够对信号的低频部分和高频部分进行分解[16],具有非冗余性、相关性和完备性等特点,本文选取db3小波作为小波基函数,利用小波包分解算法对原始信号进行3层分解,得到8个节点的小波包分解系数并对各节点的分解系数进行重构,最后计算前5个重构信号的频段能量,作为5种不同的时频特征,即Ei,i=1,2,3,4,5。
综上所述,本文共提取24种不同的轴承故障特征数据(表1),即得到24维特征矩阵。多维数据在数据分析中往往会降低计算效率,增加计算难度,并且维度越高,数据在每个特征维度上的分布就越稀疏。因此,采用PCA算法对特征数据进行降维,选取第一主成分作为最终筛选结果;通过归一化处理得到数据区间为[0,1]的一维向量并将其作为后续故障监测的初始指标。
表1 特征提取表
信息熵是对系统有序程度的一种度量[17]。某个评价指标的信息熵越小,表明该指标的变异程度越大,提供的信息量越大,在综合评价中的作用也越大,即指标的权重也越大。因此,可以根据各指标的变异程度,利用信息熵计算各指标的权重。
通过上述特征筛选方法,计算每个信息源所采集数据的特征值。定义矩阵R={Rij}为初始的证据矩阵,其中i为信息源的数量,i=1,2,…,S;j为采集数据的次数,j=1,2,…,C;则初始证据矩阵可表示为
当初始证据Rij的变化相对明显时,计算所得各信息源的权重更准确。权重计算步骤如下:
1)计算第i个信息源下第j个证据值的比重
2)计算第i个信息源下的熵值
其中L=1/lnS(L>0,0≤Pij≤1)。
3)计算第i个信息源的差异系数
αi=1-Hi。
4)计算第i个信息源的权重
D-S证据理论是一种处理不确定信息的数学理论,其能够融合不同来源的信息,主要包含3个重要的参数:基本信任分配函数m(A)、信任函数(Bel)、似然函数(Pl)。
设Θ为识别框架,Φ为空集,则函数m(A):2Θ→[0,1]称为基本信任分配函数且满足
(1)
设m(A)为辨识空间Θ上的基本信任分配函数,∀A⊂Θ,则由
(2)
所定义的函数Bel:2Θ→[0,1]为Θ上的信任函数;Pl:2Θ→[0,1]为Θ上的似然函数。
设∀A⊂Θ,[Bel(A),Pl(A)]即A的信度空间,设m1,m2为Θ上的2个基本信任分配函数,则证据融合规则为
(3)
记为
m=m1⊕m1。
式中:N为归一化系数。
由(3)式可知,多个证据的信息融合与次序无关,可由2个证据的融合计算得到。
在应用中,发现D-S证据理论存在Zadeh悖论、一票否决、鲁棒性和公平性等问题,可从修改数据源或修改合成规则这2个方面进行改进。本文采用基于熵权法和孙全组合规则的方法对证据源和组合规则进行改进[18]。
1)定义识别框架为{R,Θ,Φ},其中R为传感器测得的不同状态的初始特征证据,通过各信息源的权重系数ω对证据R进行重构得到新的证据矩阵R′,即R′=ωR,则新的证据源为
(4)
式中:m′(Θ)为不确定度,包含识别框架中所有可能出现的情况。
2)基于孙全组合规则改进方法,对局部冲突引起的证据丢失进行分配,新的合成规则为
(5)
ε=e-k,
式中:p(A)为识别对象在证据源中的支持度;q(A)为识别对象在证据源中平均支持度;ε为证据可信度;k为证据源之间的冲突程度。
当k值较小时,数据之间的冲突较小,当k=0时,等同于D-S证据组合规则,当k趋近于1时,证据合成结果由ε*q(A)决定,因此,在融合2个冲突较严重的证据时,对未知部分的概率进行了一定分配,优化原始证据融合的结果。
多源信息融合轴承故障监测方法的具体步骤如下,诊断流程如图2所示。
图2 故障监测流程图
1)选取不同传感器所采集的数据源信息作为待处理对象。
2)对各传感器不同工况下的数据进行时域、频域及时频域的特征提取,获得24维的特征矩阵。
3)融合决策。①对特征矩阵进行PCA降维处理,筛选出能够表征轴承故障的状态指标,经归一化处理后作为待处理的初始证据;②利用熵权法对信息源的权重系数进行计算,并对原始证据进行重构;③结合改进D-S证据理论对新证据进行融合,得到监测结果。
采用帕德博恩大学的轴承故障数据作为样本集[19],轴承试验台如图3所示,由电动机、扭矩测量轴、滚动轴承测试模块、飞轮和负载电动机等组成。
图3 轴承故障检测试验台
滚动轴承故障类型分为人为损伤和真实损伤,其中人为损伤由电火花加工、钻孔和电动雕刻机加工的方法完成,包括7种外圈故障和5种内圈故障。
试验轴承型号为6203,该数据集除采集轴承振动信号外,还采集了电动机电流信号,采样频率均为64 kHz。测试数据按故障模式分为健康、内圈故障和外圈故障共3类故障;按损伤程度分为1~5共5个等级;按加载模式分为K0,K1,K2,K3共4种工况。为更好验证本文提出的故障监测方法,选取3组数据进行分析,对应的参数与文件名见表2。
表2 试验轴承数据分类表
4.2.1 特征提取
以“N15_M07_F10_ KI08”为例,该文件下的“.Y”文件中包含3组数据,分别为电流信号1、电流信号2和振动信号。为直观展示3组信号的变化,对每组数据均进行部分提取并绘制时域波形图,结果如图4所示。
图4 原始状态下的轴承数据的时域波形
4.2.2 特征筛选及初始证据计算
根据特征筛选方法,对特征矩阵P20×24进行PCA降维处理,并选取第一主成分作为初始特征指标进行分析;然后,对特征指标进行归一化处理,使数据归到[0,1]区间并将其作为初始的证据;最后,每个验证方案得到一个初始的证据矩阵R60×3,数字3表示信息源的数量。
4.2.3 新证据和组合规则计算
根据熵权法计算每个信息源在初始证据矩阵R中的权重系数ωi,i=1,2,3;对初始证据进行重构,得到新的证据特征矩阵R′;最后建立识别框架Θ={A1,A2,A3,C},其中,A1为加载条件K0或健康模式,A2为加载条件K1或内圈故障模式,A3为加载条件K2或外圈故障模式,C为不确定度。为解决局部冲突较大所引起的识别偏差,采用新的组合规则改进了融合方法,各信息源的权重系数见表3。
表3 信息源权重系数表
离散度是指同类指标分布相对某一中心指标分布的偏离程度,可用来分析数据之间的紧密程度。离散度μ的定义为
(6)
为更好地比较改进D-S融合算法的结果,定义所有工况下离散度之和的倒数为
(7)
表4 融合效果对比
(a)试验组1
分析可知:
1)单一类型数据的特征指标在实现轴承状态监测过程中的效果不明显,而且容易出现数据重合的现象,如试验组1中K0,K1工况下的电流信号及K1,K2工况下的振动信号,试验组2中K0,K2工况下的电流信号,以及试验组3中健康、内圈故障模式下的电流1信号都出现了数据重合现象,从而导致结果的区分度偏低,不利于观察。
综上,改进后D-S证据理论相比改进前的融合效果有明显提升,更适用于滚动轴承故障监测。
介绍了基于多源信息融合的滚动轴承故障监测方法,重点阐述了特征指标的筛选和信息融合框架的搭建。利用PAC算法对多维特征数据进行筛选,降低多维特征计算的难度;利用熵权法和孙全组合规则对D-S证据理论进行改进,得到新的证据源和组合规则,改进的融合算法能够更准确地识别轴承运行状态的变化情况。本文研究的不足之处在于融合的信息类型及数据源数量有限,仅分析了电流信号和振动信号的融合效果,对于新证据源的引入还需要进一步的研究。