唐静,胡云安,肖支才
基于KPCA和类峰值特征的模拟电路诊断方法✴
唐静,胡云安,肖支才
(海军航空工程学院控制工程系,山东烟台264001)
针对传统的核主成分分析方法(KPCA)无法解决在故障样本交叠严重时多分类性能较差的问题,提出一种基于改进KPCA的特征提取和类峰值特征辅助识别分类相结合的模拟电路故障诊断方法。在预处理阶段,提出了一种图像混合欧氏距离用于建立核函数,进行核主成分分析特征提取,克服了传统KPCA的局限性;并且设计了一种用类峰值特征识别的方法进行辅助识别预分类,提高分类速度。标准电路的故障诊断仿真和结果分析表明,该方法较好地克服了交叠样本给分类带来的困难,具有很好的故障识别速度和正确率。
模拟电路;故障诊断;主成分分析;欧氏距离;类峰值特征
模拟电路自身由于存在电路非线性、器件容差、难于模型化、可及节点有限性和输入和输出间的关系复杂等原因,其相关故障诊断技术[1-3]发展缓慢。随着检测手段的日益丰富和数据分析能力的不断提高,基于知识和数据的模拟电路故障诊断得到了重点的研究和发展,已成为当今研究的热点领域。基于知识的模拟电路故障诊断方法[4-7]可以在没有电路精确解析模型的情况下对电路运行的过程数据或测试数据进行分析处理,完成故障诊断和故障定位。
模拟电路的故障诊断一般包括以下几个步骤:首先,测试节点选择和测试数据的归一化处理;其次,数据特征提取;第三,故障分类识别。第2个和第3个环节是现在模拟电路故障诊断所关注的重点。
在数据特征提取方面,基于核函数的主成分分析(KPCA)方法[8-9]最为突出,它通过某种事先选择的非线性映射,将输入向量X映射到一个高维特征空间F,使输入向量具有更好可分性,达到高维输入数据降维的目的。尽管核方法能够表示目标间复杂的非线性关系,但在故障样本交叠严重时多分类性能较差,需要找到一个对数据敏感的核函数来提高映射转换空间的分辨性能。
在故障分类识别环节,文献[10]使用最近邻域法实现待测样本的识别,由于需要计算待测样本投影与每个训练样本投影的距离,当训练样本数量较大时,其运算分辨的时间将大大延长,在某些对处理分类时间要求较高的场合中,不能满足对处理速度的要求。
针对这些问题,本文引入图像处理的概念和方法。基本思路为:对于大规模模拟电路,在数据特征提取阶段,提出一种图像混合欧氏距离(Image Mixed Euclidean Distance,IMED)进行核主成分分析的方法进行特征数据降维,克服了传统KPCA在故障样本交叠严重时多分类性能较差的局限性;然后给出一种类峰值特征识别的方法对待测样本进行预分类,再用最近领域法计算待测样本投影与每类训练样本的峰值特征投影的距离进行分类。仿真分析表明,在不降低分类精度的前提下,该方法有效地提高了分类速度。实际电路的故障诊断结果表明,该方法故障识别速度和正确率均高,具有较好的应用前景。
在模拟电路中,节点之间往往具有线性或非线性的关系,当电路出现周期性的激励信号和白噪声信号并存时,所采集的节点测试数据会出现一定程度的“闪烁”,在此基础上做非线性映射,会出现严重的交叠现象,影响样本的分离程度。
这里引入图像处理的方法,运用一种图像混合欧氏距离(ImageMixed Euclidean Distance,IMED)构造核函数进行降维,这种距离充分考虑了图像的空间关系和先验知识,将其引入KPCA中,可以克服传统KPCA的局限性。
设电路数据样本经预处理后的已知样本为X={x1,x2,…,xi,…,xN}∈RL×L,其中xi表示第i个样本,N表示已知样本总数。另设已知样本的类别总数为c。
定义Φ为一个非线性映射,对应空间记为F,F空间中的样本记为Φ(xi),即F空间中样本X的协方差表示为
¯C=E{(Φ(X)-E(Φ(X)))(Φ(X)-E(Φ(X)))T}=
其中,
将式(4)代入式(3),可得:表示F空间中所有样本的均值。对¯C做特征分解得:
这里,V是F空间中对应λ≥0的特征矢量。由于V可由F空间中的所有样本Φ(xi)张成,故式(2)可以写成:同理,存在
这说明,只要求得内积(·),求解式(3)的特征向量V,问题便转换为求特征方程(5)的特征向量α问题。
则F空间中的内积关系运算可用核函数K(x,x′)表示:
当F空间为Hilbert空间,K(x,x′)是对称正定矩阵,则式(5)可以用核函数表示:
其中,I表示一个N×N的单位阵,1表示N×N的全1矩阵,K为N×N的半正定对称矩阵,满足K=
M ercer定理:对于任意的对称函数K(x,x′),它是某个特征空间的内积运算的充分必要条件是,对于任意的<∞有
由式(9)可知,任意对称的函数只要满足Mercer定理都可作为核函数。
核函数是一个满足Mercer条件的对称正定矩阵,然而无论什么形式的核函数,都需要具备一种关键的性质:捕获适合于特定任务和领域的相似性衡量尺度,即核函数应反映两个样本的相似程度。引入一种二维图像的欧氏距离:
其中,G=(gi′j′)L2×L2采用以下方式定义:
其中,σ表示方差参数,当σ→∞时,图像欧式距离趋于传统的欧式距离。
式(11)是图像欧式距离中常采用的方式,一般称之为高斯型函数。高斯型函数是基于模-2距离的,其中含有平方运算,向量中数值大的元素在总的计算中可起更大的作用。在电路出现周期性的激励信号和白噪声信号并存时,所采集的节点测试数据会出现一定程度的“闪烁”,而模-2距离可放大“闪烁”效应。因此,根据图像欧氏距离的条件,下面给出一种混合G的形式:
式中,σ表示方差参数。式(12)将模-2距离和模-1距离进行组合,既能有效压低“噪声”信号对识别的影响,又能有效抑制闪烁效应。
借鉴高斯型核函数,则基于图像混合欧氏距离的高斯型核函数可以表示为
将式(11)~(13)代入式(8)求解特征方程,依次选取最大的m个特征值对应的特征矢量v1,v2,…,vm构建相应的特征矢量子空间F,则任一样本在F空间vk上的投影可以表示为
在用最近领域法进行分类之前,由于传统的最近领域法计算待测样本投影与每个训练样本投影的距离,当训练样本数量较大时,其运算时间不尽如人意,特别是在某些对处理分类时间要求较高的场合中,更无法满足对处理速度的要求。本文考虑到电路数据样本中,不同的节点在不同的工作状态下,节点具有特定的工作范围,某些节点的工作范围与其它节点有明显的不同,即可以利用其局部特征对全局特征进行辅助识别。其中某一类电路状态的“峰值”是指那些同时在电路幅值和激励状态呈局部极大值的那些点,利用峰值和工作类别的对应关系实现状态的分类和识别。
对于某一类电路数据样本而言,其类峰值特征可用6个参数表征:该类电压或电流值的峰值位置、幅度、所在特征空间的峰值宽度以及取向。这里可以用一种高斯峰值模型来表征某一类数据的峰值I(x,y):
式中,x、y表示幅度分布中的坐标,H0、H1为常数,x0、y0分别表示响应的峰值位置,σx0、σy0分别表示响应的峰值宽度。
模拟电路的冲激响应可以用二维高斯函数近似:
则峰值函数可以表示为
因为一般系统冲激响应函数中参数σb为常数,故式(17)可进一步表示为
式中,σu0、σv0为峰值在旋转后的u轴和v轴的宽度,u0、v0为峰值中心的位置,H为峰值幅度。由此可知,只要求得峰值函数的6个参数,某一类数据的峰值散射中心特征就可以获得。
对式(18)进行泰勒展开,可以用二次抛物面方程近似表示:
其中:
解方程(20)~(25)就可以获得峰值的6个参数,进而求得峰值特征。
获得峰值特征后,通过计算数据样本和各种类峰值特征之间的匹配程度作为分类的预处理步骤,这里给出待测样本与已知各分类峰值特征的匹配关系式:
采用类峰值特征预处理的最近领域法识别分类的步骤如下:
(2)根据式(12)~(14),运用图像混合欧氏距离进行核主成分分析的方法进行特征数据降维,经非线性映射,根据贡献率选取主成分,在F特征空间V上求得的训练样本和测试样本的投影分别为Y和YT;
(3)根据式(18)求出每一个模式在降维后的特征空间映射的类峰值特征集合I={I1,I2,I3,…,Ic},c为类的数量;
(4)根据式(28),计算待测样本与每个类峰值特征的匹配程度,这里为提高诊断正确率,选取匹配程度最高的3个类做为候选类;
(5)计算待测样本投影与每个候选类中的训练样本投影的距离,利用最近邻域法实现待测样本的分类定位。
本文选择ITC′97国际标准电路中的CTSV滤波器为例进行仿真和分析。CTSV滤波器电路如图1所示。电路中电阻和电容等无源器件的容差设为10%。无源器件的标称值为R1=R2=R3=R4= R5=10 kΩ,R6=3 kΩ,R7=7 kΩ,C1=C2=20 nF。
考虑待测电路的单一软故障,F1(R1+50%)、F2(R1-50%)、F3(C1+50%)、F4(C1-50%)、F5(C2+50%)、F6(C2-50%)、F7(R5+50%)、F8(R5 -50%),多种软故障组合:F9(R1+50%&C1+ 50%)、F10(R1-50%&C1-50%)、F11(R5+50%&C2+50%),其中符号“+”或“-”表示故障值上偏或下偏离元件的标称值;加上电路正常工作状态NF,则共有12种状态模式。
在NI-Multisim10电路仿真软件中对CTSV电路进行仿真,对电路每种故障模式进行150次Monte Carlo仿真。从Vin节点输入激励信号,激励信号采用脉宽为10μs、幅度为5 V的单脉冲信号,在节点6(Output)处采集各种状态下电路的响应电压信号。对电路每次响应信号的前200μs信号进行采样得2 000个数据点,进行10层Haar小波变换,因为小波变换理论中近似系数和细节系数分别体现了故障信号的低频和高频信息。用每层近似系数的第一个数值构成低频特征,用每层细节系数的绝对值之和构成高频特征,分别构成十维低频和十维高频特征向量,并对其进行归一化处理。电路每种状态模式的特征由150个低频特征和150个高频特征样本组成,其中50个样本用于训练,100个样本用于测试。
表1为利用基于IED高斯型核函数在不同维数下几个模式获得的识别结果,参数σ=1,高斯型核函数中参数δ=10。表2为利用传统KPCA方法获得的F10模式的识别结果,其核函数仍然选取高斯型核函数,参数同上。
由仿真结果可以得到如下结论:
(1)由表1可以看出,文中所述的KPCA算法能实现多故障和软故障的识别分类,且正确识别率较高;从平均识别率看,当特征矢量维数增大时,正确识别率先增大后降低,在维数为10附近获得较高的识别结果;
(2)由表2可以看出,基于IED的KPCA识别算法的识别性能优于传统的KPCA。
表3为12种状态模式的诊断分类平均时间,传统方法为最近领域法,OURS为本文设计的预处理方法,计算平台为Intel双核E5300,2G内存,160G硬盘,XP操作系统,从诊断运行时间上可以看出,由于经过了类峰值特征预分类,所需的计算时间和工作量大大减少,是一种可以用于实时诊断系统的方法。
分析结果可以发现,本文提出的方法和故障诊断组合方法是一种可行的方法。从诊断性能上,本文所提出的优化组合诊断方法较现有的方法更适用于容差模拟电路的故障特征数据提取和分类。并且对软多故障的诊断,本文所提出的方法性能最好,具有一定的实用价值。
本文所研究的改进的KPCA特征提取方法结合样本类峰值特征辅助识别的模拟电路故障诊断方法,在不降低分类精度的前提下,有效地提高了分类速度。在标准电路的故障诊断中,诊断的速度和结果表明,该方法能突出不同故障的特性,故障识别速度和正确率高,具有较好的应用前景。在研究过程中,发现类峰值特征选择的适当与否对分类精度的影响较为明显,其特征的选取原则和选取要求将是下一步工作关注的重点。
[1]陈晓娟,王树勋,戴逸松.一种基于神经网络的模拟电路故障诊断方法[J].电讯技术,2004,44(3):43-46.
CHEN Xiao-juan,WANG Shu-xun,DAIYi-song.An Analog Circuit Fault Diagnosis Method Based on Neural-Network[J].Telecommunication Engineering,2004,44(3): 43-46.(in Chinese)更生
[2]周绍磊,张文广,何,等.模拟电路故障诊断技术研究[J].海军航空工程学院学报,2006,21(1):127-130.
ZHOU Shao-lei,ZHANGWen-guang,HE Su,et al.Re-search on the fault diagnosis technology of analogue circuits[J].Journal of Naval Aeronautical Engineering Institute,2006,21(1):127-130.(in Chinese)
[3]朱大奇,桑庆兵.光电雷达电子部件的量子神经网络故障诊断算法[J].电子学报,2006,34(3):573-576.
ZHU Da-qi,SANGQing-bing.A FaultDiagnosis Algorithm for the Photovoltaic Radar Electronic Equipment Based on Quantum Neural Networks[J].Acta Electronica Sinica,2006,34(3):573-576.(in Chinese)
[4]边肇祺,张学工.模式识别[M].2版.北京:清华大学出版社,2003:65.
BIAN Zhao-qi,ZHANG Xue-gong.Pattern Recognition[M].2nd ed.Beijing:Tsinghua University Press,2003:65.(in Chinese)
[5]马超,陈西宏,邓均明,等.模拟电路故障诊断的信息融合新方法[J].微电子学与计算机,2011,28(4):253.
MA Chao,CHEN Xi-hong,DENG Jun-ming,et al.A New Information Fusion Algorithm for Analog Circuit Fault Diagnosis[J].Microelectronics&Computer,2011,28(4): 253.(in Chinese)
[6]DAOQ Z,SONG C C,ZHIH Z.Learning the kernel parameters in kernel minimum distance classifer[J].Pattern Recognition,2006,39(1):133-135.
[7]Xiong H L,Swamy M N S,OmairM Ahmad.Optimizing the kernel in the empirical feature space[J].IEEE Transactions on Neural Networks,2005,16(2):460-472.
[8]Shawe-Taylor J,Cristianini N.Kernel Methods for Pattern Analysis[D].Cambridge:Cambridge University Press,2004.
[9]Bach F R,Jordan M I.Kernel independent component analysis[J].Journal of Machine Learning Research,2002,3(2):1-48.
[10]李松,郝忠孝.球面上最近邻空间关系处理方法[J].计算机工程,2010,36(6):91-93.
LISong,HAO Zhong-xiao.Methods for Handling Nearest Neighbor SpatialRelations on Spherical Surface[J].Computer Engineering,2010,36(6):91-93.(in Chinese)
TANG Jing was born inWuhan,HubeiProvince,in 1978.He received the B.S.degree in 2004.He is currently working toward the Ph.D.degree.His research interests include intelligent faultdiagnosis and testing.
Email:tangj105@163.com
胡云安(1966—),男,湖北松滋人,教授、博士生导师,主要研究方向为控制理论与控制工程、智能控制与测试工程;
HU Yun-an was born in Songzi,Hubei Province,in 1966.He is now a professor and also the Ph.D.supervisor.His research interests include control theory and control engineering,intelligent control and test engineering.
肖支才(1976—),男,湖北汉川人,副教授,博士研究生,主要研究方向为模式识别与智能系统。
XIAO Zhi-cai was born in Hanchuan,Hubei Province,in 1976.He isnow an associate professor and currentlyworking toward the Ph.D.degree.His research interests include pattern recognition and intelligent system.
An Analog Circuit Fault Diagnosis M ethod Based on KPCA and Class Peak Characteristics
TANG Jing,HU Yun-an,XIAO Zhi-cai
(Department of Control Engineering,Naval Aeronautical and Astronautical University,Yantai264001,China)
Traditional KPCA methods can not solve the problem of poormulti-classification performance when fault samples overlap seriously.So,this paper presents amethod of analog circuit fault diagnosis based on improved KPCA and class peak characteristics.In the data pre-processing stage,an Image Mixed Euclidean Distance(IMED)kernel principal component analysismethod for data dimensionality reduction is proposed,which overcomes the limitations of traditional KPCAmethods.Then,feature recognition of the class peakmethod is designed to perform pre-classification so as to improve classification speed.The circuit fault diagnosis shows that themethod can overcome the difficulty caused by overlap samples and is featured by good fault failure recognition speed and accuracy.
analog circuit;fault diagnosis;PCA;euclidean distance;class peak characteristics
The National Natural Science Foundation of China(No.61004002)
TN707;TP391
A
10.3969/j.issn.1001-893x.2011.12.025
唐静(1978—),男,湖北武汉人,2004年获硕士学位,现为博士研究生,主要研究方向为智能电路故障诊断和测试技术;
1001-893X(2011)12-0117-06
2011-07-26;
2011-09-29
国家自然科学基金资助项目(61004002)