摘 "要: 模糊C均值聚类(FCM)算法是一种基于非监督聚类算法。样本加权模糊C均值聚类(WFCM)算法是FCM算法的改进,该算法能够明显提高收敛速度和聚类的准确性。无论是FCM算法还是WFCM算法,对噪声都相对敏感,而且聚类数目仍然需要人工确定。在此提出一种改进算法,首先通过偏微分方程(PDE)降噪算法对原始脑MRI医学图像进行处理;其次利用聚类有效性确定最佳聚类数目,对WFCM算法进行改进;最后利用本文改进算法对图像进行聚类分割。实验表明,该方法是一种具有自动分类能力、抗噪性较好的模糊聚类图像分割算法。
关键词: 图像分割; PDE降噪; 聚类有效性; 样本加权; 模糊聚类
中图分类号: TN964⁃34 " " " " " " " " " 文献标识码: A " " " " " " " " " " " " " "文章编号: 1004⁃373X(2015)06⁃0090⁃04
Application of an improved WFCM⁃based algorithm in MRI image segmentation
HAN Hong⁃wei, MIAO Jia⁃qing
(Engineering amp; Technical College, Chengdu University of Technology, Leshan 614000, China)
Abstract: Fuzzy C⁃means clustering (FCM) algorithm is an unsupervised clustering algorithm. The sample weighted fuzzy C⁃means clustering (WFCM) algorithm is an improved FCM algorithm, which can significantly improve the speed of convergence and accuracy of clustering. Both FCM algorithm and WFCM algorithm are relatively sensitive to noise, but still need to determine the number of the clusters manually. In this paper, an improved algorithm is proposed, in which the noise reduction algorithm of partial differential equations (PDE) is used to process the original brain MRI image, and the cluster validity is adopted to determine the optimal number of clusters to improve WFCM algorithm and execute the image segmentation. Experiment results show that the improved algorithm has a capability of automatic classification and better noise immunity.
Keywords: image segmentation; PDE noise reduction; validity of clustering; sample weighting; fuzzy clustering
0 "引 "言
图像分割是图形处理的基本问题之一,是目标的特征提取、识别与跟踪的基础。由于脑MRI医学图像边界数据的模糊和整体图像数据的噪声干扰,使得医学图像分割问题比较困难[1]。由于脑MRI医学图像在一定程度上存在着不确定性,而模糊理论则正好对图像的这种不确定性有着较好的描述能力,因此模糊聚类被应用于图像分割问题中,并取得了较好的效果。而模糊C均值(FCM)聚类算法[2]是目前流行的图像分割方法之一。该算法适用于存在模糊性和不确定性图像的分割。
但是模糊C均值聚类这种算法也存在着一些明显的不足。比如没有充分利用图像的空间信息、聚类数目无法自动确定、计算量大等问题[3]。文献[4]提出了样本加权的模糊C均值聚类(WFCM)算法,作者认为样本在聚类过程中所起的作用不一样,对聚类结果产生的影响就不同,因此给每个样本赋予一定的权值对FCM目标函数进行修改,同时修改迭代公式。该算法提高了收敛速度和聚类的准确性,但是仍然无法克服人工确定聚类数的缺点,而且抗噪表现不理想。本文在该算法的基础上首先进行了偏微分方程图像降噪处理, 其次利用聚类的有效性进行最佳聚类数目确定, 最后进行样本加权改进。这样能够得到一种能自动给出最佳分类、抗噪性更好的改进算法。本文使用的脑MRI医学图像由西门子0.35T永磁核磁共振仪直接拍摄提供。
1 "偏微分方程降噪方法
1.1 "基于各向异性扩散PDE降噪模型
基于PDE的图像处理方法在医学图像降噪领域得到了广泛的应用,因为它在平滑噪声的同时,可以使得医学图像的细节,如血管信息, 病灶区域边缘和医学纹理信息等得到保护[5]。利用偏微分方程进行图像降噪的方法比较多,其中Catte降噪模型最具有代表性。Catte降噪模型是P⁃M降噪模型的改进. 下面介绍P⁃M图像降噪方法。Perona和Malik于1990年首先提出了各向异性扩散PDE模型, 即P⁃M模型[6], 如式(1)所示:
[∂u(x,y,t)∂t=div(g(∇u)∇u)u(x,y,0)=u0(x,y)] "(1)
式中:[g(∇u)]被称为各项异性扩散函数, Perona和Malik给出[g(∇u)]函数的经典选择, 如式(2)所示:
[g(∇u)=exp∇uK2] (2)
或选择:
[g(∇u)=11+(∇uK)2] (3)
式中:参数[K]是边缘阈值,故而对于函数[g(∇u)]中[K]的取值十分重要, 假若[K]取值过大, 脑MRI医学图像平滑过渡会直接导致医学图像的边缘模糊,医学信息细节丢失; 假若[K]取值太小, 脑MRI图像较早的停止了平滑扩散进而导致图像降噪效果不理想[7]。
现在来了解各向异性扩散的PM方程中的常量[K]对扩散的影响, 如式(4)所示可知:
[Φ(∇u)=g(∇u)∇u] (4)
首先对于梯度[∇u]增大, 则[Φ(∇u)]在零点附近的值趋于零, 当[∇u≈K]时函数[Φ(∇u)]取得最大值, 然后函数[Φ(∇u)]的值又下降到零, 故而函数[Φ(∇u)]的扩散特征可进而表示为: 当[∇ugt;K]时, 各向异性扩散退化为各项同性扩散; 当[∇ult;K]时, 函数[Φ(∇u)]的值趋于零, 各向异性扩散是很微弱的, 这样就便于脑MRI医学图像的边缘,血管等医学细节信息的保留。
PM方程的各向异性扩散的主要原理是: 沿着脑MRI图像的法向进行相应的滤波增强脑MRI图像的边缘的敏感性, 而沿着脑MRI医学图像的切向进行滤波则降低噪声。P⁃M方程可重写成如下形式:
[∂u∂t=11+λ2∇u2uξξ+1-λ2∇u2(1+λ2∇u2)2uηη] (5)
式中:[λgt;0(λ=1k)]是参数;[η=∇u∇u]; [ξ=∇u⊥∇u⊥][(∇u⊥=(-uy,ux))]; [ξ],[η]分别是脑MRI图像的切向和法向两个方向。同理,式(5)可重写成如式(6)的形式:
[∂u∂t=∇u=uξξ+uηη] (6)
对比式(5)和式(6)可见, 上述的降噪方法虽然可以实现脑MRI图像的医学细节信息的保留和图像降噪两个方面。由于该偏微分方程的所求得的解并不是惟一的, 就是说该偏微分方程是一个病态的PDE问题[8]。
各向异性扩散的P⁃M模型在一定程度上改进了各项同性扩散所存在的缺陷,但是P⁃M模型是一个病态问题, 为了解决这个问题使用正则化方法。利用[Gσ∗∇u]替换掉式(4)中的[∇u]来改进这个各向异性扩散的P⁃M模型, 其中[Gσ]是高斯核函数. 则P⁃M模型可以改进为如式(7)的形式:
[∂u(x,y,t)∂t=div[g(Gσ∗∇u)∇u]] (7)
式中[Gσ∗∇u=∇(Gσ∗u)=∇Gσ∗u], 同时式(7)也被称为正则化的各向异性扩散P⁃M方程, 也被称为Catte降噪模型. 对于上述的P⁃M模型, 改进了的Catte降噪模型主要有两个优点:
(1) 利用 Catte降噪模型降低脑MRI图像中的噪声点, 效果非常明显, 与未改进的P⁃M模型相比, Catte降噪模型首先平滑了图像, 即首先进行了脑MRI图像的降噪。
(2) Catte降噪模型最为主要的思想是在各项异性的扩散中加入了各项同性的扩散。
1.2 "基于Catte降噪模型降噪效果分析
图1是Catte模型对高噪声原始脑MRI医学图像[u0(x,y)]降噪结果。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\38t1.tifgt;
图1 各项异性扩散的Catte模型降噪结果
由图1可以看出, 当迭代次数增大时图像的模糊程度也随之增大,信息细节的丢失增多, 同时迭代次数增加将加大计算时间,故而对于相应的迭代次数的选取人为参与因素较大。所以合理地选择控制迭代次数使得去除噪声的同时保留脑MRI医学图像的医学细节是十分重要的。在进行降噪效果分析时发现, 对于各项同性的降噪模型所存在的缺点大幅度的进行了改进,同时发现Catte降噪模型迭代速度较慢, 并且在进行相同的迭代次数时式(3)的平滑程度较式(2)弱,故而对于扩散函数的选择十分重要。
2 "样本加权模糊C均值聚类算法
2.1 "FCM算法
FCM算法[2]是目前比较流行的一种模糊聚类算法,它适合于图像中存在不确定性和模糊性的特点,同时FCM算法是属于无监督的分类方法,聚类过程中不需要任何人工的干预,很适合于自动分割的应用领域。式(8)给出了基于目标函数的一般描述:
[min JmU,P=k=1ni=1cμikmdik2, " m∈1,∞s.t. U∈Mfc] "(8)
式中[U=μik]为模糊隶属度矩阵,[P=[pi]i=1,2,…,c]表示第[i]类的聚类原型矢量,[dik]表示第[i]类中的样本[xk]与第[i]类的典型样本[pi]之间的失真度,这里采用的是两个矢量间的欧式距离。[JmU,P]表示各类中样本与其典型样本的误差平方和,[m]为加权指数,又称作平滑参数。尽管从数学角度看,[m]的出现不自然,但是如果不对隶属度加权,从硬聚类目标函数到模糊聚类目标函数的推广将是无效的。根据拉格朗日乘数法可得两个优化迭代公式如下:
[μik=1j=1cdikdjk2m-1] (9)
[pi=1k=1nμikmk=1nμikmxk] (10)
由以上算法不难看出,整个计算过程就是反复修改聚类中心和分类矩阵的过程,因此常称这种方法为动态聚类或者逐步聚类法。几经修补,该算法的收敛性已经得以证明:FCM算法能从任意给定初始点开始沿一个迭代子序列收敛到其目标函数[JmU,P]的局部极小点或鞍点[1]。
2.2 "加权的模糊聚类算法(WFCM)
FCM算法是目前比较流行的一种模糊聚类算法,然而经典算法本身并不完善。下面介绍这个改进的WFCM算法:正如前文所述,在聚类过程中,FCM算法是基于传统的欧式距离,每个样本对聚类的贡献是没有差别的,实际上,每个样本所起的作用是不一样,对聚类结果产生的影响不同。经过研究发现,那些包含样本点比较多,分散的或孤立的样本点会对聚类结果产生不良影响,而样本数比较均匀的类别则有助于算法得到良好的聚类结果。因此,对原来的算法进行优化是很有必要,从而体现出不同样本的作用差异[9]。
模糊聚类是按照事物之间的相似性来分类的,相似性一般用距离来度量,如果样本之间的距离越小,说明这两个样本之间越相似或越接近,与其他样本之间的平均相似度越高,则它对聚类产生的正面影响就越大[10]。所以,对于某个样本而言,它周围的样本点越多,获得的平均相似度就高,就有利于聚类,应该被赋予较大的权值。首先,定义样本间的平均相似度如下:
[zk=1nj=1ndxk,xj] (11)
式中[dxk,xj]表示样本[xk]和[xj]之间的欧式距离。那么样本的权值可表示为:
[ωk=k=1nzkzk] "(12)
可以看出,[d]越小,即样本[xk]与其他样本越相似,则[zk]的值越小,权值[ωk]就越大。这样根据各自权值的大小,每个样本的重要性就能很好地区分出来。
确定样本点的权值后,原来的聚类目标函数就变为:
[JmU,P=k=1ni=1cωkμikmdik2] (13)
根据拉格朗日乘数法可得到相应的迭代公式:
[μik=h=1cdikdhk2m-1-1] (14)
[pi=k=1nωkμikmxkk=1nωkμikm] (15)
该算法能明显提高收敛速度和聚类的准确性,具有一定的优越性。
3 "改进的WFCM算法
WFCM算法是改进的FCM算法,该算法能明显提高收敛速度和聚类的准确性,但是该算法仍然无法克服人工确定类数的缺点,而且抗噪性不理想,本文在改算法的基础上进行改进,得到一种能自动给出最佳分类、抗噪性更好的改进算法。为了降低算法对噪声的敏感性,本文利用PDE降噪算法对原图像进行前期处理;为了确定最佳的聚类类数[11],本文引入聚类有效性方法对WFCM进行初始化,然后利用WFCM算法对降噪后的图像进行分割。
3.1 "聚类有效性
FCM算法本身并不能确定聚类的数目,为了能得到最优聚类数目,本文采用Xie⁃Beni指标[10]作为模糊聚类有效性函数。下面定义模糊划分的平均紧致度和类间分离度:
[Com=1ni=1cj=1numijVi-Xj2] (16)
[Sep=mini≠j⊂1,…,cVi-Xj2] (17)
式中:[Xj]为数据点;[Vi]为聚类中心;[c]表示聚类的数量;[n]表示数据对象的数量。则Xie⁃Beni指数[S]定义为紧致度和分离度的比值:
[S=i=1cj=1numijVi-Xj2nmini≠j⊂1,…,cVi-Xj2] (18)
从上式可以看出,同一聚类中数据点的紧致度越高且不同聚类间的分离度越高,[S]的值就越小,聚类的划分也就越合理。因此,要得到最佳聚类个数[c],可以选定不同的[c2≤c≤n-1],并选取具有最小[S]值的作为最佳聚类数。
3.2 "本文改进算法
结合PDE降噪算法和聚类有效性测度对WFCM改进的本文算法步骤如下:
(1) 利用PDE降噪算法对原图像进行降噪;
(2) 输入降噪后的数据,首先令[c=2],初始化[xi]相对于聚类[i]的隶属度[uij],并根据式(12)计算权值[ωj];
(3) 根据式(14)计算或更新模糊隶属度[uij];
(4) 根据式(15)计算或更新模糊聚类中心[pi];
(5) 判断[pb-pb+1lt;ε]是否成立,若否,转步骤(3);
(6) 根据式(18)计算[S]的值;
(7) 令[c=c+1],判断[clt;n]是否成立,若否,转步骤(3),找出[S]最小时的[c]值就是最优聚类个数[c*]。
4 "仿真实验和结果分析
为了验证本文改进算法的分割效果,本文选取由西门子0.35T永磁核磁共振仪拍摄的脑MRI医学图像(如图2(a)),在相同的Matlab环境下,分别利用FCM、WFCM和本文算法对原图进行分割。
在利用本文改进算法进行分割时,经过反复实验确定模糊加权指数[m]取2时,聚类效果最好。同时分别计算了[c]取2~15时的[S]值,当[c=5]时,[S]值最小,此时聚类效果最好,为了能够比较算法效果,对于FCM和WFCM算法本文也选取聚类数为5。分割结果如图2所示。从分割结果来看,本文算法聚类效果比前两种算法好的多,这是因为本文采用的PDE降噪算法在降低噪声的同时,能够保留细节,而且能够自动确定最佳聚类数目,达到准确分割的目的。
5 "结 "论
本文根据MRI医学图像的特点,提出一种基于WFCM的改进算法,该算法首先利用PDE降噪算法进行降噪,然后根据Xie⁃Beni指数,在没有先验知识的条件下,确定了最佳聚类数目,以此对WFCM算法进行初始化,得到本文改进的 WFCM算法。利用该算法对MRI医学图像进行分割,结果表明该算法比WFCM算法有更高的聚类准确性,效果更好。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\38t2.tifgt;
图2 仿真实验结果
参考文献
[1] 高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004.
[2] BEZDEK J C. Pattern recognition with fuzzy objective function algorithms [M]. New York: Plenum Press, 1981.
[3] 汪庆淼.基于目标函数的模糊聚类新算法及其应用研究[D].镇江:江苏大学,2014.
[4] 杜正聪,牛高远.基于加权模糊聚类算法的变压器故障诊断方法[J].高压电器,2014,50(4):43⁃44.
[5] 陈建军.基于偏微分方程的图像降噪和图像恢复研究[D].重庆:重庆大学,2009.
[6] AUCLAIR⁃FORTIER M F, ZIOU Djemel. A global approach for solving evolutive heat transfer for image denoising and inpainting [J]. IEEE Transactions on Image Processing, 2006, 15(9): 2258⁃2574.
[7] 杨迎春.基于偏微分方程的图像去噪算法研究[D].太原:中北大学,2012.
[8] 夏石川,桂志国,张权,等.基于偏微分方程的BGA射线图像去噪方法[J].中北大学学报:自然科学版,2013(6):667⁃672.
[9] 陈刚,陆媛,杨慧中.基于小波去噪和改进的FCM算法的基因表达数据分析[J].计算机与应用化学,2011,28(7):952⁃953.
[10] 刘青,邓庆山.基于有效性测度的基因表达数据的模糊聚类分析[J].计算机工程与科学,2005,27(9):73⁃74.
[11] 罗军锋,洪丹丹.基于数据抽样的自动k⁃means聚类算法[J].现代电子技术,2014,37(8):19⁃20.