陈 雷,刘静光,张立毅,,李 锵,孙彦慧
基于像元混合模型估计的高光谱图像解混
陈 雷1, 2, 3,刘静光2,张立毅2,3,李 锵2,孙彦慧2
(1. 天津大学 精密仪器与光电子工程学院,天津 300072;2. 天津大学 电子信息工程学院,天津 300072;3. 天津商业大学 信息工程学院,天津 300134)
在高光谱图像中,线性混合像元和非线性混合像元同时存在,若采用基于单一混合模型的解混算法,会使解混精度降低。因此,提出采用神经网络对高光谱图像中的像元混合模型进行估计,然后针对不同的混合模型进行相应的像元解混。像元解混时,在目标函数中添加丰度非负和丰度和为一约束项,利用差分搜索算法优化求解目标函数以实现高光谱图像的解混。仿真和实际高光谱数据实验表明,本算法提高了解混精度,适用于线性和非线性混合模型。
高光谱图像解混;神经网络;像元混合模型;差分搜索算法
由于高光谱成像仪器空间分辨率的限制,高光谱图像中多数像元是由多种地物光谱组合而成,这些像元被称为混合像元。如何从混合像元中提取出各种光谱成分(端元)和各光谱成分所占的比例(丰度),实现高光谱图像解混,是目前高光谱遥感领域研究的重点。高光谱图像中像元混合模型可以分为线性混合模型(Linear Mixing Model,LMM)和非线性混合模型(Nonlinear Mixing Model,NLMM)。线性混合模型建模简单、物理意义明确,是研究高光谱图像解混常用的模型。该模型假设在宏观尺度上地物之间没有相互作用,每个像元是各个端元的线性混合。但在实际高光谱图像中,微观尺度上的地物和宏观尺度上存在多层结构的地物之间会存在散射现象,此时需要利用非线性混合模型进行描述[1]。
与基于线性混合模型的解混算法相比,非线性混合模型的解混算法[2-5]取得了较好的效果。但在高光谱图像中,往往同时存在线性和非线性混合的像元,单纯采用基于非线性混合模型的解混算法对非线性混合的像元具有较好的解混效果,但由于模型不完全匹配,对线性混合像元的解混精度会有所下降。因此,本文首先采用人工神经网络(Artificial Neural Network,ANN)对像元的混合模型进行估计,然后分别对线性混合像元进行线性解混,对非线性混合像元进行非线性解混,以提高整体解混精度。在解混过程中,采用差分搜索(Differential Search,DS)算法[6]对目标函数进行优化求解。
线性混合模型通常假设地物之间没有相互作用,每个像元是端元光谱和相应丰度的线性混合,其模型为:
=+(1)
式中:是混合像元;=[1,2, …,m]是光谱矩阵,每一列是维的端元光谱,是端元个数;=[1,2, …,]是丰度向量;是白噪声。根据端元混合的实际意义,混合模型必须满足丰度和为一约束(Abundance Sum-to-one Constraint,ASC)和丰度非负约束(Abundance Nonnegative Constraint,ANC),其定义为:
非线性混合模型大都基于辐射传输理论,比较典型的有Hapke模型[2]和SAIL模型[3]等。这些模型的物理意义明确,但需要大量的先验知识,计算复杂,依赖于地物类型。为了简化非线性模型,一些学者提出了双线性混合模型,将两种物质之间的散射加入到线性模型中。该类模型包括NM模型[4](Nascimento Model)和Fan模型[5](Fan Model)等。其中Fan模型是较为典型的双线性模型,它忽略3种及以上端元之间的散射现象,将两种端元光谱的交叉乘积项加入到线性混合模型,并认为该乘积项的幅度与所包含端元的丰度有关。该模型更好地保留了非线性模型的物理意义,能够获得更高的解混精度,被广泛应用于高光谱图像非线性解混中,其模型为:
式中:和分别表示第个端元光谱向量和第个端元光谱向量在该像元中的丰度值;m⊙m表示第个端元光谱向量和第个端元光谱向量的Hadamard乘积(对应位置相乘)。非线性模型中的丰度同样要求满足式(2)的约束。
人工神经网络有多种模型结构,其中前馈神经网络(Feed-Forward Neural Network,FNN)由于结构简单、计算量小而被广泛应用。其中,BP神经网络是一种多层前馈神经网络。信号在前向传递过程中,通过误差反向传播来不断调整网络的权值和阈值,使网络中的传输误差达到最小。
本文采用BP神经网络来估计像元的混合模型,输出数据由{-1,1}构成。其中,1表示线性混合像元,-1表示非线性混合像元,网络中采用双曲正切函数作为隐层的传输函数。为了避免过度拟合并提高网络适用性,在训练过程中使用正则化技术,而不采用提前停止或交叉验证的方法。与此同时,在正则化过程中加入网络权值和偏差相关项。为了对实际高光谱图像中像元的混合模型进行估计,首先采用基于几何理论的端元提取算法来提取实际数据中的端元,该种算法同样适用于非线性混合模型[7]。然后根据式(1)和式(3)得到神经网络的训练样本。本文采用贝叶斯反向传播训练算法,该算法根据Levenberg-Marquardt方法优化权值和偏差,能最大限度地减小权重和误差平方组合的值,产生更具有适应性的网络,从而提高对像元混合模型估计的准确性。
通过上述两次调查我们发现,解戒人员在社区康复过程中,初期确实有一定的效果,操守率远比没有进行社区康复的人员高,可随着时间的推移,社区康复作用在慢慢弱化,实验组和对照组人员操守率差距越来越小。笔者认为,除了本身个人意志等主观因素外,社区康复在一定程度上促成“毒友圈”的形成,在人员跟进方面“虎头蛇尾”,除了签字、报到、验尿,涉及心理咨询、工作安置、疾病治疗等全方位手段执行不到位、造成解戒人员对社区康复失去信心也是造成操守率持续下降的重要原因。因此,社区康复工作必须在为社区康复人员解决实际困难上下功夫,而非将“签字、报到、验尿”作为主抓工作,这样才能逐步降低复吸率。
在得到像元混合模型估计后,针对不同的混合模型进行相应的解混。像元解混算法大都采用最小二乘估计[7-9]或基于神经网络[10-11],它们都是基于梯度类优化的算法。而梯度类算法本身是一种局部极值搜索算法,易陷入局部收敛,并且添加约束项的方法复杂。为避免这一缺陷,本文提出采用差分搜索算法对可行解空间进行全局极值搜索,并通过在目标函数中添加丰度约束项来实现高光谱图像的有效解混。
差分搜索算法[6]是土耳其学者Pinar Civicioglu于2012年根据生物体在迁徙过程中寻找有利生存区域(停歇地)而提出的一种新的仿生智能优化算法。该算法为提高全局收敛性,在生物体寻找停歇地的过程中,根据布朗随机运动原理定义迁徙规则如下:
site=+×map(donor-) (4)
式中:代表生物体当前位置;是采用gamma分布生成器产生的随机数;map是一个由0和1构成的选择器;donor是生物个体随机重新排序组成的矩阵;donor-表示生物体下一步要运动的方位指向。差分搜索算法的流程图如图1所示。
图1 差分搜索算法流程图
本文采用仿生智能优化算法作为优化方法进行高光谱图像的解混,算法的计算复杂性与所使用仿生智能优化算法的搜索策略、生物个体数量和进化代数相关。本文所采用的差分搜索算法搜索策略简单、全局优化能力强,可以在少量的生物个体数量和较少的进化代数的情况下有效地完成解混过程。
根据高光谱图像丰度非负和丰度和为一特性,在差分搜索算法解混过程中添加相应的约束项。针对每个像元,定义丰度非负约束项为:
式中:为正整数,本文取=1;s-表示丰度估计向量中小于零的元素。定义丰度和为一约束项为:
式中:为正整数,本文取=1。可见,当像元满足ANC和ASC时,ANC()和ASC()的值都为零。
式中:1和2代表两个约束项的权重值。利用差分搜索算法优化式(8)得到像元的丰度估计。本文算法具体实现过程如下:
步骤1 利用HySime算法[12]估计观测数据中端元数目,并用VCA算法[13]提取端元,采用Dirichlet分布产生丰度。
步骤2 将端元和丰度按照式(1)或式(3)混合得到训练样本,并用样本进行训练得到像元混合模型估计的网络。
步骤3 把观测数据输入到训练好的网络,得到像元混合模型的估计。
步骤4 设置差分搜索算法中的种群数量、搜索维数、迭代次数和边界限制范围。
步骤5 初始化生物群体所处的位置,得到初始的丰度估计。根据像元混合模型的估计结果,代入式(1)或式(3)得到重构的观测数据,将其代入式(8)得到初始的适应度值。
步骤6 生物群体按照式(4)进行寻优,并进行边界限制。
步骤7 若生物个体寻找到的新位置的适应度值优于当前位置,则将该个体当前位置替换为新位置;否则保持当前位置不变。
步骤8 当达到设置的迭代次数后,优化结束,得到最终的丰度估计值;否则继续进行优化求解过程。
实验中,采用均方根误差(Root Mean Square Error,RMSE)和重构误差(Reconstruction Error,RE)两个指标来衡量算法性能。其中,RMSE用来衡量丰度估计的准确度,定义为:
式中:和s分别表示真实丰度和估计出的丰度,是像元总数。RE定义为:
仿真实验数据中的端元光谱取自美国地质勘测局(USGS)提供的矿物光谱库,光谱数据为244个波段。从中选取3种光谱作为端元,丰度由Dirichlet分布产生,满足ANC和ASC特性。神经网络样本集选取5000个像元,测试数据为2000个像元,在混合过程中加入20dB高斯白噪声,差分搜索算法中种群数量设为30,迭代次数设为200,上限值和下限值分别设为0和1,1=2=0.5。
为了验证神经网络估计像元混合模型的有效性,设计仿真数据由LMM和NLMM共同构成,用本文提出的解混算法对该数据进行3种形式的解混。第1种按照LMM解混;第2种按照NLMM解混;第3种按照用神经网络得到的像元混合模型估计,进行相应的LMM和NLMM解混,表1给出了这3种解混方案的RMSE和RE值。可见,后两种方案解混性能优于第1种,说明用线性算法解混非线性混合像元会产生较大误差,证明了非线性解混的有效性。第3种方案的解混精度高于第2种,说明单一使用非线性算法解混混合特性模型光谱图像时,解混精度会下降,证明了用神经网络估计像元混合模型的有效性。
为了进一步验证本文算法的有效性,与文献[14]提出的线性解混算法和文献[5]提出的非线性解混算法作比较。采用3种混合数据进行实验,数据1由LMM构成,数据2由NLMM构成,数据3由LMM和NLMM共同构成。表2和表3分别给出各算法的RMSE和RE值。数据1的结果表明,文献[14]和本文提出的算法性能较好,而在有NLMM混合的数据2和数据3的结果中,文献[14]的算法性能不如其他两种算法。数据2的结果表明,本文采用差分搜索算法的解混效果优于文献[5]算法采用的梯度方法。该实验同时表明,本文算法根据像元混合模型估计进行相应解混,它适用于线性和非线性混合模型,将更加适应于解混实际环境光谱数据。
表1 本文算法采取不同解混模型性能的比较
表2 不同混合模型下各算法RMSE性能的比较
表3 不同混合模型下各算法RE性能的比较
在本节中,采用高光谱数字图像采集实验(Hyperspectral Digital Imagery Collection Experi- ment,HYDICE)中的城市高光谱数据集,对算法性能进行测试。该数据集由210个光谱波段构成,光谱分辨率和空间分辨率分别为10nm和2m,图像的大小为307×307,图2是波段为80的灰度图像。
实验中,去除水吸收和低信噪比的波段(波段1~4,76~87,101~111,136~153和198~210),只用剩下162个波段进行实验。该数据集被广泛应用于高光谱图像解混和分类研究领域中,文献[15]提供了该地面实况报告,其成像区域主要有4种地物:沥青、草地、屋顶和树木。图3是用VCA算法[13]提取到的4种地物的光谱。图4是利用本文算法得到的丰度图像,结果与实际地物分布相符,通过观察能够确定这些端元所对应的地物种类。表4给出了本文算法与文献[14]和文献[5]中算法各自的RE值。从中可以看出,本文提出的算法性能优于其他算法。
本文提出一种基于像元混合模型估计的高光谱图像解混算法,利用神经网络对像元混合模型进行估计,克服了非线性算法解混线性混合像元时,使解混精度下降的缺陷。同时,采用差分搜索算法对解混目标函数进行优化求解,以克服梯度类优化方法全局收敛性不佳的问题,从而有效实现了高光谱图像的解混。仿真数据和真实场景数据的实验结果表明,本文基于模型估计的解混算法较之其他解混算法具有更高的精度,对于实际高光谱图像具有更好的适应性。本文只采用了两种混合模型进行估计,在今后的研究中,可以增加对更多种像元混合模型的估计,从而更准确地描述实际地物的混合情况,更好地提高解混精度。
图2 HYDICE城市高光谱数据(波段80)
图3 VCA算法提取出的光谱曲线
图4 HYDICE城市数据的丰度结果
表4 HYDICE城市数据的RE比较
[1] KESHAVA N, MUSTARD J F. Spectral unmixing[J]., 2002, 19(1): 44-57.
[2] HAPKE B. Bidirectional reflectance spectroscopy: 1. Theory[J].:(1978-2012), 1981, 86(B4): 3039-3054.
[3] VERHOEF W. Light scattering by leaf layers with application to canopy reflectance modeling: the SAIL model[J]., 1984, 16(2): 125-141.
[4] NASCIMENTO J M P, BIOUCAS-Dias J M. Nonlinear mixture model for hyperspectral unmixing[C]//XV, 2009, 7477: doi: 10.1117 /12.830492.
[5] FAN W, HU B, MILLER J, et al. Comparative study between a new nonlinear model and common linear model for analysing laboratory simulated-forest hyperspectral data[J]., 2009, 30(11): 2951-2962.
[6] CIVICIOGLU P. Transforming geocentric cartesian coordinates to geodetic coordinates by using differential search algorithm[J]., 2012, 46: 229-247.
[7] ALTMAN Y, HALIMI A, DOBIGEON N, et al. Supervised nonlinear spectral unmixing using a post nonlinear mixing model for hyper- spectral imagery[J]., 2012, 21(6): 3017-3025.
[8] COMBE J P, LAUNEAU P, CARRèRE V, et al. Mapping micro- phytobenthos biomass by non-linear inversion of visible-infrared hyperspectral images[J]., 2005, 98(4): 371-387.
[9] 普晗晔, 王斌, 夏威. 约束最小二乘的高光谱图像非线性解混[J]. 红外与毫米波学报, 2014, 33(5): 552-559.
PU H H, WANG B, XIA W. Nonlinear unmixing of hyperspectral imagery based on constrained least squares[J]., 2014, 33(5): 552-559.
[10] 吴柯, 张良培, 李平湘. 一种端元变化的神经网络混合像元分解方法[J]. 遥感学报, 2007, 11(1): 20-26.
WU K, ZHANG L P, LI P X. A neural network method of selective endmember for pixel unmixing[J]., 2007, 11(1): 20-26.
[11] KARATHANASSI V, SYKASs D, TOPOUZELIS K N. Develop- ment of a network-Based method for unmixing of hyperspectral data[J]., 2012, 50(3): 839-849.
[12] BIOUCAS-Dias J M, NASCIMENTO J M P. Hyperspectral subspace identification[J]., 2008, 46(8): 2435-2445.
[13] NASCIMENTO J M P, DIAS J M B. Vertex component analysis: a fast algorithm to unmix hyperspectral data[J]., 2005, 43(4): 898-910.
[14] HEINZD C, CHANG C I. Fully constrained least squares linear spectral mixture analysis method for material quantification in hyperspectral imagery[J]., 2001, 39(3): 529-545.
[15] GUO Z, WITTMAN T, OSHER S. L1 unmixing and its application to hyperspectral image enhancement[C]//,,XV, 2009, 7334: 73341M.
Hyperspectral Unmixing Based on Estimation of Pixels Mixing Models
CHEN Lei1, 2, 3,LIU Jingguang2,ZHANG Liyi2, 3,LI Qiang2,SUN Yanhui2
(1.,,300072,; 2.,,300072,; 3.,,300134,)
Both linear and nonlinear mixing pixels exist in the hyperspectral images. The unmixing accuracy will decrease if the unmixing algorithm is only based on a single mixing model. In this paper, we propose to adopt neural network to estimate the pixels mixing model in the hyperspectral images, and then unmix the pixels under different mixing models. To achieve the hyperspectral unmixing, we introduce the abundance non-negative constraint and abundance sum-to-one constraint to the objective function, and then the differential search algorithm is used to optimize the objective function. The experimental results on simulated data and real hyperspectral data demonstrate that the proposed algorithm can improve the accuracy of the unmixing, and it can be applied to linear and nonlinear mixing models.
hyperspectral images unmixing,neural network,pixels mixing model,differential search algorithm
TP751
A
1001-8891(2016)02-0132-06
2015-08-03;
2015-10-07.
陈雷(1980-),男,博士后,副教授,主要从事信号高光谱图像处理,盲信号处理。E-mail:article.com.cn@126.com。
张立毅,E-mail:zhangliyi@tjcu.edu.cn。
国家自然科学基金资助项目(61401307);中国博士后科学基金资助项目(2014M561184);天津市应用基础与前沿技术研究计划资助项目(15JCYBJC17100)。