王 敬,赵红东,朱胜银,杨志明
(河北工业大学 电子信息工程学院,天津 300401)
近年来,随着卫星技术和高分辨率对地观测系统的快速发展,传回地面工作站的高分辨率多光谱图像数据量急剧增加。面对海量遥感图像数据,快速有效地检索已成为急需解决的问题[1]。
当今主流的遥感图像检索是基于内容特征的,基于图像内容特征(如纹理、形状、颜色等)或特征组合顺序检索的内容式遥感图像检索得到了迅速发展[2-4]。目前,主要的遥感图像检索研究分为两类:一类是提高检索的准确率,文献[5]提出了基于联合稀疏表示算法与形态学特征的高光谱图像分类,提高稀疏分类的能力,提高分类精度;董安国提出的基于谱聚类和稀疏表示的高光谱图像分类算法[6];文献[7]提出了基于颜色矩和灰度共生矩阵的遥感图像检索原型系统;综合利用小波变换、LTRP和ANFIS的遥感图像检索技术,检索精度有所提高[8];文献[9]对图像RGB值的稀疏表达的相似性度量方法进行检索,能够有效进行图像检索,但计算复杂度高;改进图像检索中相关反馈,使得检索精度提高,但是由于选取的图像特征多,相似性度量准则复杂使得检索效率较低[10]。另一类是提高检索的效率,包含降维方法进行图像检索:聚合特征进行检索,提高检索的精确度[11];对多光谱遥感图像降维以提高检索效率,减少图像存储空间[12];另一方面,利用分类方法进行图像检索成为研究的方向,樊利恒等提出基于分类器集成的高光谱遥感图像分类方法[13];张洪群提出深度学习的半监督遥感图像检索方法,与不分类相比检索效率有明显提高[14]。由我国2013年发射的GF-1遥感卫星拍摄的高分辨率图像,更能切实反映我国国情,目前对其研究报道较少。为了提高检索效率,本文对河北阳原地区的GF-1图像进行研究,对比不同图像特征在三类图像中的分辨能力,选出最具分辨能力的特征,并提出了基于贡献值的特征选择及其分类检索方法。
实验所用遥感图像共包含3个类别,分别是山脊、水体和村落。GF-1号三类遥感图像样本如图1所示,图像分辨率为8 m,大小为50像素×50像素。
图1 GF-1三类遥感图像样本
矩不变量分析图像某个区域或者边界的灰度变化情况。Hu矩的7个矩不变量M1~M7具有平移、旋转和尺度不变性[15]。图1中3个遥感图像样本Hu矩特征值如表1所示。
表1 典型三个遥感图像样本的Hu矩特征值
表1为利用sobel算子得到遥感图像边缘图,对其提取的Hu矩特征值。表1中的图像特征值即是图2中三幅图像的Hu矩特征值。
小波变换是指将信号分解为一系列的基本函数,这些基本函数均是通过对母函数变形得到,在时域和频域两个域表示信号的局部特征的能力。表2为利用小波Haar进行小波分解提取的3个遥感图像样本的特征值。其中,图像在水平和垂直方向上的低频分量LL、水平方向上的低频和垂直方向上的高频LH、水平方向上的高频和垂直方向上的低频HL以及水平和垂直方向上的的高频分量 HH。
表2 3个遥感图像样本的小波分解特征值
灰度共生矩阵(GLCM)描述了图像中从灰度为i的像素出发,到距离为(dx,dy)的像素灰度为j的概率(或次数)。本文以0°、45°、90°和135° 4个方向上,灰度共生矩阵的能量ASM、熵ENT、惯性矩CON及相关性COR的均值和标准差作为8维纹理特征[16],如表3所示。
表3 3个遥感图像样本的灰度共生矩阵特征值
分别计算3类图像的3种图像特征值,将同类遥感图像特征值的均值作为类别特征值。采用不同的特征分别进行分类实验,可得分类正确率如表4所示。由表1—3可见,发现Hu矩的村落图像与另外两类图像的差值差距较大,能够准确判别村落图像,而另两种图像的类别特征值之差较小,不能作为图像特征用于分类检索。多光谱图像的G通道能够对山脊和水体进行良好区分。引入颜色特征即图像的G通道图像的值,与Hu矩共同构成遥感图像分类检索的特征空间。根据地物分布情况得到200幅山脊、136幅水体和216幅村落图像。以部分样本,50幅山脊、34幅水体和54幅村落图像,进行分类正确率测试,实验分类正确率,如表4所示。
图像检索以欧式距离度量特征相似度。若直接对Hu矩和颜色特征组合检索,相似度计算的复杂度较高。本文将特征的各分量的重要性纳入考虑,通过计算Hu 矩特征各分量在分类检索中的贡献值,发现部分分量的贡献值较小。贡献值即各分量在相似性度量中距离的差值中所占的比重。只选取贡献量大的特征分量,在保证检索质量的情况下,有效提升检索效率。区分不同图像类别时,Hu矩各个不同分量的贡献值,如表5所示。Hu矩的M1和M2贡献值之和达到99%以上,故选择M1和M2代表整个Hu矩分量,而忽略其它分量。
表4 选取不同特征的遥感图像分类正确率 %
表5 山脊、水体及村庄图像Hu矩各分量差值的贡献值
分类检索在检索图像前进行,判断其所属类别。然后,在检索图像库的同类别图像库中检索。图像分类的各个类别中的图像越多,分类检索方式越能提高检索的效率。本文计算已知分类的遥感图像样本特征值,并存入特征空间。同一类别的样本特征均值作为类别特征值。本文中Hu矩判定遥感图像是否属于村落类别?若是,则在村落类别的图像中检索;若不是,则通过颜色特征判定待检索的遥感图像所属类别。最后,只在检索图像库中同类别图像中查找相似图像。
采用图像特征向量的欧式距离进行不同遥感图像的相似性计算,设两幅遥感图像的特征向量分别为s=(s1,s2,…,sm)和t=(t1,t2,…,tm),特征向量为m维,则这两幅图像的特征距离d(s,t)为:
(1)
式中:si和ti分别为特征向量s和t的第i个分量。d(s,t)越大,相似性越小;d(s,t)越小,相似性越大。
本文提出的基于贡献值的有效特征选择及其分类检索算法,其计算过程如下:
第一步:对训练图像库中的图像提取特征,得到训练图像特征集。然后利用遥感图像进行特征分类,并得到不同类别的图像类别特征值;
第二步:对检索图像库中的图像提取与第一步相同的特征,利用第一步得到的图像类别特征值,判断检索图像库中每幅图像的类别;
第三步:对待检索图像提取与第一步相同的特征,利用第一步得到的图像类别特征值,判断待检索图像的类别;
第四步:根据待检索图像的类别,利用图像相似性度量准则进行,在检索图像库中的同类别图像中查找与待检索图像相似的图像,得到检索结果。
目前,在遥感图像检索中最常用的性能评估准则是查全率和查准率,查准率P和查全率Q计算式为:
P=n/N,
(2)
Q=n/S.
(3)
其中,n为一次检索返回的检索结果中正确图像的数目,N为一次检索返回的检索结果中图像的总数目,S为检索图像库中包含正确图像的数目。
本文每次检索返回最相似的10幅图像,采用查准率对检索系统性能进行评估。
构建并实现基于GF-1遥感图像特征的遥感图像检索系统。实验图像均从原始GF-1遥感图像中截取的。根据地物分布情况得到200幅山脊、136幅水体和216幅村落图像,截取子图大小为50像素×50像素。从每类图像中随机取100幅图像作为训练样本,其余为测试样本。检索系统结果如图2所示。
图2 检索系统检索结果
其中,查询图像即待检索图像,图2中图像与查询图像相似度按从大到小排列的检索结果。
为验证本文算法的有效性,对山脊、水体和村落三类遥感图像分别随机选取10次进行测试,查准率取10次测试的均值。其中,一次遥感图像检索结果如图2所示。采用查准率和查全率对本文方法检索性能评估,其查准率可达到94%,查全率可达到88%。各类别图像查准率如表6所示,查全率如表7所示。
表6 本文方法各类图像查准率 %
表7 本文方法各类图像查全率 %
表6为本文方法下的各类图像查准率。将各类图像综合起来,本文算法的总查准率为92%。由此可见,本文方法的检索准确率很高。
表7为本文方法下的各类图像查全率。将各类图像综合起来,本文算法的总查全率为88%。由此可见,本文方法达到很好的识别效果。
为了验证本文方法在检索效率上的性能是否有所提升,对传统顺序检索方法和本文方法所搭建的系统各进行20次实验。使用传统方法遥感图像检索的时间均值为0.28 s;使用本文方法遥感图像检索的时间均值为0.07 s。实验结果表明:与顺序检索相比,利用分类决策的检索技术能够大大提高检索效率。本文算法与深度学习的半监督遥感图像检索方法[14]得到的实验结果进行对比,本文方法检索时间为0.07 s,而深度学习半监督方法检索时间为1.88 s,本文算法在检索效率上有很大提高。此外,由于深度学习中神经网络需要对数据进行训练,比本文的分类方法消耗更长时间。在对特征进行降维时,文献[11]采用主成分分析法方法,这需要对所有图像特征数据计算协方差矩阵、协方差矩阵的特征值和特征向量、比较特征值大小等,计算复杂度高于本文算法。
基于有效值分类检索的方法,对GF-1遥感图像中的不同类别图像的3种图像特征的计算,表明Hu矩具有识别图像能力的特征,将其应用到遥感图像分类检索模型中进行实验。并证明了本文提出的方法用于遥感图像的检索和分类能够成功的将不同类别的图像区分开,对不同类别图像的检索识别结果达到较高的正确率。相比神经网络、深度学习算法,本文提出方法简便,不需要神经网络的多次训练,因此检索效率高,其检索速度在毫秒量级。该方法对我国GF-1的其他图像的山脊、水体、村落的分布和面积测量等地理勘测领域以及目标检索识别和定位具有参考价值,也为目标识别的进一步分析提供重要依据。