机器学习算法辅助的GPS信噪比观测值土壤湿度反演

2018-08-03 02:57:10丰秋林郑南山
测绘通报 2018年7期
关键词:土壤湿度振幅反演

丰秋林,郑南山,2

(1. 中国矿业大学环境与测绘学院,江苏 徐州 221116; 2. 江苏省资源环境信息工程重点实验室,江苏 徐州 221116)

土壤湿度在研究生态水循环、植被水分供给、土地承载能力等方面发挥着至关重要的作用,实时、准确、长期的土壤湿度信息将会为气候、水文、农业等科学研究及灾害防治提供重要的数据来源[1]。烘干称重法、土壤湿度计法、电阻法等传统的土壤湿度测量方法虽然很准确,但远远达不到工程应用的需求[2]。微波遥感及传统的双基地GNSS-R(Global Navigation Satellite System Reflection)技术是大范围、非接触式监测土壤水分的重要手段,但还是存在需要特定的设备、价格昂贵及时空分辨率受限等一系列问题[3-5]。因此利用全球导航卫星反射信号的干涉效应(Global Navigation Satellite System interferometric reflectometry,GNSS-IR)成为一种探测土壤湿度的新技术[6]。

目前国内外在利用此技术进行土壤湿度测量方面作了大量基础的研究和试验。Bilich等通过利用SNR(signal-to-noise ratio)幅频特性建立相关模型,并提取时变和动态多路径信号的频率和幅度的参数,分析后发现剔除直射分量后的SNR幅频特性与多路径误差存在一定的关系,同时确定了SNR幅频特性与多路径环境之间存在很强的相关性[7-8]。西班牙Starlab利用IPT(interference pattern technique)技术设计了SMIGOL反射计,该反射计利用垂直极化天线同时接收直射与反射信号,通过GNSS反射信号与直射信号产生的干涉效应进行土壤湿度测量[9]。科罗拉多大学Larson等证实了在卫星高度角较低的情况下,普通测地型接收机同样可以接收并跟踪GPS卫星反射信号,并利用观测文件中的SNR数据进行土壤湿度反演研究,试验结果表明,幅度参数与土壤湿度之间存在相似性,但延迟相位参数与土壤湿度之间的相关性较幅度参数更高[10-12]。在国内,敖敏思等通过仿真和实测土壤湿度与GPS观测值数据展开对比试验,结果表明SNR多径延迟相位与土壤湿度之间的存在较好的指数关系[13]。

但是目前对于利用GNSS反射信号的干涉进行土壤湿度探测的研究,还是一直没有建立准确的解析模型,大多只是验证了干涉信号的物理参数(相位、振幅、频率等)与土壤湿度有很强的相关性。大多数的试验成果依旧停留在土壤湿度趋势的反演和监测,除了少数利用线性公式进行大致的土壤湿度监测以外,没有具体的土壤湿度的反演公式和模型。以此本文提出将GNSS的干涉信号和土壤湿度之间看成一个非线性的回归问题。利用干涉信号物理参数如相位、振幅、频率等作为输入项,将地表粗糙度和植被覆盖的影响看成噪声,利用回归方法得到土壤湿度。目前较好的回归方法主要为BP神经网络算法和支持向量回归机,本文利用这两种方法分别进行土壤湿度反演,同时与线性模型进行对比分析,选择一种较优的模型,旨在探索一种适用于定量估测地表土壤湿度的方法。

1 GPS-IR的基本原理和方法

GNSS接收机每个历元下不仅会记录导航电文、伪距与载波相位观测值,还会记录GNSS信号的强度,即信噪比观测值(SNR,signal-to-noise ratio)。由于多路径效应的影响,在通常情况下,测地型GPS接收机接收到的信号都是直射信号和反射信号的叠加信号,如图1所示。具体的直射信号、反射信号及其两者之间的相位差与SNR观测值之间的关系表示为

(1)

式中,ψ为反射信号与直射信号的相位差,随着卫星高度角的变化而变化;Ad为直射信号分量;Am为反射信号分量。对于普通的GNSS接收机而言,直射信号占主要成分,因此Ad和Am在数值上会相差很大,可以采用低阶多项式来进行拟合,进而提取去除直射信号后的残余SNR值,即反射信号分量。对于去除直射信号后剩余的反射信号分量SNR与sinθ之间可以用某一固定频率的余弦函数来进行拟合,即

(2)

式中,θ为卫星高度角;λ为GPS信号波长;h为接收机天线高度;Am为反射信号多径干涉相对幅度;φ为反射信号相对相位延迟。

图1 GPS反射信号示意图

经过上述拟合后,可以求出反射信号的干涉物理量Am和φ。它们的大小主要由接收机的增益水平和信号反射系数决定,而反射系数与天线周围环境密切相关。因此在天线增益水平不变的情况下,可以通过SNR参量的变化建立土壤湿度与反射信号之间的关系。

本文正是利用反射信号分量的振幅和相位等特征参数与土壤湿度有很强的相关性,将利用SNR观测值反演土壤湿度看成一个非线性的回归问题,利用BP神经网络算法和支持向量回归机两种回归方法,建立GNSS土壤湿度反演模型。同时,通过与线性回归统计模型对比和实测数据,探究其可行性。

2 基于机器学习算法的土壤湿度反演模型

2.1 基于BP神经网络算法的反演模型

BP(back propagation)神经网络模型是由Rumelhart和McCelland为首的科学家小组于1986年提出的一种按误差逆传播算法训练的多层前馈网络模型,它是把一组样本的输入与输出问题转化为一个非线性优化问题,并通过负梯度下降算法,利用迭代运算求解权值问题的一种学习方法[14]。BP算法主要由正向传播和误差反向传播组成,文献[15]中详细介绍了BP神经网络算法的结构和流程,这里不再详细阐述。

根据上文的分析,SNR观测值反射信号分量的振幅和相位等特征参数与土壤湿度有很强的相关性,因此将SNR观测值反射信号分量的振幅Am和相位φ作为输入项,而实际土壤湿度则作为期望输出值。本文使用Matlab进行BP神经网络模型的构建,BP神经网络模型训练的基本参数设置为:最大迭代次数为50 000次,学习率为0.01,训练目标误差为0.000 1,输出层神经元个数为1,隐含层和输出层激活函数都设置为tansig。由于隐藏层神经元的个数对处理结果有影响,因此将隐含层神经元个数范围设置为7~13,逐步寻找最合适的神经元个数。选择最优的隐含层神经元个数和相应的各层权值和阈值,来构建基于BP神经网络模型的土壤湿度反演模型。

2.2 基于支持向量回归机的反演模型

支持向量机是一种机器学习算法,它追求在有限信息条件下得到最优结果,用结构风险最小化原则替代经验风险最小化原则,通过一套在有限样本下的机器学习理论框架和方法,在小训练集上能够得到较好的泛化特性[16]。支持向量回归机是在支持向量机的基础上发展而来的,文献[17]给出了详细原理和公式推导,这里不作详细阐述。

这里同样使用SNR观测值反射信号分量的振幅Am和相位φ作为输入项,而实际土壤湿度作为期望输出值。由于输入向量与土壤湿度的关系是非线性关系,因此需要将输入空间中的样本通过一个非线性变换映射到一个更高维度的特征空间,从而将输入空间中的非线性问题转化为特征空间中的线性问题,然后在特征空间中使用线性支持向量回归机对样本点进行拟合。在构建基于支持向量回归机的反演模型时,还应注意核函数的引入,因为核函数是利用解线性问题的方法求解非线性问题的关键,它成功避免了显式地定义特征空间和映射函数。本文采用适用性更好的径向基核函数(radial basis function,RBF),RBF核函数为

(3)

式中,γ为RBF核函数的待定参数。由此建立基于支持向量回归机的土壤湿度反演模型。

3 试验与结果分析

3.1 数据来源

美国大陆板块边界观测网(plate boundary observatory,PBO)中安装了超过1000台用于大地测量的高质量GPS接收机,其中大部分位于美国西部地区和阿拉斯加地区。试验选择PBO观测网中的P037站点(如图2所示)2016年中90—249 d的观测数据作为数据来源,该站点位置为36.448 113° W,256.846 046° N,海拔为1 493.6 m,站点周围视野开阔,植被稀疏,地形平坦,可为用户提供1 Hz采样率的L2C观测值。土壤湿度采用Noah土地表面模型计算,根据7种地上气象数据(温度、湿度、气压、降水量、平均风速和长、短波辐射)估计地表土壤湿度。长、短波辐射由全球陆面数据同化系统(GLDAS)进行插值获得,降水数据由附近的气象站获得,其他数据来自GPS气象文件。

图2 P037站点

3.2 数据预处理

(1) 利用TEQC(translation,editing and quality checking)软件对GNSS接收机的观测文件进行分析并提取SNR数据、卫星高度角和方位角数据,其中SNR数据与卫星高度角数据用于多路径反射信号的参数估计,方位角数据用于有效反射区域的确定。

(2) GNSS接收机观测得到的SNR值是直射信号与反射信号的叠加,其中直射信号为主要趋势项,因此采用低阶多项式进行拟合,提出直射信号分量,进而得到SNR观测值残差,即为反射信号分量。本文选用8°~20°高度角之间的SNR反射分量作为反演数据。

(3) 通过重采样得到SNR反射分量与卫星高度角正弦值之间的变化量,再对重采样后的数据进行正弦拟合,得到反射信号分量的特征参数的相位和振幅。

通过上述预处理及数据整理后总共得到155组数据,本文将这些数据采用随机分配的方法分为两组:一组为训练集共120组,一组为测试集35组。训练集和测试集是互斥的,没有交集。本文除了将反演值与土壤湿度真值进行对比外,还比较了基于机器学习算法的土壤湿度反演模型与其线性模型之间的关系。基于120组训练集拟合的线性模型如下。

振幅与土壤湿度线性回归模型

y=-0.017 6x+0.337 6

(4)

式中,y为土壤湿度值;x为信号振幅值。

相位与土壤湿度线性回归模型

y=-0.475 0x-0.761 1

(5)

式中,y为土壤湿度值;x为信号相位值。

3.3 结果分析

在利用上述训练集数据进行模型训练之后,分别利用模型进行测试集的测试,图3显示了几种模型的预测值与真值之间的关系。可以看出,由振幅拟合的线性模型预测的结果最差,第17—19 d的预测值误差最大,都不符合其变化趋势。而相位拟合的线性模型其预测结果基本符合土壤湿度值,与土壤湿度变化基本一致,这也说明振幅与土壤湿度的相关性远远不如相位与土壤湿度的相关性。但是相比基于机器学习算法的土壤湿度反演模型,相位拟合的线性模型部分预测值与真值还存在一定的差距,两种回归模型的预测值与土壤湿度真值的契合度都非常高,从图中可以看出这两种模型的预测值与真值相差无几。这也充分证明了基于机器学习算法的土壤湿度反演模型具有一定可行性。

图3 几种模型预测结果与土壤湿度期望值的对比

为进一步说明几种模型的预测能力及两种回归模型的准确性,分别计算了几种模型的相对误差,具体如图4所示。从图中可以清晰地看出,振幅拟合的线性模型的预测值相对误差最大,而且起伏不定,好的情况低于5%,但最差的也甚至高于100%。相位拟合的线性模型的预测值则明显优于振幅拟合的线性模型,但也基本处于20%左右。而基于机器学习算法的土壤湿度反演模型的相对误差则明显较低,基本都不超过20%,同时基于支持向量回归机的土壤湿度反演模型的相对误差也优于基于BP神经网络算法的土壤湿度模型。虽然BP模型的部分预测值的相对误差小于支持向量回归机模型,但是整体而言,支持向量回归机模型的预测值的相对误差大小更加稳定。

由于相位拟合的线性模型只采用相位一个物理量,因此为了对比分析,本文还将两种基于机器学习算法的土壤湿度模型只采用相位一个输入量进行预测,预测结果如图5、图6所示。从图中可以看出,基于回归算法的土壤湿度模型得预测值的准确性高于相位拟合的线性模型。从图6中几种模型的相对误差大小也可以看出,基于机器学习算法的土壤湿度反演模型的结果较优。

从整体上进一步比较几种模型的优越性,基于支持向量回归机的土壤湿度反演模型的决定系数为0.912 8和0.928 3,均方根误差RMSE为0.032 9和0.026 6,采用振幅和相位两种物理参数作为输入量的模型结果较优。而基于BP神经网络算法的土壤湿度反演模型的决定系数为0.886 0和0.913 1,均方根误差RMSE为0.038 0和0.032 6,同样是用振幅和相位两种物理参数作为输入量的模型结果较优。但是两种模型采用两个输入量的结果比一个输入量优越性并不高,主要是由于振幅与土壤湿度的相关性不是很高。而振幅的拟合的线性模型的决定系数为0.553 2,均方根误差为0.093 9,相位的拟合的线性模型的决定系数为0.859 8,均方根误差为0.041 6。上述结论说明基于机器学习算法的土壤湿度反演模型可以反演土壤湿度,能达到一定的精度要求,有一定的可行性,而且基于支持向量回归机的土壤湿度反演模型定量估测土壤湿度优于基于BP神经网络算法的土壤湿度反演模型。

图4 几种模型的相对误差

图5 几种模型结果与土壤湿度期望值的对比

图6 几种模型的相对误差

4 结 论

本文主要研究了基于两种机器学习算法的GNSS反射信号土壤湿度反演方法,给出了数据处理的一般流程,并开展了仿真试验对该方法进行验证测试,同时与线性回归统计模型和实测数据对比,其结果表明:

(1) 利用SNR观测值提取的振幅和相位与土壤湿度之间存在很强的相关性,以分解的干涉信号的振幅和相位作为自变量集,利用两种回归算法构建估算土壤湿度模型的方法是可靠的。

(2) 利用这两种模型反演的结果与土壤湿度参考值相关性很好,反演模型的决定系数分别为0.928 3和0.913 1,均方根误差为0.026 6和0.032 6,且基于支持向量回归机的土壤湿度反演模型定量估测土壤湿度优于基于BP神经网络算法的土壤湿度反演模型。

(3) 在得不到地表粗糙度和植被信息的情况下,取得了较高的反演精度,说明将这些解析模型不易建模或采集难度较高的因素作为系统噪声使用机器学习算法进行抑制是合理、有效的。

本文研究的基于机器学习算法的GNSS反射信号土壤湿度反演方法是可行的,但是在低矮灌木丛、较厚乔木植被和多种植被混合下的复杂情况,以及验证基于BP神经网络算法的GPS卫星反射信号土壤湿度反演方法的普遍适用性,仍需要进一步研究。

猜你喜欢
土壤湿度振幅反演
反演对称变换在解决平面几何问题中的应用
中等数学(2022年5期)2022-08-29 06:07:38
土壤湿度传感器在园林绿化灌溉上的应用初探
基于51单片机控制花盆土壤湿度
电子制作(2019年15期)2019-08-27 01:12:12
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
十大涨跌幅、换手、振幅、资金流向
十大涨跌幅、换手、振幅、资金流向
十大涨跌幅、换手、振幅、资金流向
沪市十大振幅
四川盆地土壤湿度时空分布及影响因子分析