基于产流机制的中长期径流预测RBF神经网络模型研究

2017-05-16 01:56:03李天成钟平安吴业楠朱非林曹明霖
水力发电 2017年3期
关键词:径流月份流域

李天成,钟平安,吴业楠,朱非林,曹明霖,马 彪

(1.河海大学水文水资源学院,江苏南京210098;2.长江规划勘测设计研究院,湖北武汉430010)

基于产流机制的中长期径流预测RBF神经网络模型研究

李天成1,钟平安1,吴业楠1,朱非林1,曹明霖1,马 彪2

(1.河海大学水文水资源学院,江苏南京210098;2.长江规划勘测设计研究院,湖北武汉430010)

从产流的物理过程出发,提出了影响产流的主要因子集,利用逐步回归分析法筛选影响各月径流的主要因子;利用筛选的主要因子建立了逐月径流预报RBF神经网络模型,并进行了实证研究。结果表明,不同月份的径流量主要影响因子不完全相同,存在明显的季节性差异;基于产流机制的RBF神经网络模型对于月尺度的径流过程,具有较好的模拟与预测能力。

产流机制;影响因子;RBF神经网络;径流模拟;径流预报

0 引 言

可靠的中长期径流预报,对于水资源的规划与管理,确保水利设施的安全及其经济效益的发挥均具有重要意义。Box和Jenkins等[1]将ARMA类模型应用于中长期径流预报领域,使得线性时间序列有了重大发展;汤家豪教授[2]采用分段线性化构造的方法提出了目前非线性时间序列经典模型之一的门限自回归模型;Hsu[3]等提出了3层BP神经网络模型并应用到径流预报中;崔东文[4]在此基础上提出多隐层BP神经网络模型,提高了模型的预报精度;杨洪[5]结合自适应动量梯度法等三种方法提出改进BP神经网络算法并应用于径流预报中,克服了单一模型稳定性不高的缺陷;陈晶等[6]通过构建相邻月径流之间的分布函数,提出了基于Copula函数的月径流预报方法;林剑艺和程春田[7]将支持向量机原理应用于径流预报中,取得了良好的效果;黄巧玲[8]等在此基础上采用Mallat算法对原始月径流序列分解、重构,提高了支持向量机在月径流预报中的精度。从已有文献看,绝大部分的研究者都是针对径流时间序列本身,对影响径流形成的物理过程考虑较少。实际上,所有的水文要素都是依据其特定的物理机制发生变化的,从物理成因角度出发,筛选合理的预报因子;依据水文现象形成的物理机制,基于物理成因建立相应的预报模型具有重要意义。为此,本文从影响径流的物理过程出发,采用逐步回归的方法确定某流域逐月径流与温度、风速、相对湿度、降水及考虑流域滞时情况下的前期降水等气候因子的相关关系;选用目前在模式识别[9-11]领域内常用的RBF神经网络结合每月径流相关因子,逐月建立预报模型。

1 影响月径流的因子集分析

径流是从降水开始到水流汇集至流域出口断面的物理过程。由产汇流理论可知,其形成主要受流域气候特征和下垫面条件的影响。

流域气候特征是影响径流量最基本和最重要的因素。在气候特征中,对径流量产生影响的主要因子为降水和蒸发。降水是径流的来源,降水的大小和空间分布将直接影响径流量的形成;而蒸发的大小则影响径流量的变化。在现实生活中,实际蒸发量是无法直接得到的。一般情况下,为获取实际蒸发量,可通过水面蒸发量乘以折算系数α得到。折算系数α的确定存在很大的变异性,因此通过这种方法得到的实际蒸发量往往误差较大。为避免误差传递对预测结果产生影响,考虑采用其他指标来替代蒸发项。结合实时信息的易获取性,本文采用温度、风速、相对湿度三项与蒸发密切相关的指标项作为蒸发的表征指标。

下垫面条件主要影响产汇流过程。根据产汇流理论可知,土壤前期蓄水量的大小决定了产流开始时间,并影响总产流量的大小。降水、蒸发和前期径流对土壤前期蓄水量有着决定性的作用。考虑到土壤前期蓄水量无法直接获取,本文选取前期降水和前期径流作为表征土壤前期蓄水量的指标。

由上述分析可知,径流量的大小可能受本时段降水、前期降水、土壤前期蓄水量和本时段内的流域蒸发量的综合影响。流域蒸发量可采用流域平均温度、流域平均相对湿度和流域平均风速反映;土壤前期蓄水量可采用前期径流和前期降水反映。结合流域滞时的影响,对于前期降雨和前期径流,在本文研究中初步选取前6个月的降雨和径流进行表征。因此,流域月径流及其影响因子可描述为

(1)

式中,Rt为当前时段(月)的流域平均径流量;Pt为当前时段(月)的流域平均降水量;Tt为当前时段(月)的流域平均温度;Wt为当前时段(月)的流域平均风速;Ht为当前时段(月)的流域平均相对湿度;Rt-k为前移k个时段(月)的流域平均径流量;Pt-k为前移k个时段(月)的流域平均降水量;k=1,2,…,6。

2 RBF神经网络

RBF神经网络[12-15]是一种将输入矢量扩展或者预处理到高维空间中的神经网络学习方法。RBF网络可以任意精度逼近任意的非线性函数,且具有全局逼近能力;因而从根本上解决了BP网络的局部最优问题,而且拓扑结构紧凑、结构参数实现分离学习、收敛速度快。在金融预测、模式识别、数据挖掘等领域均有广泛的应用。

2.1 RBF神经网络的基本结构

RBF神经网络是由3层结构构成:输入层、隐含层、输出层。其网络模型的基本拓扑结构如图1所示。

图1 RBF网络基本结构

(2)

式中,bj为高斯基函数宽度,为正标量;m为隐含层的节点数量。网络的输出由如下加权函数实现

(3)

式中,ω为输出层的权值;r为输出节点的个数;y是神经网络的输出。

2.2 网络模型建立

本文采用Matlab软件中的RBF网络函数实现建模。RBF网络函数为newrb()和sim()。newrb()用于设计一个RBF网络,sim()是用训练好的网络来预测函数输出。网络设计为

net=newrb(P,T,err_goal,spread,MN,DF)

(4)

其中,P和T分别为训练集输入、输出矢量;err_goal为设定的网络模拟目标误差,默认值为0;spread为径向基函数的扩展速度,默认值为1;MN为神经元的最大数目,默认为输入矢量P的维数;DF为两次显示之间所添加的神经元数目,默认为25;net为返回值,一个训练完成的RBF网络模型。

网络模型训练完成,采用函数sim()进行数据仿真,设计如

Y=sim(net,X0)

(5)

其中,X0为测试集的输入目标矢量;Y为仿真结果。

2.3 模型参数优化

模型的可靠性是衡量一个模型好坏最重要的标准,RBF神经网络模型的newrb()函数可根据具体研究问题自适应增加网络的隐层节点数,直到达到设定目标误差err_goal的要求。本文采用Matlab程序语言实现对二维空间(err_goal,spread)内参数最优解的搜索,以达到参数最优化[16]。选取网络预测值和实测值的均方根误差变量作为衡量指标

(6)

式中,mse为均方根误差变量;Y0,i为第i个预测序列的实测值;Yi为第i个预测序列的预测值;n为预测序列的长度。

3 实证分析

本文选取某流域1957年~2013年57 年长系列实测径流、降水、相对湿度、温度、风速资料作为研究对象,筛选逐月径流相关因子,结合RBF神经网络建立逐月径流预报模型。

3.1 逐月预报因子的确定

在水文中长期预报中,逐步回归是常用的一种因子筛选方法,逐步回归在多元回归的基础上考虑了各项因子的独立性,增加了回归方程的稳定性,从而提高了预报的精度[17]。

实际操作中,本文根据上文初步界定的月径流影响因子集,采用逐步回归分析法进一步筛选因子;设定回归方程中引入变量的显著性F检验概率标准为α1=0.05,得出与预报对象相关性较高的因子。结果见表1。

表1 因子筛选结果

3.2 逐月模型参数确定

以流域长系列实测资料中的5月份为例,采用上述参数优化方法确定参数:

(1)令spread=1,等步长改变err_goal值,按min(mse)搜索err_goal的条件相对优区间,如图2所示A段。

图2 err_goal的条件相对优区间

(2)err_goal在相对优区间中取最低值,等步长改变spread值,按min(mse)搜索spread的条件相对优区间如图3所示B段。

图3 spread的条件相对优区间

(3)搜索(err_goal,spread)的最优组合区间。考虑单个参数最优可能并非是组合最优,因此适当扩展A、B区间,让err_goal在扩展之后的A区间,spread在扩展之后的B区间内等步长变化,并减少各个参数的步长,搜索(err_goal,spread)的全局最优组合区间。结果为三维图形的最底面区间(见图4)。依例对12个月份的预报模型进行逐月参数优化,可得到12组最优组合参数(见表2)。

图4 (err_goal,spread)的最优组合区间

表2 逐月预报模型最优组合参数

3.3 结果分析

由表3可以看出,模型的相对误差绝对平均值在模拟期中最小值为8.31%,最大值为17.32%,平均为11.82%;在预测期中最小值为12.92%,最大值为21.65%,平均为15.16%。合格率标准为20%的合格率在模拟期中最小值为68%,最大值为86%,平均为78.6%;在预测期中最小值为42.9%,最大值为85.7%,平均为64.3%。

表3 月径流模拟及测试单分析指标统计结果 %

为避免单指标评价的差异性,增加模型评定可信度,本文选用基于熵权的模糊优选模型[18]进行综合指标评价。各单评价指标的客观权重采用改进的熵权法[18]确定,其权重值分配见表4。

表4 模型模拟及预测各单项评价指标熵权值

将表3中的数据向量标准化,结合表4的各权重,可得模型的逐月综合评价指标(见表5)。

表5 模型模拟及预测逐月综合评价指标

为了更直观地体现模型的模拟及预测效果,选取综合评价指标体系下的模型模拟及预测效果最好、最差的月份绘制详细过程进行对比。由表5可见,综合指标评定下,模型模拟效果最好的是1月份,最差的是6月份;模型预测效果最好的5月份,最差的是6月份(见图5、图6和图7、图8)。

图5 1月份模拟过程

图6 6月份模拟过程

图7 5月份预测过程线

图8 6月份预测过程线

4 结 论

本文从影响径流的物理因子层面出发,探求不同月份的径流量主要影响因子,结合RBF神经网络,构建逐月径流预报模型,结果表明:①不同月份径流量的主要影响因子不完全相同,如本文研究中,12个月份中只有2月份和4月份、7月份和10月份的径流影响因子相同。其中,3月份和8月份的主要径流影响因子还包括相对湿度、温度气候因子。②在物理成因分析的基础上,结合RBF神经网络建立的逐月径流预报模型试报结果的相对误差绝对平均值最大为21.65%,最小为12.92%,平均为15.16%。③在合格率标准为20%的评定标准下,模型试报结果的合格率最大为85.7%,最小为42.9%,平均为64.3%。说明该模型具有较强的可靠性与稳定性。

[1]BOX G E P, JENKENS G M. Time Series Analysis Forecasting and Control[M]. San Francisco: Holden Day, 1970.

[2]TONG N, LIM K S. Threshold autoregression, limit cycles and cyclical data[J]. Journal of the Royal Statistical Society: Series B(Methodological), 1980, 42(3): 245- 292.

[3]HSU K,GUPTA H V, SOROOSHIAN S. Artificial Neural Network Modeling of the Rainfall-Runoff Process[J]. Water Resources Research, 1995, 31(10): 2517- 2530.

[4]崔东文. 多隐层BP神经网络模型在径流预测中的应用[J]. 水文, 2013, 33(1): 68- 73.

[5]杨洪. 改进BP神经网络集成模型在径流预测中的应用[J]. 水资源与水工程学报, 2014, 25(3): 213- 219.

[6]陈晶, 顾世祥, 杜俊. 基于Copula函数的云龙水库月径流预测研究[J]. 水电能源科学, 2016, 34(3): 24- 27.

[7]林剑艺, 程春田. 支持向量机在中长期径流预报中的应用[J]. 水利学报, 2006, 37(6): 681- 686.

[8]黄巧玲, 粟晓玲. 基于小波支持向量机耦合的月径流预测方法[J]. 水力发电学报, 2015, 34(3): 1- 20.

[9]韩敏, 崔丕锁. 一种用于模式识别的动态RBF神经网络算法[J]. 大连理工大学学报, 2006, 46(5): 746- 751.

[10]李国友, 姚磊, 李惠光, 等. 基于优化的RBF神经网络模式识别新方法[J]. 系统仿真学报, 2006, 18(1): 181- 185.

[11]朱树先, 张仁杰. BP和RBF神经网络在人脸识别中的比较[J]. 仪器仪表学报, 2007, 28(2): 375- 379.

[12]史峰, 王小川, 郁磊, 等. Matlab神经网络30个案例分析[M]. 北京: 北京航空航天大学出版社, 2010.

[13]卫敏, 余安乐. 具有最优学习效率的RBF神经网络及其应用[J]. 管理科学学报, 2012, 15(4): 50- 56.

[14]韩红桂, 乔俊飞, 薄迎春. 基于信息强度的RBF神经网络结构设计研究[J]. 自动化学报, 2012, 38(7): 1083- 1090.

[15]张宇, 卢文喜, 伊燕平, 等. 基于RBF神经网络的地下水动态预测[J]. 节水灌溉, 2012(2): 64- 70.

[16]曹茂森, 任青文, 李妮. 基于Matlab的RBF网络的深层搅拌桩承载力建模[J]. 山东建筑工程学院学报, 2003, 18(2): 15- 20.

[17]汤成友, 官学文, 张世明. 现代中长期水文预报方法及其应用[M]. 北京: 中国水利水电出版社, 2008.

[18]周惠成, 张改红, 王国利. 基于熵权的水库防洪调度多目标决策方法及应用[J]. 水利学报, 2007, 38(1): 100- 106.

(责任编辑 陈 萍)

Research on RBF Neural Network Model for Medium and Long Term Runoff Forecasting Based on Runoff Generation Mechanism

LI Tiancheng1, ZHONG Ping’an1, WU Yenan1, ZHU Feilin1, CAO Minglin1, MA Biao2

(1. College of Hydrology and Water Resources, Hohai University, Nanjing 210098, Jiangsu, China;2. Changjiang Institute of Survey, Planning, Design and Research, Wuhan 430010, Hubei, China)

The main factor set that affects runoff generation is firstly established based on the physical process of runoff, and the main factors influencing monthly runoff are selected by using stepwise regression analysis. Then a monthly runoff prediction model based on Radial Basis Function (RBF) neural network is set up. A case study is carried out. The results show that the main factors influencing monthly runoff are not identical in different months which show obvious seasonal difference, and the RBF neural network model based on runoff generation mechanism has better simulation and forecast ability for monthly scale runoff process.

runoff generation mechanism; influence factor; RBF neural network; runoff simulation; runoff forecast

2016- 08- 29

国家自然科学基金资助项目(51579068,51179044);水利部水体污染控制与治理科技重大专项(2014ZX07405002)

李天成(1992—),男,江西南昌人,硕士研究生,研究方向为水资源规划与管理;钟平安(通讯作者).

P338.2

A

0559- 9342(2017)03- 0013- 05

猜你喜欢
径流月份流域
压油沟小流域
堡子沟流域综合治理
罗堰小流域
12月是最残酷的月份
打造智慧流域的思路及构想——以讨赖河流域为例
Topmodel在布哈河流域径流模拟中的应用
探秘“大径流”
攻克“大径流”
京东3月份繁体书畅销榜及推荐
书香两岸(2014年4期)2014-05-30 08:11:12
博客来3月份简体书畅销榜及推荐
书香两岸(2014年4期)2014-05-30 08:11:12