琪美格
(新疆维吾尔自治区水文分析计算中心,乌鲁木齐 830000)
逐步回归分析:建立多元回归方程时,预报因子是逐步挑选的,先计算每个因子的方差贡献,挑选其中未引进因子中方差贡献最大者进行给定信度下的F检验,通过检验则引进该因子,否则不引进。若可引进的因子不足3个,则逐步回归结束,超过3个,则从第4步开始,再计算每个因子的方差贡献,挑选其中所引进因子中方差贡献最小者进行给定信度下的F检验,通过检验则剔除该因子,否则不剔除。最后,直到回归方程中既不能引进也不能剔除因子时,逐步回归结束。
逐步回归周期分析:用于从W(t)序列中识别和提取周期函数。对W(t)序列,m为样本容量n的取整,按方差分析分组形式将序列分成k组(k = 2、3、…、m + 1),分别计算每个k对应的各组均值(即周期振幅);再将各组均值按试验周期k从序列起始年份排至终止年份,生成长度为n的m个序列因子。将m个因子与W(t)序列建立逐步回归方程,经统计检验,若所有回归系数为零,则W(t)序列无周期函数,否则存在周期函数,其因变量就是W(t)序列所隐含的周期函数的估计值,所选中的因子就是被识别和提取的隐含周期,第一个因子是序列隐含的第一周期,余类推,这些因子相应的k值就是其周期长度[1]。逐步回归周期分析模型形式为:
W(t) =b0 + ∑bi*Xi(t) +e(t)
(1)
式中:i为因子中被识别和提取的隐含周期数;b0、bi为逐步回归系数;Xi(t)为被识别和提取的不同周期的预报因子序列;e(t)为噪声项。
卡群水文站年径流量W(t)序列建模年限为1954-2018年,样本容量n为65,经逐步回归周期分析,共引进5个因子,即识别和提取了5个不同的周期,W(t)序列模型具体形式为:
W′(t) =b0 + ∑bi*Xi(t)
(2)
式中W′(t)是W(t)的估计值,i = 1-5,X1(t)是周期为28年的第一因子序列(将28年周期振幅从1954年排至2018年),见表1第2列。X2(t)是周期为31年的第二因子序列(将31年周期振幅从1954年排至2018年),见表1第3列。X3(t)是周期为32年的第三因子序列(将32年周期振幅从1954年排至2018年),见表1第4列。X4(t)是周期为29年的第四因子序列(将29年周期振幅从1954年排至2018年),见表1第5列。X5(t)是周期为30年的第五因子序列(将30年周期振幅从1954年排至2018年),见表1第6列。
bi是逐步回归系数,取值为:b0 = -62.9665,b1 = 0.4087,b2 = 0.4151,b3 = 0.4243,b4 = 0.4009,b5 = 0.2851。
n = 65,进行F检验,F = 60.13 > F(0.001) = 4.77,bi为零的假设不成立,说明逐步回归效果是显著的。
表1给出了卡群水文站1954-2018年年径流量W(t)序列与对应估计值W′(t)的相对拟合误差WS(t),若其绝对值小于等于15%为合格,则不合格为2次,合格63次,合格率达96.9%,说明模拟检验效果很好,(1)式中噪声项e(t)很平稳,有效周期已基本识别和提取完毕。
表1 卡群水文站1954-2018年年径流量序列模拟检验表 径流量(108m3)
续表1 卡群水文站1954-2018年年径流量序列模拟检验表 径流量(108m3)
t取2019年时,将表1中各周期序列外延1年,得2019年5个周期振幅依次为57.78、63.07、61.07、80.35和62.48,代入(2)式得2019年卡群水文站年径流量预报值W′(2019) = 62.76×108m3,实测值W(2019) = 66.00×108m3,|WS(t)|= 4.91% ≤15%,预报正确。
t取2020年时,将表1中各周期序列外延2年,得2020年5个周期振幅依次为57.81、51.31、71.16、55.32和71.68,代入(2)式得2020年卡群水文站年径流量预报值W′(2020) = 54.76×108m3,实测值W(2020) = 58.72×108m3,|WS(t)|= 6.74% ≤15%,预报正确。
1)模型仅用本站历年年径流量W(t)序列逐步回归周期分析成果来对其未来年径流量作预报,适用于水文站网稀少的干旱区。
2)从模拟检验结果来看,若相对拟合误差WS(t)的绝对值小于等于15%为合格,则合格率为96.9%,说明模拟检验效果很好,逐步回归周期分析式中的噪声项很平稳,有效周期已基本识别和提取完毕。
3)2019、2020年年径流量预报结果对应的|WS(t)|分别为4.91%和6.74%,精度高,说明逐步回归周期分析法适用于长期水文预报。