更全的杂志信息网

基于支持向量回归机的长期径流预报及不确定性分析

更新时间:2009-03-28

径流的长期预报是指预见期在15 d以上、一年 以内,并提供各月径流量的预报,其对防汛抗旱、水资源调度和高效利用具有重要意义[1]。目前,长期径流预报大致可分为物理成因分析法、数理统计法和智能方法三大类[2]。物理成因分析法通过研究陆地海洋下垫面情况、太阳活动、大气环流等要素,推求降水变化规律,再通过水文模型进行径流预报[3]。由于影响径流的因素复杂,该方法实施难度较大,仍处于摸索发展之中。数理统计法根据预报因子类别的不同可分为两种:一是寻求水文要素自身的演变规律进行预报,如根据径流的周期性、趋势性、随机性等特征,采用 Morlet小波、方差分析、ARMA等方法构建基于径流自相关关系的预报模型[4-7];二是寻求水文要素间相互作用的物理机制进行预报,如根据径流与前期大气环流指数、海温场、高度场等遥相关关系,构建多元回归、逐步回归等预报模型[8-11]。智能方法是当前重点研究和应用的预报技术,随着数学、计算机技术的快速发展,如随机森林、灰色系统、混沌理论、支持向量机等开拓了长期径流预报的新途径,有效提高了预报精度[12]

学界认为,《鸠那罗的眼睛》是苏雪林唯美主义戏剧的代表作,因而对该剧的关注度较高,专题研究论文也较多。如潘讯《〈鸠那罗的眼睛〉的唯美主义风格》,丁增武《“艺术”与“道德”之间的厚此薄彼——从〈鸠那罗的眼睛〉看苏雪林对唯美—颓废主义思潮的接受》等。

支持向量机(Support Vector Machine,SVM)是Vapnik等人1995年提出的一种基于统计学习理论的新型机器学习算法,最初从线性可分情况下的最优分类面发展而来,其核心思想是最优分类面不但正确将两类样本分开,而且使分类间隔最大化,平行最优分类面且距离最短的直线上的训练样本即为支持向量;在线性不可分情况下,引入松弛变量和误差惩罚参数,建立广义最优分类面;对于非线性问题,通过核函数将低维非线性分类问题变换为高维线性分类问题,其形式上类似神经网络,输出的是中间节点的线性组合,每个节点对应一个支持向量。SVM采用结构风险最小化准则(Structural Risk Minimization,SRM),具有避免过学习、全局最优、泛化能力好等性能,较好的解决了小样本、非线性、高维度等水文中的常见问题[13-15]

1 支持向量回归机

支持向量回归机(Suppport Vector machine for Regession,SVR)是建立在SVM上的回归算法,其基本思想是用少数支持向量代表整个样本集,利用非线映射φ(x),将低维非线性函数估计问题转换为高维线性函数估计问题。设非线性回归函数:

 

式中:x为样本输入;f(x)在不敏感损失函数ε范围内的线性回归问题转换为寻求最小‖ω‖问题,针对精度ε不能处理的问题,引入松弛变量ξi*i 和误差惩罚参数C,此时优化方程的约束为:

 

得到原优化问题的Lagrange对偶问题:

 

为求解此凸二次规划,根据KKT条件,引入Lagrange函数:

 

本次所选的气象因子分为北太平洋海温场(SST)、500 hPa高度场、74项环流指数三大类,前两类下载自NCEP再分析数据,第三类下载自中国气象数据网。首先根据汉江流域的地理位置、水系分布等特征,选取SST的空间范围为52.5°N-12.5°S,117.5°E-77.5°W,分辨率为 5° × 5°,500 hPa 高度场的空间范围为 80°N-10°S,0°E-360°E,分辨率为2.5°×2.5°及全范围74项环流指数等作为初选预报因子,之后计算径流序列与前一年气象因子序列的相关系数,利用相关系数显著性检验表剔除不显著相关的初选预报因子。由于中长期径流预报的物理成因复杂,预报因子与预报对象的本构关系仍处于摸索阶段,故本次假定三类气象因子的重要度相似,最终利用逐步回归从每类气象因子中各挑选5个作为最终预报因子。考虑到历史资料存在非一致性,本文只选取1980年以后的数据。下面以1月、7月、年总量为例说明,其他不予赘述,预报因子见表 1。

 

式中:K〈xi,xj〉为核函数,本文采用径向基核函数:

 

误差惩罚参数C起到调节模型复杂度和训练误差的作用,取太小或太大,将出现“欠学习”或“过学习”现象,使训练误差增大,泛化能力减弱;核参数σ反映了训练样本数据的分布特性,确定了局部领域的宽度。因此,SVR回归问题的推广性能取决于误差惩罚参数C与核参数σ。由于遗传算法(Genetic algorithm,GA)在复杂优化问题中只需构造一个适应度函数,通过选择、杂交、变异等遗传机制,完成对问题最优解的自适应搜索过程,且算法成熟,在水文中应用广泛,故本次选择构建GA-SVR算法进行参数优选,既保证参数的准确性,又保证计算的时效性,算法流程见图1。

皮副乡长走后,过了两天,李顺来了。李顺一进门就批评了我一通。说我在领导面前说话一点也不注意,还给领导讲起了道理,领导不比你一个农民强,人家不知道青山绿水的好处。可那个顶啥用,能增加GDP还是能变成金钱。不要觉得说钱俗,现在是经济社会,金钱就是经济社会的生动体现。你那个小鱼塘充其量也就一亩地吧,人家佟老板说了,给你两万块钱补偿。我一听又笑了,我说张顺,别人不知道你还不知道我是啥样的人。我那意思够明白的了,我就是想留个念想,咱村,噢不,咱社区,那些地快卖光了,虽说住上了楼,可是心里反倒空空的。有句话叫“有福不会享”,我就是个有福不会享的人,就是不习惯这些高楼大厦,还是想着那些庄稼地。

  

图1 GA-SVR算法流程图Fig.1 Flowchart of GA-SVR algorithm

2 预报因子挑选

求解上述对偶问题,得到最优解最优解中非零向量所对应的样本点(xi,yi)的输入xi即为支持向量,从而构造非线性回归函数:

由以上分析表明,GA-SVR模型的90%置信区间几乎包括所有实测值,且50%分位数与实测值拟合更好,预报精度更高。将50%分位数与GA-SVR预报值相比,确定性系数进一步增大,平均相对误差和均方根误差均有一定程度的减小,说明经过HUP处理后,不仅能以置信区间的方式量化预报的可靠度,提供更为丰富的预报信息,同时若以某一分位数(如50%)作为定值预报,由于贝叶斯方法本身所具有的校正能力,可进一步提高预报精度。

 

表1 皇庄站径流预报因子Tab.1 T he runoff forecast factors of Huangzhuang Station

  

预报因子 1月预报因子说明(前一年) 7月预报因子说明(前一年) 年总量预报因子说明(前一年)1 12月西太平洋副高西伸脊点 5月西太平洋副高脊线 11月冷空气2 12月南海副高面积指数 6月欧亚纬向环流指数 7月北非副高脊线3 3月亚洲纬向环流指数 8月太平洋副高北界 7月北非大西洋北美副高脊线4 5月北美大西洋副高脊线 12月东亚槽强度 1月北半球极涡中心位置5 6月大西洋欧洲环流型 6月大西洋欧洲区极涡面积指数 2月南海副高北界6 5月(7,24)点海温 12月(3,21)点海温 12月(6,27)点海温7 7月(6,34)点海温 12月(7,10)点海温 6月(14,15)点海温8 8月(6,34)点海温 11月(6,25)点海温 5月(14,15)点海温9 2月(3,1)点海温 12月(6,27)点海温 8月(13,10)点海温10 10月(7,30)点海温 12月(3,20)点海温 11月(11,33)点海温11 3月(18,55)点500 hPa 5月(10,134)点500 hPa 12月(23,23)点500 hPa 12 7月(16,22)点500 hPa 9月(12,8)点500 hPa 6月(2,17)点 500 hPa 13 9月(10,125)点 500 hPa 12月(26,93)点500 hPa 6月(23,26)点500 hPa 14 4月(11,8)点500 hPa 2月(24,141)点500 hPa 7月(14,74)点500 hPa 15 4月(5,59)点500 hPa 8月(12,120)点500 hPa 6月(7,142)点500 hPa

3 径流预报

结果,生下来是个脑瘫的儿子,来不及了。她哭,埋怨婆婆,可她天生乐观,眼泪擦干,袖子一挽,就想着怎么照顾儿子。

将Matlab作为本次编程平台,将1980-2007年逐月预报因子作为输入量,1981-2008年逐月径流量作为输出量,训练GA-SVR模型。将2008-2012年逐月预报因子输入训练完毕的GA-SVR模型中,对2009-2013年逐月径流量进行预报。预报精度的评价指标采用平均相对误差(MRE)、均方根误差(RMSE)和确定性系数(DC),公式见式(7)-式(9)。将预报结果与随机森林(RF)、多元线性回归(MLR)结果作对比,结论见图2至图4,表2至表3所示。

  

图2 皇庄站1月径流训练期与验证期Fig.2 T he training period and verification period of January runoff at Huangzhuang Station

 
  

图3 皇庄站7月径流训练期与验证期Fig.3 T he training period and verification period of July runoff at Huangzhuang Station

  

图4 皇庄站年径流训练期与验证期Fig.4 T he training period and verification period of yearly runoff at Huangzhuang Station

 

表2 训练期精度评价指标(1981-2008)T ab.2 The evaluation indexes of accuracy in training(1981-2008)

  

模型MRE 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 8.38 14.96 15.54 15.31 17.31 26.28 21.1 35.19 39.07 30.06 38.02 17.71 13.22 RF 12.94 19.27 18.03 17.06 24.05 27.18 23.75 43.03 45.58 43.11 32.68 19.3 20.99 MLR 5.89 9.32 13.29 11.23 12.82 17.57 14.2 16.43 20.48 27.3 25.94 12.86 5.46模型RMSE 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 33.19 58.93 111.48 157.05 223.76 450.23 578.98 765.35 679.85 570.95 291.09 106.24 2 173.89 RF 54.65 106.16 186.43 232.5 356.09 464.35 877.59 976.18 1190.13 1146.27 539.71 122.61 5 581.46 MLR 27.75 39.95 119.99 153.8 201.11 366.95 487.63 453.77 618.97 435.02 232.02 81.73 1 230.69模型DC 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 0.91 0.88 0.87 0.85 0.91 0.77 0.89 0.82 0.89 0.91 0.83 0.97 0.89 RF 0.75 0.61 0.64 0.67 0.76 0.76 0.74 0.71 0.67 0.62 0.43 0.59 0.65 MLR 0.94 0.95 0.85 0.85 0.92 0.85 0.92 0.94 0.91 0.95 0.89 0.82 0.96

 
 

表3 验证期精度评价指标(2009-2013)Tab.3 T he evaluation index es of accuracy in verification(2009-2013)

  

MRE 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 18.62 26.03 15.60 29.96 16.82 22.96 29.51 24.00 33.58 19.94 28.52 14.43 13.22 RF 10.03 27.84 18.02 34.97 19.26 24.05 25.00 38.37 33.67 38.53 31.89 21.01 26.74 MLR 26.74 36.19 40.94 19.93 37.70 25.93 32.05 38.69 73.11 70.58 53.65 21.64 20.25

由图2至图4可知,非汛期在年际间的变化较小,以 1月为例,其径流量变化范围在200~600 m3/s之间;而汛期在年际间的变化很大,以7月为例,其径流量最小仅1 000 m3/s,最大可达7 000 m3/s;年径流的变化也较大,且并无明显规律可循,这在一定程度上加大预报难度同时,也表明GASVR模型不仅能反映各月、年际间的变化趋势,也能较好地预测极值月与极值年的径流量。

由表2可知,在平均相对误差上,多元线性回归表现最佳,GA-SVR次之,随机森林较差。GA-SVR的平均相对误差在非汛期第一阶段(1月-5月)为8%-17%之间,汛期(6月-9月)为21%~39%之间,非汛期第二阶段(10月-12月)为17%~38%之间,年总量的平均相对误差为13%,这表明GASVR模型在1月-5月与年总量上率定良好,在汛期仍有一定的差距,而非汛期第二阶段率定不佳的原因可能是随着预见期的增长,预报因子的时效性与可靠性降低。在确定性系数上,GA-SVR与多元线性回归相近,且均优于随机森林。GA-SVR除6月的确定性系数为0.77外,其余各月均在0.85以上,年总量的模拟也达到0.89,表明GA-SVR模型整体上率定精度良好,可靠性较高。

将GA-SVR预报值作为确定性预报输入,采用HUP计算径流的后验概率分布,并给出90%置信区间与50%分位数,结果见图5至图7。GA-SVR预报值与HUP50%分位数比较见表4。

4 预报不确定性分析

Krzysztofwicz在1999年提出的贝叶斯预报系统(Bayesian Forecasting System,BFS)将预报的总不确定性分为降雨不确定性和水文不确定性,分别采用降雨不确定处理器(Precipitation Uncertainty Processor,PUP)和水文不确定处理器(Hydrological Uncertainty Processor,HUP)处理,最后通过集成器(Integrator,INT)综合输出[17-19]。设H0为预报时已知的实测流量,Hn和Sn分别表示实际流量过程和预报流量过程,hn为Hn的实测值,sn为Sn的估计值,对于任意时刻n及Hn=hn,由贝叶斯原理可得在Sn=sn的条件下Hn的后验概率密度函数为[20]:

 

由于验证期序列时间较短,不宜采用确定性系数作为评价指标,故本次只采用平均相对误差。由表3可知,两种智能方法在验证期表现均远优于多元线性回归。GA-SVR的平均相对误差在非汛期除2、4、11月在26%~29%外,其余均在20%以下;在汛期(6月-9月)为23%~33%之间;在年总量上也表现最佳,平均相对误差仅13%,这表明GASVR模型不仅可预报逐月径流,也可预报年总量的丰枯趋势。

  

图5 皇庄站1月径流不确定性分析Fig.5 T he uncertainty analysis of January runoff at Huangzhuang Station

  

图6 皇庄站7月径流不确定性分析Fig.6 T he uncertainty analysis of July runoff at Huangzhuang Station

  

图7 皇庄站年径流不确定性分析Fig.7 The uncertainty analy sis of yearly runoff at Huangzhuang Station

 

表4 GA-SVR预报值与50%分位数的精度对比(1982-2013)T ab.4 The accuracy comparison between the GA-SVR predicted value and the 50%quantile(1982-2013)

  

M RE项目1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 9.98 16.63 15.75 17.76 17.16 26.15 23.05 34.08 40.03 29.38 36.5 17.17 12.26 50%分位数 7.54 16.63 17.39 12.48 16.58 18.89 20.2 21.06 34.41 22.74 30.84 17.88 11.93项目 RM SE 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 46 73.69 113.94 174.34 273.67 453.66 733.57 791.4 754.28 545.28 283.45 106.62 2300.61 50%分位数 39.39 84.57 136.87 153.83 255.52 368.64 693.44 705.97 867.22 527.63 382.18 131.08 2265.92项目DC 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 年总量GA-SVR 0.82 0.8 0.86 0.8 0.86 0.75 0.84 0.8 0.87 0.91 0.84 0.78 0.87 50%分位数 0.87 0.73 0.79 0.84 0.87 0.83 0.85 0.84 0.83 0.91 0.71 0.67 0.87

生如逆旅,一苇以航;长夜已彻,山扉洞开。他通过自身的努力,如愿以偿地走出了农门。一个新的际遇在他面前铺开,他成为了教学之路上一个新的旅人。

5 结论

(1)根据皇庄站1981-2008年逐月径流量与1980-2007年逐月74项环流指数、北太平洋海温场、500 hPa高度场的相关关系,利用逐步回归挑选预报因子,构建GA-SVR模型,并对2009-2013年逐月径流量进行预报,结果表明,径流预报精度较高,汛期平均相对误差在30%以内,非汛期、年总量平均相对误差在20%以内,均优于随机森林和多元线性回归模型。但个别年份中的个别月平均相对误差较高,这表明预报因子的时效性与稳定性仍需提高,其中的物理成因仍需进一步研究。

(2)将GA-SVR模型作为确定性预报结果,采用HUP可以实现径流的概率预报。将概率预报的50%分位数与 GA-SVR预报值进行对比,结果表明,50%分位数与实测值拟合更好,精度更高。HUP不仅可以提供精度更高的定值预报,还能以置信区间的方式量化预报的可靠度,提供更为丰富的预报信息,为防汛抗旱、水资源优化调度提供参考。

传统公路养护思想的根深蒂固是阻碍其发展的一大弊端。以“要想富,就修路”为主的传统交通公路建设观念,虽然在一定程度上促进了公路建设,但对后期出现的公路破坏、和损害没有及时进行修复和养护,既耗时又耗资,并且,只在乎公路建设这种传统的片面思维,严重影响了公路的使用寿命和服务人民的质量,既耗时又耗资,与此同时又对环境资源和人工资源造成了严重的浪费[1]。普通公路只建不养的行为已经跟不上社会经济的发展,人们越来越意识到养路的重要性,同步碎石封层技术的出现和应用必将取代片面单一的传统普通公路建设方式。

参考文献(References):

[1] CLOKE H L,PAPPENBERGER F.Ensemble flood forecasting:a review[J].Journal of Hydrology,2009,375(3):613-626.DOI:10.1016/j.jhydrol.2006.05.017.

[2] 张俊.中长期水文预报及调度技术研究与应用[D].大连:大连理工大学,2009.(ZHANG J.M id-and-long term hydrological forecasting and operation techniques research and application[D].Dalian:Dalian University of Technology,2009.(in Chinese))

[3] PIECHOTA T C,CHIEW F H S,DRACUP J A,et al.Seasonal streamflow forecasting in eastern Australia and the El NiÌo-Southern Oscillation[J].Water Resources Research,1998,34(11):3035-3044.DOI:10.1029/98WR02406.

[4] KRST ANOVIC P F,SINGH V P.A univariate model for longterm streamflow forecasting[J].Stochastic hydrology and hydraulics,1991,5(3):173-188.DOI:10.1007/BF01544057.

[5] KALRA A,AHMAD S.U sing oceanic-atmospheric oscillations for long lead time streamflow forecasting[J].Water Resources Research,2009,45(3).DOI:10.1029/2008WR006855.

[6] BOX G E P,JENKINS G M,REINSEL G C.T ime series analysis:forecasting and control[M].John Wiley&Sons,2011.

[7] Mohammadi K,Eslami H R,Kahawita R.Parameter estimation of an ARM A model for river flow forecasting using goal programming[J].Journal of Hydrology,2006,331(1):293-299.DOI:10.1016/j.jhydrol.2006.05.017.

[8] PIECHOTA T C,CHIEW F H S,DRACUP J A,et al.Development of ex ceedance probability streamflow forecast[J].Journal of Hydrologic Engineering,2001,6(1):20-28.DOI:10.1061/(ASCE)1084-0699(2001)6:1(20).

[9] 范钟秀.中长期水文预报[M].南京:河海大学出版社,1999.(FAN Z X.Mid-and-long term hydrological forecasting.Nanjing:Hohai University Press,1999.(in Chinese))

[10] BROWN C,XU K,KWON H H,et al.Climate teleconnections to Yangtze River seasonal streamflow at the T hree Gorges Dam,China[J].International Journal of Climatology,2007,27(6):771-780.DOI:10.1002/joc.1437.

[11] PIECHOT A T C,CHIEW F H S,DRACU P J A,et al.Development of ex ceedance probability streamflow forecast[J].Journal of Hydrologic Engineering,2001,6(1):20-28.DOI:10.1061/(ASCE)1084-0699(2001)6:1.

[12] 王富强,霍风霖.中长期水文预报方法研究综述[J].人民黄河,2010,32(3):25-28.(WANG F Q,HU O F L,Review on study of medium and long term hydrological forecasting technique[J].Yellow River,2010,32(3):25-28.(in Chinese))DOI:10.3969/j.issn.1000-1379.2010.03.011.

[13] 林剑艺,程春田.支持向量机在中长期径流预报中的应用[J].水利学报,2006,37(6):681-686.(LIN J Y,CHENG C T.Application of support vector machine method to long-term runoff forecast[J].Journal of Hydraulic Engineering,2006,37(6):681-686.(in Chinese))DOI:10.13243/j.cnki.slxb.2006.06.007.

[14] VAPNIK V.Estimation of dependences based on empirical data[M].Springer Science&Business Media,2006.

[15] VAPNIK V.The nature of statistical learning theory[M].Springer Science&Business Media,2013.

[16] 杨晓华.参数优选算法研究及其在水文模型中的应用[D].南京:河海大学,2002.(YANG X H.Study on parameter optimazation algorithm and its application in hydrological model[D].Nanjing:Hohai University,2002.(in Chinese))

[17] KRZYSZTOFOWICZ R.Bayesian theory of probabilistic forecasting via deterministic hydrologic model[J].Water Resources Research,1999,35(9):2739-2750.DOI:10.1029/1999WR900099.

[18] KRZYSZTOFOWICZ R,KELLY K S.Hydrologic uncertainty processor for probabilistic river stage forecasting[J].Water Resources Research,2000,36(11):3265-3277.DOI:10.1029/2000WR900061.

[19] KRZYSZTOFOWICZ R.Bayesian system for probabilistic river stage forecasting[J].Journal of Hydrology,2002,268(1):16-40.DOI:10.1016/s0022-1694(02)00106-3.

[20] 梁忠民,戴荣,李彬权.基于贝叶斯理论的水文不确定性分析研究[J].水科学进展,2010,21(2):274-281.(LIANG Z M,DAI R,LI B Q.A review of hydrological uncertainty analysis based on Bayesian theory[J].Advances in WaterScience,2010,21(2):274-281.(in Chinese))DOI:10.14042/j.cnki.32.1309.2010.02.008.

 
郦于杰,梁忠民,唐甜甜
《南水北调与水利科技》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号