1、第 卷第 期 年 月水 力 发 电 .基于经验模态分解和支持向量机的日径流预测研究万新宇 王鑫宇 侯添甜 林晓梦(河海大学水文水资源学院 江苏 南京)摘 要:准确的径流预测是水资源开发利用的重要依据 但预测难度大 为提高日径流预测精度 以榕江流域南河东桥园站日径流为例 建立了经验模态分解()和支持向量机()耦合的日径流预测模型 首先 利用经验模态分解将日径流系列分解为若干子过程 再采用支持向量机深度学习模型分别对每一个子过程进行预测 最后将每个预测结果相加得到原日径流数据的预测结果 研究表明:组合模型相对于、单模型具有更好的预测性能关键词:日径流预测 经验模态分解 支持向量机 组合模型 预测精
2、度 榕江流域 .中图分类号:文献标识码:文章编号:()收稿日期:基金项目:国家自然科学基金资助项目()作者简介:万新宇()男 江苏东台人 副教授 博士主要从事水资源规划与管理研究.0引言径流预测是水资源开发利用与管理的重要依据 但径流形成具有显著的非线性特征 预测难度大 因此 径流预测一直是水资源领域研究的热点问题 过程驱动模型和数据驱动模型是当前径流预测常用的两类方法 过程驱动模型建立在流域产汇流的机理上 利用水文学方法对径流形成过程进 行 模 拟如 新 安 江 模 型、模 型 及 模型等 数据驱动模型则是根据数理统计原理 深入挖掘输入与输出数据之间的相关关系建立径流预测模型 如多元线性回归
3、、支持向量机、神经网络模型等 均在径流预测中取得了较为可观的成果近年来 随着深度学习理论的快速发展 一种改进的循环神经网络 长短期记忆神经网络()在径流预测中得到了较为广泛的应用如孙望良等基于 处理的数据集通过 模型对三峡水库进行日径流预测 结果表明其性能优于 模型 此外 支持向量机()作为监督机器学习模型可以用于异常值检测以及预测序列顾哲衍等对黄尾河径流预测研究中发现在高精度模拟上 模型优于 模型 当前径流预测的水 力 发 电 年 月 .研究方向着重于优化模型 以达到更好的预测效果针对数据驱动模型的输入步长(滑动窗口)的讨论较少 孙传文等通过构建三峡水库的季节性 模型进行月径流预测 结果优于
4、 神经网络模型和标准 模型 王爽等通过对历史时间序列进行自相关分析选择最佳输入步长 在最小二乘支持向量机()和 的预测中获得了较好的预测效果 为了能较为清楚直观且有依据地选择输入步长 使用自相关函数分析水文数据的相关性 提高预测精度由于水文径流序列具有非线性与非平稳性单一深度学习预报模型在训练过程中易受噪声信号干扰 导致对时间序列内部规律的变化不能明显识别 影响预测精度 为此 本研究引入一种自适应信号时频分解方法 经验模态分解()对日径流序列进行分解 识别其内部变化规律 构建基于 和 耦合的日径流预测模型 以提高径流预测精度 与经典小波分析相比 方法具有更好的抗噪能力 并已成功应用于非线性数据
5、的处理分析中综上所述 本文将对我国南方榕江流域日径流序列进行自相关分析 以及采用 方法对该数据进行适当分解 在决定输入步长的同时确定预测模型的输入数据 使用 模型对控制流域日径流预测 并设立、模型作为对照模型 以验证所建模型的预测性能1研究方法 自相关分析对于时间序列 自相关函数主要用于分析该序列和其本身 阶滞时后的时间序列之间的相关程度 衡量历史序列对 时刻的影响 在径流数据中自相关分析常用于研究时间序列自身随滞时增加而变化的周期性特征及检验径流序列自身相依性 同时可根据自相关程度判断模型输入数据和预测数据的关联性自相关系数公式为()()式中 为滞时(时移)步长 ()为 和 的协方差、分别为
6、 和 的均方差因为水文序列具有波动性 在径流数据自相关分析中可选择显著性水平 设置容许限 取 容许限水平为 公式为()()式中 取负号为下限 取正号为上限 位于容许限外认为该序列具有相关性 反之该序列独立 经验模态分解经验模态分解()是由 于 年提出的一种新型自适应处理非平稳信号的方法 不同于小波分解法与傅里叶变换法 方法在理论上可以适用将任何一种类型的时间序列(信号)分解成不同时间尺度的时间序列(信号)分量 因而在对径流时间序列这种非线性数据的处理上 效果显著优于传统时频处理方法 能够将复杂的信号根据其自身时间尺度特征分解成为有限个本征模函数()和一个残差()其中每个 都含有原始时间序列中不
7、同尺度的局部特征信号()残差所表现的多为原始序列的整体趋势 分解得到的 需要满足以下两个约束:()在整个数据集中 含有的极值点数与零点数必须相等或最多相差()在任何一点上 由局部最小值形成的下包络线和由局部最大值形成的上包络线的平均值应等于 对径流时间序列进行 分解分为以下步骤:()根据原始径流时间序列信号()确定上下极值点 分别画出下包络线()、上包络线()()求出下包络线()、上包络线()的均值 得到径流时间序列均值包络线()公式为()()()()()原始径流时间序列信号()减去均值包络线()得到去除低频信号的新时间序列信号()公式为()()()()()判断该()是否满足 的上述两个约束
8、若不满足 则以()为基础 重做上述()()的分析直至满足约束 如果满足 记()()该信号()作为第一个 分量 并将原始径流时间序列信号()减去()得到一个去除高频信号的残余分量()作为新的径流时间序列信号 公式为()()()()()重复上述步骤 得到()的第 个 分量()当残余分量()满足 分解终止条件(通常至()成为一个单调函数)循环结束最终可以分解为 个 分量和一个残差()公式为第 卷第 期万新宇等:基于经验模态分解和支持向量机的日径流预测研究 .()()()()支持向量机支持向量机()是一种根据预选的非线性映射 把输入向量投映至某一个高纬度的特征空间并通过最优用于分类的超平面的分类过程
9、通过统计学习理论的 维理论和结构风险最小化原理建立 其构架形式与多层感知器网络相似设有 个训练样本集合:()其中 为输入向量的元素 为预测向量的元素 在高纬特征空间的线性回归函数为()()()式中 为超平面法向量()为非线性函数 为超平面偏置项使用惩罚因子 和松弛变量、求解 和 的凸二次规划 得到回归函数()()()()式中、为二次规划 乘子()为任意满足 条件的核函数 模型结构示意如图 核函数()将两个低维空间的向量 计算经某一变换后在高维空间的向量内积值 是构建 的关键成分图 结构示意 模型构建 模型构建步骤如下 其模型构建的技术路线如图 所示步骤 为提高 预测精度 使用自相关分析对日径流
10、时间序列进行预处理 通过自相关系数大小确定模型的输入步长步骤 利用 算法将日径流时间序列分解为不同时间尺度的 分量和一个残差()步骤 将径流时间序列数据按 划分训练集和测试集 通过试错法寻找 最优惩罚因子 步骤 滤除残差()将各个 的预测结果相加求和作为 模型最终预测结果 评价指标本文选取平均绝对百分比误差()、均方图 技术路线根误差()、纳什效率系数()项指标评价模型性能 各计算公式为 ()()()()()()式中 为实测径流量 为预测径流量 为实测径流量平均值 为径流数据的总容量 值越接近 表明模型误差越小 表示预测值与观测值的偏差 其值越小表明偏差越小 预测效果越好 反映水文过程的拟合效
11、果取值范围(当值越接近 表明水文过程拟合效果越好 可以更加直观了解模型预测结果的精度和可靠性2研究实例榕江属于南海水系 是广东粤东地区第二大河流 也是连接香港与广州的重要航运通道 榕江流域河段总长度 自西向东流经汕尾市、揭阳市、汕头市 市 其中南河为榕江流域主流 上游部分河道纵比降较大 由于榕江流域暴雨多 洪水传播迅速 易发生旱涝灾害 因此 高精度的径流预报对榕江流域及时发布预警 合理调控水资源发挥重要作用 榕江流域 数据图如图 所示本文以榕江流域南河的东桥园站为研究对象水 力 发 电 年 月 .图 榕江流域 东桥园站集水面积 多年平均年径流 亿 搜集选取东桥园水文站 年 月 日 年 月 日的
12、逐日历史径流数据作为 日径流预测模型的训练期进行测试 年 月 日 年 月 日的逐日历史径流数据作为预测模型的检验期3结果与讨论 日径流数据自相关分析合理选择预测因子直接影响模型的预测精度选择东桥园站日径流序列作为模型主要输入 日径流数据的自相关系数和容许限如图 所示 从图 中可知 当滞时 为 和 时 自相关系数位于容许限内 视为与历史数据没有相关性 当 为 和 时 自相关系数在容许限外且数值最大 但较长的滞时通过 分解 能使预测模型更好的学习径流时间序列内部规律 提高预测性能 因此 可认为当输入步长为 时 对预测精度的影响最大图 东桥园站日径流自相关分析 分解日径流数据结果东桥园站日径流序列分
13、解结果如图 所示 原始序列通过 分解 当重构 迭代次数设定为 时 得到 个 分量和 个残余函数()由图 可以发现 各 的频率由高到低递减 至 的波动幅度较大 反映了原始径流量在不同情况下的变化趋势 至 波形较为平缓 反映了原始径流量的随机性 各个分量的值较平均分布于零的两侧 分解较为直观地显示了对日径流序列扰动较低的原始序列特征 故模型通过这些分量可以更精准地学习径流序列的规律性特征 之后进行预测 预测误差会减小图 东桥园日径流 分解对 分解后得到的各个 序列建立各自 预测模型 使用子预测模型对各个子序列进行预测 并将径流预测值相加求和 获得最终预测结果 模型参数设置 模型的惩罚因子 用来衡量
14、目标函数损失的权重 当选取惩罚因子越大 表明对于错误样的惩罚程度越大 但存在过拟合的现象 降低模型泛化能力 故选取(、)进行试验选用预测结果最好的一组超参数 本文为了获得更佳的预测结果 选择多项式核()作为 核函数 以未经 处理的测试集作为输入数据 不同惩罚因子 的测试结果如表 所示由表 可知 惩罚因子 在 范围内对预测结果的影响较大 在 范围内 项评价指标几乎不变 但模型运行时间有所增长因此 当惩罚因子 选取 时 模型具有较好的综合表现效果第 卷第 期万新宇等:基于经验模态分解和支持向量机的日径流预测研究 .表 不同惩罚因子 的测试结果/对各个 分量建立 模型 核函数 选择 函数 多项式 核
15、函数的维度 为 核函数系数 选择 模型预测效果 模型的预测结果如图 所示 然后将 模型的预测结果与、模型的预测结果进行横向对比 如图 所示 以此验证该组合模型预测结果的精度与可靠性 模型采用与 模型相同的参数及变量设置图 模型预测值与实际值对比为了直观地比较 预测模型结合 算法所得径流量预测结果的精度 显然 通过图 可知 在大流量的时间序列预测上神经网络的 模型误差明显较大且数值偏小 模型预测浮动范围大 会出现预测值远大于实际值的现象 模型存在和 同样的问题 在中小流量的时间序列预测上 模型比、模型具有更高的预测精度 通过图 与图、对比 显然使用 算法对径流时间序列预先分解再分别进行预测 得到
16、的结果更加接近真实值图 模型预测值与实际值对比图 模型预测值与实际值对比图 模型预测值与实际值对比 算法较好地弥补了 模型在大流量预测上的不足 实现了大中小流量较高精度的预测 明显地提升了预测效果 各模型训练期与检验期的 项误差指标对比如表 所示由表 可以得出以下结论:()在训练期 模型在 和 指标上优于 模型 明显优于、模型但在 指标上效果略劣于其他模型 在检验期 模型在、指标上高于其他模型 指标低于其他模型 的预测性能大幅下降水 力 发 电 年 月 .表 东桥园水文站日径流预测结果对比模型训练期/检验期/()预测模型在检验期可以更好地表现其真实性能 指标方面 模型比、模 型 分 别 降 低
17、 了 、指标方面 模型比、模 型 分 别 提 高 了 、指标方面 模型比、模型分别减小 、因此 说明 模型的预测结果在检验期具有更高的精度 更加适用于研究区域的径流预测()通过大量数据对预测模型进行训练 相对于其他 个模型 神经网络模型在训练期和检验期的模拟效果均不突出()由于径流序列具有非平稳性和非线性性且序列中多含有噪声的特征 使用 模型直接进行预测会降低对径流量的拟合效果 分解可以对原始时间序列数据进行自适应分解 较为有效地提高了模型预测的精度4结论本文按照自相关性分析径流序列分解分项逐一预测结果累加的技术路线建立 的时间序列耦合模型 榕江流域东桥园站作为研究区域 以日径流时间序列预测为
18、实例对该耦合模型进行试验 得到如下结论:()对于径流等这类水文数据与时间关系密切相关的序列 建议选取自相关系数较大的输入步长预测误差较低()使用 分解对日径流时间序列进行自适应分解 可以呈现多个更好反映原序列的时间子序列 选择具有不同尺度特征和代表整体趋势的分量作为模型的输入数据 可以起到更好的预测效果大规模高质量的训练数据集可以使模型更好地预测径流量()模型的超参数需要进行选优 超参数选择的不同对径流量的预测效果有较大的影响 特别是核函数 模型在榕江流域南河东桥园水文站日径流预测中具有较好的模拟效果 可以应用于榕江流域日径流预测()径流预测模型随预见期延长预测效果如何变动 及和其他数据驱动模
19、型对比效果有待深入研究参考文献:王文川 王莉芳 郭安强.基于 修正模型的年径流预测.人民长江 ():.段勇 任磊.基于 神经网络的黄河中游日径流预测研究.人民黄河 ():.崔东文 金波.基于改进的回归支持向量机模型及其在年径流预测中的应用.水力发电学报 ():.黄景光 吴巍 程璐瑶 等.基于小波支持向量机特征分类的日径流组合预测 以宜昌三峡水库为例.中国农村水利水电():.李代华.基于改进布谷鸟搜索算法优化的 月径流预测.中国农村水利水电():.孙传文 钟平安 万新宇 等.考虑季节因子的支持向量机径流预测模型.中国农村水利水电():.孙望良 周建中 彭利鸿 等.组合日径流预测模型研究.水电能源
20、科学 ():.孙娜 周建中 朱双 等.基于小波分析的两种神经网络耦合模型在月径流预测中的应用.水电能源科学 ():.胡庆芳 曹士圯 杨辉斌 等.汉江流域安康站日径流预测的 模型初步研究.地理科学进展 ():.王文川 高畅 徐雷.基于 与 神经网络耦合的月径流预测研究.中国农村水利水电():.顾哲衍 陈杭 伊鑫.基于 神经网络与 模型的黄尾河径流预测比较分析 .西北林学院学报 ():.程凯 王然风 付翔.基于 的重介分选精煤灰分时间序列预测方法研究.煤炭工程 ():.莫崇勋 邓云 阮俞理 等.基于多种径流预测耦合模型的流域月径流预测优选研究.广西大学学报(自然科学版)():.罗远兴 李志红 梁兴 等.基于 的非平稳时间序列多重分形去趋势波动分析方法.电子学报 ():.王爽 黄海超 石宝存 等.基于自相关分析的交通流预测输入步长研究.华东交通大学学报 ():.(责任编辑 安莉莉)