1、第 卷第 期 年 月灾 害 学 王甜甜 鲁云蒙 刘铁忠.基于 模型和迁移学习框架的风暴潮预测研究.灾害学 ():.():/基于 模型和迁移学习框架的风暴潮预测研究王甜甜 鲁云蒙 刘铁忠(北京理工大学 管理与经济学院 北京 北京理工大学 危机管理研究中心 北京 重庆邮电大学 管理与经济学院 重庆)摘 要:针对数值风暴潮预测模型耗时长及可操作性差的问题 基于“分解 预测 集成”的思想 融合变分模态分解算法()、“点 窗”采样模型、卷积神经网络()、长短期记忆网络()及数值集成方法 构建了风暴潮组合预测模型 首先 采用 分解风暴潮增水时序数据 得到多个分量 其次 利用“点 窗”采样模型对分量数据进行
2、采样 构建输入矩阵 之后 将输入矩阵输入到 组合预测框架中进行预测最后 集成各分量预测结果 得到风暴潮最终预测结果 实证结果表明 预测模型与目前广泛采用的单一模型和其他组合预测模型相比 具有更高的预测精度 为了将模型更好地运用于实际工程中 采用迁移学习方法 将大数据训练模型“迁移”到小数据领域 结果表明:即使新样本数据量较少 迁移后的模型仍具有较好的泛化能力关键词:风暴潮预测 时间序列 变分模态分解 卷积神经网络 长短期记忆网络 迁移学习中图分类号:文献标志码:文章编号:():/针对风暴潮灾害的预测研究 国内外学者提出了一系列风暴潮预测模型 大致可以分为三类:经验预报模型 数值预报模型 机器学
3、习模型 世纪 年代 以、等为代表的学者通过构建经验预报方程的方法实现了对风暴潮的初步预测 但该类方法依赖于预报员正确的预报思路和丰富的预报经验 预报过程具有很强的主观性 且建立的预报方程往往只适用于特定的港口 到 世纪 年代 风暴潮数值预报模型开始了飞跃式的发展 一系列经典的风暴潮预报模型如 和 等被应用在风暴潮预报工作中 然而 巨大的计算成本使研究者们不得不依赖于有限的高保真风暴潮模型或大量的低保真风暴潮模型 从而导致预测精度降低随着计算机技术的不断发展 基于数据驱动的机器学习方法 如人工神经网络()支持向量机()以及遗传算法()等因其快速和轻量的特点 被广泛用于风暴潮预测中然而 单一的机器
4、学习模型存在很多问题 主要表现为 结构难以确定 以及随着数据规模的扩大 全连接网络及 模型计算成本显著增加等 为了提升风暴潮预测精度、等将流体力学模型与机器学习模型相结合 以改善在预测台风风暴潮时产生的计算不良现象尽管这些组合模型具有良好的预测性能 但其在预测中需要收集大量海平面数据信息 短时间内难以快速获取 不利于对风暴潮的实时预测针对以上模型存在的不足之处 本文基于“分解 预测 集成”的思想 提出了一种新的风暴潮预测模型 对中国沿海地区风暴潮增水进行实时预测 混合神经网络能充分挖掘数据特征 在处理具有非线性、非平稳性和时变性等特征的风暴潮水位序列时优势更为显著 为了进一步提升预测精度在将数
5、据输入神经网络前 利用变分模态分解()方法对增水序列进行分解 以削弱其非线性和非平稳性 基于 的风暴潮增水预测模型 模型框架本文基于“分解 预测 集成”的思想 构建了基于 多尺度分解方法、深度学习模型和迁移学习模型的风暴潮增水预测框架(图)收稿日期:修回日期:基金项目:国家重点研发计划()第一作者简介:王甜甜()女 汉族 山东德州人 博士研究生 主要从事自然灾害风险分析研究.:通信作者:刘铁忠()男 汉族 黑龙江海伦人 博士 副研究员 博士生导师 主要从事风险分析与危机管理等方面的研究.:灾 害 学 卷图 风暴潮预测框架图 该预测框架主要分为两个部分:使用历史风暴潮增水大数据构建 预训练模型
6、使用实时采集风暴潮增水数据 对预训练模型进行迁移 从而实现对正在发生的风暴潮进行预测 其中预训练模型具体步骤如下:步骤:分解 利用 方法对历史风暴潮增水序列进行分解 得到多条具有物理意义的本征模态函数()()()()其中 为预先设定的 分解个数步骤:滑动时间窗采样(具体采样方式见 节)构建 个样本库 然后对各个 进行滑动时间窗采样 将()的采样结果添加至样本库()采样完成后 随机选取其中的数据作为训练集 剩余的 作为测试集用于测试预测模型的泛化能力步骤:利用 模型对多尺度分量进行预测 使用训练集训练 组合预测模型 在训练过程中使用测试集测试预测模型当训练结束时 保存在测试集上表现最好的预测模型
7、步骤:预测结果集成 将各 的预测结果集成相加 得到风暴潮增水最终预测结果由于风暴潮灾害发生初期 各水文测站产生的增水数据较少 很难对深度学习模型进行有效的训练 为了满足工程需要 本文使用迁移算法对上述构建的预训练模型进行迁移 冻结网络前 层 只对模型进行全连接层和输出层进行微调具体步骤如下:步骤:构建与预训练模型结构完全相同的神经网络框架 复制预训练模型中前四层的参数并随机初始化输出层的参数步骤:对新的风暴潮增水数据进行 分解和滑窗采样 由于样本数量较少 因此不再划分训练集和测试集步骤:使用新的样本库中的样本训练全连接层和输出层参数 为避免过拟合现象 学习率降低为预训练模型的 倍 迭代次数设定
8、为 次步骤:将训练结果集成相加 得到风暴潮增水最终预测值 变分模态分解()具有自适应、准正交和完全非递归的特性 在频域处理信号方面有效地克服了 中模态混叠及虚假分量的缺点 采用 方法对观测信号进行降噪重构 假设观测信号()是由原始信号的多个子信号与一个独立的高斯噪声叠加而成:()()()()()()()式中:()为原始信号()为高斯噪声()即为 分解得到的 由于该问题的解不唯一 使用正则化方法增加了如下约束:()()()()约束中的第二项是各()对 的偏导数 为各的中心频率 由于约束项中存在导数项 求解难度较大 根据傅里叶变换的性质 有 ()()因此 将时域信号转换至频域进行分析 即:()()
9、()()令 约束函数变为:期王甜甜 等:基于 模型和迁移学习框架的风暴潮预测研究()()()()()将其展开为泛函 泛函变分为 即为泛函取得极值的必要条件:.()()()()()引入约束项 用拉格朗日乘子法求解:()()()()()()()()()式中:()为拉格朗日乘子 利用交替方向乘子()迭代算法交替寻优迭代更新()()其中()的更新公式如下:()()()()()式中:为噪声容忍度总结 的迭代求解过程如下:步骤:为了获得信号的频域分量 首先将实观测信号()通过希尔伯特变换转换为解析信号:()()()()()()式中:()为瞬时幅值()为瞬时频率 求解析信号的傅里叶变换 获得频域信号()表示
10、希尔伯特变换步骤:初始化 以及最大迭代次数 步骤:利用式()、式()更新和步骤:利用式()更新步骤:设定精度收敛判据 如式()所示设定迭代终止的阈值 当 后 序列不再产生新的 造成这种情况的可能原因是信号不足导致虚假频率成分 因此本文选择最优 为 为了更直观地显示分解效果 本文以 风暴潮吕泗站为例绘制分解序列(图)图 分解模数 计算结果 实证结果及分析 预训练预测模型结果及分析本节对所有实验模型在不同提前期内获得的预测结果进行详细的讨论和分析 为消除各预测模型中随机初始化对预测结果的负面影响 所有实验均重复进行 次 所获得的指标值为 次实验的平均值 表 展示了不同预测模型样本外预测的拟合结果
11、各模型不同提前期预测结果与实际结果对比图见附录 图 分解序列结果 期王甜甜 等:基于 模型和迁移学习框架的风暴潮预测研究表 各模型在 个台风风暴潮数据集中不同提前期下的指标预测结果风暴潮事件提前期范围 模型/结合表 和附录 可以发现:()采用水位数据的时间序列构建单因子预测模型对风暴潮进行预测是可行的 并且预测效果取决于预测模型()与设计的 个对比模型相比 模型在预训练数据集上均具有更高的预测精度 从而证明所提模型的优越性()在未经分解方法预处理的模型中 与、和 对比 模型并没有显著的优势 甚至与浅层的 模型相比 深度学习网络的性能有所下降 这可能是由于原始数据内部具有较强的非平稳性以及随机性
12、导致以上模型与 相比具有明显的差异 进一步说明数据分解技术是提升预测性能的有效策略 同时 由表 可以看出 随着预测提前期的增加 未经分解处理的模型性能下降十分明显 说明其不适用于风暴潮长提前期预测()从组合模型的预测结果来看 与 和 相比 模型具备更高的预测精度 由此可以看出 包括 和 在内的多尺度分解技术可以显著提升 的预测能力 而基于 分解技术的模型由于其高效的分解模式 普遍具有更优越的性能 同时 在预训练数据集的 个提前期范围内 通过对比 和 所提模型 和 指标的平均下降率分别为 和 ()和 ()和 ()因此 在应用 的基础上 开发的 框架具有更好的预测性能以上发现表明 本文所使用的预训
13、练模型具有更好的预测精度 基于多尺度分解的方法和深度学习模型相结合具有更好的预测性能 并且更适应长期前期预测 迁移模型预测结果及分析由于风暴潮发生初期 各测站监测数据较少进行 分解效果较差 因此需对数据进行积累在风暴潮发生时 首先积累 个数据点进行分解(由于增水年检中数据单位为小时 因此为风暴潮发生后)将分解后的 序列输入到固定参数的 模型中 并对全连接层和输出层重新进行训练 输出预测结果 当积累 个数据点时 对序列重新进行分解 并输入到固定参数的 模型中 依次输出预测结果 以此类推 每次获取新的数据点时 都重新将序列进行分解 并输入到迁移后的 模型中本文使用 风暴潮事件吕泗站风暴潮增水数据对
14、迁移模型进行验证 并分别对提前期为 和 进行训练 结果如表 和图 所示 分析结果可知 从迁移模型预测的结果可以看出 固定预训练模型前 层 对全连接层和输出层的参数进行微调 得到的模型具有更小的预测误差 即使新样本数量较少 迁移后的模型仍然具有较好的泛化能力 由此证明将迁移学习应用于风暴潮增水预测中 具有十分重要的意义表 模型预测结果指标名称 图 迁移学习模型预测值与实际值对比 结论本文结合“分解 预测 集成”的思想 提出灾 害 学 卷了一个基于 多尺度分解方法与 深度学习框架相结合的风暴潮多步预测模型 并采用迁移学习将其应用于新样本集中 与以往模型相比 所提模型能够有效地提高风暴潮预测的准确性
15、和泛化能力 并且在长提前期预测中也表现出了较好的预测精度将数据分解技术和人工智能模型相结合的设计 为风暴潮预测提供了一种新的方法 也为后续研究工作提供了一种新的方向 与此同时 我们也发现了一些问题 例如如何更好地解决海洋环境中的非线性和不确定性 需要进一步探索和研究 因此 未来的研究主要集中于进一步完善数据预处理技术 以提高风暴潮预测的实用性参考文献:.():.():./:.:.:.:/.().:/.:.():.(/):.:.(/):.():.():薛明 李醒飞 成方林.基于多种神经网络的风暴潮增水预测方法的比较分析.海洋通报 ():.:.:.():.():.():.():.:():.():.
16、:.(/):.():陆继翔 张琪培 杨志宏 等.基于 混合神经网络模型的短期负荷预测方法.电力系统自动化():刘慧敏 徐方远 刘宝举 等.基于 的岩爆危险等级时序预测方法.中南大学学报(自然科学版)():.():尤成 于福江 原野.基于相空间重构的神经网络风暴潮增水预测方法.海洋预报 ():.:.():.():.:.():.:国家海洋局.台风海浪与增水年鉴.北京:国家海洋局 ():“”()“”()().“”期王甜甜 等:基于 模型和迁移学习框架的风暴潮预测研究 .“”.:附录 不同模型预测值与实际值对比灾 害 学 卷图 不同模型预测值与实际值对比灾害学继续被“中国科技核心期刊”收录 年 月 中
17、国科学技术信息研究所发布 年中国科技核心期刊目录 灾害学继续被中国科技核心期刊(中国科技论文统计源期刊)收录中国科技论文统计与分析是国内目前最具权威性的统计结果 其确定的统计源期刊也被公认为是高质量科技期刊 自 年以来 由科学技术部中国科学技术信息研究所承担的“中国科技论文统计与分析”项目每年以发布会形式向社会公布中国科技论文统计结果 公开出版中国科技论文统计与分析年度研究报告、中国科技期刊引证报告(核心版)为政府管理部门和广大高等院校、研究机构和研究人员提供了丰富的信息和决策支持“中国科技论文与引文数据库”选择的期刊称为“中国科技核心期刊”又称“中国科技论文统计源期刊”“中国科技核心期刊”的选取经过了严格的同行评议和定量评价 是中国各学科领域中较重要的、能反映本学科发展水平的科技期刊灾害学目前已被北京大学图书馆中文核心期刊要目总览(版)中国科学引文数据库()核心库科技期刊世界影响力指数()报告等核心期刊收录 灾害学将通过做好服务 严格执行三审三校制度 努力提升期刊内容质量 扩大期刊在灾害研究领域的社会影响力和竞争力 在服务党和人民的防灾减灾事业上发挥更大作用