收藏 分销(赏)

基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf

上传人:自信****多点 文档编号:237056 上传时间:2023-04-06 格式:PDF 页数:12 大小:2.18MB
下载 相关 举报
基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf_第1页
第1页 / 共12页
基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf_第2页
第2页 / 共12页
基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、李晶,唐全莉.基于1DCNN和LSTM的单站逐时气温预报方法J.热带气象学报,2022,38(6):800-811.文章编号:1004-4965(2022)06-0800-12基于1DCNN和LSTM的单站逐时气温预报方法李晶1,唐全莉2(1.宁波工程学院经济与管理学院,浙江 宁波 315000;2.昆明理工大学理学院,云南 昆明 650500)摘要:针对海量气象观测数据间存在大量的物理噪声、与气温无关的冗余特征以及时间相关性,提出了一种将一维卷积神经网络(1DCNN)和长短期记忆神经网络(LSTM)相结合的多信息融合气温预报方法。首先,运用差分法对气象观测数据进行预处理,得到平稳时间序列数据

2、;其次,运用1DCNN提取与气温变化相关的特征变量作为神经网络模型的输入变量;最后,运用 1DCNN 和 LSTM 构建多信息融合气温预报模型 1DCNN-LSTM,并以云南省昆明市历史气象观测数据为例,与传统的LSTM、1DCNN和反向传播神经网络(BP)对未来24小时的逐时气温预报进行了比较研究。研究结果表明,1DCNN-LSTM的均方根误差(RMSE)相较于LSTM、1DCNN 和 BP 最大降低了 5.221%、19.350%和 9.253%,平均绝对误差(MAE)最大降低了 4.419%、17.520%和8.089%。为气温的精准预报提供了参考依据。关键词:1DCNN神经网络;LST

3、M神经网络;多信息融合;气温预报;单站逐时预测中图分类号:P456.4文献标志码:ADoi:10.16032/j.issn.1004-4965.2022.074收稿日期:2021-04-13;修订日期:2022-08-08基金项目:浙江省统计局重点项目(22TJZZ25);国家自然科学基金(71964018);云南省社会科学基金(YB2019036);昆明理工大学学生课外学术科技创新基金(2020YB207)共同资助通讯作者:李晶,女,河北省人,副教授,博士,从事数据科学、质量管理工程研究。E-mail:第38卷 第6期2022年12月热 带 气 象 学 报JOURNAL OF TROPICA

4、L METEOROLOGYVol.38,No.6Dec.,20221 1 引引言言气温是影响气候最主要的参数之一,其变化可导致财产损失,甚至会威胁人类生命。因此,精准的气温预报在人类的经济活动、地质灾害防控、医疗实践等众多领域具有重要意义1-5。因此,有效挖掘地面气象观测站中的时间序列数据,预知未来气温的动态变化,受到国内外专家学者的高度重视6-8。早期的气温预报方法大多运用数值预报方法9和传统的统计学预报方法10。张金秀等11运用统计学方法系统分析了河西走廊东部强降温的时空分布、强度等气候特征,并利用Press准则和逐步回归方法对预报因子进行初选和精选,构建了一种基于最优子集回归的各地月最低

5、气温预报方法,为强降温预报和预警提供了客观有效的参考依据。张颖超等12基于气温在空间上的相关性,运用粒子群算法进一步改进了多面函数内插算法,进而构建了一种基于地面逐时气温观测资料的多站联网质量控制方法,该方法具有较强的地区适应性和气候适应性。李江峰等13基于偏最小二乘回归能完全消除多重共线性的特点,构建了水汽和地面气温多模式集成预报模型,进一步改善了比湿和地面气温多模式集成预报的效果。虽然这些方法在气温预报上都取得了良好的预报效果,但因受制于较大的计算代价、大量物理噪声以及与气温无关的冗余特征对气温变化的影响,传统的统计学气温预报方法无法有效地学习气象观测数据间的时间相关性,在气温预报精度上仍

6、具有一定的提升空间。随 着 深 度 学 习 的 发 展,人 工 神 经 网 络(Artificial Neural Networks,ANN)凭借超强的自学习能力,可深度学习海量数据间隐藏的复杂关系,第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法在气象领域已取得一定的应用成果14-18,例如小波神经网络(Wavelet Neural Network,WNN)19、反向传播神经网络(Back Propagation,BP)20、长短期记忆神经网络(Long Short-Term Memory,LSTM)以及 一 维 卷 积 神 经 网 络(One-DimensionalConvol

7、utional Neural Network,1DCNN)等。其中,1DCNN神经网络的表征学习能力,可挖掘时间序列数据中存在的长期依赖关系,进而提取高阶特征21;LSTM神经网络利用遗忘门、输入门和输出门,被证实在时间序列任务中具有较好的预报效果22。倪铮等23将LSTM深度神经网络用于精细化气温预报,在空军T511数据模型产品的试用过程中,发现该模型对转折天气具有较好的气温预报效果。陶晔等24利用随机森林(RandomForest,RF)可度量特征重要性的特点,将 RF 与LSTM模型相结合,构建了RF-LSTM气温预报模型。然而,尽管LSTM神经网络对时间序列数据具有较好的预报能力,但由

8、于海量气象观测数据间存在大量的物理噪声和与气温无关的冗余特征,因此,仅运用LSTM模型对气温进行预报存在训练时间长、易过拟合等缺陷。鉴于此,本文基于1DCNN能够进行特征提取的特点和LSTM较强的时间序列数据处理能力,构建了一种多信息融合气温预报方法 1DCNN-LSTM。该方法可有效地挖掘气象观测数据间存在的时间相关性,剔除与气温变化无关的物理噪声和冗余特征,降低数据维度和时间复杂度,进而可提取出与气温高度相关的潜在特征,进一步提高气温预报精度。2 2 研究方法概述研究方法概述2.1 1DCNN神经网络模型1DCNN 神 经 网 络 是 卷 积 神 经 网 络(Convolutional N

9、eural Network,CNN)的一种特殊结构,具有强大的表征学习能力,能够从输入信息中提取高阶特征25。一个典型的 1DCNN模型通常包括输入层、若干个交替的卷积层和池化层、全连接层和输出层这5个部分。其中,卷积层可对输入数据进行特征提取26。卷积层。卷积层通过卷积运算从输入数据中提取子序列,以达到从局部输入中提取高阶特征,提高特征鲁棒性的目的,卷积公式如式(1)所示。为了提高1DCNN模型的稀疏性,减少参数之间的依 存 关 系,通 常 采 用 线 性 整 流 函 数(RectifiedLinear Unit,ReLU)作为卷积层的激活函数,数学表达式如式(2)所示,xlj=f()i M

10、jxl-1i wlij+bj(1)al+1i()j=f()yl+1i()j=max0,yl+1i()j(2)其中,xlj为卷积操作的输出值,f为激活函数,Mj为输入的特征矢量,xl-1i为待卷积区域,wlij为卷积核(权重),bj为相应的偏置系数。yl+1i()j为卷积操作的输出值,al+1i()j为yl+1i()j的激活值。池化层。池化层在卷积层之后,利用最大池化方法对卷积层的输出执行池化操作,如式(3)所示,pl+1i()j=max()j-1 W+1 t jWqli()t(3)其中,pl+1i()j为池化操作的输出值,qli()t为第l层第i个特征矢量中第t个神经元的值,W为池化区域的宽度

11、。2.2 LSTM神经网络模型LSTM 神经网络是递归神经网络(RecursiveNeural Network,RNN)的 一 种 变 体,是 SeppHochreiter和Jrgen Schmidhuber专门研究梯度消失问题所提出的重要研究成果27。该方法提出了一种可携带信息跨越多个时间步的设计,因此,能够挖掘数据间存在的时间相关性,有效避免传统RNN模型由于无法学习数据间的时间依赖关系而面临的梯度爆炸和梯度消失问题。其单元结构如图1所示。图1LSTM单元结构图htCtCtCt-1ht-1XththtftitottanhtanhC?t801热 带 气 象 学 报第38卷由图1可看出,LST

12、M是由多个结构完全相同的单元构成,利用遗忘门、输入门和输出门的相互作用来调节单元状态。遗忘门、输入门和输出门的具体调节步骤如下。(1)通过遗忘门从单元状态中找到需要丢弃的信息,如式(4)所示,ft=()Wfht-1,xt+bf(4)其中,ft为遗忘门,为sigmoid激活函数,ht-1和xt分别为前一时刻的输出值和当前时刻的输入值,Wf和bf分别表示遗忘门的权重矩阵和偏置项。(2)通过输入门决定加入新状态的时间。通过sigmoid层找到需要更新的单元状态;通过双曲正切函数(tanh)层创建一个新的单元状态值;将旧单元状态更新到新单元状态,具体计算步骤如式(5)式(7)所示,it=()Wiht-

13、1,xt+bi(5)C?t=tanh()Wcht-1,xt+bc(6)Ct=ft Ct-1+it C?t(7)其中,it、C?t、Ct-1和Ct分别表示输入门、当前输入的单元状态、旧单元状态和跟新后的新单元状态,Wi和bi分别表示输入门的权重矩阵和偏置项,Wc和bc分别表示单元状态的权重矩阵和偏置项。(3)通过输出门将新单元状态和输入数据相结合,确定 LSTM 模型的输出值。首先,利用sigmoid层确定需要输出的信息,如式(8)所示;其次,将tanh层和sigmoid层相乘,得到最终的输出值,如式(9)所示,ot=()Woht-1,xt+bo(8)ht=ot tanh()Ct(9)其中,ot

14、表示输出门,ht表示LSTM模型最终的输出,Wo和bo分别表示输出门的权重矩阵和偏置项。3 3 基于基于1 1DCNNDCNN和和LSTMLSTM的多信息融的多信息融合气温预报模型构建合气温预报模型构建3.1 研究区域本文研究区域为云南省昆明市。由于其独特的地理位置,经常出现倒春寒、洪涝、干旱等多种气象灾害,以及由气象灾害引发的泥石流、山体滑坡等地质灾害,该地区时常遭受经济和人员等重大损失。因此,本文将通过挖掘云南省昆明市气象观测数据间的隐藏特征,进而提高气温预报精度,增强气象灾害预防能力。3.2 预报时间范围气温变化易受到各种不可控因素的影响,随着预报时间的增加,预报误差逐渐累积,进而导致气

15、温预报模型的预报精度不断降低。因此,预报时间越长,气温预报误差就越大。基于此,本文拟运用过去一周(即7天)的历史气象观测数据来预测云南省昆明市未来24小时的逐时气温,进一步探究多信息融合气温预报模型1DCNN-LSTM在未来24小时中的气温预报效果,为中长期气温预报的研究提供理论基础。3.3 数据收集传统的气温预报方法主要基于单变量的气温预报,即仅考虑了气温这一气象要素,忽略了其他气象要素对气温变化的影响。因此,导致气温预报模型的输入变量过少,时间序列数据之间关联信息不足,进而降低传统气温预报方法的精度。基于此,本文将构建多信息融合的预报方法对气温变化进行深入探究。通过运用文献分析法,得出影响

16、气温变化的主要因素有气温(T)、气象站气压(PO)、海 平 面 气 压(P)、相 对 湿 度(RH)、风 向(WD)、风速(WS)以及水平能见度(VV)。其单位分别为摄氏度()、hPa、hPa、百分率(%)、罗盘方向、米/秒(m/s)、千米(km)。其中,T 为本文的预测值(y),PO、P、RH、WD、WS以及VV为特征值(x)。根据以上影响因素,本文将收集云南省昆明市地面气象站2017年1月1日00时2019 年12月31 日23时(北京时间,共计1 095天)的每小时气象观测数据(共计26 280条)进行实证研究。同时,运用差分法对气象观测数据进行预处理,将预处理后的数据集中的前80%作为

17、训练集,后20%作为测试集,并随机抽取训练集中的20%作为验证集。3.4 数据预处理由于本文所收集到的气象观测数据具有明显的季节性变化,且其中的的风向数据属于文本数据,因此,本文的数据预处理主要包括以下3个方面:(1)运用地面气象电码将风向中的文本数据转换成对应的风向电码(数值数据),得到适用于神经网络模型的数据集;(2)运用差分法对转换后的气象观测数据集进行去季节化处理,剔除季节性变802第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法化对模型产生的信号干扰,进而得到平稳的时间序列数据;(3)运用z-score标准化方法对去季节化后的数据进行标准化处理,得到均值为0标准差为1的服

18、从标准正态分布的数据,以解决不同气象要素之间由于量纲和量纲单位不统一而造成的可比性问题,如式(10)所示。该方法使训练数据更加集中,有效缩短了模型的训练时间,更有利于模型的正常运行。x*=x-x(10)其中,x为原始时间序列数据,x*、x 和分别为x标准化后的样本数据、x的均值和标准差。3.5 预报性能评价指标的选取通常情况下,用于评估机器学习模型预报性能所采用的评价指标主要包括均方根误差(RootMean Square Error,RMSE)、平均绝对误差(MeanAbsolute Error,MAE)、皮尔逊相关系数(PearsonCorrelation Coefficient,PCCs)

19、以及高斯核密度估计(Gaussian Kernel Density Estimation,GKDE)等。其中,RMSE和 MAE是预测误差的衡量指标,指标值越小,表明预测精度越高,即预测值越接近真实值。PCCs是度量相关性的衡量指标,常用r表示。r值越接近1,表明预测值与真实值之间的相关性越强,拟合度越高。GKDE模型是一种用于估计概率密度函数的非参数方法,通过比对各模型的误差分布,GKDE曲线峰度越高,表明模型产生的预报误差越集中地分布在0附近,即气温预测值越接近真实值。因此,本文选取模型的泛化能力、预报精度以及误差分布作为衡量 1DCNN-LSTM多信息融合气温预报模型预报性能的评价指标。

20、其中,RMSE、MAE和r的计算公式分别如式(11)(13)所示:RMSE=1Ni=1N()yi-yi2(11)MAE=1Ni=1N|yi-yi(12)r=1n()yi-y()yi-y 1n()yi-y 21n()yi-y 2(13)其中,yi、yi、y 以及y 分别为真实气温值、预报气温值、真实气温值的均值和预报气温的均值,N为测试样本的数量。3.6多信息融合气温预报模型 1DCNN-LSTM的建立随着科学技术的不断进步,尤其是计算机领域的逐渐壮大,神经网络模型在气温预报领域已取得一定的应用成果。其中,传统的气温预报方法 主 要 包 括 1DCNN、LSTM 和 BP 神 经 网 络。LST

21、M 神经网络具有良好的长期依赖性,能够挖掘出时间序列数据间存在的时间相关性,但存在参数过多、训练时间较长且容易过拟合的缺陷。1DCNN神经网络具有强大的特征学习能力,能够从输入信息中提取隐藏特征,从而挖掘出与气温高度相关的高阶特征,有效弥补了LSTM的不足,在提高模型预报精度的同时减少训练时间。BP神经网络具有较强的非线性映射能力,可利用误差反向传播算法自动调整权值和阈值,能够较好地完成时间序列预报任务。鉴于此,本文构建了一种将1DCNN神经网络和LSTM神经网络相结合的多信息融合气温预报模型1DCNN-LSTM,该模型主要由输入层、卷积层、SpatialDropout1D 层、池 化 层、L

22、STM 层、Dropout层和全连接层构成。1DCNN-LSTM模型的总体气温预报过程可分为5步。(1)运用输入层将形为(batch_size,time_steps,input_features)的气象观测数据输入神经网络模型。其中,batch_size表示用于训练的数据批量大小,即每次喂入神经网络的样本数,属于样本数量上的概念。经过反复试验,本文将其设置为32;time_steps表示气温预报的时间步长,即每个样本内包含的步长数,属于样本内部概念。由于本文运用过去7天(t-6,t-5,t-4,t-3,t-2,t-1,t)内T、PO、P、RH、WD、WS和VV的时间序列数据来预测t+24小时内

23、的逐时气温,故将 time_steps 设置为 7;input_features 表示输入数据的特征维度,由于输入7个特征因子,因此本文将其设置为7。(2)运用卷积层对输入数据进行特征提取。(3)运用池化层对提取到的深层特征进行下采样,以进一步降低数据维度。(4)运用LSTM 层挖掘时间序列数据之间的时间相关性,进而有效地学习气象观测数据之间的时间依赖关系。(5)运用全连接层输出第t+1时刻各气象要素的预报值,并利用该预报结果继续更新输入层中的时间序列数据,即输入(t-5,t-4,t-3,t-2,t-1,t,803热 带 气 象 学 报第38卷t+1)内各气象要素的数据来预测t+2时刻的气温值

24、。通过重复这个过程,可实现t+n小时内的逐时气温预报,本文将n设置为24。在整个试验过程中,设置1DCNN-LSTM气温预报模型的优化器为 Adam,损失函数 RMSE,epoch 为 200,batch_size 为 32,学习率=0.000 1,且每隔 100 个 epoch,学习率减小为原来的 1/10。同时,经过本文的反复实验,发现将 1DCNN-LSTM模型中一维卷积层层数设置为1,且该层一维卷积核大小设置为 5,一维卷积核个数设置为200,LSTM层层数设置为2,且每层LSTM神经元个数分别设置为128和64时,该模型的气温预报效果最好。此外,为了降低1DCNN-LSTM模型的过拟

25、合,进一步提高气温预报精度,本文在一维卷积层和 LSTM 层之后,分别添加了比率为 0.5 的SpatialDropout1D层和Dropout层。其总体框架如图2所示。图2多信息融合气温预报方法1DCNN-LSTM的总体框架由图 2 可看出,多信息融合气温预报方法1DCNN-LSTM主要分为两部分。第一部分,将经过数据预处理后 7 天内的气象观测数据作为1DCNN神经网络的输入变量,通过卷积层进行特征提取,利用池化层降低数据维度,进而提取出与气温高度相关的深层特征;第二部分,将1DCNN模型提取到的特征向量输入LSTM神经网络中,利用LSTM模型特殊的门结构,进一步学习数据间的时间依赖关系,

26、进而对气温进行预报。4 4 实验结果与分析实验结果与分析由3.4节可知,基于深度学习的传统气温预报方法主要包括1DCNN、LSTM和BP神经网络。因此,本文将选取1DCNN、LSTM和BP神经网络作为基线模型,与所构建的1DCNN-LSTM在模型总体预报效果、气温预报性能两个方面进行对比分析。4.1 模型总体预报效果对比分析通常情况下,测试集样本数更多且数据分布可能发生变化,比验证集更能考验模型的泛化能力、预报精度和总体预报效果。因此,在进行气温预报性能对比之前,本文首先针对测试集中的数据,对模型的总体预报效果进行对比分析,分别绘制出1DCNN-LSTM、1DCNN、LSTM和BP模型的气温真

27、实值(折线)与预测误差(柱状)的对比图,如图3图6所示。由图3图6可看出,在对气温预报总体趋势的过程中,除了少数的波峰和波谷预报效果较差以外,1DCNN-LSTM、1DCNN、LSTM 和 BP 模型都能较好地刻画气温的动态变化,气温预测值与真实值的总体走势基本一致。为了更清晰地描述各模型的预报效果,本文随机抽取了图3图6中连续2天(共48个)的数据进行分析,具体如图7所示。由图7可看出,相较于传统的1DCNN、LSTM和BP模型,本文所构建的多信息融合气温预报模型1DCNN-LSTM的气温预报曲线更贴近气温真实曲线。因此,该模型具有较好的气温预报效果,气 温 预 测 值 更 接 近 真 实

28、值。这 进 一 步 表 明1DCNN-LSTM模型可有效地剔除历史气象观测数据间的物理噪声和与气温无关的冗余特征,进而提取出与气温高度相关的隐藏特征;在考虑数据间时间相关性的同时,弥补了LSTM模型训练时间长、易过拟合的缺陷,这也是本文将1DCNN模型和LSTM模型相结合构建多信息融合气温预报模型的原因所在。7天内的气象观测数据(T、PO、P、RH、WD、WS、VV)一维卷积层(200)SpatialDropout1D层(0.5)一维最大池化层LSTM层(128)Dropout层(0.5)LSTM层(64)Dropout层(0.5)全连接层(32)全连接层(1)下一时刻的气温值1DCNN特征提

29、取LSTM气温预报804第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法图31DCNN-LSTM模型气温预报结果图4 1DCNN模型气温预报结果图5 LSTM模型气温预报结果2520151050Air Temperature/Real Data1DCNN-LSTM Error05001 0001 5002 0002 5003 0003 500Time/h2520151050Air Temperature/Real data1DCNN Error05001 0001 5002 0002 5003 0003 5002520151050Air Temperature/Real dataL

30、STM Error05001 0001 5002 0002 5003 0003 500Time/hTime/h805热 带 气 象 学 报第38卷4.2 模型预报性能对比分析由3.5节可知,用于评估机器学习模型预报性能所采用的评价指标主要包括模型的泛化能力、预报精度以及误差分布。针对测试集中的数据,分别从以下3个方面对各模型的气温预报性能进行 对 比 分 析。(1)对 1DCNN-LSTM、1DCNN、LSTM和BP模型的泛化能力进行对比分析。模型的泛化能力越强,表明该模型的实际预测能力越强,理论上气温预报精度就越高,具有进一步研究的价值。(2)从RMSE、MAE、r以及p值的角度对模型的预报

31、精度进行对比分析。其中,p值是统计学中应用最广的假设检验指标之一,将其与给定的显著性水平进行比较,可确定是否具有统计学意 义。本 文 将 选 定 显 著 性 水 平 为 0.05,则 当p 0.05时,表明该模型的RMSE、MAE和r值均具有统计学意义。RMSE和MAE的值越小且r值越接近 1,表明该模型的预报精度越高。(3)针对1DCNN-LSTM、1DCNN、LSTM和BP模型的气温预测值,对模型的误差分布进行对比分析,预报误差越集中地分布在0附近,表明模型的预报性能越好。4.2.1 模型泛化能力对比分析针对测试集中的数据,分别绘制出 1DCNN-LSTM、1DCNN、LSTM和BP模型在

32、200次迭代下的RMSE、MAE对比图,分别如图8和图9所示。图6 BP模型气温预报结果图7 1DCNN-LSTM、1DCNN、LSTM和BP模型随机抽取的气温预报结果2520151050Air Temperature/Real dataBP Error05001 0001 5002 0002 5003 0003 500Time/h2422201816Air Temperature/01020304050Time/h1DCNN-LSTM1DCNNLSTMBPReal data806第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法由图8可看出,在对未来24小时的逐时气温预报过程中,1

33、DCNN-LSTM模型的RMSE曲线明显比 1DCNN、LSTM 和 BP 模型低,表明 1DCNN-LSTM 模型随着预报时间的不断增加,始终保持较高的气温预报精度,具有较强的实际气温预报能力。同时,1DCNN-LSTM、1DCNN、LSTM 和BP模型的 RMSE曲线均随着预报时间的增加而持续上升,且最终趋于稳定。这可能是因为在整个气温预报过程中,各模型的预报误差随着预报时间的增加而不断累积,模型的可预报性逐渐降低,进而导致各模型的RMSE曲线随着预报时间的增加而持续上升。此外,由前10小时的气温预报结果可看出,相较于1DCNN、LSTM和BP模型,1DCNN-LSTM模型的RMSE曲线最

34、低,表明在短时气温预报过程中,1DCNN-LSTM模型的气温预报精度更高,气温预报值更接近真实值。由后1524小时的气温预报结果可看出,1DCNN-LSTM模型的RMSE曲线在0.700附近趋于稳定,LSTM和 BP模型的 RMSE曲线在 0.715附近趋于稳定,1DCNN 模型的 RMSE 曲线在 0.745 附近趋于稳定。1DCNN-LSTM模型的RMSE稳定值最低,表明随着预报时间的持续增加,1DCNN-LSTM模型在未来48小时、72小时甚至未来几天的气温预报过程中,均具有较好的气温预报效果。综上所述,对比1DCNN、LSTM和BP模型,无论是短期气温预报还是长期气温预报,本文所提出的

35、多信息融图81DCNN-LSTM、1DCNN、LSTM和BP模型未来24小时的RMSE曲线对比图图91DCNN-LSTM、1DCNN、LSTM和BP模型未来24小时的MAE曲线对比图0.750.700.650.600.550.500.45RMSE/0510152025Prediction Horizons/h1DCNN-LSTM1DCNNLSTMBP0.600.550.500.450.400.35MAE/0510152025Prediction Horizons/h1DCNN-LSTM1DCNNLSTMBP807热 带 气 象 学 报第38卷合气温预报模型1DCNN-LSTM均具有更好的学习能

36、力和泛化能力,能够更有效地对气温进行精准预报。由图 9 可看出,相较于 1DCNN、LSTM 和 BP模型,1DCNN-LSTM模型在总体24小时气温预报过程中的MAE曲线最低,表明1DCNN-LSTM模型具有更好的气温预报效果,能够更有效地提高气温预报精度。同时,与图 8 中 1DCNN-LSTM、1DCNN、LSTM 和 BP模型的 RMSE曲线相似,在对未来24小时的逐时气温预报过程中,各模型的MAE曲线均随着预报时间的增加而持续上升,且最终趋于稳定。其中,1DCNN-LSTM 模型的MAE 曲线在 0.575 附近趋于稳定,LSTM 模型的MAE曲线在0.585附近趋于稳定,BP模型的

37、MAE曲线在0.590附近趋于稳定,1DCNN模型的MAE曲线在 0.625 附近趋于稳定。综上所述,对比1DCNN、LSTM和BP模型,本文所构建的多信息融合气温预报模型1DCNN-LSTM能够进一步提高气温的预报精度,进而对气温进行精准预报。4.2.2 模型预报精度对比分析由 4.2.1 节 可 知,1DCNN-LSTM、1DCNN、LSTM和BP模型的RMSE和MAE曲线在未来10小时气温预报之后均趋于稳定。基于此,为了进一步比较各模型的气温预报精度,分别计算得出在对未来 10 小时的气温预报过程中,1DCNN-LSTM 模型相较于 LSTM、1DCNN 和 BP 模型在RMSE、MAE

38、和r上改进的百分比,具体如表1所示。表11DCNN-LSTM相较于1DCNN、LSTM和BP模型在RMSE、MAE、r和p上改进的百分比模型LSTM1DCNNBP评价指标RMSEMAErpRMSEMAErpRMSEMAErp1小时5.2214.4190.1190.00019.35017.5200.4350.0009.2538.0890.2250.0002小时4.2163.7570.1210.00016.24115.1400.4430.0007.6857.0340.2280.0003小时3.6513.4150.1230.00014.33513.5410.4510.0006.7986.3320.2

39、320.0004小时3.1843.0950.1250.00012.49712.0600.4580.0005.9085.7570.2350.0005小时2.4932.5090.1260.00010.65010.4970.4650.0004.9554.9510.2380.0006小时2.1032.1290.1280.0009.3318.9670.4700.0004.2644.2890.2400.0007小时1.7031.7600.1290.0007.9737.8780.4750.0003.5453.6500.2420.0008小时1.2191.3700.1300.0006.6346.5480.47

40、80.0002.7532.9170.2440.0009小时0.8541.1410.1300.0005.5525.3170.4800.0002.1102.3580.2450.00010小时0.5190.6760.1310.0004.6944.3840.4820.0001.5271.7130.2460.000由表1可看出,LSTM、1DCNN和BP模型的p值均等于0.000(小于0.050),表明各模型的RMSE、MAE和r值均具有统计学意义。同时,在对未来10小时的总体气温预报过程中,各模型每小时的RMSE、MAE和 r值的百分比都大于 0,表明相较于LSTM、1DCNN和BP模型,1DCNN-

41、LSTM模型的气温预报精度更高,能够更好地对气温进行精准预报,与图8和图9得到的结论相符。其中,由表 1 加粗的数据可看出,1DCNN-LSTM 模型的RMSE 和 MAE 在第 1 小时内降低的最多,表明1DCNN-LSTM模型的短时气温预报效果较好,为后续进一步提高中长期气温预报精度提供了理论依据;相关性 r 在第 10 小时内提高的最多,表明1DCNN-LSTM模型的气温预测值与真实值之间的相关性不断增强,具有更好的气温预报效果。接 下 来,本 文 将 1DCNN-LSTM 模 型 分 别 与LSTM、1DCNN和BP模型进行对比分析。(1)对比 LSTM 模型,1DCNN-LSTM 模

42、型的RMSE 和 MAE 最大降低了 5.221%和 4.419%,相关性r最大提高了0.131%。这是因为LSTM模型虽然可较好地学习气象观测数据间的时间依赖关系,但无法避免不能进行特征提取、训练时间较808第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法长、易过拟合的缺陷,而1DCNN-LSTM模型可提取出与气温变化相关的深层特征,进而有效地弥补了LSTM模型的不足。(2)对比1DCNN模型,1DCNN-LSTM模型的RMSE 和 MAE 最大降低了 19.350%和 17.520%,相关性 r 最大提高了 0.482%。这是因为 1DCNN模型虽然能够挖掘出与气温高度相关的隐

43、藏特征,但忽略了气象观测数据之间的时间相关性,而1DCNN-LSTM 模型可运用 LSTM 模型学习数据间的时间依赖关系,进而有效弥补了1DCNN模型无法挖掘数据间时间相关性的缺陷。(3)对 比 BP 模 型,1DCNN-LSTM 模 型 的RMSE 和 MAE 最大降低了 9.253%和 8.089%,相关性 r最大提高了 0.246%。这是因为 BP模型是一种无时序概念的前馈神经网络,虽然该模型具有较强的非线性映射能力,但与LSTM模型不能进行特征提取的缺陷相似,BP模型无法避免物理噪声和与气温无关的冗余特征对气温变化的影响;同时,也与1DCNN模型无法挖掘数据之间时间相关性的缺陷相似,B

44、P模型不能学习数据间的时间依赖关系,因此,导致气温预报精度远低于1DCNN-LSTM模型。由上述 1DCNN-LSTM 模型与传统气温预报模 型 的 对 比 分 析 可 看 出,针 对 RMSE 指 标,1DCNN-LSTM 模型较 LSTM、1DCNN 和 BP 模型最大降低了5.221%、19.350%和9.253%,气温预测值更接近真实值;针对MAE指标,1DCNN-LSTM模型较 LSTM、1DCNN 和 BP 模型最大降低了4.419%、17.520%和 8.089%,具有较高的预测精度;针对 r 指标,1DCNN-LSTM 模型较 LSTM、1DCNN和BP模型最大提高了0.131

45、%、0.482%和0.246%,气温预测值与真实值的相关性最高。因此,4 种模型的气温预报精度从优到劣依次是1DCNN-LSTM 模 型、LSTM 模 型、BP 模 型、1DCNN模型。综上所述,相较于LSTM、1DCNN和BP模型,本文所构建的多信息融合气温预报模型1DCNN-LSTM 是基于 1DCNN 较强的特征提取能力和LSTM 能够挖掘时间相关性的特点等优势。因此,该模型较好地弥补了LSTM和1DCNN存在的缺陷,有效提高了气温预报精度。4.2.3 模型误差分布对比分析为了进一步说明 1DCNN-LSTM 模型具有更好的气温预报效果,本文将运用GKDE方法对模型产生的误差进行分析(图

46、10)。由 图 10 可 看 出,1DCNN-LSTM、1DCNN、LSTM和BP模型的误差分布近似于高斯分布。对比 1DCNN 模型,1DCNN-LSTM 模型的 GKDE 曲线峰度明显更高,预报误差更集中地分布在 0附近;对比 LSTM 模型,虽然 1DCNN-LSTM 模型的KDE 曲 线 峰 度 略 低,但 由 4.1 节 所 分 析 的,1DCNN-LSTM 模型的整体预报效果明显优于LSTM模型;对比BP模型,1DCNN-LSTM模型的GKDE曲线的密度更高且平均值更接近于0。因此,相较于 1DCNN、LSTM 和 BP 模型,1DCNN-LSTM模型产生的预报误差更密集地分布在0

47、附近,气温预测值更接近真实值,具有显著良好的气温预报效果,可对气温进行精准预报。5 5结论与讨论结论与讨论为了剔除大量物理噪声和与气温无关的冗余特征对气温变化的影响,挖掘出海量气象观测数据之间的时间相关性,本文构建了一种将特征提取能力较强的1DCNN神经网络和时间序列处理能力较强的LSTM神经网络相结合的多信息融合气温预报方法 1DCNN-LSTM。该方法不仅有效地缓解了传统气温预报模型因关联信息不足而导致的预报精度降低、泛化能力下降的弱点,还较好图10 1DCNN-LSTM、1DCNN、LSTM和BP模型的误差分布对比结果1DCNN-LSTM1DCNNLSTMBP0.60.50.40.30.

48、20.10Density/bit-3-2-10123Prediction Error/809热 带 气 象 学 报第38卷地弥补了LSTM模型训练时间长、易过拟合的缺陷。实验结果表明,在对未来24小时的逐时气温预报过程中,相较于传统的1DCNN、LSTM和BP模型,本文所构建的多信息融合气温预报方法1DCNN-LSTM 的 RMSE和 MAE值最小且 r值最接近1,表明1DCNN-LSTM模型具有较好的气温预报效果,能够有效地降低数据维度和时间复杂度,进而提高气温预报精度。此外,由前10小时的气温预报结果可看出,相较于 1DCNN、LSTM 和BP模型,1DCNN-LSTM模型的RMSE和MA

49、E值在第1小时内降低的最多,相关性r在第10小时内提高的最多,表明1DCNN-LSTM模型在短时气温预报过程中的气温预报精度较高,气温预报值更接近真实值。因此,在进一步的工作中,可考虑将本文所构建的多信息融合气温预报模型1DCNN-LSTM 与滚动预测方法相结合,进而在提高短时气温预报精度的基础上,进一步提高中长期气温预报精度。参考文献:1CURCEAC S,TERNYNCK C,OUARDA T B,et al.Short-term air temperature forecasting using nonparametric functional data analysisand SARM

50、A modelsJ.Environmental Modelling&Software,2019,111(1):394-408.2MORAL-CARCEDO J,PREZ-GARCA J.Temperature effects on firmselectricity demand:an analysis of sectorial differences in SpainJ.Appl Energy,2015,142(3):407-425.3 熊敏诠,代刊,唐健.春季中国日最高气温延伸期预报误差分析及订正J.热带气象学报,2020,36(6):795-804.4SALCEDO-SANZ S,DEO

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服