收藏 分销(赏)

基于深度学习的气象要素时空预报策略——直接预报和迭代预报的对比.pdf

上传人:自信****多点 文档编号:2341112 上传时间:2024-05-28 格式:PDF 页数:12 大小:3.67MB
下载 相关 举报
基于深度学习的气象要素时空预报策略——直接预报和迭代预报的对比.pdf_第1页
第1页 / 共12页
基于深度学习的气象要素时空预报策略——直接预报和迭代预报的对比.pdf_第2页
第2页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、曾安捷,华维,严中伟,等.2023.基于深度学习的气象要素时空预报策略直接预报和迭代预报的对比J.气候与环境研究,28(5):547558.ZENGAnjie,HUA Wei,YAN Zhongwei,et al.2023.Comparison between Direct and Recursive Forecast Strategy Based on Deep Lear-ningMethodforSpatio-TemporalMeteorologicalParametersForecastingJ.ClimaticandEnvironmentalResearch(inChinese),28

2、(5):547558.doi:10.3878/j.issn.1006-9585.2023.23011基于深度学习的气象要素时空预报策略直接预报和迭代预报的对比曾安捷1,2华维1严中伟2,3祖子清4娄晓2,3于小淇2,3夏江江2,31成都信息工程大学,成都6102252中国科学院大气物理研究所东亚区域气候环境重点实验室,北京1000293中国科学院大学地球与行星科学学院,北京1000494国家海洋环境预报中心国家海洋局海洋灾害预报技术研究重点实验室,北京100081摘要以大气垂直累积液态水含量的预报问题为例,使用 UNet 网络结构作为基础结构构建时空预报模型,对比了采用两类预报策略的模型的预报

3、效果,预报策略包含一个迭代预报策略(RecursiveForecastStrategy,RFS)以及两个直接预报策略(DirectForecastStrategies,DFSs)。研究结果表明,两个直接预报模型对整体预报时段的预报效果明显优于迭代预报模型,直接预报模型的 RMSE 比迭代预报模型低 19%。随着预报时次的增加,迭代预报模型的预报误差累积速度比两个直接预报模型快。在两个直接预报模型中,多时次输出模型(DirectForecastModelMulti-Steps,DFS-M)的预报表现更加稳健,在整体预报时段上预报效果优于单时次输出模型(DirectForecastModelSin

4、gle-Step,DFS-S),但 DFS-S 模型对几个前期时次的预报效果较好。本研究利用深度学习可解释性技术中的深度学习重要特征分析方法(DeepLearningImportantFeaTures,DeepLIFT)分析 DFS-M和 DFS-S 模型各个输入时次对于模型预报的相对重要性。研究结果表明,DFS-M 和 DFS-S 模型 80%的输入重要性都集中在最后两个输入时次上,较早期输入时次的重要性随着预报时次的增加而呈现上升趋势。由于各输出时次间存在一定的统计相关性,受输出时次相关性约束的 DFS-M 模型的输入时次重要性变化比 DFS-S 模型更加稳定。通过将 DFS-M 和 DF

5、S-S 模型对于不同时次的预报进行结合,可以得到效果更加均衡的预报。本研究可以为基于深度学习的天气气候预报方法的选择提供新的思路。关键词天气气候预报UNet 网络垂直累积液态水含量深度学习可解释性文章编号1006-9585(2023)05-0547-12中图分类号P456文献标识码Adoi:10.3878/j.issn.1006-9585.2023.23011Comparison between Direct and Recursive Forecast Strategy Based on Deep Lear-ning Method for Spatio-Temporal Meteorolog

6、ical Parameters ForecastingZENGAnjie1,2,HUAWei1,YANZhongwei2,3,ZUZiqing4,LOUXiao2,3,YUXiaoqi2,3,andXIAJiangjiang2,31Chengdu University of Information Technology,Chengdu 6102252Key Laboratory of Regional ClimateEnvironment for Temperate East Asia,Institute of Atmospheric Physics,ChineseAcademy of Sci

7、ences,Beijing 100029收稿日期2023-02-09;网络预出版日期2023-06-07作者简介曾安捷,男,1997 年出生,硕士研究生,主要从事灾害性天气智能预警研究。E-mail:通讯作者夏江江,E-mail:资助项目国家自然科学基金 42275158Funded byNationalNaturalScienceFoundationofChina(Grant42275158)第28卷第5期气候与环境研究Vol.28No.52023年9月ClimaticandEnvironmentalResearchSept.20233College of Earth and Planeta

8、ry Sciences,University of Chinese Academy of Sciences,Beijing 1000494Key Laboratory of Marine Hazards Forecasting,National Marine Environmental Forecasting Center,Ministry ofNatural Resources,Beijing 100081Abstract For nowcasting models based on the Convolutional Neural Networks(CNNs)used in radar e

9、choextrapolation,differentstrategiesarecommonlyappliedtoforecastingtheradarechooffuture(usuallywithintwohours)multipletimesteps.Inthiswork,usingthenowcastingoftheatmosphericverticalintegratedliquidwatercontent,theforecastperformancesofmodelswithtwotypesofstrategies,namelyRecursiveForecastStrategy(RF

10、S)andDirectForecastStrategies(DFSs),werecompared.CNN-basedmodelswereconstructedforspatiotemporalforecastingwiththeUNetarchitectureasthebackbone.ResultsexhibitedthesignificantlybetterperformanceofthetwoDFSmodelsthantheRFSmodelontheoverallforecasthorizonwitharoughly19%lowerroot-mean-squareerror.Within

11、creasingforecasttimesteps,theforecastestimationerrorsoftheRFSmodelaccumulatedmuchfasterthanthoseofthetwoDFSmodels.FortheDFSmodels,themultioutputDFS(DFS-M)wasmorerobustandperformedbetterthanthesingle-outputDFS(DFS-S)ontheoverallforecasthorizon;forashortforecasthorizon,DFS-Shasaslightlybetterforecast(

12、approximatelythefirsttwotimestepsinthefuture).Moreover,aneuralnetworkinterpretationmethod(i.e.,DeepLIFT)wasappliedtothetwoDFSmodelstofindtherelativeimportanceofeachinputtimestep.ItwasrevealedthatforbothDFSmodels,approximately80%ofthemeanimportancescorewasinthelasttwoinputtimestepsandearlyinputtimest

13、epshaveanincreasingimpactonlongerforecasttimes.TheinputimportanceofDFS-MateachoutputstepwasmuchmorestablethanthatofDFS-Sduetotheself-constraineffectexertedbythestochasticdependenciesbetweenoutputsteps.Bycombiningtheforecastoftwodirectmodelsatdifferenttimesteps,amorebalancedforecastcanbeperformedonth

14、ewholeforecasthorizon.KeywordsWeather and climate forecast,U Net(UNet),Vertically integrated liquid water content,Deep learning,Interpretability 1 引言气象要素的时空预报问题是天气气候预报中一个重要的研究课题。近年来,随着可用气象观测数据的增多以及计算机技术的发展,机器学习,特别是深度学习方法被越来越多地应用于天气气候预报问题中。周康辉等(2021)总结了传统机器学习方法和深度学习方法在强对流监测、短时临近预报和短期预报领域的应用,对目前机器学习存在

15、的问题和未来发展方向进行了讨论。贺圣平等(2021)在关于机器学习方法在气候预报中的应用的研究中,介绍了机器学习方法和卷积神经网络(ConvolutionalNeuralNetwork,CNN)的原理,并利用卷积神经网络对东亚冬季温度进行了建模回报。在北京地区体感温度误差和华北气温多模式集合预报的订正问题中,机器学习方法均取得了较好的效果(门晓磊等,2019;武略等,2022)。Zhouetal.(2022)利用深度学习方法,基于基本数值模式变量进行定量降水预报,预报效果超过了欧洲气象中心的 ECMWFHRES 高分辨率数值模型。在气象要素的临近预报问题中,以长短期记忆网络(LongShort

16、-TermMemory,LSTM)结合卷积神经网络 CNN 为主要结构的卷积长短期记忆模型ConvLSTM(Shietal.,2015)和预报循环网络PredRNN(Wangetal.,2017)被用来进行雷达回波的时空预报。这类模型主要是基于能直接提取时序信息的循环神经网络(RecurrentNeuralNetwork,RNN)构建的。在基于 RNN 结构的预报中,韩丰等(2019)利用具有空间记忆模块和时间记忆模块的 ST-LSTM(SpatioTemporalLSTM)单元构建模型,对雷达反射率进行预报,其预报效果超过了业务使用的交叉相关法。近年来,有较多的研究以卷积神经网络 CNN为主

17、要网络结构构建时空预报模型。一般来说基于 CNN 结构的模型能够较好地捕捉空间信息(Reichsteinetal.,2019),常用于和图像处理相关的问题中。但基于 CNN 结构的模型也能利用卷积结构将时间序列图像叠加在通道或深度维度上,隐式地处理时空序列预报问题(Pruddenetal.,2020;Huetal.,2021)。相比基于 RNN 的预报模型(如ConvLSTM),基于 CNN 的预报模型的结构更加简单灵活,优化模型所消耗的计算资源更少,被越来越多地应用于时空预报任务(Hanetal.,2021;Huetal.,2021)。气候与环境研究28卷548ClimaticandEnvi

18、ronmentalResearchVol.28为了预报未来多个时次的气象要素场,基于CNN 的模型通常采用不同的预报策略,例如迭代预报策略(RecursiveForecastStrategy,RFS)以及直接预报策略(DirectForecastStrategy,DFS)(ShiandYeung,2018)。RFS 模型一般以相对于输入时段气象要素场的下一时次气象要素场为训练目标,通过将上一时次的预报场作为预报下一时次气象要素场的一个输入,迭代使用 RFS 模型从而实现目标时段的预报(曹伟华等,2022)。Ayzeletal.(2020)构建了一个基于 CNN 的雷达回波预报模型 RainNe

19、t,RainNet 输出未来 5min 的雷达回波,通过迭代策略 RainNet 被用于预报未来 1h 内 12个连续时次的雷达回波。对于较低的降水阈值,RainNet 预报效果超过了基于光流法的传统模型,RainNet 对较强降水的预报能力有限。与 RFS 利用模型自身输出作为新的模型输入进行预报不同,DFS 模型直接对目标时段进行训练,不需要借助模型中间输出就能生成目标时段的预报。DFS 模型通常有多输出的多时次直接预报模型(DirectForecastStrategy-Multisteps,DFS-M)和单输出的单时次直接预报模型(DirectForecastStrategy-Singl

20、estep,DFS-S)。DFS-M 模型在整个目标时段的所有时次上计算损失函数,通过一个模型直接输出多个时次的预报结果。在使用 DFS-M预报策略的研究中,Zhangetal.(2019)使用多来源的 3 维雷达回波数据和气象再分析数据,构建了一个 3D 卷积模型(3D-cubeSuccessiveConvolutionNetwork,3D-SCN)用于预报对流雷暴的生消发展,该模型的预报效果超过了传统临近预报算法雷暴识别、追踪与外推算法(ThunderstormIdentification,Tracking,andNowcasting,TITAN)。Castroetal.(2021)利用时

21、空卷积“序列到序列”网络(Spatiotemporal Convolutional Sequence to Sequ-enceNetwork,STConvS2S)构建了一个DFS-M 模型,相比于一般的 CNN 序列预报模型,STConvS2S在训练阶段不会违背输入数据的时间顺序,可以生成超过输入时次长度的预报。其对于气温的预报效果超过基于 RNN 的基准模型,训练耗时比 RNN模型更短。Panetal.(2021)构建了基于 UNet 网络变体的混合重分配网络(FUsionandREassign-mentNetworks,FURENet),通过融合额外的偏正雷达数据,FURENet 可以更好

22、地预报对流雷暴的演变过程。DFS-S 模型一般由多个子模型构成,每个子模型负责预报目标时段中的一个时次。在使用 DFS-S预报策略的研究中,Agrawaletal.(2019)使用UNet 模型预报未来 1h 的雷达降水,预报效果超过了光流法、持续预报以及一个数值预报模型。Hametal.(2019)利用 CNN 直接预报未来某一个时刻的 Nio 指数,相比动力预报模型 CNN 模型更善于预报海温的纬向分布。Trebingetal.(2021)提出加入注意力机制的 UNet 变体模型 SmaAt-UNet(SmallAttention-UNet),该模型使用更少参数取得了和其他深度学习模型相似

23、的降水预报效果。通过相关研究可以看出,在使用基于 CNN 的模型进行临近预报时,可以采用不同的预报策略,但目前缺少针对同一个气象要素临近预报问题使用多个预报策略的研究,此类研究可以通过对比不同预报策略预报效果的差异,分析预报策略对模型预报效果的影响。本研究以一个气象要素时空预报问题(垂直累积液态水含量)为例,对比基于 CNN 模型的不同预报策略模型的预报效果,通过深度学习可解释性技术,对导致预报策略间差异的原因进行初步分析,以期为深度学习技术在天气气候预报问题中的应用提供方法参考。2 数据和方法 2.1 数据本研究使用风暴事件图像数据集(StormEVentImagRy,SEVIR)中的垂直累

24、积液态水含量(VerticallyIntegratedLiquidwatercontent,VIL)数据作为时空预报问题的数据集。为了有效地训练各种深度学习模型以及验证各个算法在气象应用问题中的效果,美国麻省理工学院林肯实验室 Veilletteetal.(2020)结合 GOSE-16 气象卫星以及 NEXRAD 天气雷达的观测数据构建了风暴事件图像数据集 SEVIR,以加速气象问题中深度学习方法的创新。SEVIR数据集是一个时空对齐的图像集合,这些图像记录了 20172019 年在美国大陆上发生的多种天气事件。SEVIR 数据集约有 20%的天气事件被分类为风暴事件,其余的天气事件被称为随

25、机事件。SEVIR_VIL 数据集共包含了 18968 次天气事件,每一个天气事件的持续时间为 4h,由 49 个连续的5期曾安捷等:基于深度学习的气象要素时空预报策略直接预报和迭代预报的对比No.5ZENGAnjieetal.ComparisonbetweenDirectandRecursiveForecastStrategyBasedonDeep.549垂直累积液态水含量图像组成,相邻时次的图像间隔 5min,单个垂直累积液态水图像以 1km 分辨率覆盖一个 384384 的格点区域。SEVIR_VIL 中的数据以灰度图的形式进行保存,取值范围是0255 以内的整数。灰度图像的格点值和实际

26、的垂直累积液态水含量(单位:kg/m2)的转化规则如表 1 所示,灰度值 255 代表缺测。参照使用 SEVIR_VIL 数据的已有研究(Huetal.,2021),本研究将 1 个天气事件分成了 3 个单独的训练样本序列,每一个训练样本序列包含 25个连续时次图像,其中前 13 个时次作为输入时段,剩下的 12 个时次是目标预报时段。本研究将 2019年 6 月 1 日之前的 44760 个训练样本序列划分为深度学习模型的训练集和验证集,训练集验证集的数据比例为 82,2019 年 6 月 1 日之后的 12133 个训练样本序列作为测试集。为了方便模型训练优化,将图像格点值除以 255,对

27、数据集整体进行了归一化处理。2.2 方法2.2.1构建 RFS 和 DFS 预报策略模型的基础网络结构本研究使用 UNet 网络结构作为构建 RFS 和DFS 预报策略模型的基础网络结构,由于该网络整体结构像一个大写的英文字母 U,故称其为UNet,UNet 的具体细节结构可参考文献(Ronnebergeretal.,2015)。本研究使用的 UNet 网络如图 1 所示,主要结构设计包含:对称的 4 层编码解码网络结构,每层编码解码结构之间都有一个跳跃连接,在解码网络后通过一个 11 的卷积层得到模型的最终输出。编码器由 4 个下采样模块组成,每一个下采样模块都有 2 个卷积层和 1 个平均

28、池化层。每一个下采样模块减小输入图像的大小,同时使其特征图数量翻倍。相对应的解码器由 4 个上采样模块构成,上采样模块扩展输入图像的大小,同时使其特征图数量减半。每一个上采样模块有 1 个上采样层和 2 个卷积层。跳跃连接将编码器中的低层特征同解码器中的高层特征结合在一起,保留了输入垂直液态水含量图像中的多尺度空间信息。本研究的预报目标是构建 3 种基于基础 UNet网络结构的预报策略模型,利用历史 13 个连续时次的垂直液态水含量图像预报未来 12 个连续时次的垂直液态水含量图像。因此基础 UNet 网络的输入图像大小是 13384384,其中 13 个通道代表历史 13 个连续时次。输出图

29、像的大小是 12384图1构建三个预报策略模型的基础 UNet 网络结构Fig.1BasicUNetarchitectureforconstructingthreeforecast-strategymodels表 1 灰度图格点值和垂直累积液态水含量之间的转换关系Table 1 Scaling rule of converting vertical integratedliquid from gray scale image对应的垂直累积液态水含量/kgm2SEVIR_VIL灰度图灰度值X的取值范围0X 5(X2)/90.665X 18e(X83.9)/38.918X 254气候与环境研究28

30、卷550ClimaticandEnvironmentalResearchVol.28384,其中 12 个通道代表未来 12 个连续时次。该网络模型共有 899596 个可训练参数,训练的迭代轮次设置为 50 次,训练批次大小为 4,在 4 个NVIDIAGTX1080Ti 显卡上使用 pytorch(Paszkeetal.,2019)框架进行并行计算,训练耗时约 5 小时。模型的损失函数为均方误差损失(MeanSquaredError,MSE),使用解耦权重衰减的自适应矩估计优化器 AdamW(LoshchilovandHutter,2019)更新网络参数,学习率为 0.0001,权重衰减系

31、数为 0.001。2.2.2基于基础 UNet 网络结构的 3 个预报策略模型本研究设计了 3 个基于基础 UNet 网络结构(2.2.1 小节)的预报策略模型,以对比不同预报策略对于深度学习模型预报能力的影响。为尽量保证模型间的预报效果差异只受预报策略的影响,3个预报策略模型均使用同样的网络结构,仅在模型训练时误差计算的时次上有所不同。3 个预报策略模型的输入图像大小均为 13384384,输出图像大小为 12384384,而在实际预报阶段使用的输出时次取决于模型的预报策略。第一个预报策略模型是基于迭代预报策略的RFS 模型,模型输出相对于输入时段下一时次的垂直液态水含量图像。模型自身输出的

32、预报作为进行下一次预报的一个新的输入时次,同原始输入时次结合,组成模型新的输入时段(图 2 中间输入序列),以此迭代生成下一时次的垂直液态水含量图像。因此目标的多时次预报是通过迭代使用 12 次RFS 模型实现的,其预报流程如图 2 所示。为了简便该 RFS 模型被记为 RFS-O(RecursiveForecastStrategy-Onestep)模型(“O”代表模型输出 1 个时次的垂直液态水含量)。第二个模型是基于直接预报策略的多时次输出模型 DFS-M。DFS-M 模型同时预报未来 12 个时次的垂直液态水含量图像,模型实际采用的预报时次即为模型的全部输出:12384384,其预报流程

33、如图 3 所示。图2RFS-O 模型预报流程示意图Fig.2ForecastprocessofRFS-Omodel图3同图 2,但为 DFS-M 模型Fig.3SameasFig.2,butforDFS-Mmodel5期曾安捷等:基于深度学习的气象要素时空预报策略直接预报和迭代预报的对比No.5ZENGAnjieetal.ComparisonbetweenDirectandRecursiveForecastStrategyBasedonDeep.551第三个模型是基于直接预报策略的单时次输出模型 DFS-S。一个 DFS-S 子模型只预报单个时次的垂直液态水含量图像,与 RFS-O 模型迭代使

34、用同一个模型进行预报不同的是,DFS-S 模型同时训练 12 个 DFS-S 子模型来预报目标时段,每个子模型负责预报特定的 1 个时次(其预报流程如图 4所示)。使用一张 NVIDIAGTX1080Ti 显卡进行预报测试,经过训练后的 3 种预报策略模型的单次推断耗时如图 5 所示。RFS-O 模型的预报耗时最高,约为 0.317s。DFS-M 模型预报耗时约为 0.007s,预报速度最快。DFS-S 模型进行一次预报约耗时0.086s。本研究设计构建了上述 3 种基于不同预报策略的垂直液态水含量临近预报模型。通过对比每个预报策略模型的预报结果,可以评估不同预报策略的对于模型预报能力的影响。

35、3 结果 3.1 统计评估指标本研究利用一些常用的统计评估指标在测试集上评估模型的预报效果,这些评估指标包括均方根误差(Root-Mean-SquareError,RMSE)以及 3 个基于二维混淆矩阵的降水预报评分(垂直液态水含量与地面降水有直接联系):命中率(ProbabilityofDetection,POD),临界成功指数(CriticalSuccessIndex,CSI)以及虚警率(FalseAlarmRate,FAR)。RMSE 代表预报垂直液态水含量图像中格点值同实际观测图像对应格点值之间的平均误差,其计算公式如下:RMSE=1MNMi=1Nj=1(Vi,jVsi,j)2,(1)

36、VVs其中,M 和 N 分别为垂直液态含水量图像的总行数和列数,i 和 j 分别为垂直液态含水量图像中格点所在的行数和列数,公式中的 和分别代表实际观测图像和模型预报图像的格点值。降水预报评分是在特定阈值下对预报技术有效性的统计评估,通过表 2 所示的二维混淆矩阵,本图4同图 2,但为 DFS-S 模型Fig.4SameasFig.2,butforDFS-Smodel图5RFS-O、DFS-M 和 DFS-S 模型进行一次预报的耗时Fig.5InferencetimeofRFS-O,DFS-M,andDFS-Smodelsforasingleforecast气候与环境研究28卷552Clima

37、ticandEnvironmentalResearchVol.28研究分别计算 POD、CSI 和 FAR 评分,对应计算公式如下:POD=TPTP+FN,(2)CSI=TPTP+FP+FN,(3)FAR=FPFP+TP,(4)其中,TP 代表真正例(TruePositive)相同格点位置的垂直液态水含量观测值和模型预报值都超过特定阈值的格点数量,FN 是假反例(FalseNegative)观测值超过特定阈值而预报值在该阈值之下的格点数量,FP 是假正例(FalsePositive)观测值低于特定阈值而预报值超过该阈值的格点数量。本研究所使用的 3 个降水评分的取值范围均为 01,其中 POD

38、 和 CSI 越接近 1,FAR 越接近0,代表模型的预报效果越好。3.2 模型预报效果对比3.2.1模型在整体预报时段上的预报效果本节对比使用不同预报策略的模型:RFS-O、DFS-M 和 DFS-S,在 12 个预报时次上的平均预报效果,计算各预报策略模型在测试集上预报结果的平均 RMSE 误差及以 20 为阈值的 POD、CSI 和FAR 评分,其结果如表 3 所示。采用直接预报策略的模型(DFS-M 和 DFS-S)在 4 个统计评分中有 3 个(除了 FAR)都优于采用迭代预报策略的RFS-O 模型,DFS-M 和 DFS-S 的平均 RMSE 低于 RFS-O 约 19%,POD

39、和 CSI 分别高于 RFS-O 模型 27%和 12%。DFS-M 模型在除了 FAR 的统计评估指标上都略微优于 DFS-S 模型。在预报耗时方面 DFS-M 对测试集中全部天气事件进行预报耗时 244s,DFS-S 和 RFS-O 则分别耗时 684s 和1345s。3.2.2预报策略模型在 12 个预报时次上的预报效果图 6 展示了 3 个预报策略模型的 RMSE、POD、CSI 和 FAR 随预报时次的变化情况。可以看出随着预报时次的增加,预报的不确定性有所上升。3个模型的 RMSE、FAR 均随预报时次增加而上升,POD 和 CSI 随预报时次增加而下降,模型的综合预报效果随预报时

40、次的增加而下降。如图 6a 所示,随着预报时次的增加,直接预报策略模型 DFS-M 和 DFS-S 的 RMSE 明显优于迭代预报策略模型 RFS-O。对于两个直接预报模型,DFS-M 在整体预报时段上优于 DFS-S 模型,对于前两个预报时次的 RMSE,DFS-S 的预报效果略微优于 DFS-M。从降水预报评分来看,图 6b 中 RFS-O 的 POD明显低于两个直接预报模型。DFS-M 和 DFS-S 模型的 POD 评分接近,在前 5 个预报时次 DFS-M的 POD 略微优于 DFS-S 模型。在图 6c 中两个直接预报策略模型DFS-M 和DFS-S 的CSI 优于RFS-O模型,

41、DFS-M 的CSI 在整体目标时段上优于DFS-S,前3 个时次DFS-S 模型的CSI 高于DFS-M。在图6d中,RFS-O 模型的 FAR 低于 DFS-M 和 DFS-S,DFS-S 的 FAR 在前 6 个时次低于 DFS-M 模型。3.3 天气事件实例分析为了对比模型预报和实际观测的垂直液态水含量之间的差异,本研究随机选取模型测试集中的一次降水天气事件,并绘制了该天气事件中,未来 6个预报时次的垂直液态水含量分布图,同 3 个预报策略模型对应时次的输出进行对比分析,如图 7 所示。每一列代表一个预报时次,第一行是该次天气事件中实际观测的垂直液态水含量分布图,剩下 3行为各个模型的

42、对应预报结果。如图 7 所示,3 个模型的垂直液态水含量相对实际观测偏低,RFS-O 模型的预报结果偏低更明显。DFS-M 模型对于更长预报时次的垂直液态水含量的高值区域预报得更准确,整体来说直接预报表 2 用于降水预报评分计算的二维混淆矩阵Table 2 Binary contingency table for calculatingprecipitation forecast verification metrics预报格点值实际格点值超过阈值未超过阈值超过阈值真正例(TP)假正例(FP)未超过阈值假反例(FN)真反例(TN)表 3 预报策略模型在测试集上的平均统计评分Table 3 Co

43、mparison of the averaged statistical forecastscores of RFS-O,DFS-M and DFS-S models on the testdataset模型RMSE/kgm2PODCSIFAR预报耗时/sDFS-M模型13.461*0.717*0.570*0.273244*DFS-S模型13.7980.7090.5590.264684RFS-O模型16.9480.5610.5030.169*1345注:和分别表示该统计评分越低和越高模型的效果越好,*表示3个预报策略模型中相应统计评分的最佳值。5期曾安捷等:基于深度学习的气象要素时空预报策略直

44、接预报和迭代预报的对比No.5ZENGAnjieetal.ComparisonbetweenDirectandRecursiveForecastStrategyBasedonDeep.553图6预报策略模型的(a)RMSE(单位:kgm2)、(b)POD、(c)CSI 和(d)FAR 随 12 个预报时次的变化Fig.6Variationsof(a)RMSE(kgm2),(b)POD,(c)CSI,and(d)FARofforecast-strategymodelsover12forecasttimesteps图72019 年 6 月 1 日(89.6W94.9W,43.3E46.6E)区域测

45、试集一次降水天气事件实例中(d1)观测和(d2d4)模型预报的 t+1时次(第一列)、t+3 时次(第二列)、t+5 时次(第三列)、t+7 时次(第四列)、t+9 时次(第五列)和 t+11 时次(第六列)垂直累积液态水含量分布Fig.7VerticallyIntegratedLiquidwatercontent(VIL)distributionsacrosst+1(thefirstcolumn),t+3(thesecondcolumn),t+5(thethirdcolumn),t+7(thefourthcolumn),t+9(thefifthcolumn),andt+11(thesixth

46、column)timestepsfor(d1)observationand(d2d4)modeloutputswithinasingleweathereventfromtestdataseton1Jun2019withintheregion(89.6W94.9W,43.3E46.6E)气候与环境研究28卷554ClimaticandEnvironmentalResearchVol.28策略模型 DFS-M 和 DFS-S 对于高值垂直液态水含量的位置和大小的预报都优于迭代预报策略模型RFS-O。随着预报时次的增加,模型预报的主要垂直液态水含量分布区域开始发散,使得预报结果出现模糊现象。RFS-

47、O 的预报图像发散较小,同时对垂直液态水含量的预报偏小,这对应了 3.2.1 和3.2.2 小节中 RFS-O 模型较小的 FAR。3.4 输入时次图像的特征重要性基于直接预报策略的两个模型 DFS-M 和 DFS-S的对垂直液态水含量的预报效果明显优于基于迭代预报策略的 RFS-O,本研究尝试对这两个直接预报模型进行进一步分析。为了对比两个模型的潜在差异,使用深度学习可解释性方法深度学习重要性特征法(DeepLearningImportantFeaTures,Deep-LIFT)(Shrikumaretal.,2017)对两个模型输入时次的特征重要性进行了计算。DeepLIFT 方法利用反向

48、传播神经网络中所有神经元对于输入特征的贡献,在特定的输入上解析一个神经网络的输出预测。在本研究中,输入特征共有 13 个,即 13 个历史时次的垂直液态水含量图像。DeepLIFT 方法使用神经网络中神经元的激活值和“参考”激活值之间的差异计算贡献分数,先通过正向传播过程计算各层神经元和“参考”激活间的差异,然后通过反向传播算法逐层推导出模型输入的特征贡献度。通过使用参考差异,DeepLIFT 在梯度为零的情况下也能允许神经元传递重要信号,同时也解决了梯度变化不连续的问题。模型在使用 DeepLIFT 方法后可以得到 13 个贡献度图像(每个贡献度图像的大小和输入图像相同),本研究定义单个输入

49、时次的特征重要性分数等于该时次贡献度图像的格点绝对值的平均。研究对测试集中的 1512 个风暴事件使用DeepLIFT,并采用相对重要性分数,也即单个输入时次的特征重要性分数在 13 个输入时次特征重要性分数之和中的占比,作为每个输入时次重要性的表征指标。如图 8 所示是 DFS-M 和 DFS-S 模型 13 个输图8随预报时次增加,模型输入时次(a)t12、(b)t11、(c)t10、(d)t9、(e)t8、(f)t7、(g)t6、(h)t5、(i)t4、(j)t3、(k)t2、(l)t1、(m)t的相对重要性分数折线图Fig.8Linechartsofrelativeimportance

50、scoreevolutionwithincreasingforecasttimesforinputtimesteps(a)t12,(b)t11,(c)t10,(d)t9,(e)t8,(f)t7,(g)t6,(h)t5,(i)t4,(j)t3,(k)t2,(l)t1,and(m)tforDFS-MandDFS-Smodels5期曾安捷等:基于深度学习的气象要素时空预报策略直接预报和迭代预报的对比No.5ZENGAnjieetal.ComparisonbetweenDirectandRecursiveForecastStrategyBasedonDeep.555入时次的相对重要性分数在 12 个预

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服