收藏 分销(赏)

基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究.pdf

上传人:自信****多点 文档编号:638624 上传时间:2024-01-22 格式:PDF 页数:9 大小:1.50MB
下载 相关 举报
基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究.pdf_第1页
第1页 / 共9页
基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究.pdf_第2页
第2页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月全球气候变暖及其对人类健康的影响是当今社会的热点之一。政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)的第五次评估报告(Assessment Report 5,AR5)明确指出:全球气候变暖已成为不争的事实,并且正在影响和改变每个人的生活。据报道,气候变暖每年可在全球范围内导致超过 10 万人死亡。若依然不能有效改善全球气候变暖,到 2030 年这个数字将变成 30万1。因此,将气象

2、学和医学结合,探索气象条件对人体健康的直接影响,进而对相关疾病的发病风险进行预测,助力疾病防控能力提升,具有重要的科学价值和现实意义。以往诸多研究表明,多种疾病的诱发因素和传播过程都和气象条件有着密切的联系。气温的变化直接影响到上呼吸道感染疾病的发病、传播以及心血管疾病的发作2-4。温度和湿度呈现典型的季节性变化特征,而一些慢性病,譬如消化系统疾病、泌尿生殖系统疾病等,它们的发病也呈现季节性变化特基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究郑甲炜1,2,王式功1,3,尹立4*,吴千鹏1,3,张祥健1,3,杨燕4,黄开龙5(1.成都信息工程大学大气科学学院/环境气象与

3、健康研究院,四川成都 610225;2.中国气象局兰州干旱气象研究所,甘肃兰州 730020;3.中国气象局成都信息工程大学气象环境与健康联合实验室,四川成都 610225;4.攀枝花市中心医院气象医学研究中心,四川攀枝花 617000;5.汕头市气象局,广东汕头 515000)摘要:选取华南地区深圳市、西南地区攀枝花市 2 个不同气候区的当地医院上呼吸道感染发病逐日就诊病例数据和同期气象数据,采用随机森林方法和 RNN(Recurrent neural network)深度学习方法,通过对两地上呼吸道感染发病特征及其与气象条件关系进行研究,分别构建了两地上呼吸道感染发病风险预测模型。结果表明

4、:(1)深圳市上呼吸道感染就诊人数峰值出现在 68月,谷值出现在 12 月,呈现以热不舒适的效应为主;而攀枝花市上呼吸道感染就诊人数峰值出现在 11 月次年 1 月,谷值出现在 37 月,呈现以冷不舒适效应为主。(2)逐日平均气温的变化对两地上呼吸道感染发病的影响最明显,当日平均气温跃25 益或者约10 益时,两地上呼吸道感染发病风险明显上升。(3)日平均风速影响次之,它与日平均相对湿度和日平均气温一起,通过对气候舒适度产生影响,进而影响人群上呼吸道感染发病情况。(4)在上呼吸道感染与气象要素关联性分析及预测方法优选的基础上,基于 RNN 深度学习方法构建的两城市上呼吸道感染发病风险预测模型,

5、可为当地相关疾病风险预测及防控提供重要科技支持。关键词:上呼吸道感染;气象条件;滞后响应关系;随机森林模型;RNN 深度学习模型中图分类号:P49文献标识码:A文章编号:1002-0799(2023)04-0160-09收稿日期:2022-01-29;修回日期:2022-07-09基金项目:海南省南海气象防灾减灾重点实验室开放基金项目(SCSF202007);2021 年省级科 技计划 转移支付 专项 资 金 项 目(21ZYZF-S-01);攀 枝 花 市 科 学 技 术 局 创 新 中 心 建 设 项 目(2021ZX-5-1);2020 年度第三批攀枝花市市 级科技计 划项目(2020C

6、Y-S-5);2021 年度第二批攀枝花市市级科技计 划项目(2021CY-S-4)作者简介:郑甲炜(1993),男,硕士研究生,主要从事气象环境与健康方面的研究。E-mail:通信作者:尹立(1985),男,副主任医师,主要从事气象医学研究。E-mail:郑甲炜,王式功,尹立,等.基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究J.沙漠与绿洲气象,2023,17(4):160-168.doi:10.12057/j.issn.1002-0799.2023.04.022开放科学(资源服务)标识码(OSID):160征5-6。一项针对接受住院治疗和医院看护的老人群体身体健康

7、情况的研究表明,昼夜温差变化会直接影响到这些老人的心血管、呼吸系统、消化系统以及泌尿生殖系统的健康状况,甚至有可能导致老人在夜间死亡7。一项针对高温对人体消化系统疾病影响的研究表明,高温会直接影响人体消化系统,高温情况下,尤其是当气温跃25 益时,人体罹患消化系统疾病的风险骤增8。而湿度变化对人体健康的影响则更为直接和迅速9。无论是在高温高湿还是低温干燥的气象条件下,人体都会感到不舒适。因此,气象条件和人体健康必然存在着或多或少的联系,这种联系可用气候舒适度表征10。以往研究气象条件对人体健康的影响,尤其是对上呼吸道感染疾病(以下简称“上感”)的影响主要以我国北方城市为典例,这些城市上感发病的

8、峰值往往出现在冬季和春季。本研究选取南部沿海深圳市和西南地区攀枝花市,在地理位置和气候特征上都与北方城市有较大区别。因此,选取这两座城市进行研究与比较,可以部分地弥补我国以往同类研究的不足。此外,现有研究中分析不同气象要素与某种疾病的关系多采用逐步回归和最优子集回归11。考虑到气象要素变化和人体疾病发病存在着一定的滞后响应效应,过去常采用广义相加模型和分布滞后非线性模型11-12。这类模型的显著优点是便于考虑滞后性,能够很好地体现气象要素和患病人数变化的时间序列关系,有利于结果的分析和检验。但缺点是预报能力不足,并且依赖数据间的回归关系。近年来,机器学习模型凭借其强大的计算机科学方法的支撑,能

9、有效地利用大数据建立可靠模型13-14。同时,机器学习模型尤其是深度学习模型不需要数据间有强回归关系,模型便可通过学习搭建数据间的联系,在数据间回归关系不明显时依然能够给出较准确的预报。目前,机器学习模型在气象学领域内主要被应用在对雷暴大风、短时强降雨和暴雪等极端天气现象的短临预报中16-17,在大气污染物浓度预报和大气主要污染物类型预报等相关方向也有应用15。深度学习则被应用于对闪电的预报和对雷达回波图的处理等更具挑战性的领域18-19。但其在气象医学这一新兴交叉学科领域应用的甚少。因此,本文拟在探明上呼吸道感染发病与气象条件关系的基础上,重点选取两种机器学习模型(经典随机森林模型和RNN

10、深度学习模型),利用两地疾病数据和气象数据进行训练,并考虑了气象数据所反映的天气过程及其周期性特征以及与医院就诊人数的滞后响应关系。基于对试预报结果的分析和检验,又对两种机器学习模型进行优选,旨在好中选优、最大限度提高预测效果、提升预测能力。1资料和方法1.1 资料资料选取深圳市某三甲医院 2014 年 8 月20日2017 年 8 月 16 日的到院上呼吸道感染(ICD编码 J39.900)挂号就诊的病例数据,共计1 093 组238 607 例。选取四川省攀枝花市某三甲医院2015年 1 月 1 日2019 年 12 月 31 日到院上呼吸道感染挂号就诊的病例数据,共计 1 825 组62

11、9 605 例。病例数据来自国家人口与健康科学数据共享平台(http:/ 2014年 8 月 20 日2017 年 8 月 16 日的常规地面气象观测资料。选取攀枝花市与疾病数据同期的 2015 年1 月 1 日2019 年 12 月 31 日的常规地面气象观测资料。数据来源于中国气象科学数据共享服务网。包括日平均(最高、最低)气温、日平均(最高、最低)气压、日平均相对湿度、日降水量、日平均风速、日照时数等气象要素。借鉴前人关于气象要素和呼吸系统疾病关系的研究,本文主要选取当地的气温、湿度和风速 3 种与呼吸系统疾病发病密切相关的气象要素作为分析和预报因子。1.2研究方法1.2.1线性相关性分

12、析不同气象要素和当地医院的上呼吸道感染发病的就诊人数通常有可通过检验的明确的线性相关性,可用 Pearson 相关系数来衡量。根据它们的Pearson 相关系数可以直观快速地确定不同气象要素与当地医院就诊人数的相关程度。Pearson 相关系数计算公式:r=ni=1移(Xi-X軍)(Yi-Y軍)ni=1移(Xi-X軍)2姨ni=1移(Yi-Y軍)2姨.(1)式中:r 表示相关系数,Xi表示气象要素,Yi表示当地医院就诊人数,n 表示样本容量,X,Y 分别表示Xi、Yi的平均值。1.2.2平滑处理郑甲炜等:基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究161研究论文研究

13、论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月一般天气过程通常持续 35 d,往往伴随大风、降温或降雨等天气现象,各种气象要素会有较大幅度的变化。为了更好地反映整个天气过程对上感发病可能产生的影响,需对原始数据进行必要的平滑处理。平滑处理可以在滤除原始数据中小扰动的同时反映数据中天气过程的整体效应,在一定程度上会提高数据的有效性。本研究选取了 3 和 5 d 两种情况作为时间步长计算滑动平均。1.2.3随机森林(Random Forest)模型随机森林(Random Forest,以下简称“RF”)模型是一种基

14、于决策树的经典机器学习模型(图 1)。一个完整的随机森林模型通常包含了大量的决策树,这些决策树会形成一个整体,对输入数据进行训练和学习并生成输出数据20。在一次完整的随机森林学习过程中,模型首先会对输入数据进行套袋,即将完整的数据按照一定的方式(随机或按序列)进行分装。数据完成套袋后统一进行分配,在每个决策树中进行训练21。这样的分配方式可以保证每个决策树都尽量得到相同数量的训练数据。每个决策树单独完成训练之后,所有训练结果被汇总并统计,随后给出一个预测结果。该预测结果可用于和实际数据进行比较,来检验模型的预报能力。随机森林模型的优势在于可以调整模型的训练细节,通过对决策树的适当限定和修正来防

15、止模型过拟合22-24。图 1随机森林模型训练和测试过程1.2.4RNN(Recurrent neural network)模型递归神经网络模型(RNN 模型)源自前馈神经网络模型。RNN 模型可以使用其内部状态(内存)来处理可变长度的输入序列25。RNN 模型能够利用输入数据对模型本身完成多次重复性的训练,最终的训练结果取决于所有先前的计算和输入。选取一个恰当的训练次数,可以防止模型过拟合。RNN 模型在执行具有时间序列性的预测任务时能够展示出强大的计算和预报能力。图 2 为基本 RNN 模型的结构。xt,st和 ot分别是时间 t 的输入、隐藏状态和输出。U、V、W 是所有步骤/时刻共享的

16、网络参数,用于计算隐藏状态和输出。作为网络的存储单元,st是通过上一步的隐藏状态和当前步骤的输入获得:st=f(U+Wst-1).(2)激活函数 f 通常是非线性的;初始的隐藏状态通常会用全零初始化,作为时间 t 的输出。ot=softmax(Vst).(3)图 2基本 RNN 模型结构展示为避免出现过度拟合现象,本次研究中在常规训练误差中加入了 Validation 误差(检验误差)来决定何时终止重复训练,以保证恰当有效的预报结果。1.2.5数据样本划分为保证模型获取足够的样本进行训练,同时留恰当的样本对模型给出的试预报结果进行检验比较,本文在综合考虑并试验了几种不同的数据样本划分方法后,优

17、选了将数据样本序列按 8颐2 的比例进行划分。即按时间顺序选取前 80%的数据样本对模型进行训练,保留后 20%的数据样本对模型进行试预报检验。划分后的数据样本集即可直接用于RNN 模型的训练,但是,基于随机森林模型的特殊训练方式,还需将划分后用于训练的数据再次进行划分。依据对深圳市和攀枝花市上呼吸道感染发病年际变化特征的分析,本文对深圳市的气象要素和患病人数数据分别按 9 月次年 2 月、38 月进行划分。将 9 月次年 2 月的数据样本集称为深圳市就诊人数下降趋势数据样本集;将 38 月的数据样本集称为深圳市就诊人数上升趋势数据样本集。同理,对攀枝花市的气象条件和患病人数数据分别按照 16

18、 月、712 月进行划分。将 16 月的数据样本集称为攀枝花市就诊人数下降趋势数据样本集;162表 2深圳市 5 d 滑动平均气象要素在不同滞后时间与上呼吸道感染发病就诊人数的Pearson 相关系数5 d 滑动平均数据日平均温度日平均相对湿度日平均风速当天0.181 9*0.347 7*-0.071 9*滞后 1 d0.176 4*0.361 0*-0.076 2*滞后 2 d0.167 2*0.358 3*-0.073 2*滞后 3 d0.158 3*0.358 9*-0.061 1*滞后 4 d0.152 9*0.356 4*-0.057 5滞后 5 d0.151 7*0.348 1*-

19、0.050 7滞后 6 d0.150 7*0.353 7*-0.059 6表 1深圳市 3 d 滑动平均气象要素在不同滞后时间与上呼吸道感染发病就诊人数的Pearson 相关系数3 d 滑动平均数据日平均温度日平均相对湿度日平均风速当天0.182 4*0.330 0*-0.060 5*滞后 1 d0.177 1*0.343 5*-0.065 5*滞后 2 d0.167 5*0.341 0*-0.062 1*滞后 3 d0.158 4*0.341 3*-0.049 2滞后 4 d0.152 6*0.337 2*-0.044 4滞后 5 d0.152 8*0.327 1*-0.038 9滞后 6

20、d0.152 4*0.329 8*-0.046 6注:*和*分别表示通过 琢=0.01 和 琢=0.05 的显著性检验(下同)。将 712 月的数据样本集称为攀枝花市就诊人数上升趋势数据样本集。2结果分析2.1上呼吸道感染发病的月际变化特征分析2014 年 8 月2017 年 8 月深圳市上感就诊人数共计 239 293 人次。如图 3 所示,深圳市上感的逐月就诊人数呈明显的年变化特征。2 月出现一个谷值,这可能与中国传统节日春节有密切关系。此时有大量外地务工人员回家探亲。之后,就诊人数出现了大幅反弹,37 月上感就诊人数增幅较大,并在 7月达到峰值,反映出深圳市居民受热不舒适度气候条件的影响

21、较大。图 320142017 年深圳市上呼吸道感染月发病就诊人数变化特征2015 年 1 月2019 年 12 月攀枝花市上感就诊人数共计 629 605 人次。如图 4 所示,攀枝花市上感的逐月就诊人数同样呈明显的年变化特征。上半年(16 月)上感就诊人数呈波动式下降,6 月降到谷值;从 7 月开始上感就诊人数又呈波动式增加,次年1 月达到最大峰值。另外,2018 年 12 月当地上感就诊人数达到峰值(接近 2 000 例)。图 42015 年 1 月2019 年 12 月攀枝花市上呼吸道感染逐月发病人数的变化特征2.2上呼吸道感染发病人数与气象要素关系的分析借鉴以往的研究,直接使用气象数据

22、与上感就诊人数数据间的线性关系进行分析的效果并不理想,但对数据间的线性关系进行分析依然能够对选取恰当的数据输入后续模型提供必要的参考。采用线性关系更强的数据对机器学习模型进行训练可以减少训练时间,提高训练结果。因此,本研究首先评估了深圳市和攀枝花市 16 d 的滞后时段,分别计算了 3 和 5 d 滑动平均日平均气温、日平均相对湿度和日平均风速与上感就诊人数的Pearson 相关系数(表 14)。深圳市温度和相对湿度与上感发病人数的相关系数绝对值均 约0.4,但显著性检验结果表明两者均与上感发病存在强相关;攀枝花市温度和风速与上感发病人数的相关系数绝对值均 约0.43,但显著性检验结果表明两者

23、均与上感发病存在强相关。深圳郑甲炜等:基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究163研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月市风速均与上感发病只存在弱相关或不存在相关;攀枝花市则是湿度与上感发病的相关性会随着滞后时段的增加而减弱,在当天和滞后 1 d 时存在强相关,在滞后 2 和 3 d 时存在弱相关,在滞后超过3 d时则不存在相关。以表中相关系数的强弱和显著性检验结果为依据,综合考虑三者体现出的不同滞后响应关系,本研究最终选取滞后时间为 1 的 3 d 滑动平

24、均数据作为深圳市典型数据用于机器学习模型的训练和试预报;选取滞后时间为当天的 5 d 滑动平均数据作为攀枝花市典型数据用于机器学习模型的训练和试预报。2.3基于随机森林模型训练和预报的结果分析对深圳市和攀枝花市按上述数据划分方法划分后,采用随机森林模型进行训练和检验,其结果见图5,训练误差和检验结果见表 5 和表 6。结果显示,基于分类数据构建的随机森林模型能较好地预报大部分情况下两地的就诊人数变化情况。同时,随机森林模型能够较为准确地识别就诊人数的变化趋势,但针对极值的试预报存在极大值预表 3攀枝花市 3 d 滑动平均气象要素在不同滞后时间与上呼吸道感染发病就诊人数的Pearson 相关系数

25、3 d 滑动平均日平均温度日平均相对湿度日平均风速当天-0.376 9*-0.100 9*-0.194 1*滞后 1 d-0.379 8*-0.091 0*-0.186 4*滞后 2 d-0.383 0*-0.073 1*-0.186 1*滞后 3 d-0.385 0*-0.052 6*-0.189 0*滞后 4 d-0.384 0*-0.038 9-0.193 7*滞后 5 d-0.384 9*-0.029 8-0.198 2*滞后 6 d-0.387 8*-0.016 9-0.215 3*表 4攀枝花市 5 d 滑动平均气象要素在不同滞后时间与上呼吸道感染发病就诊人数的Pearson 相关

26、系数5 d 滑动平均日平均温度日平均相对湿度日平均风速当天-0.414 2*-0.100 8*-0.221 9*滞后 1 d-0.415 9*-0.091 7*-0.221 2*滞后 2 d-0.419 5*-0.074 3*-0.224 9*滞后 3 d-0.421 1*-0.054 2*-0.229 8*滞后 4 d-0.420 2*-0.039 2-0.233 1*滞后 5 d-0.420 7*-0.028 9-0.234 9*滞后 6 d-0.421 9*-0.016 2-0.250 4*图 5基于随机森林模型使用分类数据对上呼吸道感染发病风险试预报检验结果(a、b 为深圳市,c、d

27、为攀枝花市)表 5基于随机森林模型使用分类数据对深圳市上呼吸道感染发病风险试预报检验结果3 d 滑动平均数据上升趋势数据集下降趋势数据集训练误差0.097 20.124 9测试误差0.166 70.160 7测试结果相关系数0.961 00.954 0164报结果偏低、极小值预报结果偏高的情况,呈现出较大的预报误差。但从整体结果上来看,随机森林模型能够提供具有一定指导意义的试预报结果,但预报结果的准确率还有待进一步提高。2.4基于 RNN 模型训练和试预报的结果分析将深圳市和攀枝花市典型数据按数据划分方法划分后,利用 RNN 模型进行训练和检验,训练次数分别设置为 50 次(图 6a、6c)和

28、 300 次(图 6b、6d),并对试预报结果进行检验。训练误差和检验结果见表 78。深圳市、攀枝花市上感发病风险 RNN 模型试预报检验结果显示,与随机森林模型试预报结果相比,该模型对上感就诊人数有很好的预报效果,试预报就诊人数和实际就诊人数契合度高,在峰值预报上有较明显的改进。通过比对训练误差和 Validation误差(检验误差),发现两者相差不大,说明 RNN 模型没有出现过拟合的现象,模型有效。试预报误差主要分布在上感就诊人数的峰值和谷值。同时比较50和 300 次训练所得试预报结果发现,提高 RNN 模型训练次数可以有效提高模型的预报。通过对比随机森林模型和 RNN 模型(表 58

29、)的具体训练误差和检验误差可知,RNN 模型的试预报能力明显好于随机森林模型,大部分情况下 RNN郑甲炜等:基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究图 6基于 RNN 模型对上呼吸道感染发病风险试预报检验结果(a、b 为深圳市,c、d 为攀枝花市)表 7基于 RNN 模型训练 50 次时对上呼吸道感染发病风险试预报检验结果训练次数 50 次深圳市 3 d滑动平均数据攀枝花市 5 d滑动平均数据训练误差0.007 70.000 0检验误差0.062 20.006 8测试误差0.060 20.005 2测试结果相对误差0.242 30.020 0测试结果相关系数0.

30、944 00.993 0表 8基于 RNN 模型训练 300 次时对上呼吸道感染发病风险试预报检验结果训练次数 300 次深圳市 3 d滑动平均数据攀枝花市 5 d滑动平均数据训练误差0.000 00.000 0检验误差0.004 80.005 4测试误差0.005 10.004 2测试结果相对误差0.018 50.040 2测试结果相关系数0.983 00.996 0表 6基于随机森林模型使用分类数据对攀枝花市上呼吸道感染发病风险试预报检验结果5 d 滑动平均数据上升趋势数据集下降趋势数据集训练误差0.093 20.081 0测试误差0.187 00.186 7测试结果相关系数0.976 0

31、0.976 0165研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月模型给出的试预报结果与实际就诊人数基本吻合。但是,对于 RNN 模型在上感就诊人数的峰值和谷值的试预报上仍然存在有误差,且该误差无法通过增加训练次数来完全消除,有待后续工作中增加样本、改进方法等多措并举来进一步改进与提高。3结论与讨论本文对华南地区深圳市、西南地区攀枝花市 2个不同气候区上呼吸道感染发病特征及其与气象条件关系分析的基础上,进而对其发病风险预测进行了探究,主要得出以下结论:(1)2014 年 8 月2017 年 8 月深

32、圳市上感发病集中在 37 月,812 月发病人数相对较少,谷值出现在 2 月(可能与深圳市外来人口多,大批人员返乡过春节有关),以热不舒适效应为主导。2015 年1 月2019 年 12 月攀枝花市上感发病集中在 11月次年 1 月,夏半年(49 月)发病人数相对较少,谷值出现在 6 月,以冷不舒适效应为主导。(2)日平均气温的变化对两地上呼吸道感染发病的影响最明显,当日平均气温跃25 益或者约10 益时,两地上呼吸道感染发病风险明显上升;影响次之的是日平均风速,风速的大小可侧面反映当地的大气扩散条件和舒适感,进而对上呼吸道感染发病产生影响;日平均相对湿度和日平均气温的协同作用对人体舒适度产生

33、影响,同样也会影响人群上呼吸道感染发病情况。(3)运用随机森林机器模型和 RNN 深度学习模型对深圳市和攀枝花市两地上呼吸道感染发病风险进行预测研究。结果表明,两种方法均能通过所构建的预测模型,有效地运用相关气象资料预报上感发病人数的变化情况。使用随机森林模型时需要根据当地气候特点和上感发病特征对数据进行分类,预报结果虽然存在误差,但也能够反映上感发病变化趋势。使用 RNN 模型时无需对数据进行分类,且能给出更为准确的患病人数试预报结果,只在峰值和谷值处存在部分误差。与随机森林模型相比,RNN模型在运用气象资料预报上呼吸道患病人数方面精度更高,表明其在健康气象领域内将有更好的应用潜力。与国内外

34、同类研究所表现出的不足之处有相似性,即随机森林和 RNN 两种方法所构建的预测模型,对峰值和谷值的预测有缺陷,即预测的峰值偏低、而谷值则往往偏高;相比之下 RNN 方法比随机森林方法对峰值和谷值的预报误差要小得多,但仍需通过多种方法进一步改进提高。参考文献:1MCMICHAEL A J,LINDGREN E.Climate change:presentand future risks to health,and necessary responsesJ.Journal of Internal Medicine,2011,270(5):401-413.2CURRIERO F C,HEINER K

35、 S,SAMET J M,et al.Temperature and mortality in 11 cities of the easternUnitedStatesJ.AmericanJournalofEpidemiology,2002,155(1):80-87.3MARTENS W J M.Global atmospheric change and humanhealth:anintegratedmodellingapproach J.ClimateResearch,1996,6(2):107-112.4张莹,辛金元,马盼,等.成都市气温与 PM2.5和 O3交互作用对疾病灭亡人数的影响

36、研究J.中国环境科学,2021,41(8):3887-3895.5FPALMAS,A ANDRIULLI,G CANEPA,et al.Monthlyfluctuationsofactiveduodenalulcers J.DigestiveDiseases and Sciences,1984,29(11):983-987.6RUSTICUCCI MATILDE,BETTOLLI M LAURA,DE LOSANGELESHARRISM.Associationbetweenweatherconditions and the number of patients at the emergency

37、room in an Argentine hospitalJ.International Journal ofBiometeorology,2002,46(1):42-51.7WANG Minzhen,ZHENG Shan,HE Shilin,et al.Theassociationbetweendiurnaltemperaturerangeandemergency room admissions for cardiovascular,respiratory,digestive and genitourinary disease among the elderly:Atime series s

38、tudyJ.Science of the Total Environment,2013,456-457.8DAVIS ROBERT E,HONDULA DAVID M,PATELANJALIP.Temperatureobservationtimeandtypeinfluence estimates of heat-related mortality in seven U.S.CitiesJ.Environmental Health Perspectives,2016,124(6):795-804.9张莹,马敏劲,王式功,等.中国大陆九大名山风景区旅游气候舒适度评价J.气象,2013,39(9)

39、:1221-1226.10马盼,李若麟,乐满,等.气象环境要素对北京市消化系统疾病的影响J.中国环境科学,2016,36(5):1589-1600.11HUANG Ruixue,BIAN Guolin,HE Tianfeng,et al.Effectsof meteorological parameters and PM10on the incidence ofhand,foot,and mouth disease in children in China J.International Journal of Environmental Research andPublic Health,20

40、16,13(5):481-494.12SMOLA A,VISHWANATHAN,S V N.Introduction toMachine Learning M.Cambridge:Cambridge UniversityPress,2008.13MCGOVERN AMY,ELMORE KIMBERLY L,GAGNE166DAVIDJOHN,etal.Usingartificialintelligencetoimprove real-time decision-making for high-impactweatherJ.Bulletin of the American Meteorologi

41、cal Society,2017,98(10).14GREGORY R HERMAN,RUSS S SCHUMACHER.Money doesnt grow on trees,but forecasts do:forecastingextremeprecipitationwithrandomforests J.MonthlyWeather Review,2018,146(5)1571-1600.15JOANNA A,Kami俳ska.A random forest partition modelfor predicting NO2concentrations from traffic flow

42、 andmeteorological conditions J .Scienceof the TotalEnvironment,2019,651.16周康辉,郑永光,王婷波.利用深度学习融合 NWP 和多源观测数据的闪电落区短时预报方法J.气象学报,2021,79(1):1-14.17任萍,陈明轩,曹伟华,等.基于机器学习的复杂地形下短期数值天气预报误差分析与订正J.气象学报,2020,78(6):1002-1020.18李英睿,李琼,魏加华,等.基于 ConvLSTM 的气象雷达回波外推J.青海大学学报,2021,39(1):93-100.19倪铮,文韬.一种基于 CNN 和 RNN 深度神

43、经网络的天气预测模型以北京地区雷暴的 6 小时临近预报为例J.数值计算与计算机应用,2018,39(4):299-309.20BREIMAN L.“RANDOM FORESTS”machine learningJ.Scientific Research,2001,45(1):5-32.21TONG Weida,HONG Huixiao,FANG Hong,et al.Decision forest:combining the predictions of multipleindependent decision tree models J.Journal of ChemicalInformat

44、ion and Computer Sciences,2003,43(2):525-531.22STUART K GRANGE,DAVID CCARSLAW,ALASTAIRCLEWIS,et al.Random forest meteorological normalisationmodels for Swiss PM10trend analysis J.AtmosphericChemistry and Physics,2018,18(9):6223-6239.23SIEMS-ANDERSON AMANDA,LEE JARED A,BROWNBARBARA,et al.Impacts of a

45、ssimilating observations fromconnected vehicles into a numerical weather predictionmodelJ.TransportationResearchInterdisciplinaryPerspectives,2020,8.24DAVID M HONDULA,ROBERT E DAVIS,DAVID BKNIGHT,etal.ArespiratoryalertmodelfortheShenandoah Valley,Virginia,USAJ.International Journalof Biometeorology,

46、2013,57(1):91-105.25DUPOND S.A thorough review on the current advance ofneural network structures J.Annual Reviews in Control,2019,14:220-230.郑甲炜等:基于机器学习的两个代表城市上呼吸道感染与气象要素关系及其发病风险预测研究167研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月A Study on the Relationship between Upper R

47、espiratory Tract Infection andMeteorological Elements and the Outbreak Risk Prediction in TwoRepresentative Cities Using Machine LearningZHENG Jiawei1,2,WANG Shigong1,3,YIN Li4,WU Qianpeng1,3,ZHANG Xiangjian1,3,YANG Yan4,HUANG Kailong5(1.College of Atmospheric Sciences/Institution of Environmental M

48、eteorology and Health,ChengduUniversity of Information Technology,Chengdu 610225,China;2.Institute of Arid Meteorology,China Meteorological Administration,Lanzhou 730020,China;3.CMA-CUIT Joint Laboratory of Meteorology and Environment on Health,Chengdu 610225,China;4.Meteorological Medicine Center o

49、f Panzhihua Central Hospital,Panzhihua 617000,China;5.Shantou Meteorological Bureau,Shantou 515000,China)AbstractThe data of daily patients of upper airway cough syndrome in local hospitals andmeteorological data in the same period were selected in Shenzhen and Panzhihua from two differentclimate zo

50、nes.By using random forest method and RNN(Recurrent neural network)deep learningmethod,the risk prediction models of upper airway cough syndrome in the two cities were constructed bystudying the characteristics of upper airway cough syndrome and its relationship with meteorologicalelements.The resul

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服