收藏 分销(赏)

基于残差修正的ARIMA-BP组合模型在中国戊型肝炎发病预测中的应用.pdf

上传人:自信****多点 文档编号:304958 上传时间:2023-07-31 格式:PDF 页数:5 大小:1.98MB
下载 相关 举报
基于残差修正的ARIMA-BP组合模型在中国戊型肝炎发病预测中的应用.pdf_第1页
第1页 / 共5页
基于残差修正的ARIMA-BP组合模型在中国戊型肝炎发病预测中的应用.pdf_第2页
第2页 / 共5页
基于残差修正的ARIMA-BP组合模型在中国戊型肝炎发病预测中的应用.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、收稿日期 2020-09-19摇 修回日期 2020-11-26基金项目 江苏省高等学校自然科学研究项目(19KJD330001);南京医科大学科技发展基金项目(2017NJMU229);南京医 科 大 学 康 达 学 院 科 研 发 展 基 金 项 目(KD2018KYJJYB014)作者单位 南京医科大学 康达学院,江苏 连云港 222000作者简介 张蓓蓓(1986-),女,硕士,讲师.文章编号 1000鄄2200(2023)05鄄0652鄄05公共卫生基于残差修正的 ARIMA鄄BP 组合模型在中国戊型肝炎发病预测中的应用张蓓蓓摘要目的:探讨基于残差修正的 ARIMA鄄BP 组合模型在

2、中国戊型肝炎传染病流行趋势预测中的作用。方法:对 2004-2017年中国戊型肝炎统计数据采用 SPSS 软件分别建立 ARIMA 和 ARIMA鄄BP 模型,将 2018 年 1-12 月戊肝数据作为对比值,对模型的预测效果进行对比分析。结果:2 种模型的预测结果评价指标中,ARIMA鄄BP 组合模型的 E、ER、MAE、MSE、MAPE 指标整体上均小于 ARIMA 模型。结论:ARIMA鄄BP 组合模型的预测效果优于 ARIMA 模型,可用于我国戊型肝炎发病趋势的早期预测。关键词 戊型肝炎;ARIMA 乘积季节模型;BP 神经网络;组合模型;预测中图法分类号 R 512.6;R 183.

3、1摇 摇 摇 文献标志码 A摇 摇 摇 DOI:10.13898/ki.issn.1000鄄2200.2023.05.023Application of ARIMA鄄BP hybrid modelon incidence prediction of hepatitis E in China based on residual correctionZHANG Bei鄄bei(Kangda College,Nanjing Medical University,Lianyungang Jiangsu 222000,China)Abstract Objective:To explore the rol

4、e of ARIMA鄄BP hybrid model based on residual correction in predicting the epidemic trend ofhepatitis E infectious diseases in China.Methods:The ARIMA and ARIMA鄄BP models were established by SPSS software based on thestatistical data of hepatitis E in China from January 2004 to December 2017.The data

5、 of hepatitis E in China from January 2018 toDecember 2018 were used as the comparison value to analyze the prediction effect of the model.Results:The overall index values of E,ER,MAE,MSE and MAPE of ARIMA鄄BP hybrid model were smaller than those of ARIMA model.Conclusions:The prediction effect ofARI

6、MA鄄BP hybrid model is better than that of ARIMA model,which can be used for the early prediction of the incidence trend ofhepatitis E in China.Key words hepatitis E;multiple seasonal ARIMA model;BP neural network;combined model;prediction摇 摇 戊型肝炎(戊肝)是由戊肝病毒(HEV)引起的以肝脏损伤为主的传染病,在急性病毒性肝炎中的死亡率占首位1。现有研究2表

7、明,HEV 主要经粪-口途径传播,以水型流行最常见,其发病常见于水源污染的资源贫困地区,在发展中国家以流行为主,在发达国家以散发病例为主。据世界卫生组织统计,全球每年约有 2 000 万人感染 HEV,其中约有330 万人出现戊肝症状,2015 年大约导致 5.66 万人死亡。我国是戊肝的主要流行地区之一,掌握戊肝的流行性特征和发病趋势,是采取针对性控制、预防措施不可缺少的依据。戊肝发病多见于雨季或洪水之后,具有明显季节性,其变化趋势一般表现为复杂的非线性特征。对季节性传染病的预测一般采用求和自回归移动平均 模 型(autoregressive integrated moving鄄averag

8、e,ARIMA),其可以整合趋势因素、周期因素和随机误差的综合影响3-5。BP 神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络,具有很强的非线性映射能力和柔性的网络结构,常用于非线性函数逼近,但往往不能反映时间 序 列 的 自 相 关 性 和 偏 自 相 关 性6-8。将ARIMA 模型与其他非线性预测模型相结合,采用组合模型优化预测效果,能有效提高预测效率和精度,增强预测模型的实际应用价值,是近年来传染病疫情预 测 的 新 方 向。本 文 探 讨 基 于 残 差 修 正 的ARIMA鄄BP 组合模型,通过组合模型与 ARIMA 模型预测效果的对比,验证残差修正的

9、 ARIMA鄄BP 组合模型在我国戊型病毒性肝炎预测中的适用性。现作报道。1摇 资料与方法1.1摇 资料来源摇数据资料来源于中国疾病预防控256J Bengbu Med Coll,May 2023,Vol.48,No.5制中 心(网 址:http:/)提 供 的2004-2018 年全国法定传 染 病 疫 情 报 告,其 中2004-2017年的戊肝疫情数据用于建立时间序列预测模型,2018 年 1-12 月的戊肝疫情数据作为检验模型预测效果的对比值。1.2摇 方法摇1.2.1摇ARIMA 模型摇ARIMA 模型适用于平稳性时间序列的短期预测,对于带有季节周期性的时间序列,需引入考虑季节性的参

10、数构成乘积季节模型ARIMA(p,d,q)(P,D,Q)s,参数 p、q、d 表示自相关函数(ACF)、偏自相关函数(PACF)的阶和差分的次数;P、Q、D 表示季节性自相关、偏自相关函数的阶和差分的次数;s 表示反映季节性的周期8。ARIMA 建模过程分为四个阶段:(1)序列平稳化,通过数据差分、变换等实现非平稳序列平稳化;(2)模型识别与定阶,根据平稳时间序列的自相关和偏自相关函数图,估计模型参数 p、q、P、D 的值;(3)参数估计及模型检验,检验 ARIMA 模型系数显著性、残差的白噪声水平;结合模型拟合系数 R2、最小信息准则等参数,确定最优模型;(4)预测,利用最优模型进行预测,评

11、估预测效果。1.2.2摇 BP 神经网络模型摇BP 神经网络能学习和存贮大量的输入-输出模式关系,具有任意复杂的模式分类能力和优良的多维函数映射能力,由输入层、隐藏层和输出层组成多层前馈神经网络,其中隐含层可以有一层或多层(见图 1)。其算法主要包含两个方面:信号的前向传播和误差的反向传播。前向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态9。1.2.3摇ARIMA鄄BP 组合模型摇ARIMA鄄BP 组合模型的研究中,目前主要分为输入样本替换法、残差修正法和组合权重法三种10-13。其中残差修正法在捕捉时间序列线性趋势方面效果更好,同时通

12、过残差修正能更精准地对目标值进行预测,在传染病预测方面有广泛的应用。将戊肝疫情的时间序列 yt 看作自相关主体 Lt与非线性残差 et 的结合,即 yt=Lt+et,Lt 反映了时间序列的季节性及线性趋势,et 反映残差序列的非线性变化规律。ARIMA鄄BP 组合模型的基本程序为:(1)根据确定的 ARIMA 模型获得时间序列的拟合样本及其残差;(2)提取 ARIMA 模型拟合样本的残差作为 BP神经网络模型的输入值样本,结合时间信息建立二维输入、一维输出的 BP 神经网络模型;(3)由ARIMA 模型对时间序列的目标值进行预测,得到预测样本 Lt;由 BP 神经网络模型对残差序列进行预测得到

13、样本 et,二者结合得到组合模型预测样本 yt;(4)采用多种误差指标对 ARIMA 模型和 ARIMA鄄BP模型的预测效果进行对比分析。1.3摇 统计学方法摇采用 ARIMA 乘积季节模型和BP 神经网络模型。2摇 结果2.1摇 戊肝流行特征分析摇 由 2004-2017 年我国戊肝发病数的时间序列图(见图 2)可知,我国戊肝的发病人数呈现明显的非平稳性和季节性效应(s=12),每年的 2 4 月为发病高峰期,9 10 月份呈现低谷,序列具有明显的线性趋势和非线性特征,为非平稳的时间序列。2.2摇 ARIMA 模型的建立摇2.2.1摇 序列平稳化摇 平稳序列是 ARIMA 模型分析预测的基础

14、14-15,根据图 2 原始序列的数据特征,首先对序列进行自然对数转化以减小异方差,通过一阶差分、一阶季节差分(s=12)消除趋势性和季节性影响,得到处理后的时间序列图(见图 3),序列在 0 附近呈现平稳的小幅上下波动,序列表现为基本平稳。2.2.2摇 模型的识别和定阶摇 由平稳化过程可知,原始数据经过自然对数转化并一阶差分、一节季节差分后,其周期性和季节性基本消失,可确定模型的参356蚌埠医学院学报 2023 年 5 月第 48 卷第 5 期数 d=1,D=1,初步确定模型的基本形式为 ARIMA(p,1,q)(P,1,Q)12。结合平稳后序列的自相关和偏自相关检验图(见图 4),初步判定

15、 p 不超过 2、q不超过 3。参数 P、Q 的取值判定较为困难,根据已有相关文献16研究成果,P、Q 取值超过 2 阶的情况比较少见,故取为 0、1、2 进行校验。基于此,从低阶到高阶对 p、q、P、Q 分别取不同数值建立模型,根据最小信息准则、拟合效果、残差序列、参数估计有关情况综合筛选模型。2.2.3摇 参数估计及模型诊断摇对所有模型进行计算,其中有 ARIMA(1,1,0)(0,1,1)12 和 ARIMA(0,1,1)(0,1,1)12 两个模型的所有参数通过 t 检验,均满足模型要求,参数检验结果见表 1。由 BIC最小信息准则结果可知,模型 ARIMA(0,1,1)(0,1,1)

16、12 结果为 11.441,小于 ARIMA(1,1,0)(0,1,1)12 模型的结果11.469;由拟合优度 R2 结果可知,模型 ARIMA(0,1,1)(0,1,1)12 结果为 0.803,大于ARIMA(1,1,0)(0,1,1)12 模型的结果 0.797。由此可知,模型 ARIMA(0,1,1)(0,1,1)12 对数据拟合效果更好。合格模型的残差应为白噪声序列,模型 ARIMA(0,1,1)(0,1,1)12 的 Ljung鄄Box 统计量 Q=18.825、P=0.278 大于 0.05 的检测水平,表明残差序列之间相互独立。结合 ARIMA(0,1,1)(0,1,1)12

17、 模型残差序列的自相关和偏自相关图(见图 5),二者均位于 2 倍标准误范围内,并表现出无规律的纯随机性,由此可判定残差序列为白噪声序列,模型ARIMA(0,1,1)(0,1,1)12 对原始数列信息的提取比较充分,拟合性较好。摇 摇 由模型 ARIMA(0,1,1)(0,1,1)12 的拟合曲线图(见图 6)可知,拟合结果与实测值的变化规律有良好的一致性,能够较好地模拟原始时间序列的线性趋势和季节特性。在部分数据上,拟合值与实际值之间的残差值较大,影响模型的拟合效果和预测精度,需进一步完善。表 1摇 ARIMA 模型参数估计检验及拟合结果统计表变量ARIMA(1,1,0)(0,1,1)12摇

18、 系数摇 摇 摇 t摇 摇 摇P摇ARIMA(0,1,1)(0,1,1)12摇 系数摇 摇 摇 t摇 摇 摇P 摇AR(1)-0.242-3.180.01MA(1)0.3814.910.01SMA(12)0.7919.350.010.7458.730.01C-0.012-2.230.05-0.012-2.320.05R20.7970.803BIC11.46911.4412.3摇ARIMA鄄BP 组合模型的建立摇由于 ARIMA(0,1,1)(0,1,1)12 的差分过程导致部分拟合数据缺失,故提取该模型 2005 年 2 月至 2017 年 12 月拟456J Bengbu Med Coll,

19、May 2023,Vol.48,No.5合数据的残差序列作为 ARIMA鄄BP 组合模型的样本数据12。添加时间信息作为 BP 神经网络模型的输入层,将全国 2018 年 1-12 月戊肝残差数据作为输出,建立二维输入一维输出的 BP 神经网络。其中BP 神经网络的参数设置:隐含层节点数为 10,目标误差为 10-4,学习速率为 0.1,最大训练周期为1 000。根据训练后的神经网络模型对残差序列进行预测,将 BP 神经网络残差预测值与 ARIMA 模型的预测值相结合,得到组合模型的预测值,并与原始序列和 ARIMA 模型预测数据进行对比分析。2.4摇 模型的预测效果对比摇对不同模型的预测效果

20、进行对比研究时,多采用绝对误差、误差率等进行评价,本文选取以下几种误差对比指标17:绝对误差:Ei=yi-y夷i,i=1,2,n绝对误差率:ERi=yi-y夷iyi,i=1,2,n平均绝对误差:MAE=1n移ni=1yi-y夷i,i=1,2,n均方误差:MSE=1n移ni=1(yi-y夷i)2,i=1,2,n均方根误差:MAPE=1n移ni=1yi-y夷iyi,i=1,2,n摇 摇 上式中,yi、y夷i分别表示实际值和预测值。各种误差指标的计算结果越小,表示预测的精度越高,其中对于 MAPE 值,一般认为 MAPE 10%的情况下,预测精度较高。结合 ARIMA 模型和 ARIMA鄄BP 模型

21、的预测数据,在绝对误差和绝对误差率分析结果上,2018 年 1-11 月范围内 ARIMA鄄BP 组合模型比ARIMA 模型的误差更小、精度更高;在 2018 年 4月,ARIMA鄄BP 组合模型对误差的修正起到了消极的作用,但误差率也仅为 3.3%,满足戊肝发病预测的精度要求(见表 2)。在 MAE、MSE 和 MAPE 分析结果上,ARIMA鄄BP 组合模型均较 ARIMA 模型表现更好(见表 3)。ARIMA鄄BP 组合模型对原始序列的预测效果优于 ARIMA 模型。3摇 讨论摇 摇 近年我国疾病监测信息逐步实现了多监测系统的无缝连接,能够长期、连续、系统地收集疾病的动态分布及其影响因素

22、,目前已成为评估疾病发展趋势、指导疾病预防和救治的指导性资料之一,尤其是对法定传染病数据的采集和统计结果,为相应传染病的预测和控制研究提供了依据。而我国的戊肝发病人数呈现逐年上升的趋势,戊肝的防治工作已经逐渐成为我国的一项重要的公共安全问题。表 2摇 2 种模型对 2018 年预测精度比较时间实际值ARIMA 模型预测值摇E摇 摇 ER/%摇ARIMA鄄BP 组合模型预测值摇E摇 摇 ER/%摇2018 年1 月2 7622 44531711.52 5412218.02018 年2 月2 2912 60231113.62 54425311.02018 年3 月3 3773 441641.93

23、359180.52018 年4 月2 8072 858511.82 901943.32018 年5 月2 6322 4012318.82 549833.22018 年6 月2 2942 0951998.72 218763.32018 年7 月2 3862 05533113.92 1812058.62018 年8 月2 3682 09127711.72 1871817.62018 年9 月2 0231 945783.92 002211.02018 年10 月1 8961 810864.51 877191.02018 年11 月2 2642 1001647.22 181833.72018 年12

24、月2 3352 362271.22 356210.9表 3摇 2 种模型的预测精度参数比较模型MAEMSEMAPE/%ARIMA 模型17843 6897.39ARIMA鄄BP 组合模型10618 1334.34摇 摇 对戊肝的发病趋势和具体情况进行精准预测,是合理分配公共卫生资源、确定防疫措施的基础。目前对传染病类疾病预测模型的研究,多以单预测模型为主,尤其是考虑季节性因素的 ARIMA 模型应用最为广泛。但单一 ARIMA 模型基于线性假定进行时间序列预测,且受自身限制和数据随机性的影响,对非线性趋势提取效果不佳,在实际应用中往往达不到高精度预测的要求。单项预测模型的有效组合可以显著提高预

25、测效果10。本研究在分析戊肝疫情发病规律的基础上,引入非线性的 BP 神经网络模型,与传统的乘积季节 ARIMA 模型相结合建立ARIMA鄄BP 组合模型,通过 BP 神经网络模型对ARIMA 模型的残差进行修正,预测取得了较为理想的效果。由预测结果的误差对比分析可知,ARIMA鄄BP组合模型对于戊肝疫情的整体预测精度有明显(下转第 660 页)556蚌埠医学院学报 2023 年 5 月第 48 卷第 5 期本研究通过碱提酸沉的方法对补骨脂中的补骨脂乙素提取工艺进行优化,其方法稳定可靠、操作简便,重现性好,适合补骨脂乙素的大量提取。参考文献1摇 李敏,杨君君,杨静,等.补骨脂果皮和种子中化学成

26、分的分布规律研究J.天津医药,2018,35(9):706.2摇 CHOPRA B,DHINGRA AK,DHAR KL.Psoralea corylifolia L.(Buguchi)鄄folklore to modern evidence:reviewJ.Fitoterapia,2013,90:44.3摇 颜冬梅,高秀梅.补骨脂化学成分研究进展J.辽宁中医药大学学报,2012,14(9):96.4摇 ZHANG X,ZHAO W,WANG Y,et al.The chemical constituentsand bioactivities of Psoralea corylifolia L

27、inn.:a reviewJ.Am JChin Med,2016,44(1):35.5摇 王路明,左艳萍.补骨脂酚对口腔鳞状细胞癌增殖、迁移和凋亡的影响及其机制J.山西医科大学学报,2018,49(4):365.6摇 郭秀芝,刘卫萍,杨杰.补骨脂的药理活性及其开发利用J.中医药学报,2005,33(5):56.7摇ALAM F,KHAN GN,ASAD MHHB.Psoralea corylifolia L:ethnobotanical,biological,and chemical aspects:a reviewJ.Phytother Res,2018,32(4):597.8摇LI Z,W

28、ANG Q,LUAN H,et al.A novel target TAX1BP1 andP38/Nrf2pathwayindependentlyinvolvedintheanti鄄neuroinflammatory effect of isobavachalconeJ.Free Radic BiolMed,2020,153:132.9摇 KUETE V,NGAMENI B,TANGMOUO JG,et al.Efflux pumpsare involved in the defense of Gram鄄negative bacteria against thenatural products

29、 isobavachalcone and diospyroneJ.AntimicrobAgents Chemother,2010,54(5):1749.10摇SHI Y,WU WZ,HUO A,et al.Isobavachalcone inhibits theproliferation and invasion of tongue squamous cell carcinoma cellsJ.Oncol Lett,2017,14(3):2852.11摇 KUETE V,MBAVENG AT,ZEINO M,et al.Cytotoxicity of threenaturally occurr

30、ing flavonoid derived compounds(artocarpesin,cycloartocarpesin and isobavachalcone)towards multi鄄factorialdrug鄄resistant cancer cellsJ.Phytomedicine,2015,22(12):1096.12摇 熊文,彭四威,刘海涛,等.补骨脂不同提取工艺的比较研究J.天津中医药大学报,2013,32(2):98.13摇陈良华.中药有效成分提取技术现状J.中国民族民间医药,2014,23(22):14.14摇 王琳.天然产物提取常用方法分析比较J.辽宁化工,2017,

31、46(7):725.15摇 谭佐祥,孙培松.碱提酸沉法提取水飞蓟中黄酮类物质的研究J.牡丹江大学学报,2017,26(10):167.16摇 赵萍,王雅,魏明广,等.葵花籽壳黑色素提取鉴定及抗氧化性研究J.食品工业科技,2012,33(22):133.(本文编辑摇 刘畅)(上接第 655 页)提升,能更好地反映时间序列的内部规律和未来趋势。需要注意的是,本研究是基于残差修正的一种组合预测模型,在此基础上开展 ARIMA 模型和 BP模型的其他组合方式、引入其他非线性模型与ARIMA 模型组合,都是有待进一步研究工作的重要方向。参考文献1摇 BALAYAN MS,ANDJAPARIDZE AG,

32、SAVINSKAYA SS,et al.Evidence for a virus in non鄄A,non鄄B hepatitis transmitted via thefecaloral routeJ.Intervirology,1983,20(1):23.2摇 周力,刘宇琼,王亮,等.戊肝流行病学特征及慢性化研究现状J.中国卫生工程学,2013,12(4):345.3摇 BOWERMAN BL,O忆CONNELL RT.Forecasting and time series:an applied approachM.3 版.北京:机械工业出版社,2003:437.4摇 BOX GEP,JE

33、NKINS GM.Time series analysis:forecasting andcontrolM.San Francisco:Holden鄄Day,1976.5摇 于林凤,吴静,周锁兰,等.ARIMA 季节模型在我国丙肝发病预测中的应用J.郑州大学学报(医学版),2014,49(3):344.6摇 蒋宗礼.人工神经网络导论M.北京:高等教育出版社,2008:36.7摇 王超,丁勇,陆群,等.ARIMA 乘积季节模型在我国甲肝发病预测中的应用J.南京医科大学学报(自然科学版),2014,31(1):75.8摇 CAVALLARO F.Electric load analysis usi

34、ng an artificial neuralnetworkJ.Int J Energy Res,2005,29(5):377.9摇 温正,孙华克.MATLAB 智能算法M.北京:清华大学出版社,2017.10摇 梁德阳.基于 SARIMA 和 BP 神经网络的时间序列组合预测模型研究D.兰州:兰州大学,2014.11摇 杨召,叶中辉,赵磊,等.ARIMA鄄BPNN 组合预测模型在流感发病率预测中的应用J.中国卫生统计,2014,31(1):16.12摇 熊志斌.ARIMA 融合神经网络的人民币汇率预测模型研究J.数量经济技术经济研究,2011,2(6):64.13摇 马爱霞,谢静,唐文熙.A

35、RIMA 模型、BP 神经网络及其组合模型在卫生政策评估中的实证比较:以公立医院价格改革为例J.中国卫生政策研究,2018,11(1):76.14摇 KALMAN RE.A new approach to linear filtering and predictionproblemsJ.J basic Engrg,1960(82):35.15摇KALMAN RE,BUCY RS.New results in linear filtering andprediction problemsJ.J basic Engrg,1961(83):95.16摇 方积乾,陆盈.现代医学统计学M.北京:人民卫生出版社,2002:219.17摇戴钰.最优组合预测模型的构建及其应用研究J.经济数学,2011,27(1):926.(本文编辑摇 卢玉清)066J Bengbu Med Coll,May 2023,Vol.48,No.5

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服