收藏 分销(赏)

基于HW-EEMD-SVM模型的民航客运量预测.pdf

上传人:自信****多点 文档编号:634514 上传时间:2024-01-19 格式:PDF 页数:16 大小:1.28MB
下载 相关 举报
基于HW-EEMD-SVM模型的民航客运量预测.pdf_第1页
第1页 / 共16页
基于HW-EEMD-SVM模型的民航客运量预测.pdf_第2页
第2页 / 共16页
基于HW-EEMD-SVM模型的民航客运量预测.pdf_第3页
第3页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、数量经济研究The Journal of Quantitative Economics第 14 卷 第 2 期Vol.14 No.22023 年2023基于 HW-EEMD-SVM 模型的民航客运量预测李 轩1 周新苗2 吴晓峰3*(1.东北财经大学 公共管理学院,辽宁 大连 116000;2.宁波大学 商学院,浙江 宁波 315211;3.北京交通大学 经济管理学院,北京 100044)摘要:作为国民经济和社会发展的重要行业之一,民用航空业在交通运输领域有着重要的作用。本文在把握中国民航客运量数据特征的条件下,基于集成组合预测的思想,将传统时间序列预测方法与机器学习相结合,利用 EEMD 方

2、法建立了一个 HW-EEMD-SVM 误差修正组合预测模型。之后,选取 2008 2019 年的中国民航客运量月度数据作为考察样本进行建模及验证模型预测效果,并将之与 HW 模型、BP 模型、SVM 模型、EEMD-BP 模型、EEMD-SVM 模型、HW-EEMD-BP 模型的预测效果进行比较,结果表明本文所选的组合预测模型可以为中国民航客运量波动特征下的数据变化趋势提供较为有效的预测。最后,本文还对疫情发生以来中国民航客运量的变化情况进行了影响分析,对疫情可能造成的冲击进行了量化测算。关键词:民航客运量 集成经验模态分解 支持向量机 组合预测中图分类号:F562.3 文献标识码:A*作者简

3、介 李轩(1998-),女,内蒙古呼伦贝尔人,东北财经大学公共管理学院博士研究生,研究方向为行政管理。周新苗(1977-),通讯作者,女,浙江宁波人,博士,宁波大学商学院教授,研究方向为绿色金融、金融风险、数量经济学。吴晓峰(1991-),男,河北邢台人,北京交通大学经济管理学院博士研究生,研究方向为数量经济与技术经济。Forecast on Passenger Traffic Volume of CivilAviation Based on HW-EEMD-SVM ModelLi Xuan1 Zhou Xinmiao2 Wu Xiaofeng3(1.School of Public Admi

4、nistration,Dongbei University of Finance andEconomics,Dalian 116000,China;2.Business School,Ningbo University,Ningbo 315211,China;3.School of Economics and Management,Beijing Jiaotong University,Beijing 100044,China)Abstract:As one of the important industries of national economic and social developm

5、ent,civil aviation industry has developed rapidly in recent years.After understanding the character-istics of passenger traffic volume data of Chinas civil aviation,based on the idea of integratedcombination forecast,this paper combines the traditional forecasting method of time series withmachine l

6、earning,and establishes a HW-EEMD-SVM error correction combination forecastingmodel,with the use of EEMD method.Then,it selects the monthly passenger traffic volumedata of Chinas civil aviation from 2008 to 2019 as the inspection sample to construct model andverify the prediction effect of the model

7、,and compares them with that of HW,BP,SVM,EEMD-BP,EEMD-SVM,HW-EEMD-BP models.The results show that the combination fore-casting model selected in this paper can provide a more effective prediction of the data changetrend underthefluctuationcharacteristicsofChinascivilaviationpassengertrafficvolume.F

8、inally,it also analyzes the impact of changes in Chinas civil aviation passenger traf-fic volume since the COVID-19 epidemic happens,and quantifies the impact it may cause.Keywords:Passenger Traffic Volume of Civil Aviation EEMD SVM CombinationForecast引 言作为国民经济和社会发展的重要行业之一,民用航空业近年来发展迅速。随着我国人民生活水平的提升

9、,民航业与经济发展的关系越发密切,民航不再只是一种传统的交通运输方式,而是在旅游需求快速增加的情况下,形成了更加复杂的产业链。民航业的运行情况对当地市场活跃度和经济发展都产生了至关重要的影响。民航旅客运091数量经济研究 输量直接影响着机场的建设、飞机的采购和航线的规划发展,更为准确地对客运量做出预测,有助于航空公司了解未来的航空出行需求,并做出相应的决策,及时有效地规划运力和时间表,更为科学地规划基础设施建设,合理开发新航线并服务潜在市场。因此,为了使航空事业在我国国民经济发展中充分发挥作用,促进航空客运快速、高效发展,同时也为民航企业的管理等相关工作提供科学依据,十分必要开展对民航客运量的

10、研究与预测(张蕾,2019)。目前,国内外学者已在航空客运量预测方面做了大量的工作,使用的预测模型或方法不尽相同,传统的时间序列分析方法有自回归移动平均模型(autoregressive inte-grated moving average model,ARIMA 模型)(Bohyoun et al.,2017;Suk,2019;Kim etal.,2019;Suk,2018)、指数平滑(Holt-Winters,HW)模型等(Dantas et al.,2017;Sharma et al.,2019)。Lee 等(1999)比较了四种时间序列模型在短期高速公路交通量预测中的表现。结果表明,A

11、RIMA 模型在他们的实证研究中提供了最稳定和准确的结果。随着人工智能的发展,神经网络(back propagation,BP)和支持向量机(supportvector machines,SVM)的方法得到了推广和应用(Xie et al.,2014;Sun et al.,2019)。随着技术手段的发展和多学科融合方法的成熟,学者对波的拆分有了更深入的研究,预测方法也不再局限于原始序列。由于单一模型的预测效果具有随机性和不稳定性的特点,越来越多的学者倾向使用组合预测的方法对交通运输客运量进行预测(梁小珍等,2020)。Xiao 等(2014)提出了一种新的混合方法,基于自适应网络的模糊推理系统

12、(ANFIS)和改进的粒子群算(IPSO)方法的结合,将奇异频谱分析(SSA),用于短期航空客运需求分析。实证结果表明,他们使用的模型在航空运输需求预测分析中具有巨大的潜力。Jin 等(2020)建立了 VMD-ARMA/KELM-KELM 模型试图解决对航空客运需求的预测问题,并引入了北京、广州和浦东机场的旅客需求以测试其性能。结果表明,就准确性和稳健性分析而言,该模型比其他基准模型具有更明显的优势,因此可以用于航空客运需求预测。Xu 等(2019)提出了一种 SARIMA-SVR模型来预测航空业中的统计指标,该模型可用于以后的容量管理和规划。此模型首先由 SARIMA 模型分析时间序列,然

13、后反向计算高斯白噪声。他们构建了四种混合模型并将之应用于预测航空业的未来统计指标。实证结果证明 SARIMA-SVR3 比其他方法预测效果更优,并证明了采用高斯白噪声能够增强预测的准确性。目前,专家学者对交通客流量预测方法进行了大量研究和改进(周建红等,2020;张健等,2020)。Rodriguez-Deniz 等(2022)为了研究相关网络组成部分的时间演化,揭示直接检查数据不容易发现的复杂依赖关系,提出了一种最先进的概率潜在网络模型来预测交通运输中日益常见的多层动态图,并提出了基于社区的扩展以减少计算负担。通过潜在高斯过程对顶点之间的边概率进行建模,得到柔性时间序列。研究利用美国航空运输

14、系统内四家主要航空公司的 10 年样本数据,发现来自模型的估计潜在参数与航空公司的连通性动态相关。Korkmaz 和 Akgungor(2021)应用花卉授粉算法(FPA)、人工蜂群算法(ABC)、乌鸦搜索算法(CSA)、磷虾群算法(KH)和蝴蝶优化算法(BOA)五种不同的元启发式算法,建立了不同的预测模型,对土耳其的航空191基于 HW-EEMD-SVM 模型的民航客运量预测 运输需求进行预测。在建立模型时,选择了燃料价格、人均国内生产总值、座位容量和年燃料消耗作为模型参数。研究结果表明,虽然使用不同方法开发的每个模型都适用,但使用 CSA 开发的二次型和幂型模型表现出最强的性能。另外,研究

15、结果将有助于评价目前的投资计划和制定满足需求的战略计划,帮助航空公司引入一些必要的规定,以确保收入和费用的平衡,提高航空公司的效率。Gudmundsson 等(2021)预测了经济冲击的强度与世界航空运输业的复苏时间之间的关系,研究结果认为全球客运需求恢复到新冠疫情发生前的水平估计需要 2.4 年(到 2022 年底恢复),最乐观的估计需要 2 年(到 2022 年中恢复),最悲观的估计需要 6 年(到 2026 年恢复)。世界各地区差异较大,亚太地区估计平均恢复时间最短,为2.2 年,其次为北美2.5 年,欧洲2.7 年。另外,与客运需求相比,航空货运需求的全球平均恢复时间较短,为 2.2

16、年。在区域层面,欧洲和亚太地区平均复苏时间相近,而北美预计复苏更快,时间为 1.5年,不同来源的经济冲击以可预测的短暂方式影响客货运量的线性增长和行业的复苏时间。近年来,以经验模态分解为代表的数据分解预测集成的组合预测方法已被广泛应用于多个领域,然而,虽然它们对数据的拟合程度较高但预测效果仍有待改进。为此,本文利用 EEMD 方法构建了误差修正组合预测模型,即将传统时间序列预测方法与机器学习方法相结合(吴晓峰等,2021),在传统时间序列预测方法的基础上,引入 EEMD 方法,将初始预测得到的误差分解成不同频率的模态分量,运用 SVM 方法对这些分量的合成项进行拟合训练,并合成得到误差的预测项

17、,用它来修正初始预测值。该模型使用 EEMD 误差修正的方法解决了误差趋势逐渐增强的问题,从而提高了预测精度。选取2008 2019 年中国民航客运量月度数据进行实证分析,并将该方法与多种方法的预测效果进行对比,实证结果充分体现了本文构建的模型对预测中国民航客运量的适用性及优越性。最后,还对疫情发生以来中国民航客运量的变化进行了影响分析。1 模型设计1.1 集成经验模态分解(EEMD)1998 年,Huang 等人提出了基于瞬时频率信号处理的经验模态分解(empiricalmode decomposition,EMD)方法(梁小珍等,2017;涂锦等,2020;Huang et al.,199

18、8)。从本质来说,该方法是对一个原始信号进行平滑处理的过程,在这个过程中,按照一定的要求,逐级分解、筛选出原始数据序列中本就存在的、不同时间尺度的波动或趋势,生成一系列具有不同波频的数据序列。每个序列都称为一个本征模态函数(intrinsic mode function,IMF),最低频率的 IMF 称为残余项 rn,包含原始数据的趋势或平均值的信息,通过对该残余项和主本征模态函数的综合判断,可以得到原始信号的趋势、走向等信息。每一个 IMF 都突出了原始数据序列的局部特征,具有明显的物理意义,如最高频率的 IMF 携带了最多的原始数据序列信息,称之为主本征模态函数。291数量经济研究 通过

19、EMD 方法分解得到的每一个 IMF 可以是线性的也可以是非线性的,但都必须符合以下条件:(1)原始数据序列曲线的极值点(极大值点、极小值点)和与横坐标交叉点的数量相同或至多差一个;(2)在任何时候,极大值点定义的上包络线和极小值点定义的下包络线的平均值为零,信号的上下包络线围绕时间轴对称。分解结果如式(1)所示:x(t)=ni=1ci(t)+rn(t)(1)式中,ci(t)代表原始信号的若干个 IMF。传统的 EMD 方法存在一定的缺陷。表现为在 EMD 分解过程中首先要获取数据序列局部的极大、极小值点,然后利用三次样条线将这些点连接形成包络线,从而得到均值曲线即 IMF。但是在这个过程中,

20、一个 IMF 中可能含有不同频率的波形或相同频率的波形,同样的,相同频率的波形也可能出现在不同的 IMF 中,这会在一定程度上使得到的拆分波携带有噪声的信息。集合经验模态分解(ensemble empirical mode de-composition,EEMD)是由 Wu 和 Huang(2011)提出的一种数据分析方法,它利用噪声作为辅助条件来弥补 EMD 方法的不足。EEMD 在待分解信号中加入白噪声以平滑异常事件,并利用白噪声声谱的均匀分布将不同时间尺度的信号自动分布到合适的参考尺度,同时利用白噪声的零均值特性进行多次平均,使噪声相互抵消,从而抑制甚至完全消除噪声的影响。EEMD 在本

21、质上是一种叠加了高斯白噪声的多重的 EMD 分解,在体现波动分解方法能够深度挖掘原始数据序列信息的优点基础上,既能尽可能保留原始数据序列的有效信息,也能消除原本存在的模式混合问题。EEMD 分解的具体步骤如下。(1)在原始信号 x(t)中多次加入服从正态分布的白噪声 ni(t),即:xi(t)=x(t)+ni(t)(2)式中,xi(t)是加入 i 次白噪声后的最新、待分解原始信号波。(2)对得到的多个新序列 xi(t)分别进行 EMD 分解,得到 i 组含有 k 的 IMF 组合,记为 cij(t)(j=1,2,k),残余项记为 ri(t)。(3)将得到的 IMF 进行总体平均处理,以消除高斯

22、白噪声的影响,最终得到 EE-MD 分解后的 IMF cj(t),即:cj(t)=1MMi=1cij(t)(3)1.2 Holt-Winters 模型指数平滑(HW)模型是由 Brown 提出的并经过多年发展已经比较成熟的时间序列预测模型(桂文林,2011)。HW 模型一般分为无季节模型、加法模型和乘法模型三类,本文采用了在航空客运量预测方面较为常用的 HW 乘法模型作为时间序列预测模型进行预测,其结构如下:391基于 HW-EEMD-SVM 模型的民航客运量预测 Ft+k=(At+Btk)St+k-sAt=yt/St-s+(1-)(At-1+Bt-1)Bt=(At-At-1)+(1-)Bt-

23、1St=yt/At+(1-)St-s(4)式中,Ft+k代表 yt在第 t+k 期的预测值,St代表季节因子,s 代表季节长度。1.3 支持向量机(SVM)原理SVM(support vector machines)是由 Cortes 和 Vapnik(1995)提出的既可以解决分类问题,也可以用来解决回归问题的基于统计学理论的机器学习方法。它的机理是通过构造一个超平面来实现样本之间的划分,而 SVM 的核心要义就是构造一个最优超平面,使得两类样本与超平面之间的最短距离最大化。其训练集是 xi,yi,其中 xiRD(xi包含 D 个特征属性),i=1,2,n,是 n 个 D 维向量,yiRD,

24、F=f f:RDR。因此,SVM 的优势在于,对于无法满足线性可分要求的非线性分类问题,SVM 可以将低维的原始训练样本数据映射到一个高维空间,以做到线性可分。如下条件:yi(xi+b)-1+i0,i0,i=1,2,n(5)i称为松弛变量,当 0 i1 时,表示样本 xi的分类是正确的;当 i1 时,表示样本xi的分类是不正确的。为此,在最小化目标122中加入惩罚项 Cni=1i,引入以下目标函数:(,)=122+Cni=1(6)C 表示惩罚因子,用于平衡松弛变量和分类间隔大小,并控制异常样本的容忍度。C 越大,表明对该项的重视程度越高,对异常样本的容忍度越低。这样一来,求解分类样本与超平面之

25、间的最短距离最大化问题就转化成了解决如下最优化问题:min122+Cni=1s.t.yi(xi+b)-1+i 0,i 0,i=1,2,n(7)上式的解为最优最终判别函数:f(x)=sgnni=1a*yiK(xi,x)+b*(8)K(xi,x)为核函数,核函数的作用包括:(1)将低维的原始训练样本数据映射到一个高维的空间,来保证非线性数据可以做到线性可分;(2)维度上升会使样本之间内积计算的复杂度提高,而它的另一个作用就是在高维空间中,仍然使其计算量是低维容量,但输出还是能保证在高维空间。本文选用径向基函数作为核函数:491数量经济研究 K(xi,x)=exp-xi-x22 ,i=1,2,n(9

26、)式中,为核密度。1.4 HW-EEMD-SVM 误差修正组合预测模型航空客运量一般情况下是不稳定的,其数据既具有线性特征也包含非线性特征,目前并没有单一模型能够满足对这一问题的研究需求。从以往的研究成果来看,组合预测模型可以充分利用单一模型的优点,并通过合理的组合规避单一模型自身存在的缺陷和不足。所以,本文选取组合预测模型来对复杂环境下多因素影响的航空客运量预测展开研究。本文选取的 HW-EEMD-SVM 误差修正组合预测模型共分为三个阶段:HW 模型预测、对误差序列进行波动拆分和去噪、合成最新误差序列对按时预测结果进行修正和优化。具体来看,首先利用 HW 传统时间序列预测模型对民航客运量数

27、据进行预测,然后利用 EEMD 方法对初始预测的误差项进行有效分解,并重构出误差的长期趋势项和波动项,剔除部分噪声分量,之后再运用支持向量机对趋势项和波动项分别进行拟合训练,并基于它们各自的预测结果叠加形成误差项的总预测值,最后将合成的误差预测值反馈到 HW 模型对客运量的预测值上,从而得到最终的预测结果。相较于以往直接对预测结果进行修正,本文提出的组合预测方法采取了更加精细和严谨的方法,以初始预测结果的误差项为优化对象,在保护原始数据序列有效信息的基础上,对误差序列在不同的时间尺度上做进一步的拆分、筛选剔除以及优化。与以往仅对预测值误差大小进行直观的观察和改善相比,本文通过拆分出不同频率的波

28、动序列,得到了更多具有现实意义的波动信息,如通过 EEMD 的拆分获得的误差项可以代表误差序列整体走向趋势,不同频率的数据序列可以与突发事件对预测结果的影响周期和影响长度等相对应。通过对以上数据序列的拆分和解读,可以挖掘更丰富和立体的信息,从而与现实情况进行对应,优化预测结果,为民航运营管理的决策者提供科学的理论支撑。本文采用平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(meanabsolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)三个指标作为模型预测性能的评价准则。MAE 和

29、MAPE 考虑的都是绝对值,因此模型实证结果产生的误差没有正负相抵消,从而可以更准确地描述各模型之间误差的实际差异;RMSE 反映了误差的统计学特性,即离散程度,所以 RMSE 的值越小越好。设 yt为真实值,yt为预测值。MAE、MAPE、RMSE 的表达式分别为:MAE=1nnt=1yt-yt(10)MAPE=1nnt=1(yt-yt)/yt 100%(11)RMSE=1nnt=1(yt-yt)2(12)591基于 HW-EEMD-SVM 模型的民航客运量预测 2 实证分析2.1 数据来源及说明本文选取 2008 2019 年中国民航客运量月度的当期值(万人)作为分析样本。其中,选取 20

30、08 2018 年的 132 个样本数据用于建立模型进行数据训练,利用 2019 年12 个月的数据用于评测上文提到的若干传统时间序列预测模型的预测能力。由图 1 可知,中国民航客运量 2008 2019 年整体呈现逐年上升的态势,且具有较强的周期性波动特征。从增速来看,除了个别月份的异常增减外,其间多数时间保持在 10%上下 10个百分点以内,呈现比较规律的波动运行状态。图 1 中国民航客运量月度数据2.2 HW 模型预测结果从图 2 可以直观地看出,HW 模型能很好地捕捉中国民航客运量的发展趋势,但从图 3 可以看出,HW 模型对测试集的数据预测误差相对较为明显。再利用 MAE、MAPE和

31、 RMSE 更为精确地刻画模型对训练集的拟合水平与对测试集的预测效果,结果如表 1图 2 时间序列模型对训练集的拟合效果691数量经济研究 所示,三个指标的值分别为 98.80、1.80、111.56。图 3 时间序列模型的预测效果表 1 HW 模型预测结果误差分析项目训练集测试集指数MAE(万人)MAPE(%)RMSE(万人)MAE(万人)MAPE(%)RMSE(万人)数值65.392.0585.6298.801.80111.562.3 基于 EEMD 的误差修正组合预测模型在利用中国民航客运量数据的训练集建立 HW 模型并对它进行初步预测的过程中,将得到的拟合值与实际值进行对比,从而得到误

32、差项。接下来运用 EEMD 方法对误差项进行修正。首先是利用 EEMD 对中国民航客运量预测序列的误差项进行分解,共得到 7 个其他本征模态函数及残余项(如图 4)。得到的数据显示,不同时间尺度上的其他 IMF 以及残余项携带的信息对原始数据序列的贡献率均比较高,说明通过此方法得到的所有分量都包含较多的原始数据序列信息,可以用来解释中国民航客运量时间序列中隐含的内在特性。残余项是误差数据的总体趋势,可以用来描述中国民航客运量的 HW 模型预测误差项的总体趋势。趋势项的上升走势表明,HW 模型对中国民航客运量的预测误差有逐渐变大的可能,这一点对后期修正预测值有较大的现实参考意义。低频部分的上下震

33、荡转折可以用来表示重大事项给中国民航客运量预测误差带来的影响。低频曲线的周期表示重大事件对中国民航客运量预测误差的影响的期限长短。周期越长,表明重大事件对中国民航客运量的影响时间越长,且此影响越不易消除,在这种情况下,在利用 HW 模型进行预测的过程中,要视现实情况适度延长重大事件的影响因子作用期限;振幅表示对中国民航客运量造成冲击的大小,振幅越大,表示重大事件对客运量预测结果的冲击影响越大,波峰表示重大事件会导致预测结果偏高,波谷则表示偏低。高频部分反映的是中国民航客运量短期内模型预测的不均衡现象,但是,通常来说预测误差的不均衡现象是客观存在的。791基于 HW-EEMD-SVM 模型的民航

34、客运量预测 图 4 经 EEMD 分解的误差分量在利用 SVM 方法对误差的 IMF 进行模拟和预测的过程中,由于代表预测误差的不均衡现象的高频波是客观存在的,因此将 IMF1 IMF3 作为噪声项舍弃,选取了趋势项和 IMF4 IMF7 的加和项作为波动项,并把二者的预测值叠加从而得到误差预测结果,然后将之反馈到初始预测序列中,最终得到经过误差修正的中国民航客运量的预测值。其中,在使用 SVM 方法预测的过程中,为了回避由于多次选择不同训练集结构参数而造成的过度拟合的问题,本文根据过往经验选择了(N 12,N 1)的训练集结构。根据图5 和表2 所示的误差修正后的最终预测结果可以看出,虽然在

35、个别时点上如 7 月、8 月的预测效果不如 HW 模型,而且2019 年4 月到 2019 年 5 月的变化趋势似乎存在一定的滞后性。但是整体来看,在2019 年12 个月的预测之中,有9 个月的组合预测模型预测值的误差百分比的绝对值要低于 HW 模型,且其波动走势与真实值基本一致。因此可以说明,整体上经过 EEMD 误差修正后的模型在多数情况下预测值与中国民航客运量的实际值更为接近,说明了该模型是切实有效的,更加适用于对中国民航客运量的预测。图 5 HW-EEMD-SVM 组合预测模型的预测结果891数量经济研究 表 2 HW-EEMD-SVM 组合预测模型的预测结果时间实际值(万人)HW

36、乘法模型组合预测模型预测值(万人)误差百分比(%)预测值(万人)误差百分比(%)2019 年 1 月53415238.22-1.925391.590.952019 年 2 月53835259.04-2.305381.76-0.022019 年 3 月53505444.371.765474.802.332019 年 4 月53125514.343.815493.903.422019 年 5 月54515411.19-0.735441.03-0.182019 年 6 月53415242.54-1.845322.33-0.352019 年 7 月59306017.681.486092.672.742

37、019 年 8 月61246213.441.466239.601.892019 年 9 月54755556.551.495534.281.082019 年 10 月56985891.043.395833.782.382019 年 11 月53065335.610.565283.71-0.422019 年 12 月52765233.48-0.815238.79-0.712.4 模型预测效果对比分析为了充分体现所构建的 HW-EEMD-SVM 模型具有较强的预测能力,本文还分别利用 HW、BP、SVM、EEMD-BP、EEMD-SVM、HW-EEMD-BP 方法对客运量数据进行了拟合及预测,并对比

38、分析了各模型的预测效果。如图 6 和表 3 所示,(1)本文构建的HW-EEMD-SVM 模型的 MAE、MAPE 和 RMSE 指标的结果在与其他模型对比中均表现最优,预测精度要整体高于其他五种模型,说明该模型能够更好地把握中国民航客运量的变化趋势,具有较强的适用性和较高的推广使用价值。(2)通过对 EEMD-BP 模型和 HW-EEMD-BP 模型、EEMD-SVM 模型和 HW-EEMD-SVM 模型的结果对比分析,可以看出通过误差修正的处理方式得到的预测效果要比直接对中国民航客运量数据进行分解-预测-集成的方式更好,这说明只对误差项进行修正,能够更好地保留原始数据序列中非噪声信息。(3

39、)通过 SVM 模型和 BP 模型、EEMD-SVM 模型和 EEMD-BP模型、HW-EEMD-SVM 模型和 HW-EEMD-BP 模型三组模型预测效果的对比分析,可以得出 BP 虽然对中国民航客运量数据的拟合效果要优于 SVM,但 SVM 对训练集样本外的预测效果表现更好。(4)本文构建的 HW-EEMD-SVM 模型的各期指标结果并没有因为期数增加而使误差偏差大幅增大,因此该模型适用于样本外多期预测,这也为更好地分析新冠疫情产生的影响提供了依据。991基于 HW-EEMD-SVM 模型的民航客运量预测 图 6 不同模型的预测效果比较002数量经济研究 表 3 不同模型的预测效果比较模型

40、MAE(万人)1 月4 月8 月12 月HW102.78130.86104.85 98.80BP144.32353.08355.18395.01SVM25.95143.37132.99125.50EEMD-BP26.58124.77192.68232.93EEMD-SVM64.5664.11174.35195.85HW-EEMD-BP85.08110.51104.12124.13HW-EEMD-SVM50.5989.6383.1876.67模型MAPE(%)1 月4 月8 月12 月HW 1.92 2.45 1.91 1.80BP2.706.606.457.22SVM0.492.682.392

41、.29EEMD-BP0.502.353.414.20EEMD-SVM1.211.203.013.50HW-EEMD-BP1.592.071.912.27HW-EEMD-SVM0.951.681.491.37模型RMSE(万人)1 月4 月8 月12 月HW102.78137.64113.32111.56BP144.32420.06414.25451.15SVM25.95170.32154.91149.31EEMD-BP26.58204.26247.17285.80EEMD-SVM64.5673.34248.04258.86HW-EEMD-BP85.08124.04118.18142.68HW-

42、EEMD-SVM50.59113.16106.9498.042.5 中国民航客运量受疫情影响分析在此利用本文构建的 HW-EEMD-SVM 模型对 2020 年和 2021 年中国民航客运量进行了无疫情影响下的预测,将预测值与民航客运量的真实值及上年同期值进行对比分析(见图 7)发现,中国民航客运量从 2020 年初开始持续受到疫情影响,其中 2020 年2 月受冲击最为严重,客运量只达到上年同期的 15.49%,较无疫情影响下的预测值低了 85.54%;在政府对疫情做到有效防控的情况下,中国民航客运量的上升势头明显,102基于 HW-EEMD-SVM 模型的民航客运量预测 到 2020 年

43、10 月,民航客运量达到上年同期 88.31%的水平。但是由于全球疫情的持续,民航尤其是国际航班,依然无法摆脱疫情带来的客运量减少的影响,民航客运量与无疫情影响下的预测值差距明显。总体而言,2020 年及 2021 年民航客运量总体较无疫情影响下的预测值低了 40.78%,其中 2020 年较上年下降了 58.00%,2021 年较2020 年回升了 5.47%,略有好转。图 7 疫情影响分析结 论民航客运量的变化对民航业发展和经济运行均有较大影响,因此应当准确预判民航客运量的变化情况,并提前做出积极应对,来减小不利冲击的负面影响或更好地承接利好事件带来的变动。本文在把握中国民航客运量变化趋势

44、的基础上,提出了一个基于 EEMD 误差修正的 HW-EEMD-SVM 集成组合预测模型,首先利用多个传统时间序列预测模型对民航客运量数据进行预测,通过对比预测结果精确性,筛选出最适用的模型(HW 模型),并基于 HW 模型预测结果中的误差项展开后续研究。具体来看,本文利用 EEMD 方法对初始预测的误差项进行了有效分解,其结果可以解释误差波动的内在含义,并重构出误差的长期趋势项和波动项,在剔除了部分噪声分量后,对趋势项和波动项分别进行拟合预测,再叠加形成误差项的预测值,最后将合成的误差预测值反馈到 HW 模型对客运量的预测值上对之进行修正,从而得到最终的预测结果。通过将之与 HW 模型、BP

45、 模型、SVM 模型、EEMD-BP 模型、EEMD-SVM 模型、HW-EE-MD-BP 模型的预测结果进行比较,不仅显示出本文构建的模型具有较高的预测精度,可以更好地把握中国民航客运量的总体变化趋势,挖掘民航客运需求的内在发展规律,同时也为我国未来民航客运量预测提供了新的思路和方法,有助于民航的决策更加科学合理。另外,由于模型预测的基础是历史规律的重复性,因此本文构建的模型并不能用来预测疫情的发生,但是可以作为模拟无疫情影响下民航客运量的依据,用来更好地分析疫情对中国民航客运量产生的影响。202数量经济研究 参考文献桂文林.2011.月度数据季节因素调整和预测 J.统计研究,28(6):7

46、9-85.梁小珍,郭战坤,张倩文,等.2020.基于奇异谱分析的航空客运需求分析与分解集成预测模型 J.系统工程理论与实践,40(7):1844-1855.梁小珍,乔晗,汪寿阳,等.2017.基于奇异谱分析的我国航空客运量集成预测模型 J.系统工程理论与实践,37(6):1479-1488.涂锦,冷正兴,刘丁毅.2020.基于 EMD 和神经网络的非线性时间序列预测方法 J.统计与决策,36(8):41-44.吴晓峰,林晓言,靳雅楠.2021.基于时间序列模型遴选的集成组合预测模型 J.统计与决策,37(9):5-8.张健,孙玉莹,张新雨,等.2020.基于时变模型平均方法的我国航空客运量预测

47、 J.系统工程理论与实践,40(6):1509-1519.张蕾.2019.基于组合模型的民航客运量预测研究 D.辽宁师范大学硕士学位论文.周建红,邝雄,陈志明,等.2020.我国航空客运量需求预测模型:基于随机前沿预测模型和模型平均 J.系统工程理论与实践,40(11):2861-2871.Bohyoun S U H,Woong Y T,Ha H-K.2017.Application of SARIMA model in air cargo demand forecasting:Focussing on Incheon-North America routes J.Korean Society

48、 of Transportation,35(2):143-159.Cortes C,Vapnik V.1995.Support-vector networks J.Machine Learning,20(3):273-297.Dantas T M,Oliveira F L C,Repolho H M V.2017.Air transportation demand forecast through bagging HoltWinters methods J.Journal of Air Transport Management,59:116-123.Gudmundsson S V,Cattan

49、eo M,Redondi R.2021.Forecasting temporal world recovery in air transport mar-kets in the presence of large economic shocks:The case of COVID-19 J.Journal of Air Transport Man-agement,91:102007.Huang N E,Shen Z,Long S R,et al.1998.The empirical mode decomposition and the Hilbert spectrum fornonlinear

50、 and non-stationary time series analysis J.Proceedings of the Royal Society A:MathematicalPhysical and Engineering Sciences,454:903-995.Jin F,Li Y,Sun S,et al.2020.Forecasting air passenger demand with a new hybrid ensemble approachJ.Journal of Air Transport Management,83:101744.Kim J,Son H,.2019.A

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服