资源描述
毕业设计(论文)文献综述
院 系:
应用数学学院
年级专业:
xx级数学与应用数学
姓 名:
xx
学 号:
xxxx
题目名称:
时间序列分析在厦门降水预测中应用文献综述
指导老师评语:
指导教师签名:
年 月 日
9
文献综述
时间序列分析在厦门降水预测中的应用
【内容摘要】:本文首先介绍时间序列概念和作用以及时间序列小波分析方法, 特别对极大重叠离散小波变换(MODWT)的阐述。进而讨论时间序列方法和小波分析方法的发展历程。最后对小波分析方法在水文时间序列上的研究进行总结和展望。
【关键词】:时间序列,ARMA模型,ARIMA模型,MODWT
第一章 导言
时间序列分析是数理统计学中的很重要的一部分, 任何事物的变化发展都伴随着一个过程, 我们依照事物发展的时间顺序把其发展过程逐一记录下来, 形成一个时间序列。通过研究一个时间序列, 可以从该序列发展的趋势中提取出事物发展随时间变化的内在规律, 进而对未来的发展趋势进行预测, 这就是时间序列分析。但是对于一个具有许多噪声降水时间序列, 如果直接对其预测发展趋势, 则精确度会有所下降。小波分析具有良好的多分辨分析能力, 能够自适应地伸缩和平移时频分析窗口的大小, 实现对信号时域和频域的联合分析, 被誉为“数学显微镜”, 它被广泛应用于信号分析、图像处理、地震勘探等领域。随着小波分析的不断发展, 它在数理统计以及水文预测领域也受到了广泛的关注。尤其极大重叠离散小波变换(MODWT)对时间序列进行分解与重构。MODWT是在小波变换的基础上改进得到的, 它对信号分解与重构的时候对信号的长度没有要求, 适用性更广。
第二章 研究历史
时间序列分析是从事件的发展中找到一种统计规律, 采用合适的数学模型来拟合这种规律并进行预测。最早的时间序列分析可以追溯到7000年前的古埃及。古埃及人为了发展农业把尼罗河涨落的情况逐天记录下来, 就形成所谓的时间序列。
时间序列分析方法的概念最早是由英国统计学家G.U.Yule于1927年提出的, 2012年, 张文斌在《矿区形变监测数据动态分析研究》[1]一文中, 介绍了著名学者G.U.Yule提出了关于时间序列中用来预测的自回归(autoregressive, AR)模型, 这些模型奠定了时间序列时域分析方法的基础, 也是ARMA模型中的一个特例。1931年他又运用AR模型进行了预测, 此后逐步发展了ARMA模型、ARIMA模型等多种模型, 这些模型的提出奠定了时间序列分析方法发展的基础。
2009年, 赵晓葵在《基于Box-Jenkins方法的中国年度GDP时间序列分析建模与预测》[2]一文中提到, 1970年美国学者Box和英国统计学家Jenkins在前人所做研究的基础上, 提出了一整套关于时间序列分析、预测和控制的方法, 详细而系统地提出了关于求和自回归移动平均(autoregressive integrated moving average, ARIMA)模型的识别、估计、检验及预测的原理和方法。这些知识现在被称为经典时间序列分析方法, 二人在时间序列分析的发展过程中作出了巨大的贡献。
结合小波分析方法的时间序列研究也得到蓬勃的发展。2007年, 汤成友与缈韧在《基于小波变换的水文时间序列分解》[3]中提到, 运用Mallat算法和Daubechies小波, 介绍基于小波变换的水文时间序列分解方法。通过小波变换, 将水文时间序列分解成不同尺度的确定性序列和随机序列, 以长江寸滩站日平均流量和年最大流量为例, 进行小波变换。通过对分解后的序列重构结果是满意的。
2009年, 哈尔滨工业大学硕士研究生雷苗和导师彭喜元教授在《移动通讯话务量时间序列预测方法研究》[4]中结合小波变换思想研究结果表明该方法具有许多优良性。小波分解得到的子层物理意义明晰;对子层进行的精简整合较好地抑制了小波分解过程中引入的算法复杂度增加问题;子层整合后利用乘积季节 ARIMA 模型获得的预测精度优于乘积季节 ARIMA 模型预测方法和基于先验知识的小波分解加逐层预测方法;更为重要的是, 新方法克服了离散小波变换时间尺度仅能二进伸缩的问题, 可在较高精度范围内, 实现多步预测。
2013年, 廖丽芳与蔡如华在研究金融数据股价的趋势走向时, 于《基于MODWT在金融数据预测的应用》[5]一文中提出了一种基于极大重叠离散小波变换(MODWT)时间序列分析的股价预测方法(M—ARMA)。该方法是对股价时间序列利用mallat算法对其进行极大重叠离散小波变换, 使得整个序列分解成不同频率的序列, 同时利用小波分析在时域和频域上都具有良好的局部化性质, 多尺度分析功能, 结合ARMA模型的预测方法, 以较为准确地根据历史数据预测其将来短期的走势。实验表明, MODWT时间序列分析方法比传统的时间序列分析方法预测的精度更高。
第三章 研究现状
3.1 时间序列分析现状
传统时间序列预测方法主要采用线性预测模型, 如自回归模型AR、移动平均模型MA、自回归滑动平均模型 ARMA [6] 、求和自回归滑动平均模型 ARIMA、Kalman 滤波器[7] 、递推最小二乘自适应滤波器[8] (Recursive LeastSquares, RLS)等。线性模型的优点主要体现在:模型简单、建模和预测速度快, 可实现多步预测。然而实际时间序列一般是非线性和非平稳的, 所以传统的线性模型适用范围较窄, 需要采用非线性方法来建模和预测。目前主要有基于神经网络模型和基于支持向量机这两种非线性,如罗方琼,吴春梅《基于PCA—LLE组合优化RBF神经网络降水模型》[20]一文中指出的和魏俊,周步祥等人基于蚁群支持向量机的短期负荷预测[21]。
3.1.1 平稳时间序列
2007年, 何书元在《应用时间序列分析》[15]对时间序列的基本知识给出了详细的阐述, 主要介绍了时间序列的基本知识, 常用的建模和预测方法。其中第2章介绍了自回归模型, 第3章介绍了滑动平均模型和自回归滑动平均模型, 第6章介绍了ARMA模型的参数估计, 这些基本理论和模型都是实际问题分析中的理论基础。
ARMA模型的全称是自回归移动平均模型(auto regression moving average), 它是目前最常用的拟合平稳序列的模型,如中南大学的吴芸芸等人在《时间序列分析在变形监测中的应用》[18]一文中很好运用ARMA模型去处理动态数据,拟合效果良好。ARMA模型它又可以细分为AR模型(auto regression model)、MA模型(moving average model)和ARMA模型(auto regression moving average model)三大类。
(1) AR模型
具有如下结构的模型称为p阶自回归模型, 简记为AR(p):
(1)
当时, 自回归模型又称为中心化AR(p)模型。
(2) MA模型
具有如下结构的模型称为q阶移动平均模型, 简记为MA(q):
当时, 模型称为中心化MA(q)模型。
(3) ARMA模型
把具有如下结构的模型称为自回归移动平均模型, 简记为ARMA(p,q):
当, 该模型称为中心化ARMA(p,q)模型。
3.1.2 非平稳时间序列
潘红宇2006年《时间序列分析》[16]一书在第六章对非平稳时间序列模型进行了详细的介绍, 因为自然界中绝大多数序列都是非平稳的, 通过差分运算的处理很多非平稳时间序列都会显现出平稳时间序列的性质, 对这种差分后的时间序列多采用ARIMA模型拟合,如刘明鼎在《ARIMA模型在地区GDP预测中的应用研究》[19]一文中指出以山东省2007年第一季度到2011年第四季度的GDP总值为基础,利用ARIMA模型拟合并预测2012年GDP的增长趋势,预测结果与实际值很吻合。
把具有如下结构的模型称为求和自回归移动平均模型, 简记为ARIMA(p,d,q):
当d=0时, ARIMA(p,d,q)模型就是ARMA(p,q)模型。
当d=1, p=q=0时, ARIMA(0,1,0)模型为:
该模型被称为随机游走(random walk)模型。
3.2小波分析方法现状
小波分析是分析时间序列的一种比较新颖的方法, 其正式的研究可追溯20世纪80年代。时间序列小波分析方法一般作为时间序列预处理方法中一种, 可以将原始序列分解为多个频段, 降低子层的预测难度;也可以实现基于小波方法的去噪, 在此基础上对含有误差的采样值进行修正, 以期获得更高的预测精度。
时间序列小波分析方法源于两种离散小波变换算法[9]在物理科学、地球科学等中的应用:一个是离散小波变换, 另一个是极大重叠小波变换。它们均可以将原始序列分解到不同频段上, 形成一个多分辨分析, 使子序列频段和时间尺度尽量单一。
离散小波变换(DWT)可以有效地将相关序列去相关。同时, 也可以利用离散小波变换的系数精确地重构原始时间序列。而且, 各层系数有自己的中心频率成分, 呈现出一个多分辨的特性。因此, 离散小波变换成为时间序列分析的一个重要工具。 文献[10]将基于 DWT 的多分辨技术用于黄河上中下游四个水文站的实测年径流序列的分析, 以判断其趋势变化, 取得了较好的实验结果。
对离散小波变换的一种修改产生了极大重叠离散小波变换(MODWT), 这种变换在时间方向上引入了一些冗余, 从而有可能更好地分析一些特定的时间序列。例如, 文献[11]将基于MODWT 的多分辨分析技术成功地应用于湍流分离中的大尺寸相干结构的分析。
离散小波变换和极大重叠离散小波变换, 都是对原始序列的低频部分不断细分, 形成新的细节和趋势;如果不仅仅是对低频部分进行细分, 每次分解也同时针对高频部分, 这就是小波包变换的思想。
上述两种算法存在的热点和难点归纳如下:小波分解得到的各子层物理意义仍然并不清晰 [12] ;离散小波变换算法中的下采样过程使得时间尺度仅能二进伸缩 [13] ,限制了某些频率成分的准确提取;同时, 小波分析过程中涉及的相关问题, 例如小波基选择、分解层数选择[14]、边界条件端点效应等问题也需要进一步研究。
3.2.1极大重叠离散小波变换
设为点实值序列:, 为自然数。设为选取的小波分解层数, 通过利用层极大重叠离散小波变换变换小波滤波器和第层尺度滤波器对进行循环滤波, 也即
其中, ,
其中,可以得到个极大重叠小波变换小波系数向量和1个尺度系数向量, 记为
, 其中
Percival 等又利用极大重叠小波逆变换公式实现序列 X 的多分辨分析和精确重构。对以上两式子得到的小波系数向量和尺度系数向量加以合并, 可以得到极大重叠小波变换总的变换系数向量:
同时, 结合满足的极大重叠离散小波变换矩阵, , 得到序列的重构公式为:
其中极大重叠离散小波矩阵可由第层小波滤波器和第层尺度滤波器产生;为第层小波细节, 为趋势项。这样就得到序列X的一个基于离散小波变换的多分辨分析, 实现序列的小波分解[17]。
3.3降水量预测方法现状
降水量的短期变化,往往会造成严重的旱涝灾害,并对国民经济等造成较为严重的影响。高精度的降水量预测方法能及早地发现其改变情况,提高应对灾害的能力。但降水的变化往往存在复杂、多变的不确定性,既受当地地形、所处的气候带、大气环流、洋流、太阳黑子以及人类活动等多种环境因子的影响,其本身又存在时序动态特征,呈现为一个复杂非线性动力系统。早期采用多因子的回归方程法预测 ,其简单的线性方程无法反映降水量的复杂规律,导致该方法预测精度比较低;现较为常用的方法人工神经网络同样存在线性缺陷,其中隐含层数与隐含层节点数需要经验性的确定,而且“过拟合”问题使得其训练模型精度较高,但反应模型真实性能的独立预测精度却比较低,制约其在实际问题中的应用;另外还有随机分析法 等,但这些方法都比较孤立,互相间缺乏系统的联系,并且都没有考虑降水量变化的时间序列属性,无法反映其时序动态特征,致使预测精度普遍不高。降水量数据作为时间序列的一种, 它具有多周期性[22]、非平稳性、海量数据特性、稳定突发特性。国内目前的预测算法主要有:回归方法、指数平滑模型、季节变动模型、神经网络以及支持向量机等。研究准确预测降水量,可提高应对灾害的能力。降水量的变化既受大气环流、地形、气压、气候带等各种环境因子的影响,降水量的动态特征呈现复杂非线性,使得准确预测未来降水量的变化较为困难。为了提高预测精度,采用融合时间序列模型结合极大重叠离散小波变换模型的研究方法是可以尝试去做的。
第四章 总结与展望
时间序列分析是认识和揭示降水过程复杂变化特性的有效手段。随着新技术和新方法不断引入到降水预测中, 必将促进对复杂降水预测等水文循环过程的理解和认识, 进而可为实际水文水资源工作提供指导和依据。不同方法联合和耦合的方式是提高降水时间序列分析结果精度和可靠性的有效途径, 特别是极大重叠小波变换(MODWT)结合ARIMA模型的方法, 今后应加强这方面的研究和应用, 但需要注意到单个方法的缺陷仍会对分析过程和结果产生影响, 因此仍需要进一步改进和完善各种时间序列分析方法。探讨物理成因分析和数理统计分析相结合是研究和解决环境变化影响下的水文问题的有效途径, 今后也需要加强这方面的研究工作。
参考文献
[1] 张文斌. 矿区形变监测数据动态分析研究[J]. 山西建筑, 2012, 38(13):112-113.
[2] 赵晓葵. 基于Box-Jenkins方法的中国年度GDP时间序列分析建模与预测[J]. 青海师范大学学报, 2009, 3(1):15-19.
[3] 汤成友, 缈韧.基于小波变换的水文时间序列分解及周期识别[J]. 人民长江报, 2006, 37(12):32-34.
[4] 雷苗.移动通讯话务量时间序列预测方法研究[D]. 哈尔滨工业大学, 2009.
[5] 廖丽芳, 蔡如华.基于MODWT在金融数据预测得应用[J]. 桂林电子科技大学学报, 2013, 34(4):1346—1350.
[6] E.Balaguer, A.Palomares, E.Soria and J.D.Martin-Guerrero. Predicting service request in support centers based on nonlinear dynamics, ARMA modeling and neural networks[J]. Expert Systems with Applications, 2008, 34:665-672.
[7] Z.Deng, Y.Gao et al. New approach to information fusion steady-state Kalman filtering[J]. Automatica, 2005, 41(10):1695-1707.
[8] 周轶, 菅浩然.基于递推最小二乘改进算法的洪水预报模型研究[J]. 河南大学学报(自然科学版), 2007, 35(1): 77-80.
[9] Donald B.Percival, Andrew T.Walden 著, 程正兴, 等译. 时间序列分析的小波方法[M]. 机械工业出版社, 2005: 56-179.
[10] 薛小杰, 等.小波分析在水文序列趋势分析中的应用[J]. 应用科学学报, 2002, 20(4): 426-428.
[11] Sejong Chun et al. Multi-resolution analysis of the large-scale coherent structure in a turbulent separation bubble affected by an unsteady wake[J]. Journal of Fluids and Structures, 2007, 23:85-100.
[12] A.Ben Mabrouk, N.Ben Abdallah, Z.Dhifaoui. Wavelet decomposition and autoregressive model for time series prediction [J]. Applied Mathematics and Computation, 2008:334-340.
[13] Konstantina Papagiannaki, Nina Taft, etal.Long-Term Forecasting of Internet Backbone Traffic[J]. IEEE Transactions on Neural Networks, 2005, 16(5):1110-1124 .
[14] 徐科, 等. 基于小波分解的某些非平稳时间序列预测方法[J]. 电子学报 , 2001, 4: 566-568.
[15] 何书元. 应用时间序列分析[M]. 北京:北京大学出版社, 2007.
[16] 潘红宇. 时间序列分析[M]. 北京:对外经济贸易大学出版社, 2006.
[17] Xu qi-fa, Zhang Shi-ying. Research on Multiresolution Persistence and Common Persistence[J]. SETP, 2007, 27(2): 36-45.
[18]吴芸芸, 左延英, 朱建军. 时间序列分析在变形监测中的应用[J]. 中南大学学报, 2012, (1): 69-72
[19]刘明鼎. ARIMA模型在地区GDP预测中应用研究[J]. 鸡西大学学报, 2013, 13(7): 68-70
[20]罗芳琼, 吴春梅. 基于PCA—LLE组合的优化RBF神经网络降水预测模型[J]. 柳州师专学报, 2013, 28(2): 126-130.
[21]魏俊, 周步祥, 林楠, 刑义.基于蚁群支持向量机的短期负荷预测[J]. 四川大学学报, 2009, 37(4): 37-40.
[22]鱼京善, 王国强, 刘昌明. 基于GIS系统和最大熵谱原理的降水周期分析方法[J]. 北京师范大学学报, 2004,24(3): 278-284.
展开阅读全文