资源描述
版本 0
1 时间序列分析方法与其它统计分析方法(回归分析)的主要区别
1 时间序列分析方法明确强调变量值顺序的重要性,而其它统计分析方法则不必如此。
2 时间序列各观察值之间存在一定的依存关系,而其它统计分析一般要求每一变量各自独立
3 时间序列分析根据序列自身的变化规律来预测未来,而其它统计分析则根据某一变量与其它变量间的因果关系来预测该变量的未来。
4 .时间序列是一组随机变量的一次样本实现,而其它统计分析的样本值一般是对同一随机变量进行N次独立重复实验的结果。
5. 二者建模思路不同
2 有时应用时间序列分析方法显得很有必要
1 .很多情况下,很难或不可能用变量间的因果关系来说明某一变量的变化。
2 .即使能估计出一个有关变量的令人满意的回归方程,其结果也可能不能用于预测。
3 常用软件EVIEWS。
版本1
1 一般概念:
1. 变量的观测值按时间顺序,在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其它各种因素影响的总结果。获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。它不研究事物之间相互依存的因果关系。
2. 惯性原则、近大远小原理
2构成要素
分为四种,即长期趋势(Secular trend):在较长时期内呈现出某种持续发展变化的状态、趋向或规律
季节变动(Seasonal fluctuation):在一年内重复出现的周期性波动
循环波动(Cyclical movement):围绕长期趋势的一种波浪形或振荡式变动
不规则波动(Irregular variations):不规则波动, 除去趋势、周期性和季节性之后的偶然性波动
实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。趋势性、周期性:随机性:综合性
3 平稳性:
样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。各观察值基本上在某个固定的水平上波动,或虽有波动,但并不存在某种规律,而其波动可以看成是随机的
平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。
4 基本步骤
(1)分析数据序列的变化特征。
(2)选择模型形式和参数检验。
(3)利用模型进行趋势预测。
(4)评估预测结果并修正模型。
1. 一般假定 均值为0,否则令
5分解模型
按四种因素对时间序列的影响方式不同,时间序列可分解为多种模型。
乘法模型 Yi=Ti×Si×Ci×Ii
加法模型 Yi=Ti+Si+Ci+Ii
最常用的是乘法模型。其基本假设是各构成因素互不独立,对事物的影响是相互的,除对时间序列的发展水平产生影响外,因素之间也相互影响。利用乘法模型可以将各因素从时间序列中分离出来进行分析。
5自回归AR(P)模型
yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt:p模型的阶次,滞后的时间周期,通过实验和参数确定;yt当前预测值,与自身过去观测值yt-1、…、yt-p是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系,yt-1、yt-2、……、yt-p同一平稳序列过去p个时期的观测值;φ1、φ2、……、φp自回归系数,通过计算得出的权数,表达yt依赖于过去的程度,且这种依赖关系恒定不变;
识别条件:当k>p时,有φk=0或φk服从渐近正态分布N(0,1/n)且(|φk|>2/n1/2)的个数≤4.5%,即平稳时间序列的偏相关系数φk为p步截尾,自相关系数rk逐步衰减而不截尾,则序列是AR(p)模型。用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。平稳条件:一阶-|φ1|<1。二阶-φ1+φ2<1、φ1-φ2<1、|φ2|<1。φ越大,自回归过程的波动影响越持久. 一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)
6移动平均MA(Q)模型
yt=εt-θ1εt-1-θ2εt-2-……-θqεt-q或平稳称为MA(q)序列
用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。参数θ取值对时间序列的影响没有AR模型中参数p的影响强烈,即这里较大的随机变化不会改变时间序列的方向. 识别条件:当k>q时,有自相关系数rk=0或自相关系数rk服从N(0,1/n(1+2∑r2i)1/2)且(|rk|>2/n1/2(1+2∑r2i)1/2)的个数≤4.5%,即平稳时间序列的自相关系数rk为q步截尾,偏相关系数φk逐步衰减而不截尾,则序列是MA(q)模型。一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0)。可逆条件: 一阶:|θ1|<1。二阶:|θ2|<1、θ1+θ2<1。当满足可逆条件时,MA(q)模型可以转换为AR(p)模型.
7 混合自回归移动平均ARMA(P,Q)模型
yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt-θ1εt-1-θ2εt-2-……-θpεt-q ;p和q是模型的自回归阶数和移动平均阶数;φ和θ是不为零的待定系数;
识别条件:平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,但较快收敛到0,则该时间序列可能是ARMA(p,q)模型。实际问题中,多数要用此模型。因此建模解模的主要工作是求解p、q和φ、θ的值,
8 差分自回归移动平均ARIMA(P,D,Q)模型,
识别条件:模型识别平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,且缓慢衰减收敛; 模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中d一般不超过2。若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q)模型。
思想: (1) 对数据进行适当次差分;(2) 拟合成ARMA(p,q)模型. 一般
用有限较少数据, 难于区分ARMA(p,q)与ARIMA(p,1,q)模型.用600个数据难分,6000个才较明显
3. 一般要求时间序列样本数据n>50,滞后周期k<n/4
4. 从图中看出;样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列基本是平稳的
版本2
1前提和伪回归
传统计量经济学模型的假定条件:序列的平稳性、正态性。 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。造成“伪回归”的根本原因在于时序序列变量的非平稳性
2 平稳性
基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动,或虽有波动,但并不存在某种规律,而其波动可以看成是随机的。非平稳性时间序列可以通过一次或多次差分的方式变成平稳性时间序列。
是指时间序列的统计规律不会随着时间的推移而发生变化。弱平稳是指随机过程的期望、方差和协方差不随时间推移而变化。
概率分布函数不随时间的平移而变化:P(Y1,Y2,… …,Yt)=P(Y1+m,Y2+m,…,Yt+m)
期望值、方差和自协方差是不依赖于时间的常数:E(Yt)=E(Yt+m);
Var(Yt)= Var(Y t+m);Cov(Yt,Y t+k)= Cov(Y t+m,Y t+m+k)
• 随机性时间序列模型是以时间序列的平稳性为基础建立的
严平稳:如果对 t1,t2,…,tn,h∈T和任意整数n,都使(yt1,yt2…,ytn)与(yt1+h,yt2+h,…,ytn+h)同分布,则概率空间(W,F,P)上随机过程{y(t),t∈T}称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。
宽平稳:宽平稳是指随机过程的均值函数、方差函数均为常数,自协方差函数仅是时间间隔的函数。
3非平稳性
是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。
非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。
具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。
异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。
具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。
非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。
4事先剔除序列趋势性再识别序列的季节性
实际问题中,常会遇到季节性和趋势性同时存在的情况,这时必须事先剔除序列趋势性再用上述方法识别序列的季节性,否则季节性会被强趋势性所掩盖,以至判断错误.
5包含季节性的时间序列也不能直接建立ARMA模型
需进行季节差分消除序列的季节性,差分步长应与季节周期一致.
5截尾 拖尾
6模型识别
6 长期趋势分析 简单平均法、移动平均法、指数平滑法、趋势方程法(趋势线配合法)
6.1简单平均法 (SIMPLE AVERAGE)
适合对较为平稳的时间序列进行预测,即当时间序列没有明显变动趋势时用该方法比较好。如果时间序列有明显变动趋势或有季节变动影响时该方法预测不够准确,此方法将远期数值和近期数值在预测未来中的作用同等看待
6.2移动平均法(MOVING AVERAGE METHOD)
(1)简单移动平均法(simple moving average)
预测误差用均方误差(MSE) 来衡量(两个公式)
m为趋势方程中未知常数的个数
主要适合对较为平稳的时间序列进行预测,关键是确定合理的移动间隔长度,选择一个使均方误差达到最小的移动步长,如果现象的发展具有周期性,应以周期长度作为移动间隔的长度,如对月份资料应采用12项移动平均,对季度资料应采用4项移动平均,可以消除变动周期的影响。
(2)易受异常数据的影响,为避免这种情况,可以用中位数来代替平均数,这就是移动中位数法。此方法不适合于预测。
移动平均后的趋势值应放在各移动项的中间位置。如3项移动平均的趋势值应放在第2项对应的位置上,5项移动平均的趋势值应放在第3项对应的位置上,其余类推。
(3)加权移动平均法(weighted moving average)
对近期的观察值和远期的观察值赋予不同的权数后再进行预测,
当时间序列的波动较大时,最近期的观察值应赋予最大的权数,较远的时期的观察值赋予的权数依次递减;当时间序列的波动不是很大时,对各期的观察值应赋予近似相等的权数。所选择的各期的权数之和必须等于1。用均方误差来测度预测精度,选择一个均方误差最小的移动间隔和权数的组合
6.3趋势方程法(趋势线配合法)
1.散点图法:以时间t为横轴,以时间序列观察值Y为纵轴,绘出散点图,根据散点的分布形态来选择趋势方程。
2.数据特征法:计算出时间序列某些动态分析特征值,如增长量、增长率等,根据这些特征值选择合适的模型。
估计方程中的参数,如常用的最小二乘法,最后依据方程计算趋势值及预测值。
指数曲线exponential curve a、b为未知常数
若b>1,变动率随着时间t的增加而增加;b<1,变动率随着时间t的增加而降低
若a>0,b<1,趋势值逐渐降低到以0为极限
6.4指数平滑预测
一次指数平滑法也可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势。
n 指数平滑法的主要优点
n 按“近大远小”原则给各期观测值赋予了不同的权数,既充分利用了以前各期观测值的信息,又突出了近期数据的影响,能够及时跟踪反映现象的最新变化。
n 它采用递推公式,更便于连续计算,因为实际计算时不必保留以前全部信息,只需上期的平滑值和最新的观测值两项数据即可。
n 其权数确定也较为简便,只需确定最新一期数据的权数,其他各项观测值的权数可自动生成。
平滑系数α的选择-α的选择是指数平滑法的关键,一般可从以下几个方面来考虑:
n (1)如果认为时间序列中随机波动成份较大,为了尽可能消除随机波动的影响,可选择较小的α;反之,若认为随机波动成份较小,为了及时跟踪现象的变化,突出最新数据的信息,可选择较大的α。
n (2)如果现象趋势的变化很平缓,可选择较小的α;如果现象趋势的变化比较剧烈,例如呈阶梯式特征,应选择较大的α。
n (3)通过大小不同的α值进行试算,使得预测误差最小的α值就是最合适的平滑系数。
n 由于指数平滑法要求数据中不能存在缺失值,因此在用SPSS进行指数平滑法分析前,应对数据序列进行缺失值填补。
n 单击Parameters按钮进行模型参数设置,在Initial Values框中选择初始值的方式,其中Automatic表示系统自动设置,Custom表示用户手工设置。
n ·在General(Alpha)框中设置简单指数平滑模型的常数α。可直接输入α的值,也可设定初值和终值以及步长,这样SPSS会通过格点法对多个值逐个建模,得到最优模型;
n 当只有少数观测值时这种方法是有效的。
n ·在General(Alpha)和Trend(Gamma)框中设置Holt双参数模型当中的普通、趋势平滑常数α,γ;
n ·在General(Alpha)、Trend(Gamma)、Seasonal(Delta)框中设置温特模型中的普通、趋势和季节平滑参数α,γ,β;
n ·选择Display only 10 best models for grid search选项表示:在平滑常数的格点选择完成后仅显示最佳的10个模型。不选择该选项,则每个格点处常数值对应的模型都会被输出。
6.4.1 (一次)简单指数平滑模型(适用于比较平稳的序列)适用于序列值在一个常数均值上下随机波动的情况,无趋势及季节要素。YT 平滑后的序列 计算公式如下
a 为平滑因子。a 越小, 越平缓,重复迭代,可得到
一般而言,当时间序列有较大的随机波动时,宜选较大的a,以便能很快跟上近期的变化;当时间序列比较平稳时,宜选较小的a
Bowermen和O’Connell(1979)建议 a 值在0.01到0.03之间较好。也可以让EViews估计使一步预测误差平方和最小的 a 值。注意:阻尼系数=1- a )
首先建立简单指数平滑模型。对平滑参数的选择采用格点(Grid Search)方法,以找出相对最优模型;对于初始值选择自动选择(Automatic)。
6.4.2 双指数平滑(一个参数)
适用于有线性趋势的序列。
6.4.3霍特二次平滑模型(适用于有线性趋势的序列)HOLT-WINTERS — 无季节趋势(两个参数)
这种方法适用于具有线性时间趋势无季节变差的情形。
其中: a 表示截距;b表示斜率, 即趋势。
6.4.4 温特线性和季节性指数平滑模型(适用于同时具有趋势性和季节性的序列)4.HOLT-WINTER加法模型(三个参数)
at 表示截距,bt 表示斜率, at + bt k 表示趋势,St 为加法模型的季节因子,s 表示季节周期长度,月度数据 s =12,季度数据 s = 4。预测值由下式计算
ST+k-s 用样本数据最后一年的季节因子,T 是估计样本的期末值。
同样用格点法选择参数。
n ·模型四:自定义三次指数平滑模型(适用于有非线性趋势的序列)
7 季节变动分析——季节指数分析法
7.1 按月(季)平均法
季节指数分析法是对时间序列计算12个月度季节指数或4个季度季节指数,并根据各季节指数与其平均数的偏差程度来确定时间序列的季节影响程度。
按月(季)平均法计算季节指数的步骤:对含有若干个季节变动周期的时间序列数据计算历年同月(季)平均数(以消除随机波动的影响);计算全部数据总月(季)平均数(其不包含季节变动影响);将各同月(季)平均数与总月(季)平均数对比求出各月(季)季节指数(S)。其公式为:
7.2 趋势剔除法
采用按月(季)平均法计算的季节指数没有剔除时间序列中长期趋势的影响,因此适用于时间序列中长期趋势影响不大的情况,若时间序列存在明显的长期趋势则该方法计算的季节指数不够准确。
趋势剔除法是先将时间序列中长期趋势予以剔除再计算季节指数。其中长期趋势值可采用移动平均法求得,也可采用最小二乘法求得。利用前者分析季节变动又称为移动平均趋势剔除法。采用移动平均趋势剔除法分析季节变动时,假定时间序列一年以上周期性波动不明显,各构成要素(长期趋势T季节变动S不规则波动I)分解模型为Y=T×S×I,假定各年度不规则波动I彼此独立。
移动平均趋势剔除法计算季节指数的步骤:1.计算移动平均趋势值T(季度数据采用4项移动平均,月份数据采用12项移动平均),并将其结果进行“中心化”处理,即将移动平均的结果再进行一次2项移动平均得出“中心化移动平均值”; 2.计算季节指数:将各观察值Y除以相应的趋势值T(Y/T=S×I)剔除长期趋势影响,再计算各比值Y/T的同月(季)平均数消除不规则波动I影响,并将同月(季)平均数除以总平均数得季节指数S;3.季节指数调整。各季节指数的平均数应等于1或100%。若上一步计算的季节指数的平均值不等于1则需进行调整,方法是将每个季节指数除以它们的总平均值。
7.3 分离季节因素
测定季节变动的目的之一是将季节性因素从时间序列中分离出去,以便观察和分析时间序列的其他特征。
方法是将原时间序列除以相应的季节指数:
结果即为季节因素分离后的序列,它反映了在没有季节因素影响的情况下时间序列的变化形态。
8循环波动和随机波动分析
循环波动由于时间长短和波动大小不一,且常与不规则波动交织在一起,因而很难单独描述和分析。通常是从时间序列中剔除趋势变动、季节变动和不规则变动,所剩结果即为循环波动然后再将结果进行平滑(移动平均),—剩余法。
9 自回归法
利用简单回归分析法进行时间序列分析时,模型要求各期的随机误差项之间是不相关的。在前文的平稳随机过程的定义中也介绍过,只有误差项中不存在任何可利用的信息时,才能够认为模型已经达到了最优。而当误差项之间存在相关性时,一方面常用的估计方法不再具有优良性,普通的简单回归模型存在着较大的缺陷;另一方面也说明模型对序列中的信息没有充分地提取。
版本3
1白噪声序列
是一种特殊的平稳序列。它定义为若随机序列{yt}由互不相关的随机变量构成,即对所有s≠t,Cov(ys,yt)=0,则称其为白噪声序列。白噪声序列是一种平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着人们无法根据其过去的特点推测其未来的走向,其变化没有规律可循。当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。
2互相关图
对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性
3相关图
在Standard Error Method框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。其中Independence model表示假设序列是白噪声的过程;Bartlett’s approximation表示,根据Bartlett给出的估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合当序列是一个k-1阶的移动平均过程,且标准差随阶数的增大而增大的情况。
4预处理
预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。
序列的预处理主要包括以下几个方面:
·序列缺失数据的处理
·序列数据的变换处理
主要包括序列的平稳化处理和序列的平滑处理等。均值平稳化一般采用差分(Difference)处理,方差平稳化一般用Box-Cox变换处理。
差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。季节差分(Seasonal difference)就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。时间序列的平滑处理目的是为了消除序列中随机波动性影响。
平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。
·中心移动平均法(Centered moving average)
计算以当前为中心的时间跨度k范围内数据的移动平均数。
·向前移动平均法(Prior moving average)
若指定时间跨度为k,则用当前值前面k个数据(注意:不包括当前值)的平均值代替当前值。
·移动中位数(Runing medians)
它以当前时间点为中心,根据指定的时间跨度k计算中位数。
5 ARIMA
ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通过变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合ARIMA模型。ARIMA模型又分为ARIMA(p,d,q)模型和ARIMA(p,d,q)(P,D,Q)s模型。
·ARIMA(p,d,q)模型
当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应的分析模型被概括为ARIMA(p,d,q),其中,d表示平稳化过程中差分的阶数。
·ARIMA(p,d,q)(P,D,Q)s模型
当序列中同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需要经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为ARIMA(p,d,q)(P,D,Q)s模型,其中,P,Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。
6 序列存在单位根,是非平稳序列。
7 协整
包含非平稳变量的均衡系统,必然意味着这些非平稳变量的某种组合是平稳的”
这正是协整理论的思想。
所谓协整,是指多个非平稳变量的某种线性组合是平稳的。
版本4
1 4种变动要素
长期趋势要素T、循环要素C、季节变动要素S 和不规则要素I。
长期趋势要素 (T ): 代表经济时间序列长期的趋势特性。
循环要素 (C ): 是以数年为周期的一种周期性变动。
季节要素 (S ): 是每年重复出现的循环变动,以12个月或4个季度为周期的周期性影响,由温度、降雨、每年中的假期和政策等因素引起。季节要素和循环要素的区别在于季节变动是固定间距(如季或月)中的自我循环,而循环要素是从一个周期变动到另一个周期,间距比较长且不固定的一种周期性波动。
不规则要素 (I ): 又称随机因子、残余变动或噪声,其变动无规则可循,这类因素是由偶然发生的事件引起的,如罢工、意外事故、地震、水灾、恶劣气候、战争、法令更改和预测误差等。
2 季节调整方法
X-11方法是基于移动平均法的季节调整方法。在计算过程中可根据数据中的随机因素大小,采用不同长度的移动平均,随机因素越大,移动平均长度越大。X-11方法是通过几次迭代来进行分解的,每一次对组成因子的估算都进一步精化。目前普遍使用的季节调整方法。X-11法与移动平均法的最大不同是:X-11法中季节因子年与年有可能不同,而在移动平均法中,季节因子被假设为是一样的。
X12季节调整方法的核心算法是扩展的X11季节调整程序。共包括4种季节调整的分解形式:乘法、加法、伪加法和对数加法模型。注意采用乘法、伪加法和对数加法模型进行季节调整时,时间序列中不允许有零和负数。
① 加法模型
② 乘法模型:
③ 对数加法模型:
④ 伪加法模型:
把Yt 分解为趋势循环项TCt 、季节项St 和不规则要素It 。
X12方法是基于移动平均法的季节调整方法。X12允许在季节调整前对被调整序列建立一个合适的ARIMA模型。
3 趋势分解将趋势和循环要素进行分解
测定长期趋势有多种方法,比较常用的方法有回归分析方法、移动平均法、阶段平均法(phase average,PA方法)、HP滤波方法和频谱滤波方法(frequency (band-pass) filer, BP滤波)
4 HODRICK-PRESCOTT滤波
是被广泛使用的一种方法:设{Yt}是包含趋势成分和波动成分的经济时间序列,{YtT}是其中含有的趋势成分, {YtC}是其中含有的波动成分。则
计算HP滤波就是从{Yt}中将{YtT} 分离出来
l = 0 时,满足最小化问题的趋势等于序列{Yt};l 增加时,估计趋势中的变化总数相对于序列中的变化减少,即 l 越大,估计趋势越光滑;l 趋于无穷大时,估计趋势将接近线性函数。一般经验地, l 的取值如下:
版本 5
1 时间序列分解法——基于乘积模型的时间序列分解
Yt = T×S×C×I
第一步:消除时间序列中的季节因素和不规则因素——采用移动平均法
计算移动平均值的时期等于季节波动的周期长度
用移动平均法计算的结果是只包含长期趋势因素T和循环波动因素C的时间序列,即:
Mt = T×C
第二步:计算只反映季节波动的季节指数(Seasonal indices)
用移动平均值去除原时间序列中对应时期的实际值,得到只包含季节波动和不规则波动的时间序列,即:
S×I 通常是围绕1随机波动的值,某个时期的值大于1,则该时期的季节波动大于平均水平。
季节指数是通过对时间序列 S×I 计算平均值得到的,即:
第三步:把长期趋势因素与循环因素分开
识别长期趋势变动的类型,建立相应的确定性时间序列模型
例如,时间序列的长期趋势可以用下列模型表示
Yt = b0 + b1t + ε t
用最小二乘法估计出模型中参数b0 和 b1,则长期趋势值可以用下式计算:
反映循环因素波动的循环指数可以用下式计算
2 间序列建摸
2.1时间序列建摸的两种基本假设
确定性时间序列模型假设:时间序列是由一个确定性过程产生的,这个确定性过程往往可以用时间 t 的函数f(t)来表示,时间序列中的每一个观测值是由这个确定性过程和随机因素决定的
随机性时间序列模型假设:经济变量的变化过程是一个随机过程,时间序列是由该随机过程产生的一个样本。因此,时间序列具有随机性质,可以表示成随机项的线性组合,即可以用分析随机过程的方法建立时间序列模型
2.2 确定性时间序列模型
一般形式
Yt = f(t) + ε t
常数模型
线性趋势模型
非线性趋势模型
二次趋势模型,描述抛物线型趋势变化
判定某时间序列是否含有抛物线趋势时,可利用差分法:
当t以一个常数变化时,Y的一阶差分,即:
△Y = Yt-Yt-1 的绝对值也接近一个常数时,该时间序列含有线形趋势
当t以一个常数变化时,Y的二阶差分,即:
△2Yt= △Yt- △Yt-1的绝对值接近一个常数时,该时间序列含有抛物线趋势。
指数模型,描述指数增长趋势变化
逻辑增长曲线模型:
也称S函数曲线(逻辑曲线)模型
• K、a、b 为未知常数
• K > 0,a > 0,0 < b ≠1
该曲线的特点是某变量刚开始时,随着t的增加,y的增长速度逐渐增加,当y达到一定水平时,其增长速度又放慢,最后超近于 一条渐近线
该方程经常用来描述某消费品的生命周期的变化,可将其分为四个阶段,即缓慢增长→快速增长→增速放慢→相对饱和
龚珀兹增长曲线模型:Gompertz curve
描述的现象:初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线,两端都有渐近线,上渐近线为Y®K,下渐近线为Y=® 0
季节性模型
时间序列的构成要素与模型
2.3随机性时间序列模型
模型的性质:
把时间序列数据作为随机过程产生的样本来分析:多数影响时间序列的因素具有随机性质,因此时间序列的变动具有随机性质
平稳性时间序列
非平稳性时间序列
利用时间序列的自相关关系建立模型
通过反复实验确定时间序列的最佳模型
时间序列的分类:
随机性时间序列模型的特点:
利用时间序列中的自相关关系进行分析和建摸
时间序列的自相关关系是指时间序列在不同时期观测值之间的相关关系
许多因素产生的影响不是瞬间的,而是持续几个时期或更长时间,因此时间序列在不同时期的值往往存在较强的相关关系
用自相关函数和偏自相关函数衡量时间序列中的自相关关系s
3 自相关函数
对于平稳随机过程,滞后期为 K 的自相关函数定义为滞后期为 K 的自协方差与方差之比
样本自相关函数
平稳性时间序列的样本自相关函数值随滞后期的延长很快趋近于零
可以较好描述季节性变动或其他周期性波动的规律: 如果季节变化的周期是 12 期,观测值 Yt 与 Yt+12,Yt+24,Yt+36之间存在较强自相关关系;因此,当 K=12,24,36,48,……时,样本自相关函数值在绝对值上大于它周围的值
4 时间序列最佳模型的确定步骤
5模型的识别
5 自协方差函数和自相关函数
自协方差
方差
样本自协方差函数
自相关函数
样本自相关函数
6 偏自相关函数
设{zt}为零均值平稳序列, zt+1 , zt+2,…, zt+k-1对zt 和zt+k 的线性估计为:
φkk表示偏自相关函数,则:
pacf的推导
7 线性平稳时间序列模型
1 自回归过程(A R (P))
2 滑动平均模型(MA(Q))
形如zt=at-q1at-1- q2at-2 -…- qqat-q模型为滑动平均模型,其中,简化形式zt=q(B)at
q(B)= 1-q1B- q2B2 -…- qqBq,满足q(B)= 0的根在单位圆外,即׀B׀>1,此时该过程是可逆的。
3 自回归滑动平均模型(AR M A (P, Q))
AR(p)
MA(q)
ARMA(p,q)
模型方程
j(B)=at
zt=q(B)at
j(B)zt= q(B) at
平稳性条件
j(B)=0的根在单位圆外
无
j(B)=0的根在单位圆外
可逆性条件
无
q(B)=0的根在单位圆外
q(B)=0的根在单位圆外
自相关函数
拖尾
Q步截尾
拖尾
偏自相关函数
P步截尾
拖尾
拖尾
版本6 平稳时间序列模型的建立
1 模型识别
1、含义:对一个观察序列,选择一个与其实际过程相吻合的模型结构。
2、方法:利用序列的acf、pacf识别。判断截尾、拖尾的主观性较大,只是初步识别。
2 模型定阶
(一)A C F、P A C F方法
(1)M A (q):
Bartlett公式:当k>q时,N充分大,
(2)AR(P)
(二)残差方差图:
(1)残差:在多元回归y=a1x1+ a2x2+….+ an x n +at,存在自变量x的选择问题。如果x选择不够,模型拟合不足,表现为y与ŷ 差异较大;若x选择多,则过度拟合,y与ŷ差异减小速度很慢。
将(y- ŷ)称为残差,多元回归就是利用此确定模型的自变量,即新增或减少变量是否会显著影响残差。
(2)将该思想应用到时间序列模型定阶上。
(3)利用sa2的变化规律,确定模型阶数。
随着模型阶数的增大,分母减小;
分子在不足拟合时,一直减小,速度较快;过拟合时,分子虽减小,但速度很慢,几乎不变。
sa2取决于分子、分母减小的速度。
在不足拟合时, sa2一直减小;过拟合时,sa2却增大。
选择sa2的最低点为模型的最优阶数。
(三)F 检验定阶法:
(1)F分布:
(2)用F分布检验两个回归模型是否有显著差异。
(3)对于ARMA(p,q)模型定阶
例如:在ARMA(p,q)和ARMA(p-1,q-1)选择。
(四)最佳准则函数定阶法
1、基本思想:确定一个函数,该函数既要考虑用某一模型拟合原始数据的接近程度,同时又考虑模型中所含参数的个数。当该函数取最小值时,就是最合适的阶数。
衡量模型拟合数据的接近程度的指标是残差方差。残差方差=
2、最佳准则函数包括FPE、AIC、BIC准则。
3、AIC准则
(1)该准则既适合于AR,也适合于ARMA模型。
3 ARIMA模型建模
ARIMA(p,d,q)模型的一般表示方法为:
4 季节时间序列模型
展开阅读全文