资源描述
自相关函数与偏自相关函数
上一节介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。
1、自相关函数定义
在给出自相关函数定义之前先介绍自协方差函数概念。由第一节知随机过程{}中的每一个元素,t = 1, 2, … 都是随机变量。对于平稳的随机过程,其期望为常数,用表示,即
,
随机过程的取值将以 m 为中心上下变动。平稳随机过程的方差也是一个常量
,
用来度量随机过程取值对其均值的离散程度。
相隔k期的两个随机变量与的协方差即滞后k期的自协方差,定义为:
自协方差序列:,
称为随机过程{}的自协方差函数。当k = 0 时,。
自相关系数定义:
因为对于一个平稳过程有:
所以,当 k = 0 时,有。
以滞后期k为变量的自相关系数列()称为自相关函数。因为,即= ,自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。
2、自回归过程的自相关函数
(1)平稳AR(1)过程的自相关函数
AR(1) 过程:,|f1| < 1。
已知(why?)。用同乘上式两侧
上式两侧同取期望:
其中(why?)(由于xt = ut + f1 ut-1 + f12 ut-2 +… ,所以xt-k = ut-k + f1 ut-k-1 + f12 ut-k-2 +…,而ut是白噪音与其t - k期及以前各项都不相关)。
两侧同除 g0 得:
因为ro = 1,所以有()
对于平稳序列有 | f1| < 1。所以当 f1为正时,自相关函数按指数衰减至零;当 f1为负时,自相关函数正负交错地指数衰减至零。见下图。因为对于经济时间序列,f1一般为正,所以第一种情形常见。指数衰减至零的表现形式说明随着时间间隔的加长,变量之间的关系变得越来越弱。
1> f1 > 0 -1<f1 < 0
图 AR(1) 过程的自相关函数
同理,对于f1 =1和f1 >1情形即非平稳和强非平稳过程的自相关函数如下图。
f1 = 1.1(强非平稳过程) f1 = 1(随机游走过程)
(2)AR(p) 过程的自相关函数
用(k > 0) 同乘平稳的 p阶自回归过程
的两侧,得:
对上式两侧分别求期望得:,k > 0
用 g0分别除上式的两侧得Yule-Walker方程:
rk = f1 rk -1 + f2 rk -2 + … + fp rk -p , k > 0
令,其中L为k的滞后算子,这里, i = 1, 2, …, p 是特征方程的根。为保证随机过程的平稳性,要求。则:
,也即。
可证:(*)
其中Ai, i = 1, … ,p 为待定常数。(提示:可把(*)式代入到Yule-Walker方程中证明)
由(*)式知道会遇到如下几种情形。
① 当为实数时,(*)式中的将随着k 的增加而几何衰减至零,称为指数衰减。
② 当和表示一对共轭复数时,设,,= R,则, 的极座标形式是:
若AR(p) 过程平稳,则,所以必有R <1。那么随着k的增加,
自相关函数(*)式中的相应项, 将按正弦振荡形式衰减。
注意:实际中的平稳自回归过程的自相关函数常是由指数衰减和正弦衰减两部分混合而成。
③ 从(*)式可以看出,当特征方程的根取值远离单位圆时,k不必很大,自相关函数就会衰减至零。
④ 有一个实数根接近1时,自相关函数将衰减的很慢,近似于线性衰减。当有两个以上的根取值接近1时,自相关函数同样会衰减的很慢。
两个特征根为实根 两个特征根为共轭复根图
AR(2) 过程的自相关函数
3、移动平均过程的自相关函数
(1)MA(1) 过程的自相关函数。
对于MA(1)过程,有:
当k = 0时,
当k = 1时,
当 k > 1 时,
综合以上三种情形,MA(1)过程自相关函数为
rk = =
q1 > 0 q1 < 0
图 MA(1)过程的自相关函数
可见MA(1) 过程的自相关函数具有截尾特征。当k > 1时,rk = 0。
(2) MA(q) 过程的自相关函数
MA(q) 过程的自相关函数是
rk =
当k > q 时,rk = 0,说明 rk , k = 0, 1, … 具有截尾特征。
例如,对于MA(2) 过程,自相关函数是
r1=, r2=, rk = 0, k > 2。
4、 ARMA (1, 1) 过程的自相关函数
ARMA (1, 1) 过程的自相关函数rk 从 r1开始指数衰减。r1的大小取决于 f1和 q1, r1的符号取决于 (f1 -q1 )。若 f1 > 0,指数衰减是平滑的,或正或负。若 f1 < 0,相关函数为正负交替式指数衰减。
对于ARMA (p, q) 过程,p, q ³ 2时,自相关函数的表现形式比较复杂,可能是指数衰减、正弦衰减或二者的混合衰减。
5、相关图(correlogram,或估计的自相关函数,样本自相关函数)
对于一个有限时间序列(x1, x2, …, xT)用样本平均数
=
估计总体均值 m,用样本方差
s2 =
估计总体方差sx2。
当用样本矩估计随机过程的自相关函数,则称其为相关图或估计的自相关函数,记为
rk =, k = 0, 1 , 2, …, K, ( K < T ) .
rk 是对rk的估计。其中
Ck = k = 0, 1, 2, …, K ,
是对gk 的估计。
C0 =
是对g0的估计。T是时间序列数据的样本容量。实际中T不应太小,最好能大于60。
注意:Ck为有偏估计量。但在小样本条件下更有效。
相关图是对自相关函数的估计。由于MA过程和ARMA过程中的MA分量的自相关函数具有截尾特性,所以通过相关图可以估计MA过程的阶数q。相关图是识别MA过程阶数和ARMA过程中MA分量阶数的一个重要方法。对于年度时间序列数据,相关图一般取k = 15就足够了。
的方差近似为。所以在观察相关图时,若的绝对值超过2(2个标准差),就被认为是显著地不为零。当T充分大时,近似有:=~ N (0, 1)
第五节 偏自相关函数
偏自相关函数是描述随机过程结构特征的另一种方法。用 fkj 表示k阶自回归过程中第j个回归系数,则k阶自回归模型表示为:
其中是最后一个回归系数。若把看作是滞后期k的函数,则称
,
为偏自相关函数。它由下式中的红项组成。
因偏自相关函数中每一个回归系数恰好表示与在排除了其中间变量,,, 影响之后的相关系数,
所以偏自相关函数由此得名。
用表达Yule-Walker方程,得
用矩阵形式表示上式,
=
或
r = P f.
则
f = P -1r,
将k = 1, 2 , … 代入上式连续求解,可求得偏自相关函数
f 11 = r1,
===
其中
f 22 =
…
对于AR(1)过程,= f11 xt-1 +,当k = 1时,f11 ¹ 0;当k > 1时,。所以AR(1)过程的偏自相关函数特征是在k = 1出现峰值(f11 = r1)然后截尾。
f11 > 0 f11 < 0
AR(1) 过程的偏相关图
对于AR(2)过程,当k £ 2时,;当k >2时,。偏自相关函数在滞后期2以后有截尾特性。
对于AR(p)过程,当k £ p时,;当k > p时,。偏自相关函数在滞后期p以后有截尾特性,因此可用此特征识别AR(p)过程的阶数。
对于MA(1)过程=+ q1 ut-1,有 [1/ (1+ q1 L)]=,
(1- q1 L + q12 L2 - … )=,
= q1 x t-1 - q12 x t-2 +q13 x t-3 - … +
当q1 > 0时,自回归系数的符号是正负交替的;当q1 < 0时,自回归系数的符号全是负的。
因为MA(1) 过程可以转换为无限阶的AR过程,所以MA(1) 过程的偏自相关函数呈指数衰减特征。
q1 > 0 q1 < 0
MA(1) 过程的偏自相关函数
对于MA(2) 过程,若Q (L) = 0的根是实数,偏自相关函数由两个指数衰减形式叠加而成。若Q (L) = 0的根是复数,偏自相关函数呈正弦衰减形式。
因为任何一个可逆的MA(q) 过程都可以转换成一个无限阶的系数按几何递减的AR过程,所以MA(q) 过程的偏自相关函数呈缓慢衰减特征。
ARMA( p, q) 过程的偏自相关函数也是无限延长的,其表现形式与MA(q)过程的偏自相关函数相类似。根据模型中移动平均部分的阶数q以及参数qi的不同,偏自相关函数呈指数衰减和(或)正弦衰减混合形式。
对于时间序列数据,偏自相关函数通常是未知的。可以用样本计算 f11, f22, … 的估计量 , , …。估计的偏自相关函数
, k = 1, 2, …, K,
称为偏相关图。因为AR过程和ARMA过程中AR分量的偏自相关函数具有截尾特性,所以可利用偏相关图估计自回归过程的阶数p。实际中对于偏相关图取k = 15就足可以了。
的方差近似为T-1。当T充分大时,近似有
(- 0) / T-1/2 = T1/2 ~ N (0, 1)
所以在观察偏相关图时,若的绝对值超过2 T-1/2(2个标准差),就被认为是显著地不为零。
注:2个标准差 = 2 T -1/2 = 2(1/7)= 0.286。图中虚线表示到中心线2个标准差宽度。
补充知识:检验过程是否为白噪声的Q统计量
在介绍Q统计量之前,先介绍序列yt的估计的自相关函数(相关图)的定义,
rk =, k = 1, 2, ….
其中rk表示yt与yt-k估计的自相关系数,是对自相关系数rk的估计。
定义= (S)/ (T-k),= (Syt)/ T。
模型残差序列是否为白噪声的检验是用Box-Pierce (1970) 提出的Q统计量完成的。Q检验的零假设是
H:r1 = r2 = … = rK = 0
即序列是一个白噪声过程。其中ri表示自相关系数。Q统计量定义为
Q = T (是用残差序列计算的自相关系数的估计值)
随着T®¥,Q渐近服从分布,其中T表示样本容量,K表示自相关系数的个数,p 表示模型自回归部分的最大滞后值,q表示移动平均部分的最大滞后值。
Ljung和Box认为定义的Q统计量的分布与分布存在差异(相应值偏小),于是提出修正的Q统计量。
Q = T (T+2)
其中rk ,K,p,q的定义如上式。修正的Q统计量渐近服从分布。且它的近似性比原Q统计量的近似性更好。(注意:EViews中给出的Q统计量就是按修正的Q统计量定义的。)
用残差序列计算Q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则Q值将很大,反之Q值将很小。判别规则是:
若Q,则接受H0。
若Q >,则拒绝H0。
其中a 表示检验水平;p,q分别表示时间序列模型中自回归和移动平均滞后项的个数。
实际检验中,K取15左右即可。
11
展开阅读全文