1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章,自相关,1,第一节自相关定义及,D-W,检验,一,自相关的定义,当误差项不再是相互独立的,即,cov(,i,j,),0,,就产生了自相关(,Auto-correlation),也叫序列相关(,serial correlation)。,即,t,、,t-1,t-2,是,相关的。,t,、,t-k,被,称为,k,阶自相关,t,、,t-1,被称为,1,阶自相关,t,、,t-2,被称,2,为阶自相关,以此类推。,2,二自相关的检验,:,DurbinWatson Test(DW,检验),关于自相关的检验就是检验,
2、t,和,t-1,之间的相关性,需要计算它们的相关系数,。,由于,是,总体的,无法得到,因此通过回归初始模型,利用计算出的,的,估计值代替,来,进行检验,,t,和,t,1,cov(,t,t,1,),hat=_,var(,t,),var(,t,1,),3,计算,DurbinWatson,统计量,用,d,来表示:,(,t,-,t,1,),2,d=_,t,2,t,2,2,(,t,t,1,)+,t-1,2,=_,t,2,4,对于大样本来说,,t,是可以得到的,且,t,2,与,t-1,2,相差很小,可以认为它们是近似相等的,因此上式可以化简成,d,2-2,hat,因为 ,1,1,,所以,0,d4,1,时,
3、d=4,完全负相关,=1,时,d=0,完全正相关,=0,时,d=2,完全不相关,所以,经验地看,,d,值在,2,左右时是不相关的,向,0,或,4,靠近则存在正相关或负相关。,5,根据计算结果,建立,DW,检验的决策规则如下:,0,d,dL,存在一阶正相关,4,dL,d4,存在一阶负相关,du,d4-du,不存在自相关,dL,d,du,4-du,d,4-dL,无法下结论,Durbin Watson,根据,d,的,显著水平规定了上限,du,和,下限,dL,(,查表,可以得到)。,d,统计量有一个假设前提:,t,=,t-1,+,t,即误差项服从一阶自相关,6,DW,检验的局限性,只能检验一阶自相关
4、当,d,值落再,dL,d,du,4-du,d,4-dL,无法下结论;,无法检验含有滞后因变量的模型,例如:,y,t,=,+,1,y,t-1,+,2,x,t,+,t,7,例题,logy=-3.938+1.451log L+0.384logK,(0.237)(0.083)(0.048),R,2,=0.9946 DW=0.88,hat,=0.559,已知,k=2,n=40,=0.05,查表,dL,=1.39,0.880,如果估计的,d,du,则在水平,上,拒绝,H,0,;,即存在统计上显著的正相关。,2,,,H,0,:,=0,H,1,:0,如果估计的,4-,d,du,则在水平,上拒绝,H,0,;
5、即存在统计上显著的负相关。,3,,,H,0,:,=0,H,1,:,0,如果估计的,d,du,或,4-,d,du,则在水平,2,上拒绝,H,0,;,即存在统计上显著的自相关。,9,例题,已知,n=50,k=4(,没有包括常数项),,d1.43,,查表,5,dL,=1.38,du,=1.72,1.43,落在,1.38,和,1.72,之间,无法下结论,但是根据修订的,d,检验,,1.431.72,所以基本可以拒绝没有一阶自相关的假设,即存在一阶自相关。,10,此外,计算机程序,SHAZAM,会自动计算出一种精确,d,检验(,exact d test),它能算出,d,值的准确概率。,11,第二节自相
6、关的结果,自相关存在的前提下,使用最小二乘法,估计量是否依旧是最佳线性无偏估计呢?,我们来推导一下,看发生何种变化。,假设模型,y,t,=,x,t,+,t,,,t,=,t-1,+,t,,,根据最小二乘法,,hat=,x,t,y,t,/x,t,2,=,x,t,(,x,t,+,t,)/x,t,2,=,(x,t,2,+,x,t,t,)/x,t,2,=+,x,t,t,/x,t,2,E(hat)=E(+,x,t,t,/x,t,2,)=,无偏得证,12,先来求E(,t,t-S,),t,=,t-1,+,t,,,已知误差项满足古典回归的假设,E(,t,t-1,)=E,(,t-1,+,t,),t-1,=E(,t
7、1,),2,+E(,t,t-1,),2,E(,t,t-2,)=E,(,t-1,+,t,),t-2,=E(,t-1,t-2,),+E(,t,t-2,),2,2,2,以此类推,,E(,t,t-s,)=E,(,t-1,+,t,),t-s,=E(,t-1,t-s,),+E(,t,t-s,),s,2,13,Var(,hat,)=,E(x,t,t,/x,t,2,),2,=1/(x,t,2,),2,(x,t,2,)E(,t,2,)+2E(,t,t-1,),x,t,x,t-1,+2E(,t,t-2,),x,t,x,t-2,+2E(,t,t-3,),x,t,x,t-3,+,=,2,/(x,t,2,),2,(x
8、t,2,)+2,x,t,x,t-1,+,2,2,x,t,x,t-2,+2,3,x,t,x,t-3,+,14,=,2,/x,t,2,1+2,x,t,x,t-1,/x,t,2,+,2,2,x,t,x,t-2,/x,t,2,+2,3,x,t,x,t-3,/x,t,2,+,如果干扰项之间不相关,,0,估计值的方差和前面的估计是相同的。,现在假设,x,t,=rx,t-1,+v,t,对照前面的推导,可知,x,t,x,t-1,/x,t,2,r,x,t,x,t-2,/x,t,2,r,2,.,15,=,2,/x,t,2,1+2 r,+2,2,r,2,+2,3,r,3,+,=,2,/x,t,2,(1+r,)/(
9、1-r,),如果不考虑自相关,估计值的方差为,Var(,hat,Ls,)=,2,/x,t,2,=,Var(,hat,),=,2,/x,t,2,(1+r,)/(1-r,),=,Var(,hat,Ls,),(1+r,)/(1-r,),Var(,hat,Ls,)=,Var(,hat,),(1-r,)/(1+r,),16,如果,和,r,是同,号,因为它们都在,1,和,1,之间,所以,,(1-,r,)/(1+r,),就会小于,1,,也就是说直接使用最小二乘估计的方差小于真实的方差,即方差被低估,这样会导致,t,检验显著,误导人们接受估计模型。,如果,和,r,是符号相反,则,(1-,r,)/(1+r,),
10、大于,1,,估计的方差会大于真实的方差,使检验无法通过。,17,第三节自相关的处理方法,一,相关系数,已知的情况,y,t,=,+,x,t,+,t,,(1),t,=,t-1,+,t,,,t,满足古典回归的假设前提。,上述模型可以写成,:,y,t-1,=,+x,t-1,+,t-1,,(2),两边同乘以,,,变成:,y,t-1,=,+x,t-1,+,t-1,,(3),18,(1,)(,3,),y,t,y,t-1,=,(1,),+,(,x,t,x,t-1,),+,t,t-1,,(4),因为,t,t-1,t,,,所以新模型中的误差项是不相关的,满足古典回归的假设。对其进行回归即可以得到最佳无偏估计量。这
11、种方法被称为广义最小二乘法(,GLS,General Least Squares),19,方程(,4,)被称为广义的差分模型或者叫准差分模型。,特别地,当,1,时,上述模型变成:,y,t,y,t-1,=,(,x,t,x,t-1,),+,t,t-1,,,就,称为标准的一阶差分模型。,GLS,方法损失了第一组观测值,建议,使用下列方法定义第一组观测值:,x,1,*=x,1,1-,2,y1*=y,1,1-,2,20,我们把初始模型称做水平方程,经过处理的模型称为一阶差分方程(,1),差分方程和水平方程的,R,2,不能直接进行比较,因为,一阶差分方程的解释变量和被解释变量均发生了改变。,为了能够将水平
12、方程的,R,2,和一阶差分方程的,R,2,进行比较,需要对水平方程的,R,2,进行调整。,21,调整的方法如下:,1,对水平方程做回归,计算得到,RSS,记做,RSS,level,自由度为,n-k-1,2,对一阶差分方程回归,计算得到,RSS,,记做,RSS,1,,,自由度为,n-k(,因为没有常数项),将经过调整的水平方程的,R,2,记做,R,D,2,,,R,D,2,=1-(1-,R,1,2,)*(,RSS,level,/RSS,1,)*,(n-k-1/n-k)*,d,level,22,例题,logy,t,=-3.938+1.451log L+0.384logK,(0.237)(0.083)
13、0.048),R,2,=0.9946 DW=0.858 RSS=0.0434,logy,t,=0.984,logL,+0.502logk,R,1,2,=0.8405 DW=1.177 RSS=0.0278,R,D,level,2,=,1-(1-0.8405)(0.0434/0.0278)(36/37)0.858,=0.7921,R,D,level,2,R,1,2,23,此外,哈韦(,Harvey),给出下面的定义:,R,D,level,2,1RSS,0,/RSS,1,(1-,R,1,2,),不考虑自由度和方差的调整。,同样是上面的例题,R,D,level,2,1-0.0434/0.0278(
14、1-0.8405),=0.7510,24,二,,未知时的处理方法。,首先要寻找并确定,。,有,两类方法,第一,循环查找法,1,,科克伦欧卡特方法(,Cochran-,Orucutt,Procedure),第一步,估计模型,y,t,=,+,x,t,+,t,,,得到,t,和,RSS,定义,RSSRSS,旧,25,计算,(,t,t,1,),hat,=_,t,2,第二步,估计模型,y,t,y,t-1,=,(1,),+,(,x,t,x,t-1,),+,t,t-1,,,26,得到,和,的估计值,利用新得到的,和,的估计值,代入步骤(,1,)中,即初始模型,计算,RSS,,将其记做,RSS,新,第三步,判断
15、RSS,新,-,RSS,旧),/,RSS,旧,|0.05,hat,就是所估计的值。,否则:将,RSS,新等同于,RSS,旧,利用第二步得到的,和,的估计值计算,t,,,在,计算出,hat,,,重复步骤,2,以下程序,直到两个残差平方和满足步骤,3,中的条件,小于,0.05,为止。一般迭代三到四步就可以满足条件。,此时,*/(1,hat),hat=hat*,*、,hat*,是差分方程中的参数估计值。,27,2,,Durbin,方法,第一步,估计模型:,y,t,=,(1-,)+,y,t-1,+,x,t,-,x,t-1,+,v,t,=,计算得到,RSS,记做,RSS,旧,,y,t-1,前面
16、的估计值就是,hat,。,第二步,已知了,hat,,,估计下列模型,y,t,hat,y,t-1,=,(1,hat,),+,(,x,t,hat x,t-1,),+,v,t,,,得到,和,的估计值,利用得到的,和,的估计值,代入步骤(,1,)中,计算,RSS,,将其记做,RSS,新,第三步,如果,|,(,RSS,新,-,RSS,旧),/,RSS|0.05,hat,就是所估计的值。,28,此时,*/(1,hat),hat=hat*,*、,hat*,是差分方程中的参数估计值。,否则将步骤,2,中的,和,的估计值代入步骤,1,的模型估计出,RSS,,重复,2,、,3,步骤,直到满足条件为止。,由于,Du
17、rbin,的方法中包含了滞后变量,y,t-1,所以该方法并不常用。,29,第二,灰色查找法具体步骤如下:,1,,在,1,1,范围内,每间隔,0.1,选一个,;,如,-1,,-0.9,0.8,,0.7,,0.9,,1,2,,每取一个,值,都,做,如下回归:,y,t,y,t-1,=,(1,),+,(,x,t,x,t-1,),+,v,t,,,计算出所有的,RSS;,3,,选择使,RSS,最小的,作为估计值。,30,如果出现两个,值,计算的,RSS,相同,并,且都是最小的,例如,0.8,和,0.7,,这时就把这个区间再按,0.01,的间隔划,分,例如令,0.71,,0.72,重复,步骤,2,,直到找到
18、使,RSS,最小的,。,31,Cochrane-,Orcutt,方法举例,根据日本,1970,1994,年间,工薪家庭的实际消费支出,Y,和实际可支配收入,X,的变化数据为:,年份,Y X,年份,Y X,1970 239 300 1978 285 370,1971 248 311 1979 293 378,1972 258 329 1980 291 374,1973 272 351 1981 294 371,1974 268 354 1982 302 381,1975 280 364 1983 304 384,1976 279 360 1984 308 392,1977 282 366 198
19、5 310 400,32,年份,Y X,1986 312 403,1987 314 411,1988 324 428,1989 326 434,1990 332 441,1991 334 449,1992 336 451,1993 334 449,1994 330 449,33,X,t,=9700 ,Y,t,=7455 ,X,t,Y,t,=2921268 X,t,2,=3808668 Y,t,2,=2241861,估计的结果如下:,Yt,=50.875+0.63744Xt,t (6.136)(30.008),R,2,=0.9751,t,2,=467.717,34,列表计算,DW,值,年份,t,
20、t,-,t-1,t,2,(,t,-,t-1,),2,1970-3.1056 -9.6445 -,1971-1.1174 1.9882 1.2485 3.9529,1972-2.5912 -1.4739 6.7145 2.1723,1973-2.6148 -0.0236 6.8374 0.0006,1974-8.5272 -5.9123 72.7123 34.9554,1975-2.9015 5.6256 8.4188 31.6477,1976-1.3518 1.5497 1.8273 2.4017,1977-2.1764 -0.8246 4.7367 0.06800,1978-1.7261 0
21、4503 2.9796 0.2027,35,年份,t,t,-,t-1,t,2,(,t,-,t-1,),2,1979 1.1744 2.9005 1.3791 8.4129,1980 1.7241 0.5497 2.9726 0.3022,1981 6.6364 4.9123 44.0421 24.1308,1982 8.2621 1.6256 68.2616 2.6427,1983 8.3497 0.0877 69.7183 0.0077,1984 7.2503 -1.0995 52.5662 1.2089,1985 4.1508 -3.0995 17.2288 9.6069,1986 4.
22、2384 0.0877 17.9644 0.0077,1987 1.1390 -3.0995 1.2972 9.6069,36,年份,t,t,-,t-1,t,2,(,t,-,t-1,),2,1988 0.3025 -0.8364 0.0915 0.6996,1989-1.5221 -1.8246 2.3168 3.3292,1990 0.0159 1.5379 0.0003 2.3653,1991-3.0836 -3.0995 9.5089 9.6069,1992-2.3585 0.7251 5.5626 0.5258,1993-3.0836 -0.7251 9.5089 0.5258,199
23、4-7.0836 -4.0000 50.1780 16.0000,合计,467.717 164.93,37,根据上面的结果就可以计算,DW,值,(,t,-,t,1,),2,d=164.993/467.717,t,2,=0.3528,38,已知,n=25,k=1,0.3581.29(dL),,所以拒绝不相关的假设,即存在一阶正相关。,下面介绍使用科克伦欧卡特方法估计模型。,根据估计模型计算,t,t,1,hat=,_=355.3091/417.5387,t-1,2,=0.850961,39,将,相关系数的估计值代入计算:,Y,t,*=,Y,t,-0.850961 Y,t-1,X,t,*=,X,t,
24、0.850961 X,t-1,得到一组新的数据,,40,就,Y,t,*,对,X,t,*,回归得到:,Y,t,*=13.973+0.53513X,t,*,t (2.918)(7.155),R,2,=0.6994 DW=2.378,41,DW,有所改善,误差项已经不存在自相关。利用差分方程可以求出初始模型的参数估计值了。,=13.973/(1-,0.850961)=93.756,hat=0.53513,Yt,=93.756+0.53513Xt,42,代入最初的模型,求新的残差和残差平方和,新的残差,=,Yt,-93.756 -0.535125Xt,因为,|,(,RSS,新,-,RSS,旧),/,
25、RSS,旧,|0.05,的条件不能满足,还要继续迭代下去。,利用新的残差可以计算出一个新的相关系数,=980.1575/1176.8310=0.832879,43,将相关系数的估计值代入计算:,Y,t,*=,Y,t,-0.832879 Y,t-1,X,t,*=,X,t,-0.832879 X,t-1,又得到一组新的数据,Y,t,*,对,X,t,*,回归,得到,Y,t,*=15.387+0.53830,X,t,*,计算出和的新的估计值为,92.073,和,0.53830,代入最初模型计算残差平方和,(,新,),,与旧的残差平方和比较满足条件,新的相关系数即为所求,上述的参数即是最后的估计结果。模
26、型最终为:,Yt,=92.073+0.53830,Xt,R,2,=0.9906 DW=2.330,44,其他估计,的方法,有时人们根据德宾,-,沃森,d,统计量来估计,,,d2(1-,hat),hat 1-d/2,上述公式在大样本的情形下,具有很好 的结果。例如在上面的例题中可以计算,hat 1-d/2=1-0.3528/2=0.8236,与我们最终迭代的结果,0.832879,相差不是很大。,45,对于小样本的情况下,泰尔和纳加(,Theil-Nagar,),n,2,(1-d/2)+k,2,hat=,n,2,-k,2,其中,,n=,样本容量,,d,为德宾,-,沃森,d,值,,k,为解释变量的
27、个数加上常数项。当样本容量非常大时,上式可以化为简单的公式(,1-,d/2,),46,在实际中有几种估计,hat,的方法,问题是到底选择那一个?在大样本的前提下,上述方法会给出近似的结果,因此使用哪种方法区别不大。但是在小样本的情况下,会有区别。估计出的,hat,有时相差很大。哪种方法更为可取并没有最后的定论。实际上经常用的是科克伦,-,欧卡特方法。,47,几种方法估计,hat,的例子,根据美国零工招聘指数(,HWI,),和失业率(,U,),的数据,(1962,年第一季度到,1967,年第四季度)估计的模型为,:,lnHWIt,=7.3084-1.5375lnUt,,,R,2,=0.9550,
28、0.1110,)(,0.0711,),d=0.9108,查表可知,,0.9108N,时,拒绝,H,0,,,即存在自相关,h1.96(,或,2.576,),所以,拒绝不存在自相关的假设,存在自相关。,53,第五节自相关产生的原因,1,,惯性。大多数经济时间序列都有一个明显的特点,就是所谓的惯性或粘滞性。这样,相继的观测值很可能是相依赖的,由此产生自相关。,2,,设定偏误(漏掉变量或不正确的函数形式)也会导致自相关,3,,蛛网现象。例如许多农产品的供给反映一种所谓的蛛网现象,即供给对价格的反映要滞后一个时期,因为供给需要经过一定时间才能实现,这样也会产生自相关。,54,滞后效应。例如人们发现当
29、前的消费除了依赖于其他的变量以外,还严重依赖于上一期的消费,因此消费函数模型就可能不仅仅是当前消费对当前收入的回归,而是当前消费对当前收入以及上一期消费的回归。但是如果我们忽视滞后项,也会导致误差项的自相关。,数据本身的原因。有时模型中使用的数据是原始数据计算后得来的,并因此导致自相关。,55,高阶自相关的检验方法,布劳殊,-,戈弗雷(,Breusch,-Godfrey,BG,),检验,假设,t,是,p,阶,自相关,t,=,1,t-1,+,2,t-2,+,p,t-p,+,t,H0,:,1,=,2,=,=,p,=0,具体的检验步骤如下:,1,估计初始模型,得到残差,t,。,2,,,就,t,对,t
30、1,、,t-2,、,.,t-p,回归。通常要实现确定自相关的阶数,在时间序列中我们会介绍如何确定确定自相关的阶数,p,为多少。,他们证明了在大样本的情况下,,(,n,p).R,2,服从具有,p,个自由度的,2,分布,即,(,n,p).R,2,2,56,本章要点,基本概念,DW,检验,最小二乘估计的结果,CO,法,57,习题,一,判断对错,1,,,DW,检验当存在异方差时不适用。,2,,当误差项存在序列相关时,最小二乘估计时有偏无效的。,3,,如果解释变量中包含了滞后变量,,DW,检验无效。,4,,,DW,检验拒绝自相关假设时,并不完全意味着误差项不存在序列相关,可能还需要运用其他检验以便作出
31、结论。,58,二,下表是日本,1971-1990,年的,20,年间,税收,T,与国民生产总值,Y,的数据,年份,T Y,年份,T Y,1971 27.9 181.9 1981 50.9 277.4,1972 31.6 198.3 1982 53.2 287.2,1973 36.6 207.7 1983 55.9 295.8,1974 36.0 207.3 1984 58.9 309.1,1975 32.1 215.6 1985 62.2 324.0,1976 34.6 224.3 1986 66.2 333.3,1977 36.4 235.0 1987 73.6 349.8,1978 42.0
32、 247.1 1988 80.4 370.6,1979 45.1 260.6 1989 84.9 387.5,1980 48.5 268.8 1990 90.0 407.2,59,假设模型为,T,t,=,+,Y,t,+,t,估计模型并检验是否存在自相关。如果存在,CO,法估计模型(迭代,2,步),估计的模型为:,T,t,=-26.093+0.28073Y,t,t,(,-10.793,)(,33.314,),R,2,=0.9840 DW=0.610,60,0.6101.20(,dL),所以存在一阶正相关,CO,法第一步,T,t,=-31.402+0.29711Y,t,t,(,-5.910,)(,17.629,),R,2,=0.9481 DW=1.878,CO,法第二步,T,t,=-31.536+0.29749Y,t,t,(,-5.910,)(,17.629,),R,2,=0.9481 DW=1.893,61,






