资源描述
第六章 自相关 思考题
6.1 如何使用 DW 统计量来进行自相关检验 ? 该检验方法的前提条件和局限性有哪些 ?
6.2 当回归模型中的随机误差项为 AR(1) 自相关时 , 为什么仍用OLS法会低估的标准误差 ?
6.3 判断以下陈述的真伪,并给出合理的解释。
1) 当回归模型随机误差项有自相关时 , 普通最小二乘估计量是有偏误的和非有效的。
2)DW 检验假定随机误差项的方差是同方差。
3) 用一阶差分法消除自相关是假定自相关系数为-1。
4)当回归模型随机误差项有自相关时 , 普通最小二乘估计的预测值的方差和标准误差不再是有效的。
6.4 对于四个解释变量的回归模型
如果样本量 n=50, 当 DW 统计量为以下数值时 , 请判断模型中的自相关状况。
1)DW=1.05 2)DW=1.40 3)DW=2.50 4)DW=3.97
6.5 如何判别回归模型中的虚假自相关 ? 6.6 在回归模型
中 ,无自相关。如果我们错误地判定模型中有一阶自相关 , 即, 并
使用了广义差分模型
将会产生什么问题 ?
练习题
6.1 表 6.6 给出了美国 1960~1995 年 36 年个人实际可支配收入 X 和个人实际消费支出Y 的数据。
1) 用普通最小二乘法估计收入-消费模型 ;
表 6.6 美国个人实际可支配收入和个人实际消费支出 ( 单位 :1010 美元 )
年份
个人实际可支配收入
X
个人实际
消费支出
Y
年份
个人实际可支配收入
X
个人实际
消费支出
Y
1960
157
143
1978
326
295
1961
162
146
1979
335
302
1962
169
153
1980
337
301
1963
176
160
1981
345
305
1964
188
169
1982
348
308
1965
200
180
1983
358
324
1966
211
190
1984
384
341
1967
220
196
1985
396
357
1968
230
207
1986
409
371
1969
237
215
1987
415
382
1970
247
220
1988
432
397
1971
256
228
1989
440
406
1972
268
242
1990
448
413
1973
287
253
1991
449
411
1974
285
251
1992
461
422
资料来源:Economic Report of the Prsident
注 : 数据为 1992 年价格
2) 检验收入 -消费模型的自相关状况 (5% 显著水平 ):
3) 用适当的方法消除模型中存在的问题。
6.2 在研究生产中劳动所占份额的问题时 , 古扎拉蒂采用以下模型。
模型 6.1
模型 6.2
其中 ,Y 为劳动投入 ,t 为时间。据 1949-1964 年数据 , 对初级金属工业得到以下结果。
模型 6.3
=0.4529-0.0041t
t= (-3.9608)
=0.5284 DW=0.8252
模型 6.4
=0.4786-0.0127t+0.0005
t= (-3.2724)(2.7777) =0.6629 DW=1.82
其中 , 括号内的数字为 t 统计量。
1) 模型 6.1 和模型 6.2 中是否有自相关 ?
2) 如何判定自相关的存在 ?
3) 怎样区分虚假自相关和真正的自相关 ?
6.3 表6.7是北京市连续 19 年城镇居民家庭人均收入与人均支出的数据。
表 6.7 北京市连续 19 年城镇居民家庭人均收入与支出数据表 ( 单位 : 元 )
年份
顺序
人均收入
(元)
人均生活消费支出(元)
商品零售
物价指数(%)
人均实
际收入(元)
人均实际
支出(元)
1
450.18
359.86
100
450.18
359.86
2
491.54
408.66
101.5
484.28
402.62
3
599.4
490.44
108.6
551.93
451.6
4
619.57
511.43
110.2
562.22
464.09
5
668.06
534.82
112.3
594.89
476.24
6
716.6
574.06
113
634.16
508.02
7
837.65
666.75
115.4
725.87
577.77
8
1158.84
923.32
136.8
847.11
674.94
9
1317.33
1067.38
145.9
902.9
731.58
10
1413.24
1147.6
158.6
891.07
723.58
11
1767.67
1455.55
193.3
914.47
753
12
1899.57
1520.41
229.1
829.14
663.64
13
2067.33
1646.05
238.5
866.81
690.17
14
2358.88
1860.17
258.8
911.85
718.77
15
2813.10
2134.65
280.3
1003.6
761.56
16
3935.39
2939.6
327.7
1200.91
897.04
17
5585.88
4134.12
386.4
1445.62
1069.91
18
6748.68
5019.76
435.1
1551.06
1153.7
19
7945.78
5729.45
466.9
1701.82
1227.13
1) 建立居民收入一消费函数 ;
2) 检验模型中存在的问题 , 并采取适当的补救措施予以处理 ;
3) 对模型结果进行经济解释。 .
6.4 表 6.8 给出了日本工薪家庭实际消费支出与可支配收入数据。
表 6.8 日本工薪家庭实际消费支出与实际可支配收人 ( 单位 :103 日元 )
年份
个人实际可支配收入
X
个人实际
消费支出
Y
年份
个人实际可支配收入
X
个人实际
消费支出
Y
1970
239
300
1983
304
384
1971
248
311
1984
308
392
1972
258
329
1985
310
400
1973
272
351
1986
312
403
1974
268
354
1987
314
411
1975
280
364
1988
324
428
1976
279
360
1989
326
434
1977
282
366
1990
332
441
1978
285
370
1991
334
449
1979
293
378
1992
336
451
1980
291
374
1993
334
449
1981
294
371
1994
330
449
1982
302
381
资料来源 : 日本银行 .经济统计年报 注 : 数据为 1990 年价格
1) 建立日本工薪家庭的收入一消费函数 ;
2) 检验模型中存在的问题 , 并采取适当的补救措施予以处理 ;
3) 对模型结果进行经济解释。
6.5 表 6.9 给出了中国进口需求 (Y) 与国内生产总值 (X) 的数据。
表 6.91985~2003 年中国实际 GDP 和进口额 ( 单位 : 亿元 )
年份
实际GDP
(X, 亿元)
实际进口额
(Y, 亿元)
1985
8964.4
2543.2
1986
9753.27
2983.4
1987
10884.65
3450.1
1988
12114.62
3571.6
1989
12611.32
3045.9
1990
13090.55
2950.4
1991
14294.88
3338
1992
16324.75
4182.2
1993
18528.59
5244.4
1994
20863.19
6311.9
1995
23053.83
7002.2
1996
25267
7707.2
1997
27490.49
8305.4
1998
29634.75
9301.3
1999
31738.82
9794.8
2000
34277.92
10842.5
2001
36848.76
12125.6
2002
39907.21
14118.8
2003
43618.58
17612.2
数据来源:中国统计年鉴 2004( 光盘 )
注 : 实际 GDP 和实际进口额均为 1985 年可比价指标。
1) 检测进口额模型的自相关性 ;
2) 采用科克伦 -奥克特迭代法处理模型中的自相关问题。
6.6 表 6.10 给出了某地区 1980~2000 年地区生产总值 (Y) 与固定资产投资额 (X)的数据。
表 6.10 地区生产总值(Y)与固定资产投资额(X)( 单位 : 亿元 )
年份
地区生产
总值(Y)
固定资产投资额(X)
年份
地区生产
总值(Y)
固定资产投资额(X)
1980
1402
216
1990
3124
544
1981
1624
254
1991
3158
523
1982
1382
187
1992
3578
548
1983
1285
151
1993
4067
668
1984
1665
246
1994
4483
699
1985
2080
368
1995
4897
745
1986
2375
417
1996
5120
667
1987
2517
412
1997
5506
845
1988
2741
438
1998
6088
951
1989
2730
436
1999
7042
1185
2000
8756
1180
1) 使用对数线性模型进行回归,并检验回归模型的自相性 ; 2) 采用广义差分法处理模型中的自相关问题。
3) 令(固定资产投资指数 ),(地区生产总值增长指数 ),
使用模型, 该模型中是否有自相关 ?
第六章 自相关性
1. 见P113
2. 见P113、P116
3.解答:将回归,得到残差序列,然后将该序列用于的ols估计,便可以得到的估计量。最后又对回归,便可以得到的消除序列相关的估计量。
4.解答:
(1)查表得到A模型dL=1.106,dU=1.371,而DW=0.8252小于这两者,所以按D-W检验,认为A模型存在正自相关性;对B模型:dL=0.982,dU=0.539,而DW=1.82,大于这两者,又小于2,所以按D-W检验,认为B模型不存在自相关性;
(2)。。。
(3)要结合经济意义、模型是否同时存在异方差综合判断。
5.解答:
(1)回归结果为:
Dependent Variable: LN_C
Method: Least Squares
Date: 05/20/03 Time: 11:09
Sample: 1951 1980
Included observations: 29
Excluded observations: 1
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LN_A
0.002109
0.035573
0.059277
0.9532
LN_H
-0.092590
0.176814
-0.523659
0.6053
LN_I
0.621243
0.207801
2.989602
0.0064
LN_L
0.382541
0.148529
2.575521
0.0166
C
-0.678260
1.231607
-0.550712
0.5869
R-squared
0.892890
Mean dependent var
3.746803
Adjusted R-squared
0.875038
S.D. dependent var
0.432004
S.E. of regression
0.152713
Akaike info criterion
-0.764925
Sum squared resid
0.559712
Schwarz criterion
-0.529184
Log likelihood
16.09141
F-statistic
50.01699
Durbin-Watson stat
0.652136
Prob(F-statistic)
0.000000
在显著性水平为0.05时,只有LN_I, LN_L显著。模型的整体拟合教好。出现这个情况的主要原因可能是模型中引入了与LN_C没多大关系的变量(LN_A ,LN_H)以及有多重共线性存在(LN_I,LN_L),当然也有可能存在自相关性。
(2)对残差和滞后一期的残差回归,结果如下:
Dependent Variable: RESID01
Method: Least Squares
Date: 05/20/03 Time: 11:23
Sample(adjusted): 1952 1980
Included observations: 27
Excluded observations: 2 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
RESID_LG01
0.712928
0.151257
4.713356
0.0001
R-squared
0.460509
Mean dependent var
0.003077
Adjusted R-squared
0.460509
S.D. dependent var
0.146298
S.E. of regression
0.107456
Akaike info criterion
-1.587132
Sum squared resid
0.300218
Schwarz criterion
-1.539138
Log likelihood
22.42629
Durbin-Watson stat
1.356284
其t检验显著。直接求其相关系数如下:0.679871652963。根据上面回归结果,可以认为存在自回归。
(3)由第一个回归结果知道DW统计量d=0.652136。查表知:dL=1.124,dU=1.743
而d=0.652136,小于这两者,所以按D-W检验,认为残差存在正自相关性;
若是去掉不显著的LN_A ,LN_H,回归结果如下:
Dependent Variable: LN_C
Method: Least Squares
Date: 05/20/03 Time: 11:10
Sample: 1951 1980
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LN_I
0.656181
0.187982
3.490653
0.0017
LN_L
0.368859
0.140095
2.632914
0.0138
C
-1.432749
0.348715
-4.108657
0.0003
R-squared
0.890773
Mean dependent var
3.721145
Adjusted R-squared
0.882682
S.D. dependent var
0.447149
S.E. of regression
0.153156
Akaike info criterion
-0.820083
Sum squared resid
0.633331
Schwarz criterion
-0.679963
Log likelihood
15.30124
F-statistic
110.0962
Durbin-Watson stat
0.669905
Prob(F-statistic)
0.000000
此时仍然可以认定有正自相关性(d=0.669905< dL=1.27);
(3)去掉不显著变量LN_A ,LN_H,用广义差分法修正。此时=1-DW/2=0.665,回归得:
Dependent Variable: D_LN_C
Method: Least Squares
Date: 05/20/03 Time: 11:43
Sample(adjusted): 1952 1980
Included observations: 29 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
D_LN_I
0.629326
0.257752
2.441590
0.0217
D_LN_L
0.388582
0.123461
3.147396
0.0041
C
-0.474665
0.282105
-1.682581
0.1044
R-squared
0.670959
Mean dependent var
1.289074
Adjusted R-squared
0.645648
S.D. dependent var
0.199306
S.E. of regression
0.118642
Akaike info criterion
-1.327716
Sum squared resid
0.365974
Schwarz criterion
-1.186272
Log likelihood
22.25189
F-statistic
26.50870
Durbin-Watson stat
1.366951
Prob(F-statistic)
0.000001
可以看到,此时DW有所提高,结果落入不能判断的区域(1.27,1.563)。之所以这样,估计是因为相关系数没有求准确。
(5)用Cochrant-Orcutt迭代法估计模型。
Dependent Variable: D_LN_C
Method: Least Squares
Date: 05/20/03 Time: 11:54
Sample(adjusted): 1953 1980
Included observations: 28 after adjusting endpoints
Convergence achieved after 9 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
D_LN_I
0.568392
0.304474
1.866798
0.0742
D_LN_L
0.381758
0.116517
3.276412
0.0032
C
-0.358973
0.374663
-0.958121
0.3476
AR(1)
0.297377
0.198696
1.496647
0.1475
R-squared
0.696210
Mean dependent var
1.297544
Adjusted R-squared
0.658237
S.D. dependent var
0.197577
S.E. of regression
0.115505
Akaike info criterion
-1.347446
Sum squared resid
0.320193
Schwarz criterion
-1.157131
Log likelihood
22.86424
F-statistic
18.33401
Durbin-Watson stat
1.837290
Prob(F-statistic)
0.000002
Inverted AR Roots
.30
可见此时不在相关。
(1) 略。
6.解答:
(1) 对模型回归结果如下:
Dependent Variable: Y
Method: Least Squares
Date: 05/20/03 Time: 13:16
Sample: 1978 1996
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X
1.236904
0.064536
19.16625
0.0000
C
38.09940
151.0455
0.252238
0.8039
R-squared
0.955769
Mean dependent var
2194.484
Adjusted R-squared
0.953167
S.D. dependent var
2029.881
S.E. of regression
439.2846
Akaike info criterion
15.10747
Sum squared resid
3280507.
Schwarz criterion
15.20689
Log likelihood
-141.5210
F-statistic
367.3452
Durbin-Watson stat
2.849855
Prob(F-statistic)
0.000000
(2) 用D_W检验法检验序列相关否。查表有:dL=1.180,dU=1.401,计算4-dL=2.820,4-dU=2.599。而d=2.849855,所以由判断规则知道存在负相关。
(3) 用广义差分法修正。=1-DW/2=-0.425,回归结果:
Dependent Variable: D_Y
Method: Least Squares
Date: 05/20/03 Time: 13:30
Sample(adjusted): 1979 1996
Included observations: 18 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
D_X
0.811313
0.027864
29.11660
0.0000
C
-38.48551
112.0719
-0.343400
0.7358
R-squared
0.981477
Mean dependent var
2467.052
Adjusted R-squared
0.980319
S.D. dependent var
2171.372
S.E. of regression
304.6197
Akaike info criterion
14.38044
Sum squared resid
1484691.
Schwarz criterion
14.47937
Log likelihood
-127.4240
F-statistic
847.7762
Durbin-Watson stat
2.631995
Prob(F-statistic)
0.000000
DW有所下降,但是落入了不可判断区域。
利用对数变换来修正自相关。结果为:
Dependent Variable: LN_Y
Method: Least Squares
Date: 05/20/03 Time: 13:33
Sample: 1978 1996
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LN_X
1.001151
0.025121
39.85272
0.0000
C
0.220615
0.179743
1.227389
0.2364
R-squared
0.989410
Mean dependent var
7.334724
Adjusted R-squared
0.988787
S.D. dependent var
0.865244
S.E. of regression
0.091623
Akaike info criterion
-1.842967
Sum squared resid
0.142711
Schwarz criterion
-1.743552
Log likelihood
19.50818
F-statistic
1588.239
Durbin-Watson stat
2.506239
Prob(F-statistic)
0.000000
DW值再次下降,达到2.506239。可以判断:已经不存在自相关了。
7.解答:
(1) 回归结果为:
Dependent Variable: LN_Y
Method: Least Squares
Date: 05/20/03 Time: 13:43
Sample: 1953 1985
Included observations: 33
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LN_X
1.001063
0.052990
18.89146
0.0000
C
1.794763
0.308551
5.816752
0.0000
R-squared
0.920080
Mean dependent var
7.573572
Adjusted R-squared
0.917502
S.D. dependent var
0.807866
S.E. of regression
0.232039
Akaike info criterion
-0.025128
Sum squared resid
1.669110
Schwarz criterion
0.065570
Log likelihood
2.414605
F-statistic
356.8872
Durbin-Watson stat
0.583389
Prob(F-statistic)
0.000000
回归结果不错。查表,dL=1.1383,dU=1.508,而DW=0.583389。显然存在正自相关。
(2)=1-DW/2=0.7083
Dependent Variable: D_LN_Y
Method: Least Squares
Date: 05/20/03 Time: 13:53
Sample(adjusted): 1954 1985
Included observations: 32 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
D_LN_X
0.681939
0.065931
10.34326
0.0000
C
1.093559
0.117572
9.301173
0.0000
R-squared
0.780995
Mean dependent var
2.288260
Adjusted R-squared
0.773695
S.D. dependent var
0.261007
S.E. of regression
0.124165
Akaike info criterion
-1.273951
Sum squared resid
0.462508
Schwarz criterion
-1.182342
Log likelihood
22.38321
F-statistic
106.9831
Durbin-Watson stat
0.834364
Prob(F-statistic)
0.000000
由于dL=1.1383,dU=1.508,而DW=0.834364。显然还是存在正自相关
(3)回归结果:
Dependent Variable: YY
Method: Least Squares
Date: 05/20/03 Time: 13:47
Sample(adjusted): 1954 1985
Included observations: 32 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
XX
0.473818
0.044671
10.60677
0.0000
C
0.574880
0.051962
11.06345
0.0000
R-squared
0.789479
Mean dependent var
1.108709
Adjusted R-squared
0.782462
S.D. dependent var
0.156754
S.E. of regression
0.073112
Akaike info criterion
-2.333192
Sum squared resid
0.160360
Schwarz criterion
-2.241584
Log likelihood
39.33108
F-statistic
112.5036
Durbin-Watson stat
1.577648
Prob(F-statistic)
0.000000
查表,dL=1.1383,dU=1.508,而DW=1.577648。显然不存在自相关。
答:对。
展开阅读全文