资源描述
实2:我国1978-2001年的财政收入(y)和国民生产总值〔X)的数据资料如表2所表2 我国1978-2001年财政收入和国民生产总值数据
obs
X
y
obs
X
y
197
3624.1
1132.2
199
18598.
2937.1
8
0
6
0
40
0
197
4038.2
1146.3
199
21662.
3149.4
9
0
8
1
50
8
198
4517.8
1159.9
199
26651.
3483.3
0
0
3
2
90
7
198
4860.3
1175.7
199
34560.
4348.9
1
0
9
3
50
5
198
5301.8
1212.3
199
46670.
5218.1
2
0
3
4
00
0
198
5957.4
1366.9
199
57494.
6242.2
3
0
5
5
90
0
198
7206.7
1642.8
199
66850.
7407.9
4
0
6
6
50
9
198
8989.1
2004.8
199
73142.
8651.1
5
0
2
7
70
4
198
10201.
2122.0
199
76967.
9875.9
6
40
1
8
20
5
198
11954.
2199.3
199
80579.
11444.
7
50
5
9
40
08
198
14922.
2357.2
200
88254.
13395.
8
30
4
0
00
23
198
16917.
2664.9
200
95727.
16386.
9
80
0
1
90
04
试根据资料完成以下问题:
⑴ 给出模型=b° +5的回归报告和正态性检验,并解释回归系数的经济意义;(2)求置信度为95%的回归系数的置信区间;
〔3〕对所建立的回归方程进展检验(包括估计标准误差评4介、拟合优度检验、参数的显著性检验);(4)假设2002年国民生产总值为103553.60亿元,求2002年财政收入预测值及预测区间
〔a = 0.05〕<,
参考答案:(1)首先将X排序,其次根据表2数据估计模型,回归结果如下:
s = (3.6480) (0.01996)t = (2.5102) (31.970)
R2 = 0.9463S.E=9.0561DW=1.813 F=1022.072
(2)检验异方差:①怀特检验:"=10.57〉好.05⑵=5.99,模型存在异方差;
②戈德菲尔德一匡特检验:将样本x数据排序,n=60,c = 〃/4 = 15 ,取c=16 ,从 中间去掉16个数据,确定子样1(1-22),求出RSS}= 630.4138 ;确定子样2(39-60),求 出 RSS, = 2495 .840,计算出 F =竺& = 2495 •84 = 3.959,给定显著性水平 a = ().05 ,RSS] 630.4138
查 ^(20,20) = 2.12 ,得:F〉F〃 ,所以模型存在异方差。
[3]在方程窗口,取w=\/abs(resid),得回归结果:
s = (0.434533) (0.002085)t = (23.36098) (303.7639)
职=0.999995 S.E=0.956155DW=1.22969 F=12908997
用怀特检验判断:
nr = 0.425945彼(;.05(2) = 5.99,模型已不存在异方差〔从p值也容易得出此结论〕。
实验内容与数据7某地区1978—1998年国内生产总值与出口总额的数据资料见表7 , 其中x表示国内生产总值〔人民币亿元儿y表示出口总额〔人民币亿元〕。做以下工作:
(1) 试建立一元线性回归模型:),,=8。+妃,
(2) 模型是否存在一阶段自相关?如果存在,请选择适当的方法加以消除。
表7某地区1978—1998年国内生产总值与出口总额的数据资料obs xy obs xy
197
3624.10
134.800
198
16917.8
1470.00
8
0
0
9
0
0
197
4038.20
139.700
199
18598.4
1766.700
9
0
0
0
0
198
4517.80
167.600
199
21662.5
1956.000
0
0
0
1
0
198
486030
211.700
199
26651.9
2985.800
1
0
0
2
0
198
5301.80
271.200
199
34560.5
3827.100
2
0
0
3
0
198
5957.40
367.600
199
46670.0
4676.300
3
0
0
4
0
198
7206.70
413.800
199
57494.9
5284.800
4
0
0
5
0
198
8989.10
438.300
199
66850.5
10421.80
5
0
0
6
0
0
198
10201.4
580.500
199
73142.7
12451.80
6
0
0
7
0
0
198
11954.5
808.900
199
78017.8
15231.70
7
0
0
8
0
0
198
14922.3
1082.10
8
0
0
参考答案:(1)回归结果
(2)自相关检验:由DW=1.106992 ,给定显著性水平a = 0.05查Durbin-Watson 统计表,n=21,k=l ,得下限临界值小=1221和上限临界值匕=1.420 ,因为 DW=1.106992<刈=1.221 ,根据判断区域可知,这时随机误差项存在一阶正自相关。
〔3〕自相关的修正:用科克伦-奥克特(Cochrane- Orcutt)迭代法,在命令窗口直 接键入:LS v c x AR(1)得如下回归结果
从表中可以看出,这时DW=1.633755 ,查〃=20,妃1, a = ().05的DW统计量表,得 劣=1.201,皿=1.414 < DW=1. 633755〈4-4 =2.586 ,这说明,模型已不存在自相关。 此时,回归方程为t= (-0.845549)(8.094503)
R2 =0.910711DW=1.633755
[AR(1) = 0.442943 ]
t= (1.608235)
也可以利用对数线性回归修正自相关,回归结果如下
从上表可以看出 这时DW=2.13078,查n=20,k=l, a = 0.05的DW统计量表, 得小=1.201,4 =1-414 < DW=2.13078<4-^ =2.586,这说明,模型已不存在自相关。 从LM(1)=2.46 LM⑵= 5.78也可以看出,模型已不存在1阶、2阶自相关。此时,回归方 程为t = (0.025507) (1.617511)
R2 =0.991903 R 2 = 0.990950DW=2.13708 LM(1)=2.46 LM(2)=5.78
F=1041.219
实验内容与数据8 :表8给出了美国1971-1986年期间的年数据。
表8 美国1971 ~ 1986年有关数据
年度
*
X1
x2
x3
x4
x5
197
1022
112.
121.
776.8
4.89
79367
1
7
0
3
197
1087
111.
125.
839.6
4.55
82153
2
2
0
3
197
1135
111.
133.
949.8
738
85064
3
0
1
1
197
8775
117.
147.
1038.
8.61
86794
4
5
7
4
197
8539
127.
161.
1142.
6.16
85846
5
6
2
8
197
9994
135.
170.
1252.
5.22
88752
6
7
5
6
197
1104
142.
181.
1379.
5.50
92021
7
6
9
5
3
197
1116
153.
195.
1551.
7.78
96048
8
4
8
3
2
197
1055
166.
217.
1729.
10.2
98824
9
9
0
7
3
5
198
8979
179.
247.
1918.
11.2
99303
0
3
0
0
8
其中,y:售出新客车的数量〔千辆〕;xl:新车,消费者价格指数,1967=100 ; x2:所有 物品所有居民的消费者价格指数,1967=100 ; x3:个人可支配收入(PDI, 10亿美元〕;x4: 利率;x5:城市就业劳动力〔千人〕。考虑下面的客车需求函数:
198
8535
190.
272.
2127.
13.7
10039
1
2
3
6
3
7
198
7980
197.
286.
2261.
11.2
99526
2
6
6
4
0
198
9179
202.
297.
2428.
8.69
10083
3
6
4
1
4
198
1039
208.
307.
2670.
9.65
10500
4
4
5
6
6
5
198
1103
215.
318.
2841.
7.75
10715
5
9
2
5
1
0
198
1145
224.
323.
3022.
631
10959
6
0
4
4
1
7
(1) 用OLS法估计样本回归方程;
(2) 如果模型存在多重共线性,试估计各辅助回归方程,找出哪些变量是高度共线性的。
(3) 在除去一个或多个解释变量后,最终的客车需求函数是什么?这个模型在哪些方面 好于包括所有解释变量的原始模型。
⑷还有哪些变量可以更好地解释美国的汽车需求?
参考答案:〔1〕回归结果t = (0.1723) (2.0500) (-2.5683) (1.6912) (-0.2499) (0.1364)
R2 = 0.8548 R2 = 0.7822DW=1.7930 F=11.7744
(2)相关系数矩阵检验:
辅助回归模型检验
被解释变量
R2
F
F值是否显著
Lnxl
0.995
666.74
是
9
0
Lnx2
0.999
4189.2
是
3
0
Lnx3
0.999
4192.8
是
3
9
Lnx4
0.870
18.47
是
4
Lnx5
0.994
533.42
是
9
(n=16,k=5,a = 0.05)由上表可以看出,所有变量都是高度共线的。
⑶由于xl〔新价格指数〕与x2〔居民消费价格指数〕变化趋于一致,可舍去其中之一;由于x3〔个人可支配收入〕与x5〔城市就业劳动力〕变化趋于一致,可舍去其中之
(4) 以下两个模型较为适宜:
t = (-2.6397) (-3.1428) (-4.0015) (3.7191)
R2 =0.6061DW=13097 F=8.6926
t = (-3.9255) (-4.5492) (-3.9541) (5.2288)
京2 =0.7364DW=1.5906 F=14.9690
与原模型相比,经上两模型中的所有系数符号正确且都在统计上显著。
(5) 还有汽车消费税、汽车保险费率、汽油价格等。
实验三:虚拟变量的设置与应用、滞后变量模型的估计〔3课时〕
实验内容与数据9 :表9给出了 1993年至1996年期间服装季度销售额的原始数据(单位:百万元):
表9服装季度销售额数据
年份
1季度
2季度
3季度
4季度
199
4190
4927
6843
6912
3
199
4521
5522
5350
7204
4
199
4902
5912
5972
7987
5
199
5458
6359
6501
8607
6
现考虑如下模型:
其中,。2 T :第二季度;。3 =1 :第三季度;R =1 :第四季度;5=销售额。
请答复以下问题:
⑴估计此模型;(2)解释/*,妇么,如;⑶如何消除数据的季节性?
参考答案:〔1〕
s = (324.0365) (458.2569) (458.2569) (458.2569)
t = (14.71362) (1.990696) (3.052327) (6.34605)
R2 = 0.778998 R2 = 0.723747 S.E=648.0731 DW=1.272707 F=14.09937
(2) & =4767.75表示第一季度的平均销售额为6767.75百万元; 方2 =912.25,方3 = 1398.75,方4 =2909.75依次表示第二、三、四季度比第一季度的销售额平 均高出 912.25,1398.75,2909.75 百万元。
〔3〕为消除数据的季节性,只需将每季度中的原始数据减去相应季度虚拟变量的系数 估计值即可。
实验内容与数据11 :表11给出了美国1970-1987年间个人消费支出〔O与个人可 支配收入(,的数据〔单位:10亿美元,1982年为基期〕表11 美国1970-1987年个人消费支出与个人可支配收入数据
年
C
I
年
C
I
197
1492.
1668.
197
2004.
2212.
0
0
1
9
4
6
197
1538.
1728.
198
2004.
2214.
1
8
4
0
4
3
197
1621.
1797.
198
2024.
2248.
2
9
4
1
2
6
197
1689.
1916.
198
2050.
2261.
3
6
3
2
7
5
197
1674.
1896.
198
2146.
2331.
4
0
6
3
0
9
197
1711.
1931.
198
2249.
2469.
5
9
7
4
3
8
197
1803.
2001.
198
2354.
2542.
6
9
0
5
8
8
197
1883.
2066.
198
2455.
2640.
7
8
6
6
2
9
197
1961.
2167.
198
2521.
8
0
4
7
0
考虑如下模型:
(1)估计以上两模型;(2)估计个人消费支出对个人可支配收入的弹性系数。
参考答案:(1)In q = -0.885464+1.1025381n I,...... (1)
s = (0.128932) (0.016816)
t = (-6.867685) (65.56382)
R2 = 0.99606DW=1.413744 LM(l)=0.7153LM ⑵=0.7056 F=4298.614in C = -0.994922+1.1317061n I, -0.0152751n...... (2)
s = (0.199544) (0.168566) (0.151814)
t = (-4.98599) (6.713724) (-0.100617)
/= 0.99564DW=1.659416 LM(l)=0.2438LM ⑵=1.8136 F=1827.919
力=(1・牛 J=94453, haf2 =加.0» = 1 •%, |/枇,场,不存在一阶自相关。
2 V 1 — nD(b})由LM(l)=0.2438、LM(2)= 1.8136可知,模型不存在1阶、2阶自相关。
(2)由 ⑴得:收入弹性片=1.1025 ;由 ⑵得:短期收入弹性片=1.1317 ,长
期收入弹性E,=1.1317
1-0.015275
= 1.114673
参考答案:
(1)=324.6844 + 0.133561 x,s(&) = (317.5155) (0.007069)
,(& ) = (1.022578) (18.89340)& = 0.133561 ,说明GNP每增加1亿元,财政收入将平均增加1335.61万元。
(2)= 4 ± taf2(n - 2) - 5(4)=324.6844± 2.0739x 317.5155=(-333.8466 983.1442)b、=b} ± ta/2 (n - 2) • s(bx) =0.133561 ± 2.0739 x 0.007069=(0.1189010.148221)
〔3〕①经济意义检验:从经济意义上看,& =0.133561)0 ,符合经济理论中财政收入随着GNP增加而增 加,说明GNP每增加1亿元,财政收入将平均增加1335.61万元。
② 估计标准误差评价:Sf = 3 = 1065.056 ,即估计标准误差为1065.056亿元,它代表我国财政收入估计值与 实际值之间的平均误差为1065.056亿元。
③ 拟合优度检验:叱=0.941946 ,这说明样本回归直线的解释能力为94.2% ,它代表我国财政收入变动中, 由解释变量GNP解释的局部占94.2% ,说明模型的拟合优度较高。
④ 参数显著性检验:[也)=18.8934) /0025(22) = 2.0739 ,说明国民生产总值对财政收入的影响是显著的。
(4) x2OO2 = 103553 .6, y2OO2 = 324.6844 + 0.133561 x 103553 .6 = 14155 .41根据此表可计算如下结果:
(工2%2 —无成=(103553 .6-32735 .47)2 =5.02 x 109 ,= (11672.2 16638.62)
实验内容与数据3 :表3给出某地区职工平均消费水平乂,职工平均收入w和生活费
用价格指数,试根据模型乂 =b。+h2x2t作回归分析报告。
表3某地区职工收入、消费和生活费用价格指数年份 乂 弓 易,年份 义 孔 乌
198
5
20.1
0
30.0
0
1.00
199
1
42.1
0
65.20
0.90
198
22.3
35.0
1.02
199
48.8
70.00
0.95
6
0
0
2
0
198
30.5
41.2
1.20
199
50.5
80.00
1.10
7
0
0
3
0
198
28.2
51.3
1.20
199
60.1
92.10
0.95
8
0
0
4
0
198
32.0
55.2
1.50
199
70.0
102.0
1.02
9
0
0
5
0
0
199
40.1
61.4
1.05
199
75.0
1203
1.05
0
0
0
6
0
0
参考答案:
(1) yt = 10.45741 + 0.634817 x„ - 8.963759 易,5(^) = (6.685015) (0.031574) (5.384905)
,(& ) = (1.564306) (20.10578) (-1.664608)
(2) ①经济意义检验:从经济意义上看,0〈& = 0.6348 <1 ,符合经济理论中绝对收 入假说边际消费倾向在0与I之间,说明职工平均收入每增加100元,职工消费水平平 均增加63.48元。庭=-8.964〈0 ,符合经济意义,说明职工消费水平随着生活费用价格 指数的提高而下降,生活费用价格指数每提高1单位时,职工消费水平将下降-8.964个单
位。
②估计标准误差评价:SE = 3 = 208.5572,即估计标准误差为208.5572单位,它代
表职工平均消斐水平估计值与实际值之间的平均误差为208.5572单位。
③ 拟合优度检验:方=0.975948 ,这说明样本回归直线的解释能力为97.6% ,它代 表职工平均消费水平变动中,由解释变量职工平均收入解释的局部占97.6% ,说明模型的 拟合优度较高。
④ F检验:尸=224.1705〉已伏,〃一&一1)=乙(2,12-2-1) = 4.26,说明总体回归 方程显著,即职工平均收入和生活费用价格指数对职工消费水平的影响在整体上是显著的。
®t检验:质)= 20.10578〉如心⑼=2.262 ,说明职工平均收入对职工消费水平的 影响是显著的;网)| = 1.664608( r(w23(9) = 2.262,说明生活费用价格指数对职工消费水 平的影响是不显著的。
实验内容与数据4:某地区统计了机电行业的销售额*〔万元〕和汽车产量叫〔万辆〕 以及建筑业产值互〔千万元〕的数据如表4所示。试按照下面要求建立该地区机电行业的 销售额和汽车产量以及建筑业产值之间的回归方程,并进展检验〔显著性水平a =0.05〕。
表4某地区机电行业的销售额、汽车产量与建筑业产值数据
年份
销售额*
汽车产量羽
建筑业产值心
198
280.0
3.909
9.43
1
198
281.5
5.119
10.36
2
198
337.4
6.666
14.50
3
198
404.2
5.338
15.75
4
198
402.1
4.321
16.78
5
198
452.0
6.117
17.44
6
198
431.7
5.559
19.77
7
198
582.3
7.920
23.76
8
198
596.6
5.816
31.61
9
199
620.8
6.113
32.17
0
199
513.6
4.258
35.09
1
199
606.9
5.591
36.42
2
199
629.0
6.675
36.58
3
199
602.7
5.543
37.14
4
199
656.7
6.933
41.30
5
199
998.5
7.638
45.62
6
199
877.6
7.752
47.38
7
[1] 根据上面的数据建立对数模型:
In yt = I,。+ /?! In xu + b2 In x2l +吗[1]
(2) 所估计的回归系数是否显著?用日值答复这个问题。
〔3〕解释回归系数的意义。
〔4〕根据上面的数据建立线性回归模型:
月=b() + b}xu + b2x2t + ut(2)
〔5〕比较模型〔1〕、〔2〕的b值。
(6)如果模型〔1〕、[2〕的结论不同,你将选择哪一个回归模型?为什么?
参考答案:
(1)回归结果
5(^) = (0.212765) (0.137842) (0.055677)
液) = (17.5541) (2.814299) (10.21006)
(2) t 检验:沾)= 2.814299〉r0.025(14) = 2.145 , /?, =0.0138 <0.05 ,说明汽车产量 对机电行业销售额的影响是显著的;心2)= 10.21006〉如^(14) = 2.145 , p2 = 0.0000 (0.05 ,说明建筑业产值对机电行业销售额的影响是显著的。
F检验:尸= 99.81632〉乙伏,〃一A:-1) = £(2,17-2-1) = 3.74 , p = 0.0000(0.05 说明总体回归方程显著,即汽车产量、建筑业产值又寸机电行业销售额的影响在整体上是显著 的。
〔3〕& = 0.387929,说明汽车产量每增加1%,机电行业的销售额将平均增加0.39% ; 4=0.56847 ,说明建筑业产值每增加1% ,机电行业的销售额将平均增加0.57%。
(4)回归结果
s(& ) = (81.02202) (15.66885) (1.516553)
,(& ) = (-0.709128) (2.916971) (7.868761)
(5)模型〔1〕的 R1 =0.934467.=0.925105 ,模型(2)的 7?2 =0.903899.
商=0.89017。因此,模型⑴的拟合优度大于模型(2)的拟合优度。
[6]从两个模型的参数估计标准误差、S.E、t、F、京2统计量可以看出,模型 ⑴ 优 于模型〔2〕,应选择模型〔1)。
实验内容与数据5 :表5给出了一个钢厂在不同年度的钢产量。找出表示产量和年度之 间关系的方程:=履、,并预测2002年的产量。
表5某钢厂1991-2001年钢产量〔单位:千吨〕参考答案:
年度
199
199
199
199
199
199
199
199
199
200
200
1
2
3
4
5
6
7
8
9
0
1
千吨
12.2
12.0
13.9
15.9
17.9
20.1
22.7
26.0
29.0
32.5
36.1
s(& ) = (0.021946) (0.003236)
液)= (105.1484) (36.06598)
R2 =0.993128 SE = 0.033937 DW=1.888171 F=1300.755
x2OO2 = 12 , In y2OO2 = 2.307562 +0.1167 x!2 = 3.707958 , y2OO2 = 63707958 = 40.77
实验二:异方差性、自相关性、多重共线性检验〔3课时〕
实验内容与数据6 :试根据表6中消费⑴与收入(为的数据完成以下问题:
(1)估计回归模型:y, = b° + b内+儿;(2)检验异方差性〔可用怀特检验、戈德菲尔德
匡特检验〕;⑶选用适当的方法修正异方差性。
表6消费与收入数据
y
X
*
X
y
X
55
80
15
22
95
14
2
0
0
65
10
14
21
10
14
0
4
0
8
5
70
85
17
24
11
15
5
5
3
0
80
11
18
26
11
16
0
0
0
0
0
79
12
13
19
12
16
0
5
0
5
5
84
11
14
20
11
18
5
0
5
5
0
98
13
17
26
13
18
0
8
5
0
5
95
14
19
27
13
19
0
1
0
5
0
90
12
13
23
12
20
5
7
0
0
0
75
90
18
25
14
20
9
0
0
5
74
10
53
80
14
21
5
0
0
11
16
70
85
15
22
0
0
2
0
11
15
75
90
14
22
3
0
0
5
12
16
65
10
13
23
5
5
0
7
0
10
14
74
10
14
24
8
5
5
5
0
11
18
80
11
17
24
5
0
0
5
5
14
22
84
11
18
25
0
5
5
9
0
12
20
79
12
18
26
0
0
0
0
0
14
24
90
12
17
26
5
0
5
8
5
13
18
98
13
19
27
0
5
0
1
0
展开阅读全文