资源描述
第二章 一元线性回归模型
1、 最小二乘法对随机误差项u作了哪些假定?说明这些假定条件的意义。
答:假定条件:
(1)均值假设:E(ui)=0,i=1,2,…;
(2)同方差假设:Var(ui)=E[ui-E(ui)]2=E(ui2)=σu2 ,i=1,2,…;
(3)序列不相关假设:Cov(ui,uj)=E[ui-E(ui)][uj-E(uj)]=E(uiuj)=0,i≠j,i,j=1,2,…;
(4)Cov(ui,Xi)=E[ui-E(ui)][Xi-E(Xi)]=E(uiXi)=0;
(5)ui服从正态分布, ui~N(0,σu2)。
意义:有了这些假定条件,就可以用普通最小二乘法估计回归模型的参数。
2、 阐述对样本回归模型拟合优度的检验及回归系数估计值显著性检验的步骤。
答:样本回归模型拟合优度的检验:可通过总离差平方和的分解、样本可决系数、样本相关系数来检验。
回归系数估计值显著性检验的步骤:
(1)提出原假设H0 :β1=0;
(2)备择假设H1 :β1≠0;
(3)计算 t=β1/Sβ1;
(4)给出显著性水平α,查自由度v=n-2的t分布表,得临界值tα/2(n-2);
(5)作出判断。如果|t|<tα/2(n-2),接受H0 :β1=0,表明X对Y无显著影响,一元线性回归模型无意义;如果|t|>tα/2(n-2),拒绝H0 ,接受H1:β1≠0,表明X对Y有显著影响。
4、 试说明为什么∑ei2的自由度等于n-2。
答:在模型中,自由度指样本中可以自由变动的独立不相关的变量个数。当有约束条件时,自由度减少,其计算公式:自由度=样本个数-受约束条件的个数,即df=n-k。一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条件予以确定,由此减去2,也即其自由度为n-2。
5、 试说明样本可决系数与样本相关系数的关系及区别,以及样本相关系数与β^1的关系。
答:样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。但样本相关系数与样本可决系数在概念上有明显的区别,r建立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r²建立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。
6、 已知某市的货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)1985~1998年的样本观测值见下表(略)。
Dependent Variable: Y
Method: Least Squares
Date: 10/28/13 Time: 10:25
Sample: 1985 1998
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
GDP
26.95415
4.120300
6.541792
0.0000
C
12596.27
1244.567
10.12101
0.0000
R-squared
0.781002
Mean dependent var
20168.57
Adjusted R-squared
0.762752
S.D. dependent var
3512.487
S.E. of regression
1710.865
Akaike info criterion
17.85895
Sum squared resid
35124719
Schwarz criterion
17.95024
Log likelihood
-123.0126
Hannan-Quinn criter.
17.85050
F-statistic
42.79505
Durbin-Watson stat
0.859998
Prob(F-statistic)
0.000028
(1) 一元线性回归方程 Yt=12596.27+26.95415GDPt
(2) 结构分析 β^1=26.95425是样本回归方程的斜率,它表示某市货物运输量的情况,说明货物运输量每增加1亿元,将26,95425用于国内生产总值;β^0=12596.27是样本回归方程的截距,它表示不受货物运输量影响的国内生产总值。
∧
(3)统计检验 r2=0.78 说明总离差平方和的78%被样本回归直线解释,有22%没被解释,说明样本回归直线对样本点的拟合优度还是比较高的。
显著性水平 α=0.05,查自由度v=14-2=12的t分布表,得临界值t0.025(12)=2.18
(4)预测区间1980~2000
obs
GDP
RESID
Y
YF
YFSE
1980
1981
1982
1983
1984
1985
161.69
1294.51817047138
18249
16954.48182952862
1837.805042947807
1986
171.07
1317.688263830489
18525
17207.31173616951
1827.852258571768
1987
184.07
842.2843420467398
18400
17557.71565795326
1815.329074565951
1988
194.75
-1152.585956772524
16693
17845.58595677253
1806.164743584577
1989
197.86
-2386.413356522331
15543
17929.41335652233
1803.689193053205
1990
208.55
-2288.553196819888
15929
18217.55319681989
1795.851377857323
1991
221.06
-246.7495861671741
18308
18554.74958616718
1788.013873793755
1992
246.92
-1729.78384903854
17522
19251.78384903854
1776.450315989464
1993
276.8
1582.826213815424
21640
20057.17378618458
1770.995648870701
1994
316.38
2658.981042723055
23783
21124.01895727694
1776.926294021264
1995
363.52
1645.362514039523
24040
22394.63748596048
1803.310480128086
1996
415.51
337.0163683828214
24133
23795.98363161718
1855.694986909933
1997
465.78
-60.96864300710876
25090
25150.96864300711
1927.747214173007
1998
509.1
-1813.62232698188
24505
26318.62232698188
2004.982737266598
1999
2000
620
29307.83732127556
2255.639096466328
单个值预测区间 Y2000∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64]
均值预测区间 E(Y2000)∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64]
8、查中国统计年鉴,利用1978~2000的财政收入和GDP的统计资料,要求以手工和EViews软件。
(1)散点图
Dependent Variable: Y
Method: Least Squares
Date: 10/29/13 Time: 16:40
Sample: 1978 2000
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
GDP
0.986097
0.001548
637.0383
0.0000
C
174.4171
50.39589
3.460939
0.0023
R-squared
0.999948
Mean dependent var
22634.30
Adjusted R-squared
0.999946
S.D. dependent var
23455.82
S.E. of regression
172.6972
Akaike info criterion
13.22390
Sum squared resid
626310.6
Schwarz criterion
13.32264
Log likelihood
-150.0748
Hannan-Quinn criter.
13.24873
F-statistic
405817.8
Durbin-Watson stat
0.984085
Prob(F-statistic)
0.000000
一元线性回归方程 Y=174.4174+0.98GDPt
经济意义 国名收入每增加1亿元,将有0.98亿元用于国内生产总值。
(2)检验 r²=99%,说明总离查平方和的99%被样本回归直线解释,仅有1%未被解释,所以说样本回归直线对样本点的拟合优度很高。
显著性水平α=0.05,查自由度v=23-2=21的t分布表,得临界值t0.025(21)=2.08。
(3)预测值及预测区间
obs
Y
YF
YFSE
GDP
1978
3645.2
3768.939527560003
178.8799078873616
3645.2
1979
4062.6
4180.536602486764
178.7740777289417
4062.6
1980
4545.600000000001
4656.821670023003
178.6544531237366
4545.600000000001
1981
4889.5
4998.011387140059
178.5706344690318
4891.600000000001
1982
4889.5
4998.011387140059
178.5706344690318
4891.600000000001
1983
5330.5
5423.808265322558
178.4682301138803
5323.399999999999
1984
5985.6
6054.220364030461
178.3211083266242
5962.7
1985
7243.8
7282.306126162203
178.0499504848901
7208.1
1986
9040.700000000001
9065.07170297124
177.6928063009931
9016
1987
12050.6
12065.37179921504
177.1899398638916
12058.6
1988
10274.4
10306.76560988973
177.4697052274058
10275.2
1989
12050.6
12065.37179921504
177.1899398638916
12058.6
1990
15036.8
15008.08380447724
176.8172394391318
15042.8
1991
17000.9
16930.48077996771
176.6385874540277
16992.3
1992
18718.3
18582.68705461982
176.5261264423878
18667.8
1993
35260
35017.08573798564
177.4791848854038
35333.9
1994
21826.2
21653.09867943883
176.4182393724463
21781.5
1995
26937.3
26723.61175867555
176.5282689819769
26923.5
1996
35260
35017.08573798564
177.4791848854038
35333.9
1997
48108.5
47702.24331311228
180.7470770711596
48197.9
1998
59810.5
60122.92955260078
185.9681357044579
60793.7
1999
88479.2
88604.77659126783
204.5612478858191
89677.1
2000
70142.5
70361.48074871261
191.6614042102092
71176.6
2001
104413.7922729122
218.1766346781298
105709
单个值的预测区间 Y2000∈[104413.8-2.07×218.2,104413.8+2.07×218.2]
均值预测区间 E(Y2000)∈[104413.8-2.07×218.2,104413.8+2.07×218.2]
第三章 多元线性回归模型
2、试对二元线性回归模型Yi=β0+β1X1i+β2X2i+ui,i=1,2,3,……n作回归分析:
(1)求出未知参数β0,β1,β2的最小二乘估计量β^0,β^1,β^2;
(2)求出随机误差项u的方差σ2的无偏估计量;
(3) 对样本回归方差拟合优度检验;
(4) 对总体回归方程的显著性进行F检验;
(5) 对β1,β2的显著性进行t检验;
(6) 当X0=(1,X10,X20)时,写出E(Y0/X0)的置信度为95%的预测区间。
答:(1)由公式可得出。其中,,
(2) 随机误差项的方差的无偏差估计量为
(3) 求出样本可决系数R-squared,修正样本可决系数为 =Adjusted-squared,比较 和值大小关系,即可得出样本回归方差拟合优度。
(4) 提出检验的原假设对立假设为 :至少有一个不等于零(),由题意得F的统计量为 F-statistic 。对于给定的显著性水平,;从附录4的表1中,查出分子自由度为,分母自由度为的F分布上侧位数。由F-statistic与的值大小关系,可得显著性关系。
(5)提出检验的原假设,求出t统计量 -statistic。对于给定的显著性水平=0.05,;从附录4的表1中,查出t分布的自由度为f的t分布双侧位数。比较-statistic与值的大小关系,可得检验结果的显著性关系。
(6)E(YO|XO)的预测区间:(Y0-tα/2(v)•S(Y0),Y0+tα/2(v)•S(Y0)) ;
YO的预测区间:(Y0-tα/2(v)•S(e0),Y0+tα/2(v)•S(e0)
3、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示(略)。
Dependent Variable: Y
Method: Least Squares
Date: 10/29/13 Time: 22:18
Sample: 1 18
Included observations: 18
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X2
0.402289
0.116359
3.457319
0.0035
X1
104.3081
6.409709
16.27345
0.0000
C
-0.962980
30.32507
-0.031755
0.9751
R-squared
0.979722
Mean dependent var
755.1556
Adjusted R-squared
0.977019
S.D. dependent var
258.6819
S.E. of regression
39.21512
Akaike info criterion
10.32701
Sum squared resid
23067.39
Schwarz criterion
10.47541
Log likelihood
-89.94312
Hannan-Quinn criter.
10.34748
F-statistic
362.3656
Durbin-Watson stat
2.561545
Prob(F-statistic)
0.000000
回归方程 Y^=-0.96+104.3X1+0.4X2
(2)检验设原假设 H0:βi=0 i=1,2
根据上表中的计算结果知:S(β^1)=6.409709 S(β^2)=0.116359
将S(β^1)和S(β^2)的值代入检验统计量式中,得
T1=β^1÷S(β^1)=16.2735 t2=β^2÷S(β^2)=3.4561
对于给定的显著水平α=0.05,自由度为v=15的双侧分位数t0.05/2=2.13。因为
¯
t1>t0.05/2 t2>t0.05/2,所以否定H0:β1≠0,H0:β2≠0,即可以认为受教育年限和家庭收入对学生购买书籍以及课外读物有显著性影响。
(3) R2=RSS/TSS=0.979722 R2=1-(1-R2)n-1/n-k-1=0.97702
(4)预测区间
obs
Y
YF
YFSE
X2
X1
1
450.5
485.1411747692648
42.17365506624408
171.2
4
2
507.7
486.3480417901021
42.10363828287697
174.2
4
3
613.9
602.7650101844977
41.60234303786757
204.3
5
4
563.4
504.2499025991888
41.39814289671567
218.7
4
5
501.5
504.5315049040509
41.39212417827067
219.4
4
6
781.5
825.9037819058965
42.97924483690921
240.4
7
7
541.7999999999999
526.2953401798169
41.41179733769013
273.5
4
8
611.1
639.17216531309
40.55748283418582
294.8
5
9
1222.1
1174.953542585611
47.47686324319662
330.2
10
10
793.2
863.1959728497693
40.68970052896574
333.1
7
11
660.8
667.8151426076286
41.63232216941219
366
5
12
792.7
766.0486478880758
40.41271901973422
350.9
6
13
580.9
560.2485323660397
43.30987322087763
357.9
4
14
612.7
664.9991195590084
41.45455915514781
359
5
15
890.8
878.8047863192651
40.55307988286174
371.9
7
16
1121
1112.926047930283
42.49588607436637
435.3
9
17
1094.2
1044.26078466035
43.63918011814712
523.9
8
18
1253
1285.140501588057
46.39915863939679
604.1
10
19
1235.216435826087
44.12507255732823
480
10
单个值的预测区间 Y∈[1235.216-2.13×44.125,1235.216+2.13×44.125]
均值的预测区间 E(Y)∈[1235.216-2.13×44.125,1235.216+2.13×44.125]
4、假设投资函数模型估计的回归方程为:
It=5.0+0.4Yt+0.6It-1,R2=0.8,DW=2.05,n=24其中It和Yt分别为第t期投资和国民收入
(1)对总体参数ß1,ß2的显著性进行检验(α=0.05)
(2)若总离差平方和TSS=25,试求随机误差项ut方差的估计量
(3)计算F统计量,并对模型总体的显著性进行检验(α=0.05)
答:(1)首先提出检验的原假设H0:ß1=0,i=1,2,。由题意知t的统计量值为t1=4.0,t2=3.2。对于给定的显著性水平α=0.05,;从附录4的表1中,查出t分布的自由度为v=21的双侧分数位t0.05/2(21)=1.72。因为t1=4.0> t0.05/2(21)=1.72,所以否定H0,ß1显著不等于零即可以认为第t期投资对国民收入有显著影响;t2=3.2 > t0.05/2(21)=1.72。所以否定H0,ß2显著不等于零即可以认为第t期投资对第t-1期投资有显著影响。
(2)R2 =RSS=R2×TSS=0.8×25=20.ut的方差估计量为:
(3)提出检验的原假设H0:ß1=ß2=0,F===42,对于给定的显著性水平α=0.05,从附录4的表3中,查出分分子自由度为2,分母自由度为21的F分布上侧位数F0.05/2(21)=3.47。因为F=42>3.47,所以否定H0,总体回归方程存在显著的线性关系,即第t期投资与第t-1期投资和第t期国民收入的线性关系是显著的。
6、已知某地区某农产品收购量Y,销售量X1,出口量X2,库存量X3的1955~1984年的样本观测值见下表。试建立以收购量Y为被解释变量的多元线性回归模型并预测。
根据题意可设方程为Y=β0+β1X1+β2X2+β3X3,利用Eview可知,
Dependent Variable: Y
Method: Least Squares
Date: 10/29/13 Time: 22:55
Sample: 1955 1984
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X3
0.150971
0.083318
1.811984
0.0816
X2
2.924095
1.655324
1.766480
0.0891
X1
0.919120
0.235896
3.896288
0.0006
C
0.437272
4.050575
0.107953
0.9149
R-squared
0.600052
Mean dependent var
22.13167
Adjusted R-squared
0.553904
S.D. dependent var
14.47259
S.E. of regression
9.666307
Akaike info criterion
7.498736
Sum squared resid
2429.375
Schwarz criterion
7.685562
Log likelihood
-108.4810
Hannan-Quinn criter.
7.558503
F-statistic
13.00281
Durbin-Watson stat
1.153567
Prob(F-statistic)
0.000022
回归方程 Y=0.437+0.919X1+2.924X2+0.151X3
第四章 非线性回归模型的线性化
1.某商场1990年~1998年间皮鞋销售额(万元)的统计资料如下表所示。(表略)
考虑指数模型lnY=α+βt+ut,试利用上表的数据进行回归分析,并预测1999年该商场皮鞋的销售额。
答:
Dependent Variable: Y
Method: Least Squares
Date: 10/30/13 Time: 21:52
Sample: 1990 1998
Included observations: 9
Variable
Coefficient
Std. Error
t-Statistic
Prob.
T
4.088333
0.419507
9.745574
0.0000
C
-4.186111
2.360696
-1.773253
0.1195
R-squared
0.931357
Mean dependent var
16.25556
Adjusted R-squared
0.921550
S.D. dependent var
11.60163
S.E. of regression
3.249485
Akaike info criterion
5.388000
Sum squared resid
73.91406
Schwarz criterion
5.431828
Log likelihood
-22.24600
Hannan-Quinn criter.
5.293420
F-statistic
94.97621
Durbin-Watson stat
0.542289
Prob(F-statistic)
0.000025
根据上表建立回归模型为Y = 4.08833333333*T - 4.1861111111
根据回归模型知道1999年该商场皮鞋销售量为Y=36.694
2.美国在1790年~1990年间每10年的人口总数Y(百万人)的统计资料如下表所示。(表略)
考虑指数增长模型:Y=Aeαt+u,试利用上表的数据进行回归分析,并预测美国2000年的人口总数。
答:
3.印度在1948年~1964年间的名义货币存量(现金余额)Mt(n),名义国民收入Yt(n),内含价格缩减指数(Implic it Price Deflator,也称综合价格换算系数)Pt,长期利率rt的统计资料如下表所示。用内含价格缩减指数分别除名义货币存量和名义国民收入,得实际货币存量和实际国民收入,记为Mt,Yt。(表略)
(1)考虑货币需求函数模型
Mt(n)= α0Ytα1rtα2Ptα3eut
利用最小二乘法估计该模型,判断α3估计值的符号是否合理,并对估计的回归方程解释其经济意义。
(2)考虑货币需求函数模型
Mt(n)= β0(Yt(n)) β1rtβ2Ptβ3eut
利用最小二乘法估计该模型,说明β1和α1之间的关系。
(3) 考虑货币需求函数模型
Mt=λ0Ytλ1rtλ2eut
利用最小二乘法估计该模型,确定实际货币存量关于实际国民收入及长期利率的弹性。
(4) 考虑货币需求函数模型
()t=αrtβeut
利用最小二乘法估计该模型,并对估计的回归方程解释其经济意义。
(5)对上述4个模型进行显著性检验,并加以比较。
展开阅读全文