资源描述
能源消耗量多重共线性
能源消耗量
(万吨标准煤)
GDP
(亿元)
汽车
(万辆)
发电量
(亿千瓦时)
化学纤维
(万吨)
大中型拖拉机
(万台)
化肥
(万吨)
粮食产量
(万吨)
2001
150406.00
110270.00
234.17
14808.02
828.00
3.80
3397.00
45262.00
2002
159431.00
121002.00
325.10
16540.00
991.00
4.50
3791.00
45711.00
2003
183792.00
136565.00
444.39
19105.75
1181.14
4.88
4200.00
43067.00
2004
213456.00
160714.00
509.11
22033.09
1424.54
9.83
4469.47
46947.00
2005
235997.00
185896.00
570.49
25002.60
1618.00
16.20
5220.00
48401.00
2006
258676.00
217657.00
727.89
28657.26
2025.50
19.90
5592.80
49746.00
2007
280508.00
268019.00
888.89
32815.53
2390.00
20.30
5786.90
50150.00
2008
291448.00
316752.00
930.59
34957.61
2415.00
31.70
6012.70
52850.00
2009
306647.00
345629.00
1379.53
37146.51
2730.00
37.10
6599.70
53082.00
2010
324939.00
408903.00
1826.53
42071.60
3090.00
38.40
6740.60
54641.00
2011
348002.00
484124.00
1841.60
47000.00
3390.00
40.20
6217.20
57121.00
2012
365000.00
534123.00
1927.70
49377.70
3800.00
46.30
7296.00
58957.00
2013
385000.00
588019.00
2211.70
53975.90
4121.90
58.70
7037.00
60194.00
2014
426000.00
635910.00
2372.50
56495.80
4389.80
64.40
6887.20
60710.00
2015
430000.00
676708.00
2450.40
58105.80
4831.70
68.80
7432.00
62144.00
数据来源:《2001年—2015年中国统计年鉴》
最小二乘法:
得到的回归模型为
Y = 132333.984713 - 0.344084350491*GDP - 20.9639535518*QC + 7.64716297259*FDL + 35.5980328128*HXXW + 1337.53288876*TLJ - 3.05654212394*HF - 1.66965708916*LSCL
t= (1.273) (-1.617) (-1.018) (3.249) (1.269) (1.834) (-0.353) (-0.613)
R²=0.996,F =258.647,DW=2.661
由以上结果可见,该模型=0.996149,修正的可决系数为0.992297,可决系数非常高,检验值为258.6471,明显显著。但是当时,,不仅HF、HXXW的系数检验不显著,而且GDP、QC、LSCL系数的符号与预期相反,这样表明可能存在严重的多重共线性。
计算各解释变量的相关系数,选择GDP、QC、FDL、HXXW、TLJ、HF、LSCL的数据。
全部解释变量的相关系数矩阵
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高吗,证实确实存在严重的多重共线性。
多重共线性的修正
为消除共线性的影响,首先分别拟合Y对GDP QC FDL HXXW TLJ HF LSCL的一元回归,得到七个回归模型的参数估计结果。
7个解释变量分别进行一元回归模型的参数估计结果
参数估计值
GDP
QC
FDL
HXXW
TLJ
HF
LSCL
系数估计值
0.4507
110.966
6.0959
69.7543
4059.198
66.3748
14.3492
T统计量
17.29886
14.7851
32.50876
28.4108
18.9907
11.6337
17.0138
0.9585
0.9439
0.987848
0.9842
0.9652
0.9124
0.9570
修正的
0.9552
0.9396
0.986914
0.9829
0.9625
0.9056
0.9537
F统计量
299.2504
2186001
1056.820
807.171
360.646
135.3427
289.4691
可以发现,变量FDL拟合效果最佳,且整体拟合效果最好。即发电量对能源消耗量起主要作用。按照各个解释变量一元回归模型的拟合优度大小进行排序:FDL,HXXW,TLJ,GDP,LSCL,QC,HF,以FDL为基础依次加入其他解释变量进行逐步回归。
加入HXXW
Y = 79506.7054599 + 4.7901720539*FDL + 15.018962978*HXXW
t = (5.08510) (2.011848) (0.550224)
=0.988,F=500.22,RSS=1.37*10^9
系数为正
加入TLJ
Y = 83502.3622712 + 4.7662124355*FDL + 10.3033091555*HXXW + 296.631527853*TLJ
t=(4.1385) (1.925450) (0.325176) (0.334023)
=0.988266,F=308.8278,RSS=1.35*10^9
系数为正
加入TLJ
Y = 57002.1055085 + 5.90241783797*FDL + 49.5728951535*HXXW - 0.311419040916*GDP
t=(4.088001) (3.191238) (2.101646) (-3.107994)
=0.993689,F=577.3510,RSS=7.27*10^8
系数为负,剔除GDP
加入LSCL
Y = 165163.157653 + 5.61116988855*FDL + 16.2680580598*HXXW - 2.25051469861*LSCL
t=(1.420467) (2.104788) (0.583718) (-0.743696)
=0.988715,F=321.2445,RSS=1.3*10^9
系数为负,剔除LSCL
加入QC
Y = 56459.2268715 + 6.33133390691*FDL + 21.8258849727*HXXW - 40.2663627237*QC
t=(3.160903) (2.821108) (0.891906) (-2.051861)
=0.991428,F=424.0930,RSS=9.88*10^8
系数为负,剔除QC
加入HF
Y = 49317.0081576 + 3.58414062424*FDL + 18.0157355404*HXXW + 11.3550355173*HF
t=(2.315445) (1.593152) (0.726667) (1.898782)
=0.991073,F=407.0851,RSS=1.03*10^9
最后,从此模型中可以看出,发电量、化学纤维、和化肥对能源消耗量有显著影响。
展开阅读全文