资源描述
我国财政收入的多元线性回归模型
一、影响我国财政收入增长因素的实证分析
研究财政收入的影响因素离不开一些基本的经济变量。回归变量的选择是建立回归模型的一个极为重要的问题。通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有税收、国内生产总值和固定资产投资和社会消费品零售总额和社会总人口,并且在总人口里面考虑了65岁以上的老年化人口数对税收的负面影响。为了考察这一问题,从国家统计局的国家数据里抽选出1995-2014年税收、国内生产总值、固定资产投资总额,社会消费品零售额,社会总人口(包括老年化人口)的数据,利用eviews7.2进行回归分析,建立财政收入影响因素模型,分析影响财政收入的主要因素及其影响程度。
二、模型的设定
1.将财政收入作为被解释变量,用Y表示。税收,GDP,固定资产投资总额、社会消费品零售额、社会总人口作为解释变量,分别用X1,X2,X3,X4,X5表示。
2.数据性质的选择是:时间序列数据
3.模型设定为:
三、数据收集如表
财政收入(Y)(亿元)
各种税收(X1)(亿元)
国生产总值GDP(X2)(亿元)
固定资产投资总额(X3)(亿元)
社会消费品零售总额(X4)(亿元)
社会总人口(X5)(万人)
65岁以上的人口(万人)(百分比)
1995
6242.2
6038.04
61129.8
20019.3
271896.1
121121
7510(6.2%)
1996
7407.99
6909.82
71572.3
22913.5
242842.8
122389
7833
(6.4%)
1997
8651.14
8234.04
79429.5
24941.1
210307
123626
8085
(6.54%)
1998
9875.95
9262.8
84883.7
28406.2
183918.6
124761
8359
(6.7%)
1999
11444.08
10682.58
90187.7
29854.7
156998.4
125786
8679
(6.9%)
2000
13395.23
12581.51
99776.3
32917.73
132678.40
126743
8821
(7.0%)
2001
16386.04
15301.38
110270.4
37213.49
114830.10
127627
9062
(7.1%)
2002
18903.64
17636.45
121002
43499.91
93571.60
128453
9377
(7.3%)
2003
21715.25
20017.31
136564.6
55566.61
79145.20
129227
9692
(7.5%)
2004
26396.47
24165.68
160714.4
70477.4
68352.60
129988
9857
(7.6%)
2005
31649.29
28778.54
185895.8
88773.62
59501.00
130756
10055
(7.7%)
2006
38760.2
34804.35
217656.6
109998.2
52516.30
131448
10419
(8.0%)
2007
51321.78
45621.97
268019.4
137323.94
48135.90
132129
10636
(8.05%)
2008
61330.35
54223.79
316751.7
172828.4
43055.40
132802
10956
(8.2%)
2009
68518.3
59521.59
345629.2
224598.77
39105.70
133450
11307
(8.5%)
2010
83101.51
73210.79
408903
251683.77
35647.90
134091
11894
(8.9%)
2011
103874.43
89738.39
484123.5
311485.13
33378.10
134735
12288
(9.1%)
2012
117253.52
100614.28
534123
374694.74
31252.90
135404
12714
(9.4%)
2013
129209.64
110530.7
588018.8
446294.09
28360.20
136072
13161
(9.7%)
2014
140349.74
119158.05
636138.7
512760.7
23613.80
136782
13755
(10%)
数据来源:国家统计局网
四、参数估计:
用eviews7.2做回归分析。假定模型中随机项满足基本假设,可用OLS(最小二乘估计)法估计其参数。
具体操作:
(1)打开file-new-workfile,设置start date为1995,end date为2014,
在命令框中输入data y x1 x2 x3 x4 x5
在命令框中输入
将变量进行标准化得 在命令框中输入ls y c x1 x2 x3 x4 x5即出现回归结果根据表中的样本数据,模型估计结果为
F=91397.54 D.W=2.713325
可以看出,可决系数,修正的可决系数,说明模型的拟合程度很好。但是,x2、x4、x5系数均不能通过t检验,且均为负数,与经济意义不符,表明模型很可能存在多重共线性。
五、模型修正
1.多重共线性的检验与修正
(1)检验
选中y,x1,x2,x3,x4,x5,点击右键,选择“open/as group”,在出现的对话框里选择“View/Covariance Analysis/correlation”,点击ok,得到相关系数矩阵”
由相关系数矩阵可以看出,y与x1、x2、x3的相关系数都在0.9以上,说明所选自变量是都与y高度相关的,用y与自变量做多元线性回归是合适的。但解释变量x1与x2、x3、x5之间存在较高的相关系数,证明确实存在严重的多重共线性。
(2)多重共线性修正
采用逐步回归的办法,检验和回归多重共线性问题。分别作Y对X1、X2、X3、X4、X5的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4,LS Y C X5并保存,整理结果如表所示
一元回归分析结果
变量 X1 X2 X3 X4 X5
参数估计值 0.999862 0.999390 0.993661 -0.732822 0.893750
T统计量 254.9438 121.4209 37.49995 -4.569383 8.453323
0.999723 0.998781 0.987361 0.537028 0.798790
0.999708 0.998713 0.986659 0.511308 0.787611
其中,X1的方程=0.999708最大,以X1为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LS Y C X1 X2,LS Y C X1 X3, LS Y C X1 X4, LS Y C X1 X5并保存结果,整理结果如表所示。
加入新变量的回归结果(一)
X1
X2
X3
X4
X5
X1,X2
1.294516
(8.660291)
-0.294742
(-1.971817)
0.999748
X1,X3
0.885360
(58.20682)
0.115431
(7.588867)
0.999929
X1,X4
1.013554
(252.7904)
0.018472
(4.6070407)
0.999862
X1,X5
1.025910
(171.2237)
-0.028961
(-4,833617)
0.999870
经比较,新加入X3的方程=0.999929,改进最大,而且各个参数的t检验显著,选择保留X3。X2不能通过t检验,剔除X2。再加入其它新变量逐步回归,在命令框中依次输入:LS Y C X1 X3 X4,LS Y C X1 X3 X5保存结果,整理结果如表所示。
加入新变量的回归结果(二)
X1
X2
X3
X4
X5
X1,X3,X4
0.918471
(53.77340)
0.088483
(5.623360)
0.008606
(2.898046)
0.99951
X1,X3,X5
0.926590
(52.00922)
0.086625
(5.688979)
-0.014072
(-3.189324)
0.999961
当加入X5时,有所增加,且t检验显著,则选择X5。再加入其他变量,在命令框中输入LS Y C X1 X3 X5 X4
加入新变量的回归结果(三)
X1
X2
X3
X5
X4
X1,X3,X5,x4
0.959209
(40.07464)
0.088483
(6.114166)
-0.092190
(-2.214560)
-0.051012
(-1.885678)
0.999969
加入X4后,t值没有显著提高,反而有略微下降趋势,也没有显著提高,剔除X4.
所以修正多重线性影响后的模型为,有回归结果为
T检验 (52.00922) (5.688979) (-3.189324)
=0.999961 =0.999954 F=138251.2 D.W=2.295833
五、异方差检验
在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。
由white检验得
n=18.62072, 从上表可以看出,由White检验可知,在=0.05下,查分布表,得临界值 (9)=16.919,所以拒绝原假设,表明模型存在异方差。
(2)异方差的修正
用WLS估计:选择权重w=1/e1,其中e1=resid。
在命令窗口中输入genr e1= resid,点回车键。
在消除多重共线性后的回归结果对话框中点击
Estimate/Options/Weithted LS/TSLS,
并在Weight中输入1/e1,点确定,得到如下回归结果。
②修正后的White检验
n=6.9561<(4)=9.488,证明模型中异方差已经被消除了。
由white修正后的回归结果
异方差修正后的模型为
t值 (10.27130)(172.0315)(15.24988)(-7.492185)
= 0.999999 =0.999998
其中= 1/e1* X1, =1/e1*X3, =1/e1*X4 , e1=resid
六、自相关检验
(1)D.W检验
在显著水平,查D.W表,当n=20,k=3时,得上临界值,
下临界值,D.W.=1.539436.因为,不能判断误差项存在自相关。
(2)LM检验
按路径“View/Residual Tests/Serial Correlation LM Tests”,在出现的对话框中选择Lags to include:1,点击ok.得到LM检验结果如下。
LM检验结果
由于=0.3324>0.05,所以不存在自相关。
由之前消除异方差,并检验出没有自相关的回归结果
得出最终的回归方程为
t值 (10.27130)(172.0315)(15.24988)(-7.492185)
= 0.999999 =0.999998
其中= 1/e1* X1, =1/e1*X3, =1/e1*X4 , e1=resid
七、模型检验
1、 经济意义检验
模型估计结果表明,在假定其他变量不变的情况下,当税收每增长1元时,财政收入增加0.94237元;在假定其他变量不变的情况下,当固定资产总额每增加1元时,财政收入增加0.077465元;在假定其他变量不变的情况下,当社会总人口每增加1人时,财政收入减少0.019583元,这是基于前面数据的老年化人口数占总人口的百分比不断增长,随着老年化人口的增多,给我国财政收入带来了负效应,这与理论分析判断相一致。
2、 统计检验
(1)拟合优度:由表中数据可得:R2=0.999999,修正的可决系数为 =0.999998,这说明模型对样本的拟合很好。
(2)F检验:针对 :,给定显著性水平,在F分布表中查出自由度为k=3和n-k-1=16的临界值 (3 ,16)=8.69。由表中得到F=1974410,由于F=1974410> = ( 3,16)=8.69,应拒绝原假设,说明回归方程显著,即“税收”、“固定资产总额”、“社会总人口”等变量联合起来确实对“财政收入”有显著影响。
(3)t检验:分别对H0: =0(j=1,2,3),给定显著性水平α=0.05,查t分布表得自由度为n-k-1=16临界值 (n-k-1)=2.120。由表中数据可得,、、,对应的t统计量分别为172.0135、15.24988、-7.492185,其绝对值均大于 (n-k-1)=2.120,这说明应该分别拒绝H0: =0(j=1,2,3),也就是说,当在其他解释变量不变的情况下,解释变量“税收”(X1) 、“固定资产总额”(X3)和“社会总人口”分别对被解释变量“财政收入”(Y)影响显著。
八、附表
表一:对X1的回归结果
表二:对X2的回归结果
表三:对X3的回归结果
表四:对X4的回归结果
表五:对X5的回归结果
表六:对X1、X2的回归结果
表七:对X1、X3的回归结果
表八:对X1、X4的回归结果
表九:对X1、X5的回归结果
表十:对 X1、X3、X4的回归结果
表十一:对X1、X3、X5的回归结果
表十二:对X1、X3、X5进行异方差修正后的回归结果
展开阅读全文