资源描述
关于我国影响税收增长因素的实证分析
【摘要】:税收是我国财政收入的重要组成部分,对维持社会稳定和促进经济增长有很大的作用。影响税收收入的因素来自于很多方面,从国内生产总值,财政支出和物价这三个方面进行研究,得出税收与三者的关系,为现行政策提供参考。
【关键词】:国内生产总值 财政支出 零售商品物价水平 税收 计量模型 检验
一、问题的提出
改革开放以来,中国经济高速增长,1978-2008年的31年间,国内生产总值从3645.2亿元增长到314045亿元,一跃成为世界第二大经济体。随着经济体制改革的深化和经济的快速增长,中国的财政收支状况也发生了很大的变化,中央和地方的税收收入1978年为519.28亿元,到2008年已增长到54223.79亿元,31年间平均每年增长16.76%。税收作为财政收入的重要组成部分,在国民经济发展中扮演着不可或缺的角色。为了研究影响中国税收增长的主要原因,分析中央和地方税收收入的增长规律,以及预测中国税收未来的增长趋势,我们需要建立计量经济模型进行实证分析。而且从进入21世纪以来,我国的经济发展面临着巨大的挑战与机遇,在新的经济背景下,基于知识和信息的产业发展迅速,全球一体化日渐深入,中国已是WTO的一员。新形势的经济发展是经济稳定和协调增长的结果,由于税收具有敛财与调控的重要功能,因而它在现实的经济发展中至始至终都发挥着非常重要的作用,所以研究影响我国税收收入的主要原因具非常重要的作用。
二、模型设定
(一)为了具体分析各要素对提高我国税收收入的影响大小,选择能反映我们税收变动情况的“各项税收收入”为被解释变量(用Y表示),选择能影响税收收入的“国内生产总值(用X1表示)”、“财政支出(用X2表示)”和“ 商品零售价格指数(用X3表示)”为解释变量。
计量经济学模型的设定
lnY= β0+ β1 lnX1+ β2 lnX2 + β3 X3 + ui
(二)确定参数估计值范围
由经济常识知,因为国内生产总值(X1)、财政支出(X2)和商品零售价格指数(X3)的增加均会带动税收收入的增加,所以国内生产总值(X1)、财政支出(X2)和商品零售价格指数(X3)与税收收入应为正相关的关系,所以可估计0<β1<1 ,0<β2<1, 0<β3<1。
表1为由《中国统计年鉴》得到的1990-2009年的有关数据。
表1 税收收入模型的时间序列表
年份
税收收入(Y)
国内生产总值(X1)
财政支出(X2)
商品零售价格指数(X3)(单位:%)
(单位:亿元)
(单位:亿元)
(单位:亿元)
1990
2821.86
18667.80
3083.59
102.1
1991
2990.17
21781.50
3386.62
102.9
1992
3296.91
26923.48
3742.2
105.4
1993
4255.30
35333.92
4642.3
113.2
1994
5126.88
48197.86
5792.62
121.7
1995
6038.04
60793.73
6823.72
114.8
1996
6909.82
71176.59
7937.55
106.1
1997
8234.04
78973.03
9233.56
100.8
1998
9262.80
84402.28
10798.18
97.4
1999
10682.58
89677.05
13187.67
97
2000
12581.51
99214.55
15886.5
98.5
2001
15301.38
109655.17
18902.58
99.2
2002
17636.45
120332.69
22053.15
98.7
2003
20017.31
135822.76
24649.95
99.9
2004
24165.68
159878.34
28486.89
102.8
2005
28778.54
184937.37
33930.28
100.8
2006
34804.35
216314.43
40422.73
101
2007
45621.97
265810.31
49781.35
103.8
2008
54223.79
314045.43
62592.66
105.9
2009
59521.59
340506.87
76299.93
98.8
资料来源:《中国统计年鉴2009》;
三、参数估计
模型为:
lnY= β0+ β1 lnX1+ β2 lnX2 + β3 X3 + ui
Y=税收收入 (亿元)
X1=国内生产总值 (亿元)
X2=财政支出 (亿元)
X3=零售商品物价指数 (%)
用Eviews估计结果为:
表2
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 10:53
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.347503
0.284342
-1.222128
0.2394
LOG(X1)
-0.005218
0.073387
-0.071101
0.9442
LOG(X2)
0.987878
0.064427
15.33321
0.0000
X3
0.003543
0.001748
2.027193
0.0596
R-squared
0.998444
Mean dependent var
9.405915
Adjusted R-squared
0.998152
S.D. dependent var
0.972567
S.E.of regression
0.041805
Akaike info criterion
-3.334744
Sumsquared resid
0.027963
Schwarz criterion
-3.135598
Log likelihood
37.34744
F-statistic
3422.460
Durbin-Watson stat
0.986881
Prob(F-statistic)
0.000000
根据表中数据,模型设计的结果为:
(-1.222128) (-0.071101) (15.33321) (2.027193)
R2=0.998444 R(—)2=0.998152 DW=0.986881 F=3422.460 n=20
四、检验及修正
(一)经济意义检验
经济意义检验主要检验模型参数估计量在经济意义上的合理性。
所估计的参数= -0.005218,=0.987878, =0.003543,且<0, 0<<1 , 0<<1 ,不符合变量参数中确定的参数范围,、符合变量参数中确定的参数范围。模型估计结果说明,在假定其他变量不变的情况下,当年国内生产总值每增长1%,平均来说税收收入会减少0.005218%;在假定其他变量不变的情况下,当年财政支出每增长1%,平均来说税收收入会增加0.987878%;在假定其他变量不变的情况下,当年商品零售价格指数上涨1%,平均来说税收收入会增加0.003543%。这里与理论分析和经验判断相一致,符合中国现实的国情具有经济意义应保留,符号为负不符合经济检验不具有经济意义,应剔除。
(二)统计意义检验
1、拟合优度检验(R2检验)
拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度。
从回归估计的结果看模型拟合较好:可绝系数 R2=0.998444 R(—)2=0.998152 ,这说明所建模型整体上与样本观测值拟合的很好
说明“解释变量”国内生产总值 财政支出 商品零售价格指数 对“被解释变量” 税收收入的绝大部分差异作了解释。
2、 F检验
假设:=0,=0,=0 :(j=1,2,3)不全为零
给定显著性水平α=0.05,在F分布表中查出自由度为F(k=3,n-k-1=16)的临界值(3,16)=3.24,由表2中得到F=3422.460>(3,16)=3.24,应拒绝原假设:=0,=0,=0 ,接受:(j=1,2,3)不全为零说明回归方程显著,即表明模型的线性关系在95%的置信水平下成立,即列入模型的解释变量“解释变量”国内生产总值 财政支出 商品零售价格指数 联合起来确实对“被解释变量”税收收入有显著影响。
3、t检验
分别针对:=0,=0,=0 ,给定显著性水平α=0.05,查t分布表的自由度为n-k-1=16的临界值=2.120。由表2中的数据可得,与、、、对应的t统计量分别为(-1.222128)(-0.071101)(15.33321) (2.027193)其绝对值不全大于=2.120,这说明在显著水平α=0.05下,只有能拒绝:=0,=0,=0 ,也就是说,当在其他解释变量不变的情况下,各个解释变量“国内生产总值(X1)”、“财政支出(X2)”和“ 商品零售价格指数(X3)”分别对被解释变量“各项税收收入(Y)”不全都有显著影响,这可能是由于多重共线性或自相关性的影响。
(三)计量经济意义检验
1、多重共线性检验
让lnY分别对lnX1、lnX2、X3做回归。
(1)将lnY与lnX1做回归得到结果如表3:
表 3
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 19:53
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-3.425298
0.499347
-6.859556
0.0000
LOG(X1)
1.123575
0.043610
25.76417
0.0000
R-squared
0.973599
Mean dependent var
9.405915
AdjustedR-squared
0.972132
S.D. dependent var
0.972567
S.E.of regression
0.162357
Akaike info criterion
-0.703402
Sum squared resid
0.474475
Schwarz criterion
-0.603829
Log likelihood
9.034023
F-statistic
663.7926
Durbin-Watson stat
0.204663
Prob(F-statistic)
0.000000
R2=0.973599 D.W.=0.204663
(2)将lnY与lnX2做回归得到结果如表4:
表 4
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 20:05
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.088902
0.098794
0.899876
0.3801
LOG(X2)
0.974373
0.010279
94.79376
0.0000
R-squared
0.998001
Mean dependent var
9.405915
Adjusted R-squared
0.997890
S.D. dependent var
0.972567
S.E. of regression
0.044677
Akaike info criterion
-3.284085
Sum squared resid
0.035928
Schwarz criterion
-3.184512
Log likelihood
34.84085
F-statistic
8985.857
Durbin-Watson stat
0.835853
Prob(F-statistic)
0.000000
(0.899876) (94.79376)
R2=0.998001 D.W.=0.835853
(3)将lnY与X3做回归得到结果如表5:
表 5
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 20:07
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
15.42325
3.444161
4.478085
0.0003
X3
-0.058116
0.033204
-1.750261
0.0971
R-squared
0.145438
Mean dependent var
9.405915
Adjusted R-squared
0.097962
S.D. dependent var
0.972567
S.E. of regression
0.923702
Akaike info criterion
2.773786
Sum squared resid
15.35807
Schwarz criterion
2.873359
Log likelihood
-25.73786
F-statistic
3.063413
Durbin-Watson stat
0.129252
Prob(F-statistic)
0.097100
(4.478085) (-1.750261)
R2=0.145438 D.W.=0.129252
计算各解释变量的相关系数,选择lnX1、lnX2 、X3的数据,得到相关系数矩阵如表6:
表6 相关系数表
LOG(X1)
LOG(X2)
X3
LOG(X1)
1.000000000000000
0.0268606
-0.344
LOG(X2)
0.0268606
1.000000000000000
-0.40
X3
-0.344
-0.40
1.000000000000000
可见财政支出对税收收入的影响最大,与经验相符合,因此选(2)得出的回归形式为初始的回归模型。
逐步回归
将lnY与lnX1、lnX2做回归得到下表7:
表7
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 20:11
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.065120
0.269604
-0.241539
0.8120
LOG(X1)
0.046124
0.074913
0.615707
0.5462
LOG(X2)
0.935395
0.064166
14.57776
0.0000
R-squared
0.998044
Mean dependent var
9.405915
Adjusted R-squared
0.997814
S.D. dependent var
0.972567
S.E. of regression
0.045468
Akaike info criterion
-3.206140
Sum squared resid
0.035145
Schwarz criterion
-3.056780
Log likelihood
35.06140
F-statistic
4338.136
Durbin-Watson stat
0.807678
Prob(F-statistic)
0.000000
将lnY与lnX1、X3做回归得到下表8:
表8
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/11 Time: 22:57
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.359433
0.222734
-1.613732
0.1250
LOG(X2)
0.983358
0.010188
96.52501
0.0000
X3
0.003500
0.001592
2.199073
0.0420
R-squared
0.998444
Mean dependent var
9.405915
Adjusted R-squared
0.998260
S.D. dependent var
0.972567
S.E.of regression
0.040563
Akaike info criterion
-3.434428
Sum squared resid
0.027971
Schwarz criterion
-3.285068
Log likelihood
37.34428
F-statistic
5452.820
Durbin-Watson stat
0.981206
Prob(F-statistic)
0.000000
将其他解释变量分别倒入上述初始回归模型,寻找最佳回归方程表9
C
lnx2
Lnx1
x3
D.W.
Y=f(x2)
0.088902
0.97437
0.998001
0.835853
t值
0.899876
94.79376
Y=f(x2,x1)
-0.065120
0.935395
0.046124
0.997890
0.807678
t值
-0.241539
14.57776
0.615707
Y=f(x2,x3)
-0.359433
0.983358
0.003500
0.998444
0.981206
t值
-1.61372
96.52501
2.199073
讨论:
第一步,在初始模型中引入X1,模型修正的拟合优度反而略有下降,同时X1的参数未能通过t检验,参数符号与经济意义相符。
第二步,去掉X1,引入X3,拟合优度提高,且参数符号与经济意义相符,变量也通过了t检验,D.W.检验也表明不存在1阶序列相关性。因此最终的税收收入函数应以
Y=f(x2,x3)为最优,拟合结果如下:
(-1.613732) (96.52501) (2.199073)
R2=0.998444
(2)异方差检验
①怀特检验 利用怀特检验法检验模型是否存在异方差。
残差相关图 表10
表11
White Heteroskedasticity Test:
F-statistic
0.664468
Probability
0.626329
Obs*R-squared
3.010411
Probability
0.556085
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/12/11 Time: 23:33
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.099197
0.146914
0.675207
0.5098
LOG(X2)
-0.006609
0.010283
-0.642673
0.5301
(LOG(X2))^2
0.000377
0.000534
0.705588
0.4913
X3
-0.001292
0.002206
-0.585688
0.5668
X3^2
5.9821794
1.0151289
0.589302
0.5644
R-squared
0.150521
Mean dependent var
0.001399
Adjusted R-squared
-0.076007
S.D. dependent var
0.001794
S.E. of regression
0.001861
Akaike info criterion
-9.523470
Sum squared resid
5.1929968
Schwarz criterion
-9.274537
Log likelihood
100.2347
F-statistic
0.664468
Durbin-Watson stat
2.373028
Prob(F-statistic)
0.626329
表12
White Heteroskedasticity Test:
F-statistic
0.637251
Probability
0.675110
Obs*R-squared
3.707910
Probability
0.592187
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/12/11 Time: 23:54
Sample: 1990 2009
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.292847
0.291105
1.005985
0.3315
LOG(X2)
-0.021207
0.021545
-0.984300
0.3417
(LOG(X2))^2
0.000440
0.000547
0.803674
0.4350
(LOG(X2))*X3
0.000130
0.000168
0.774190
0.4517
X3
-0.003714
0.003845
-0.965839
0.3505
X3^2
1.177808
1.272489
0.925594
0.3703
R-squared
0.185396
Mean dependent var
0.001399
Adjusted R-squared
-0.105535
S.D. dependent var
0.001794
S.E. of regression
0.001886
Akaike info criterion
-9.465391
Sum squared resid
4.979800
Schwarz criterion
-9.166671
Log likelihood
100.6539
F-statistic
0.637251
Durbin-Watson stat
2.603946
Prob(F-statistic)
0.675110
记为对原始模型进行普通最小二乘回归的道德残差平方项,将其与X2 、X3及其平方项与交叉项做辅助回归,得
(1.005985) (-0.984300) (0.803674) (0.774190) (-0.965839) (0.925594)R2=0.185396
怀特统计量nR2=20*0.185396=3.70792,该值小于5%显著性水平下,自由度为5的分布的相应临界值=11.07,因此,不拒绝同方差的原假设。
去掉交叉项后的辅助回归结果为
(0.675207) (-0.642673) (0.705588) (-0.585688) (0.589302)R2=0.150521
怀特统计量nR2=20*0.150521=3.01042,该值小于5%显著性水平下,自由度为5的分布的相应临界值=11.07,因此,不拒绝同方差的原假设。
②拉格朗日乘数检验
表13
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
4.184117
Probability
0.057610
Obs*R-squared
4.145950
Probability
0.041734
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/13/11 Time: 01:00
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.059763
0.206489
0.289426
0.7760
LOG(X2)
-0.003202
0.009480
-0.337779
0.7399
X3
-0.000293
0.001468
-0.199347
0.8445
RESID(-1)
0.482915
0.236085
2.045511
0.0576
R-squared
0.207297
Mean dependent var
5.83E-16
Adjusted R-squared
0.058666
S.D. dependent var
0.038369
S.E. of regression
0.037226
Akaike info criterion
-3.566736
Sum squared resid
0.022173
Schwarz criterion
-3.367589
Log likelihood
39.66736
F-statistic
1.394706
Durbin-Watson stat
1.432424
Prob(F-statistic)
0.280658
含1阶滞后残差项的辅助回归为
(0.289426) (-0.337779) (-0.199347) (2.045511)
R2=0.207297
于是,LM=19*0.207297=3.938643,该值大于显著性水平自由度为1的分布的相应临界值=3.84,由此判断原模型存在1阶序列相关性。
表14
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
3.468355
Probability
0.057796
Obs*R-squared
6.324294
Probability
0.042335
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/13/11 Time: 01:14
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.041358
0.198427
0.208432
0.8377
LOG(X2)
-0.002665
0.009100
-0.292815
0.7737
X3
-0.000166
0.001410
-0.117462
0.9081
RESID(-1)
0.695821
0.265057
2.625178
0.0191
RESID(-2)
-0.413502
0.267512
-1.545731
0.1430
R-squared
0.316215
Mean dependent var
5.83E-16
Adjusted R-squared
0.133872
S.D. dependent var
0.038369
S.E. of regression
0.035708
Akaike info criterion
-3.614540
Sum squared resid
0.019126
Schwarz criterion
-3.365606
Log likelihood
41.14540
F-statistic
1.734177
Durbin-Watson stat
1.943582
Prob(F-statistic)
0.194866
含2阶滞后残差项的辅助回归为
(0.208432) (-0.292815) (-0.117462) (2.625178) (-1.545731)
R2=0.316215
于是,LM=18*0.316215=5.69187,该值小于显著性水平自由度为2的分布的相应临界值=5.99,仍说明原模型不存在序列相关性,表明并不存在2阶序列想关性结合1阶滞后残差项的辅助回归情况,可判断存在1阶序列相关性。
表15
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
2.347569
Probability
0.116783
Obs*R-squared
6.693728
Probability
0.082328
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/13/11 Time: 10:18
Presample missing value lagged residuals set to zero.
展开阅读全文