1、 我国财政收入的多元线性回归模型一、影响我国财政收入增长因素的实证分析 研究财政收入的影响因素离不开一些基本的经济变量。回归变量的选择是建立回归模型的一个极为重要的问题。通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有税收、国内生产总值和固定资产投资和社会消费品零售总额和社会总人口,并且在总人口里面考虑了65岁以上的老年化人口数对税收的负面影响。为了考察这一问题,从国家统计局的国家数据里抽选出1995-2014年税收、国内生产总值、固定资产投资总额,社会消费品零售额,社会总人口(包括老年化人口)的数据,利用eviews7.2进行回归分析,建立财政收入影响因素模型,分析影
2、响财政收入的主要因素及其影响程度。二、模型的设定1.将财政收入作为被解释变量,用Y表示。税收,GDP,固定资产投资总额、社会消费品零售额、社会总人口作为解释变量,分别用X1,X2,X3,X4,X5表示。2.数据性质的选择是:时间序列数据3.模型设定为:三、数据收集如表财政收入(Y)(亿元)各种税收(X1)(亿元)国生产总值GDP(X2)(亿元)固定资产投资总额(X3)(亿元)社会消费品零售总额(X4)(亿元)社会总人口(X5)(万人)65岁以上的人口(万人)(百分比)19956242.26038.0461129.820019.3271896.11211217510(6.2%)19967407.
3、996909.8271572.322913.5242842.81223897833(6.4%)19978651.148234.0479429.524941.12103071236268085(6.54%)19989875.959262.884883.728406.2183918.61247618359(6.7%)199911444.0810682.5890187.729854.7156998.41257868679(6.9%)200013395.2312581.5199776.332917.73132678.40 1267438821(7.0%)200116386.0415301.381102
4、70.437213.49114830.10 1276279062(7.1%)200218903.6417636.4512100243499.9193571.60 1284539377(7.3%)200321715.2520017.31136564.655566.6179145.20 1292279692(7.5%)200426396.4724165.68160714.470477.468352.60 1299889857(7.6%)200531649.2928778.54185895.888773.6259501.00 13075610055(7.7%)200638760.234804.352
5、17656.6109998.252516.30 13144810419(8.0%)200751321.7845621.97268019.4137323.9448135.90 13212910636(8.05%)200861330.3554223.79316751.7172828.443055.40 13280210956(8.2%)200968518.359521.59345629.2224598.7739105.70 13345011307(8.5%)201083101.5173210.79408903251683.7735647.90 13409111894(8.9%)2011103874
6、.4389738.39484123.5311485.1333378.10 13473512288(9.1%)2012117253.52100614.28534123374694.7431252.90 13540412714(9.4%)2013129209.64110530.7588018.8446294.0928360.20 13607213161(9.7%)2014140349.74119158.05636138.7512760.723613.80 13678213755(10%)数据来源:国家统计局网四、参数估计:用eviews7.2做回归分析。假定模型中随机项满足基本假设,可用OLS(最
7、小二乘估计)法估计其参数。具体操作:(1)打开file-new-workfile,设置start date为1995,end date为2014, 在命令框中输入data y x1 x2 x3 x4 x5 在命令框中输入 将变量进行标准化得 在命令框中输入ls y c x1 x2 x3 x4 x5即出现回归结果根据表中的样本数据,模型估计结果为 F=91397.54 D.W=2.713325可以看出,可决系数,修正的可决系数,说明模型的拟合程度很好。但是,x2、x4、x5系数均不能通过t检验,且均为负数,与经济意义不符,表明模型很可能存在多重共线性。五、模型修正1.多重共线性的检验与修正(1)
8、检验选中y,x1,x2,x3,x4,x5,点击右键,选择“open/as group”,在出现的对话框里选择“View/CovarianceAnalysis/correlation”,点击ok,得到相关系数矩阵”由相关系数矩阵可以看出,y与x1、x2、x3的相关系数都在0.9以上,说明所选自变量是都与y高度相关的,用y与自变量做多元线性回归是合适的。但解释变量x1与x2、x3、x5之间存在较高的相关系数,证明确实存在严重的多重共线性。(2)多重共线性修正采用逐步回归的办法,检验和回归多重共线性问题。分别作Y对X1、X2、X3、X4、X5的一元回归,在命令窗口分别输入LSYCX1,LSYCX2,
9、LSYCX3,LSYCX4,LS Y C X5并保存,整理结果如表所示 一元回归分析结果变量 X1 X2 X3 X4 X5参数估计值 0.9998620.9993900.993661-0.7328220.893750T统计量 254.9438121.420937.49995-4.5693838.453323 0.999723 0.998781 0.987361 0.537028 0.798790 0.999708 0.998713 0.986659 0.511308 0.787611其中,X1的方程=0.999708最大,以X1为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LSYCX
10、1X2,LSYCX1X3,LSYCX1X4, LSYCX1X5并保存结果,整理结果如表所示。加入新变量的回归结果(一)X1X2X3X4X5X1,X21.294516(8.660291)-0.294742(-1.971817)0.999748X1,X30.885360(58.20682)0.115431(7.588867)0.999929X1,X41.013554(252.7904)0.018472(4.6070407)0.999862X1,X51.025910(171.2237)-0.028961(-4,833617)0.999870 经比较,新加入X3的方程=0.999929,改进最大,而且
11、各个参数的t检验显著,选择保留X3。X2不能通过t检验,剔除X2。再加入其它新变量逐步回归,在命令框中依次输入:LS Y C X1 X3 X4,LS Y C X1 X3 X5保存结果,整理结果如表所示。加入新变量的回归结果(二)X1X2X3X4X5X1,X3,X40.918471(53.77340)0.088483(5.623360)0.008606(2.898046)0.99951X1,X3,X50.926590(52.00922)0.086625(5.688979)-0.014072(-3.189324)0.999961当加入X5时,有所增加,且t检验显著,则选择X5。再加入其他变量,在命
12、令框中输入LS Y C X1 X3 X5 X4加入新变量的回归结果(三)X1X2X3X5X4X1,X3,X5,x40.959209(40.07464)0.088483(6.114166)-0.092190(-2.214560)-0.051012(-1.885678)0.999969加入X4后,t值没有显著提高,反而有略微下降趋势,也没有显著提高,剔除X4.所以修正多重线性影响后的模型为,有回归结果为T检验(52.00922) (5.688979) (-3.189324)=0.999961 =0.999954 F=138251.2 D.W=2.295833五、异方差检验在实际的经济问题中经常会出
13、现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。由white检验得n=18.62072, 从上表可以看出,由White检验可知,在=0.05下,查分布表,得临界值 (9)=16.919,所以拒绝原假设,表明模型存在异方差。(2)异方差的修正用WLS估计:选择权重w=1/e1,其中e1=resid。 在命令窗口中输入genre1=resid,点回车键。在消除多重共线性后的回归结果对话框中点击Estimate/Options/WeithtedLS/TSLS,并在Weight中输入1/e1,点确定,得到如下回归结果。 修正后的White检验n=6.95610.05
14、,所以不存在自相关。 由之前消除异方差,并检验出没有自相关的回归结果 得出最终的回归方程为t值(10.27130)(172.0315)(15.24988)(-7.492185) = 0.999999 =0.999998 其中=1/e1*X1, =1/e1*X3, =1/e1*X4 ,e1=resid七、模型检验1、 经济意义检验模型估计结果表明,在假定其他变量不变的情况下,当税收每增长1元时,财政收入增加0.94237元;在假定其他变量不变的情况下,当固定资产总额每增加1元时,财政收入增加0.077465元;在假定其他变量不变的情况下,当社会总人口每增加1人时,财政收入减少0.019583元,
15、这是基于前面数据的老年化人口数占总人口的百分比不断增长,随着老年化人口的增多,给我国财政收入带来了负效应,这与理论分析判断相一致。2、 统计检验(1)拟合优度:由表中数据可得:R2=0.999999,修正的可决系数为 =0.999998,这说明模型对样本的拟合很好。(2)F检验:针对 :,给定显著性水平,在F分布表中查出自由度为k=3和n-k-1=16的临界值 (3 ,16)=8.69。由表中得到F=1974410,由于F=1974410 = ( 3,16)=8.69,应拒绝原假设,说明回归方程显著,即“税收”、“固定资产总额”、“社会总人口”等变量联合起来确实对“财政收入”有显著影响。(3)
16、t检验:分别对H0: =0(j=1,2,3),给定显著性水平=0.05,查t分布表得自由度为n-k-1=16临界值 (n-k-1)=2.120。由表中数据可得,、,对应的t统计量分别为172.0135、15.24988、-7.492185,其绝对值均大于 (n-k-1)=2.120,这说明应该分别拒绝H0: =0(j=1,2,3),也就是说,当在其他解释变量不变的情况下,解释变量“税收”(X1) 、“固定资产总额”(X3)和“社会总人口”分别对被解释变量“财政收入”(Y)影响显著。八、附表表一:对X1的回归结果表二:对X2的回归结果表三:对X3的回归结果表四:对X4的回归结果表五:对X5的回归结果表六:对X1、X2的回归结果 表七:对X1、X3的回归结果 表八:对X1、X4的回归结果 表九:对X1、X5的回归结果 表十:对 X1、X3、X4的回归结果 表十一:对X1、X3、X5的回归结果 表十二:对X1、X3、X5进行异方差修正后的回归结果