1、基于SAS分析浙江省人均可支配收入影响因素的研究一 导言可支配收入是反映居民家庭全部现金收入中能用于安排家庭日常生活的那部分收入,指居民家庭在支付个人所得税之后,所余下的全部实际现金收入(不包括借贷收入),即居民家庭可以用来自由支配的收入。居民家庭人均可支配收入调查统计的范围是城市居民家庭生活收入,包括家庭成员中的职工与非职工的收入。随着市场经济的稳定繁荣和改革开放的深入发展,浙江省城镇居民人均生活水平有了较大幅度的提高,其主要表现在人均可支配收入的增长。城镇居民收入高,消费量大,在消费结构的研究中占有重要的地位。与此同时,改革开放以来的经济在从计划向市场转型的过程中,人民的消费水平、结构都发
2、生了很大变化。针对这种现象,本文收集了浙江省1990-2008年的一系列数据,旨在研究城镇居民可支配收入的主要影响因素。本文首先解释模型结构,然后用SAS软件进行数据分析,对分析结果进行探究,得出结论。二 文中符号含义y:人均可支配收入:人均收入:就业人数:消费价格指数:社会消费品零售总额:固定资产投资总额:第二产业(工业)总产值:回归常数:回归系数,其中 注:本文所有检验水平均为0.05。三 基本模型1. 问题阐述 通过对浙江省城镇居民可支配收入及其其他经济指标,确立一个多元线性模型来反映影响其变化的各种因素与城镇居民可支配收入间的关系,并确定模型中个参数的估计及模型的显著性检验。2. 模型
3、基本结构因变量确定为浙江省城镇居民可支配收入,加上一系列解释变量的线性组合,再加上随机扰动项,基本结构如下所示3. 解释变量的选取通过对人均可支配收入的影响因素分析,确定如下解释变量:(1)浙江省人均收入水平。收入的增长是可支配收入增长的最主要因素,模型中用表示人均收入;(2)浙江省就业人数。就业是收入的前提,且本文研究的是人均可支配收入,模型中用表示;(3)浙江省消费价格指数。由于可支配收入是居民家庭在支付个人所得税之后剩余的收入,消费价格指数影响居民的消费意愿,进而影响其可支配收入,模型中用表示;(4)浙江省社会消费品零售总额,模型中用表示;(5)浙江省固定资产投资总额,说明物质资本对收入
4、的影响,模型中用表示;(6)浙江省科技三项经费,从重视技术开发程度的角度侧面说明科学技术水平,进而影响居民收入水平,模型中用表示;(7)浙江省第二产业(工业)产值,就我国而言,第二产业仍是经济发展的最大驱动力,借以说明经济规模对于人均收入分配的影响,模型中用表示;故模型结构基本确定为:四 数据处理结果(程序实现)及主要结论人均可支配收入及所确定的七个解释变量的数据可在山东省统计局网站中的统计年鉴上查得,数据见附表一。(一) 首先用数据建立一个Excel文件,以便在分析过程中数据的导入。(二) 在SAS中导入所用数据,导入时代码为:PROC IMPORT OUT= WORK.shuju1 DAT
5、AFILE= C:Documents and SettingsAdministrator桌面1.xls DBMS=EXCEL5 REPLACE; GETNAMES=YES;RUN;此时有数据如图1:图1 数据(三) 用以下代码对数据进行汇总整理,如图2所示:图2 数据汇总代码(四) 对所用变量进行相关性检验,代码如图3所示:图3 相关性检验代码得到的结果如图4所示:图4 相关性检验结果图图中显示7个变量的相关系数,以及关于相关系数等于零的假设的单尾显著性检验概率。从表中可以看到因变量y(人均可支配收入)与自变量、之间的相关系数依次为0.996、0.324、0.736、0.996、0.966、0
6、.975、0.971,反映人均可支配收入与、之间存在显著的相关关系。自变量与因变量y之间相关系数为0.324,它与其他几个自变量之间的相关系数也都很小,说明他们之间的线性关系不显著。此外,与、之间的相关系数之间的相关系数分别为0.999、0.979、0.987、0.982,这也说明他们之间存在较为显著的线性关系。下面用逐步回归方法来消除这种相关关系的影响。(五) 用逐步回归法对变量进行多元线性回归,代码如图:图5 回归代码得到的结果如图69所示:图6 回归结果1图7 回归结果2图8 回归结果3图9 回归结果4五 参数估计及检验参数的估计、检验及置信区间均在上部分数据分析结果相应的图表中给出。六
7、 模型中存在的问题1. 模型考虑因素不够完善,由于数据收集和实际操作性等问题的综合影响,没有引入一些其他重要因素,使得对这一问题的的说明程度有所降低。2. 模型只是定性说明人均可支配收入的影响因素,并无定性的说明。3. 模型最终未包括山东省固定资产投资总额和第二产业产值的影响,且采集数据只从1990到2008年,分析上会出现一定的局限性。4. 由于数据收集和实际操作性等问题的综合影响,模型中仅对19的样本点进行了回归,在样本相关系数及模型的检验等方面具有一定的不可靠性。七 结论通过运用逐步回归进行线性回归得到的模型为:此模型反映自变量(人均收入)、(就业人数)对人均可支配收入均有正的影响关系。
8、首先,本文研究的是人均可支配收入的影响因素,可支配收入指居民家庭在支付个人所得税之后,所余下的全部实际现金收入,因此自变量人均收入水平必然会对因变量y产生正向影响,即人均收入增加也会造成人均可支配收入的增加,且每增加一单位的人均收入会引起人均可支配收入增加0.58个单位其次,自变量就业人数的增加对因变量y产生正向影响,且每增加一单位的就业人数会引起人均可支配收入增加3.633个单位。这是由于人均可支配收入的计算是用家庭总收入除以家庭总人数得到的,就业人数增加,家庭总收入增加,因此人均可支配收入增加。由模型结构可知,要提高山东省人均可支配收入,可以从增加就业人数这点出发。八 参考文献【1】 于锦华,杨维权编著.多元统计分析与应用.北京:中山大学出版社【2】 何晓群,刘文卿编著.应用回归分析(第二版).中国人民大学出版社,2007【3】 朱世武编著.SAS编程技术教程九 附录附表一:数据