资源描述
《应用计量经济学》课程
期末论文
年级专业 13级金融工程
姓 名 李永田
学 号 130152684
指导教师 陈健
上海师范大学商学院
2015年 12月
目录
摘要 3
关键词 3
引言 3
一.查阅文献,建立理论模型: 4
二.设定模型: 5
三.假设参数的预测符号: 6
四.搜集、检查整理数据: 6
五.方程的估计与评价 8
六.报告结果 9
6.1显著性检验 9
6.2多重共线性检验: 9
6.3序列相关性检验 11
6.4异方差检验 12
七.最终的模型解释(结论) 13
湖北省省内生产总值的多元线性回归分析
摘要
国内生产总值(GDP=Gross Domestic Product)是指一个国家(国界范围内)所有常驻单位在一定时期内生产的所有最终产品和劳务的市场价值。GDP是国民经济核算的核心指标,也是衡量一个国家或地区总体经济状况重要指标。GDP的总量可以反映一个国家和地区的经济发展及人民的生活水平,其结构可反映社会生产与使用,投资与消费之间的比例关系及宏观经济效益,对于经济研究、经济管理都具有十分重要的意义。因为GDP是一个区域概念,于是我产生了对我的家乡湖北省省内生产总值进行多元线性回归的想法,借助统计软件 Eviews对样本作初等模型,结合统计专业知识对初等模型作回归系数t检验、多重共线性检验、异常差性检验以及序列相关性检验等,最终确立的经验回归方程,回归方程式对样本拟合度最好的。
关键词
湖北省 省内生产总值 多元线性回归 多重共线性检验 异方差 序列相关性
引言
在通常情况下,GDP 是反映一国经济增长、经济规模、人均经济发展水平、经济结构和价格总水平变化的一个基础性指标,因而是国际上普便是用的考察国民经济发展变化的重要 工具。GDP 是描述经济发展状况和经济规模的最重要的宏观经济指标,一个国家的经济规模 是其经济实力和国际地位的重要标志之一。我国 GDP 增长速度迅速,众所周知 2008 年我国 GDP 跃居世界第三位,是仅次于美国、日本的第三大经济国,而 2009 年在金融危机的影响 下我国 GDP 稳中求进,依然保持着 9.0%的增长态势。提高 GDP 已经成为经济发展的潮流, 利用国家的各种有限资源,在最大程度上发挥资源的利用率,推动经济的发展是势在必行的, 因为资源一直在减少,而人口一直在增加,要保持经济的增长就必要抓住主要因素,提高 GDP。因此本文研究 GDP 的影响因素就变得很有实际意义。而一个地区的生产总值是GDP的一个缩影,将GDP研究的思想应用于地区生产总值中有一定的可行性。习近平总书记视察湖北时要求:“争取在转变经济发展方式上走在全国前列”。这是时代的命题,发展的课题。“主要经济指标在全国的位次进一步前移,转变经济发展方式取得突破性进展,产业核心竞争力和综合经济实力大幅跃升,在中部地区率先实现全面建设小康社会的目标。”长于做“加法”,湖北经济总量跨越进位。目前,湖北省“十二五”淘汰落后产能任务全部完成,钢铁、水泥、平板玻璃等,均大幅超额完成任务。善于做“乘法”,发挥科技创新的乘数效应。作为湖北人对湖北经济的发展有强烈的兴趣,希望通过回归模型对湖北的经济状况进行预测。
一.查阅文献,建立理论模型
根据宏观经济教材高鸿业版得出国民收入核算的概念和分析得出:在实际核算中,国内生产总值的三种表现形态表现为三种计算方法,即生产 法、收入法和支出法,三种方法分别从不同的方面反映国内生产总值及其构成。用生产法、收入法、支出法计算的结果分别称为生产法GDP、收入法GDP或分配 法GDP、支出法GDP。按三种方法计算的GDP反映的是同一经济总体在同一时期的生产活动成果,因此,从理论上讲,三种计算方法所得到的结果应该是一致的。但在实践中,由于受资料来源、口径范围、计算方法等因素的影响,这三种方法的计算结果往往存在差异即存在统计误差。
在实际中,由于生产法和收入法都是对各产业部门的增加值进行核算,为了就 每一产业部门取得一致的增加值数据,根据资料来源情况,有的产业部门,如农业、工业部门,增加值主要以生产法计算的结果为准,有的产业部门如一些服务部 门,增加值主要以收入法的计算结果为准,因此我国生产法GDP等于收入法GDP,但支出法GDP大多数情况下与这两者不同, 有时会大一些,有时会小一些。鉴于生产法和收入法的计算基础更好一些,因此,国家规定一般以生产法GDP和收入法GDP数据为准,并将支出法GDP与生产 法GDP的统计误差控制在一定范围内,一般是2%。 各种公开发表的GDP总量和增长速度数据均是生产法和收入法的计算结果。在经济学中,常用GDP和GNI(国民总收入,gross national Income)共同来衡量该国或地区的经济发展综合水平。这也是各个国家和地区常采用的衡量手段。GDP是宏观经济中最受关注的经济统计数字,因为它被认为是衡量国民经济发展情况最重要的一个指标。GDP反映的是国民经济各部门的增加值的总额。变量P——居民消费指数水平(1994=100),E——经营单位所在地进出口总额(亿元),S——城乡居民人民币储蓄存款年底余额(亿元),I——政府财政收入(亿元)均能刻画GDP的性质,因为湖北省生产总值即为GDP的一部分,所以也沿用GDP核算的原理进行进一步的分析。
二.设定模型
选择解释变量的及函数形式。经过上面的准备,归纳出若干可选择的解释变量。仔细分析后发现有四个解释变量可以被列入模型中。分别是居民消费指数水平(1994=100),经营单位所在地进出口总额(亿元),城乡居民人民币储蓄存款年底余额(亿元),政府财政收入(亿元)
P——居民消费指数水平(1994=100):居民消费价格指数,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。它是度量一组代表性消费商品及服务项目的价格水平随时间而变动的相对数,是用来反映居民家庭购买消费商品及服务的价格水平的变动情况。居民消费价格统计调查的是社会产品和服务项目的最终价格,一方面同人民群众的生活密切相关,同时在整个国民经济价格体系中也具有重要的地位。它是进行经济分析和决策、价格总水平监测和调控及国民经济核算的重要指标。其变动率在一定程度上反映了通货膨胀或紧缩的程度。一般来讲,物价全面地、持续地上涨就被认为发生了通货膨胀。
E——经营单位所在地进出口总额(亿元):是指与外国当事人通过缔结契约进行买卖商品,包括劳务、技术等的一系列具体业务。具体内容包括:进出口商品的买卖和贸易方式;进出口商品的运输和保管业务;进出口商品的检验工作;进出口商品的海关监管业务;进出口商品的货运保险业务;进出口商品结算货款和提供资金的国际结算与银行信用业务,解决进出口业务纠纷的仲裁工作和司法审理;进出口业务的经营与管理。从例中是指发生在湖北省内的进出业务的总额,之前数据中是以美元为结算单位,总用汇率7.0进行换算,成为人民币。方便回归分析。
S——城乡居民人民币储蓄存款年底余额(亿元):城乡居民将暂时不用或结余的货币收入存入银行或其他金融机构的一种存款活动。又称储蓄存款。根据理论分析城乡居民的储蓄是生产总值得一个重要组成部分,此例中我们使用年底余额这个量来进行衡量。
I——政府财政收入(亿元): 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。财政是同国家的产生和存在相联系。国家为了维持自身的存在和发挥职能,必须消耗一定的社会产品。但是,国家本身通常不直接从事生产活动,因而必须凭借自身拥有的政治权力,强制性地征收一部分社会产品,以满足各方面支出的需要。 这种国家的收入和支出就是财政,它是国家凭借政治权力而进行的社会产品的分配。从这一概念的内容可以看出,财政是一种分配关系,是一种以国家为主体、在社会范围内集中性的分配关系。在此我们把税收收入近似看做是政府财政收入。
三.假设参数的预测符号
居民消费指数水平,经营单位所在地进出口总额,城乡居民人民币储蓄存款年底余额,政府财政收入,越高省内生产总值GPP越高,所以变量P、E、S、I,预期的符号都是正的。
四.搜集、检查整理数据
OBS
Y
P
E
S
I
1
24791.83
650.38
2546.61
15507.00
2191.22
2
22250.45
588.04
2237.46
13419.70
1823.05
3
19632.26
536.05
2351.09
11291.60
1526.91
4
15967.61
442.65
1815.25
9798.00
1011.23
5
12961.10
384.24
1207.57
8163.50
814.87
6
11328.92
364.90
1449.40
6745.40
710.85
7
9333.40
322.07
1040.83
5430.80
590.36
8
7617.47
270.87
823.35
5103.60
476.08
9
6590.19
239.08
633.83
4465.80
375.52
10
5633.24
211.01
473.61
3860.70
310.45
11
4757.45
196.66
357.65
3296.50
259.76
12
4212.82
180.42
276.72
2754.50
243.44
13
3880.53
161.81
250.40
2322.30
231.94
14
3545.39
147.10
225.60
2002.20
214.35
15
3229.29
140.77
187.43
1438.90
194.44
16
3114.02
141.47
198.25
1204.50
168.95
17
2856.47
127.68
224.33
982.60
139.89
18
2499.77
122.54
200.31
941.90
124.51
19
2109.38
109.80
238.30
897.20
99.69
*数据来自中国统计年鉴
计算机实际输出结果(应用EViews软件)
Dependent Variable: Y
Method: Least Squares
Date: 12/26/15 Time: 23:43
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-43.33004
730.1493
-0.059344
0.9535
E
1.777780
0.751798
2.364704
0.0330
I
2.978022
0.669176
4.450283
0.0005
P
10.35269
8.147482
1.270662
0.2246
S
0.480301
0.228436
2.102564
0.0541
R-squared
0.998315
Mean dependent var
8753.242
Adjusted R-squared
0.997833
S.D. dependent var
7141.317
S.E. of regression
332.4061
Akaike info criterion
14.67153
Sum squared resid
1546914.
Schwarz criterion
14.92006
Log likelihood
-134.3795
Hannan-Quinn criter.
14.71359
F-statistic
2073.474
Durbin-Watson stat
1.341475
Prob(F-statistic)
0.000000
五.方程的估计与评价
使用普通最小二乘法(OLS)进行多元回归分析。根据EViews数据结果得出如下回归方程:
Dependent Variable: Y
Method: Least Squares
Date: 12/26/15 Time: 23:43
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-43.33004
730.1493
-0.059344
0.9535
E
1.777780
0.751798
2.364704
0.0330
I
2.978022
0.669176
4.450283
0.0005
P
10.35269
8.147482
1.270662
0.2246
S
0.480301
0.228436
2.102564
0.0541
R-squared
0.998315
Mean dependent var
8753.242
Adjusted R-squared
0.997833
S.D. dependent var
7141.317
S.E. of regression
332.4061
Akaike info criterion
14.67153
Sum squared resid
1546914.
Schwarz criterion
14.92006
Log likelihood
-134.3795
Hannan-Quinn criter.
14.71359
F-statistic
2073.474
Durbin-Watson stat
1.341475
Prob(F-statistic)
0.000000
(0.75) (0.67) (8.15) (0.23)
t= 2.36 4.45 1.27 2.10
N=19 =0.998
根据上述方程得出:方程中的估计值符号与预期相同。并且整体的拟合优度还不错。这个结果还算比较合理。方程中参数系数的经济意义如下(以变量E为例):在方程中其他解释变量不变的情况下,经营单位所在地进出口总额(E)每增加1亿元,省内生产总值Y增加1.78亿元。
六.报告结果
计量经济学问题常规检验:
6.1显著性检验
在显著性水平为5%的情况下,tc=1.7613,te、ti、ts>tc=1.7613,因此对于变量E、I、S拒绝原假设,显著大于0.而对于变量P,tp<tc=1.7613,因此不能拒绝原假设,系数不显著大于0.
6.2多重共线性检验
由于E、I、P、S存在一定的相关性,于是推断他们存在一定的多重共线性。通过EViews计算出各个解释变量的相关系数如下:
分别对变量E、I、P、S进行一元回归:
Dependent Variable: Y
Method: Least Squares
Date: 12/29/15 Time: 17:05
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1156.163
384.2834
3.008621
0.0079
E
8.623769
0.323564
26.65247
0.0000
R-squared
0.976628
Mean dependent var
8753.242
Adjusted R-squared
0.975253
S.D. dependent var
7141.317
S.E. of regression
1123.418
Akaike info criterion
16.98544
Sum squared resid
21455173
Schwarz criterion
17.08486
Log likelihood
-159.3617
Hannan-Quinn criter.
17.00227
F-statistic
710.3544
Durbin-Watson stat
1.700065
Prob(F-statistic)
0.000000
Dependent Variable: Y
Method: Least Squares
Date: 12/29/15 Time: 17:06
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1812.973
364.5346
4.973390
0.0001
I
11.45905
0.427756
26.78876
0.0000
R-squared
0.976859
Mean dependent var
8753.242
Adjusted R-squared
0.975498
S.D. dependent var
7141.317
S.E. of regression
1117.836
Akaike info criterion
16.97548
Sum squared resid
21242467
Schwarz criterion
17.07489
Log likelihood
-159.2670
Hannan-Quinn criter.
16.99230
F-statistic
717.6376
Durbin-Watson stat
0.479412
Prob(F-statistic)
0.000000
Dependent Variable: Y
Method: Least Squares
Date: 12/29/15 Time: 17:07
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-3079.665
250.9558
-12.27174
0.0000
P
42.12148
0.770823
54.64485
0.0000
R-squared
0.994339
Mean dependent var
8753.242
Adjusted R-squared
0.994006
S.D. dependent var
7141.317
S.E. of regression
552.8822
Akaike info criterion
15.56747
Sum squared resid
5196539.
Schwarz criterion
15.66688
Log likelihood
-145.8909
Hannan-Quinn criter.
15.58429
F-statistic
2986.059
Durbin-Watson stat
0.414724
Prob(F-statistic)
0.000000
Dependent Variable: Y
Method: Least Squares
Date: 12/29/15 Time: 17:08
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
396.3317
247.3689
1.602189
0.1275
S
1.593762
0.036335
43.86284
0.0000
R-squared
0.991241
Mean dependent var
8753.242
Adjusted R-squared
0.990726
S.D. dependent var
7141.317
S.E. of regression
687.7135
Akaike info criterion
16.00392
Sum squared resid
8040147.
Schwarz criterion
16.10334
Log likelihood
-150.0373
Hannan-Quinn criter.
16.02075
F-statistic
1923.949
Durbin-Watson stat
0.711177
Prob(F-statistic)
0.000000
如图看出两两之间均存在较高的相关系数,即存在多重共线性,但此四个变量均在理论上重要,所以并不能对此采取相应的办法。
6.3序列相关性检验
Dependent Variable: Y
Method: Least Squares
Date: 12/26/15 Time: 23:43
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-43.33004
730.1493
-0.059344
0.9535
E
1.777780
0.751798
2.364704
0.0330
I
2.978022
0.669176
4.450283
0.0005
P
10.35269
8.147482
1.270662
0.2246
S
0.480301
0.228436
2.102564
0.0541
R-squared
0.998315
Mean dependent var
8753.242
Adjusted R-squared
0.997833
S.D. dependent var
7141.317
S.E. of regression
332.4061
Akaike info criterion
14.67153
Sum squared resid
1546914.
Schwarz criterion
14.92006
Log likelihood
-134.3795
Hannan-Quinn criter.
14.71359
F-statistic
2073.474
Durbin-Watson stat
1.341475
Prob(F-statistic)
0.000000
根据上图看到杜宾-沃森d=1.34,查表N=19,K=4,在单侧检验5%的显著水平下,du=1.85,dl=0.86,其值处于不能确定的区域,所以不能确定是否存在序列相关性。
6.4异方差检验
我们使用white检验来检验异方差性
其中被解释变量是残差的平方(resid^2)解释变量是E、I、P、S,它们的平方项以及它们的交叉相乘项。
Heteroskedasticity Test: White
F-statistic
7.338064
Prob. F(14,4)
0.0338
Obs*R-squared
18.28794
Prob. Chi-Square(14)
0.1940
Scaled explained SS
5.356845
Prob. Chi-Square(14)
0.9802
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/29/15 Time: 01:22
Sample: 1 19
Included observations: 19
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1527844.
783845.9
-1.949164
0.1231
E
2779.486
2711.720
1.024990
0.3633
E^2
2.549697
2.848224
0.895189
0.4213
E*I
1.485540
2.338759
0.635183
0.5598
E*P
-21.40956
28.65477
-0.747155
0.4965
E*S
-0.338399
0.577161
-0.586316
0.5892
I
1910.587
1846.696
1.034598
0.3593
I^2
-3.570721
6.363173
-0.561154
0.6046
I*P
-8.532163
24.67527
-0.345778
0.7469
I*S
0.963640
1.503180
0.641068
0.5564
P
24986.98
19427.15
1.286188
0.2678
P^2
-111.3584
116.4596
-0.956197
0.3931
P*S
10.67283
8.603308
1.240549
0.2826
S
-1236.142
621.9210
-1.987619
0.1178
S^2
-0.193943
0.186856
-1.037929
0.3579
R-squared
0.962523
Mean dependent var
81416.51
Adjusted R-squared
0.831355
S.D. dependent var
86889.18
S.E. of regression
35682.30
Akaike info criterion
23.82350
Sum squared resid
5.09E+09
Schwarz criterion
24.56911
Log likelihood
-211.3232
Hannan-Quinn criter.
23.94969
F-statistic
7.338064
Durbin-Watson stat
2.669002
Prob(F-statistic)
0.033829
NR2=18.24,而在5%的显著性水平下χ2=9.49。NR2>χ2,拒绝同方差的原假设,所以推断存在异方差性。根据分析过程推断,可能是由于遗漏变量引起的异方差。
七.最终的模型解释(结论)
最终的回归方程为:,本模型使用的是最小二乘估计法进行的回归检验,有着严格的基本假定作为基础,还要经过严格的检验,使得最后预测的依据充分。根据方程的系数分析对于湖北省省内的生产总值政府财政收入起着最为重要的影响, P——居民消费指数水平(1994=100),E——经营单位所在地进出口总额(亿元),S——城乡居民人民币储蓄存款年底余额(亿元)按影响的重要程度排开该模型在理论上具有充分的基础,但时在检验过程中存在或多或少的问题,比如多重共线性、异方差等需要我们进一步调整和完善,从拟合模型来看,该模型的预测精度比较高,可以用于分析、预测未来几年湖北省省内生产总值的的状况,但是这并不是一个准确的结果,而且我们回归检验检验的是相关关系而不能检验因果关系,因此这个模型并不能说明原因。但我们需要注意的是,影响地区GDP的因素很多,且影响程度不同,它涵盖的具体范围很广,我们只能从有限的数据中选取一些合适的变量,再对其研究分析,并不是模型中没有的便量就对Y没有影响。
【参考文献】
[1]中华人民共和国国家统计局。中国统计年鉴
[2]西方经济学[宏观部分 第六版]高鸿业
展开阅读全文