资源描述
4.1数据的处理
(1)数据的处理,由于本文的数据都比较大属于数据的范畴了,为了减少数据的波动对结果造成的影响,我们采取的是进行正态化检验,以确定数据可以进行回归分析。
表 1: 变量说明与数据来源
变量
变量解释
数据来源
单位
DE
需求
自己注明数据局来源
EX
出口
自己注明数据局来源
IM
进口
自己注明数据局来源
BEN
纯苯
自己注明数据局来源
PINDEX
价格
自己注明数据局来源
STOCK
库存指数
自己注明数据局来源
PPI
PPI
自己注明数据局来源
PRICE
消费价格指数
自己注明数据局来源
4.2描述性统计
表2:数据的描述性统计
PRICE
EX
IM
BEN
STOCK
PPI
PINDEX
Mean
15829.71
15321.21
21054.19
7251.958
48.19792
101.1083
14303.51
Median
15805
14728.5
19589.5
7612.5
48.05
101.695
13840
Maximum
21748
27309
39313
10601
53.1
107.54
33669
Minimum
11170
6933
7374
3053
43.4
91.8
9317.6
Std. Dev.
2009.701
4584.097
8273.062
1689.999
2.358009
5.245435
4018.636
Skewness
0.205897
0.375484
0.388384
-0.54697
-0.00674
-0.320725
2.308279
Kurtosis
4.517713
2.449013
2.381869
3.284273
2.256354
1.667094
12.26862
Observations
48
48
48
48
48
48
48
表2为各变量的描述性统计分析,显示出各变量的最小值、最大值、平均值和标准差。
4.3 回归关系
回归分析的目的是通过对大量的样本数据进行分析,以寻找变量之间的相互作用关系,并确定变量之间的数学关系式。同时对所确定的数学关系式的可信程序进行各种统计检验,以区分出对某一特定变量影响较为显著的变量和影响不显著的变量;利用所确定的数学关系式,根据一个或几个变量的值来预测另一个特定变量的取值,并给出这种预测或控制的精确度。
4.3.1 以价格为因变量,以需求、出口、进口、纯苯、库存指数、PPI、消费价格指数为自变量进行回归分析。
表3 回归模型检验
Variable
Coefficient
Std. Error
t-Statistic
Prob.
EX
0.115489
0.051901
2.225183
0.0316
IM
0.030888
0.025304
1.220654
0.2292
BEN
1.10197
0.165179
6.671373
0.0000
STOCK
-230.2087
92.73772
-2.482363
0.0172
PPI
-89.82531
41.23348
-2.178456
0.0352
PINDEX
-0.076194
0.062419
-1.220682
0.2292
C
26686.03
4323.394
6.172472
0.0000
表4:模型各项指标
R-squared
0.72422
Mean dependent var
15829.71
Adjusted R-squared
0.683862
S.D. dependent var
2009.701
S.E. of regression
1129.977
Akaike info criterion
17.03182
Sum squared resid
52350755
Schwarz criterion
17.3047
Log likelihood
-401.7637
Hannan-Quinn criter.
17.13494
F-statistic
17.9449
Durbin-Watson stat
0.958825
Prob(F-statistic)
0.0000
从图中可以看到IM、PINDEX对应的P值大于0.05,不具有显著的统计学意义,因此删除IM、PINDEX重新进行回归。
4.3.2 以价格为因变量,以出口、纯苯、库存指数、PPI为自变量进行回归分析。
表5 回归分析结果
Variable
Coefficient
Std. Error
t-Statistic
Prob.
EX
0.126623
0.051067
2.479572
0.0172
BEN
0.932612
0.146618
6.360838
0.0000
STOCK
-282.4456
92.10314
-3.066623
0.0037
PPI
-53.51183
36.49817
-1.466151
0.1499
C
26150.2
4418.601
5.918209
0.0000
表6:模型各项指标
R-squared
0.693428
Mean dependent var
15829.71
Adjusted R-squared
0.664909
S.D. dependent var
2009.701
S.E. of regression
1163.356
Akaike info criterion
17.05434
Sum squared resid
58196036
Schwarz criterion
17.24925
Log likelihood
-404.3041
Hannan-Quinn criter.
17.128
F-statistic
24.31515
Durbin-Watson stat
0.798828
从图中可以看到PPI对应的P值大于0.05,不具有显著的统计学意义,因此删除PPI重新进行回归。
4.3.3 以价格为因变量,以出口、纯苯、库存指数为自变量进行回归分析。
表7 回归分析结果
Variable
Coefficient
Std. Error
t-Statistic
Prob.
EX
0.139518
0.050957
2.737972
0.0089
BEN
0.880768
0.144137
6.110644
0.0000
STOCK
-322.5306
89.09325
-3.620146
0.0008
C
22850.14
3851.691
5.932496
0.0000
表8:模型各项指标
R-squared
0.678102
Mean dependent var
15829.71
Adjusted R-squared
0.656154
S.D. dependent var
2009.701
S.E. of regression
1178.455
Akaike info criterion
17.06145
Sum squared resid
61105294
Schwarz criterion
17.21739
Log likelihood
-405.4748
Hannan-Quinn criter.
17.12038
F-statistic
30.89643
Durbin-Watson stat
0.838866
Prob(F-statistic)
0.0000
从图中可以看到所有对应的P值均小于于0.05,具有显著的统计学意义,因此不需要删除变量重新进行回归。
4.3.4共线性诊断
若变量间存在共线性问题,进行多因素回归分析,会造成回归系统变化大,回归系数的数值与方向与其它研究不一致,使一些本应对结果有影响的变量被排除在模型外等问题。因此我们对各变量进行共线性诊断,经检验:各变量之间均不存在共线关系,不需要剔除变量进入多元回归分析(见表9)。
表9 相关分析
PRICE
EX
BEN
STOCK
PRICE
1.0000
0.6212
0.7428
0.1842
EX
0.6212
1.0000
0.6595
0.4902
BEN
0.7428
0.6595
1.0000
0.5490
STOCK
0.1842
0.4902
0.5490
1.0000
有上表可知:PRICE与EX 、BEN、STOCK的相关系数为0.6212、0.7428、0.1842 对应的P值小于0.05,具有显著性意义。但是自变量之间的相关系数较小,均小于0.8,从相关分析可以看到,变量之间的不可能存在共线性。
4.3.5.异方差检验
采用White检验。在获得估计结果的情况下,进入White检验。
表10: 异方差检验
F-statistic
1.322891
Prob. F(9,38)
0.2578
Obs*R-squared
11.4513
Prob. Chi-Square(9)
0.246
Scaled explained SS
5.800094
Prob. Chi-Square(9)
0.7597
采用White检验。在获得估计结果的情况下,利用white检验法,可知,因本例为多元函数,故选择交叉乘积项,可得相应信息。经估计出现White检验结果。从上表中可以看出,nR2=11.4513,由White检验知,在下,查X2分布表,得临界值 。比较计算的X2统计量与临界值,因为nR2=11.4513< 18.6321,所以接受原假设,表明模型不存在异方差。另外,其概率值也大于0.05,表明模型不存在异方差。
4.3.6 自相关检验
表11:自相关检验
F-statistic
11.21601
Prob. F(2,42)
0.0001
Obs*R-squared
16.7112
Prob. Chi-Square(2)
0.0002
在显著性水平下,得根据DW检验决策规则得到:DW=0.838866,另外模型的LM检验值可知,模型的LM检验的P值小于于0.05,因此误差项u1、u2`````` un间存在自相关。因此加入AR(1)再次进行回归如下。
4.3.7再次进行回归
表12:回归分析
Variable
Coefficient
Std. Error
t-Statistic
Prob.
EX
0.05279
0.031909
1.654373
0.1055
BEN
0.636853
0.243083
2.619906
0.0122
STOCK
-97.3337
75.06755
-1.996615
0.0491
C
15252.91
4094.441
3.725272
0.0006
AR(1)
0.746618
0.100393
7.436987
0.0000
表13:回归指标
R-squared
0.818511
Mean dependent var
15927.19
Adjusted R-squared
0.801227
S.D. dependent var
1913.28
S.E. of regression
853.0169
Akaike info criterion
16.43572
Sum squared resid
30560792
Schwarz criterion
16.63255
Log likelihood
-381.2395
Hannan-Quinn criter.
16.50979
F-statistic
47.35484
Durbin-Watson stat
1.48021
Prob(F-statistic)
0.0000
上表结果显示:模型的决定系数为0.818511,调整后决定系数为0.801227,说明选取的自变量的解释度达到80.1%。同时模型的DW值为1.48021,经检验,说明模型不存在异方差问题,建立的模型不存在序列相关性。当回归方程包含不同的自变量时,F值为47.35484,其显著性概率值为0.000,小于0.01,即拒绝总体回归系数均为0的原假设。因此,认为建立的回归方程方程拟合效果很好。表12是为以价格为因变量,以EX、BEN、STOCK、AR(1)率为自变量的回归分析,由表可知,EX、BEN、STOCK、AR(1)对应的P值均小于0.05,具有显著的统计学意义。因此说明EX、BEN、STOCK、AR(1)均会对价格产生显著的影响作用。其中库存的回归系数为负数,说明库存会对价格产生显著的负性影响作用,即库存越高,价格反而越低。而EX、BEN、AR(1)的回归系数为正数,说明EX、BEN、AR(1)会对价格产生显著的正性影响作用,即EX、BEN、AR(1)越高,价格也随之相应越高。因此根据以上回归分析结果可建立以下模型:
价格=0.05279*EX+0.636853*BEN--97.3337*-97.3337+15252.91
+0.746618*AR(1)
展开阅读全文