资源描述
计量经济学课程论文
论文题目:
上海房价影响因素多元线性回归分析
班 级: 07国贸
姓 名: 至 上 励 合
指导教师: 佟继英
时 间:2009-2010学年第一学期
上海房价影响因素多元线性回归分析
【内容摘要】近几年,随着经济的不断发展尤其是上海等大城市的飞速发展,房价也一路飘升,为了研究1998~2008年的上海市房屋销售价格指数,本文引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素,并根据模型结论给出政策建议。
【关键词】城市人口密度 城市居民人均可支配收入 年贷款利率 房屋空置率
一、影响上海房价的主要因素
作为全国的金融中心和经济中心,上海的经济在飞速发展,随着经济的发展,地价在不断上涨,房价也随之攀升。许多上海的精装房动辄一万多甚至两万多一平米,令普通百姓咋舌,望房兴叹。上海的房价为何会如此之高,理论上说受城市人口密度,城市居民人均可支配收入,贷款利率和房屋空置率的影响。因为人口密度直接影响房屋的供给状况,而人均可支配收入和年贷款利率的高低又对需求状况有很大影响,房屋的空置率则是综合供给和需求状况进行分析的。
二、变量选取
为了研究1998~2008年的上海市房屋销售价格指数,引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量。
三、数据搜集
根据上海市统计年鉴整理得到下面数据:
年份
商品房平均售价(元每平方米
城市人口密度 (人/平方公里)
城市居民人均可支配收入(元)
五年以上平均年贷款利率(%)
房屋空置率(%)
1998
3401.00
1654.00
8773
8.64
9.37
1999
3422.00
1672.00
10932
6.69
15.68
2000
3565.00
1757.00
11718
6.21
23.83
2001
3866.00
1950.00
12883
6.21
44.24
2002
4134.00
1959.00
13250
5.76
57.71
2003
5118.00
1971.00
14867
5.76
64.38
2004
5855.00
1970.00
16683
5.82
55.28
2005
6842.00
2718.20
18645
6.12
40.45
2006
7196.00
2774.20
20668
6.45
34.82
2007
8361.00
2931.00
23623
7.48
39.31
2008
8362.00
2640.00
26675
6.89
36.92
四、模型建立及处理
Y=α+β1X1+β2X2+β3X3+β4X4+μ
其中Y表示商品房平均售价,X1表示城市人口密度,X2表示城市居民人均可支配收入,X3表示五年以上年贷款利率,X4表示房屋空置率(空置率=成交面积/竣工面积)。
利用EVIEWS回归
利用EVIEWS5.0软件,进行OLS回归估计,可以得到:
Dependent Variable: Y
Method: Least Squares
Date: 12/12/09 Time: 18:02
Sample: 1998 2008
Included observations: 11
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-3242.851
1662.869
-1.950154
0.0990
X1
1.213216
0.570409
2.126925
0.0775
X2
0.237942
0.050003
4.758521
0.0031
X3
268.7713
204.4948
1.314319
0.2367
X4
11.36692
10.78998
1.053470
0.3327
R-squared
0.978541
Mean dependent var
5465.636
Adjusted R-squared
0.964236
S.D. dependent var
1957.466
S.E. of regression
370.1856
Akaike info criterion
14.96884
Sum squared resid
822224.2
Schwarz criterion
15.14970
Log likelihood
-77.32863
F-statistic
68.40197
Durbin-Watson stat
0.997978
Prob(F-statistic)
0.000039
(一)多重共线的检验和修正
由回归结果可见,该模型R2=0.978541,R2=0.964236可决系数较高,F=68.40197,给定显著性水平α=0.05,查F分布表可得Fα(4,6)=4.53< F,则说明回归方程显著,即各个解释变量联合起来对被解释变量有显著影响。但是当α=0.05时,tα/2(n-k)= t0.025(6)=2.447,X1、X3、X4系数的t检验值不显著,表明很可能存在严重的多重共线性。
计算各解释变量的相关系数,得到:
X1
X2
X3
X4
X1
1.000000
0.902892
0.025890
0.209591
X2
0.902892
1.000000
-0.032927
0.287857
X3
0.025890
-0.032927
1.000000
-0.729265
X4
0.209591
0.287857
-0.729265
1.000000
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
修正:
采取逐步回归法修正模型,分别做Y对X1,X2,X3,X4的一元回归,结果如下:
变量
X1
X2
X3
X4
参数估计值
3.815170
0.340559
71.79361
30.93860
t统计量
8.197073
13.79805
0.095816
0.847435
R2
0.881877
0.954861
0.001019
0.073897
R2
0.868753
0.949846
0
0
其中,加入X2的方程R2最大,以X2为基础,顺次加入其他变量逐步回归,结果如下:
变量
R2
X2,X1
0.965404
X2,X3
0.948718
X2,X4
0.943698
经比较,新加入X1后的方程R2=0.965404,改进最大,而且t检验显著,选择保留X1,再加入其他新变量逐步回归,结果如下:
变量
R2
X2,X1,X3
0.963675
X2,X1,X4
0.960519
加入X3、X4后,方程R2不但没有增大,反而减小,而且各个参数的t检验都不显著,这说明X3、X4引起严重多重共线性,应予剔除。
所以修正严重多重共线性影响的回归结果为:
Dependent Variable: Y
Method: Least Squares
Date: 12/12/09 Time: 18:34
Sample: 1998 2008
Included observations: 11
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1220.247
621.5122
-1.963351
0.0852
X1
1.248876
0.555891
2.246622
0.0549
X2
0.243828
0.047687
5.113063
0.0009
R-squared
0.972323
Mean dependent var
5465.636
Adjusted R-squared
0.965404
S.D. dependent var
1957.466
S.E. of regression
364.0888
Akaike info criterion
14.85967
Sum squared resid
1060485.
Schwarz criterion
14.96819
Log likelihood
-78.72820
F-statistic
140.5253
Durbin-Watson stat
1.159448
Prob(F-statistic)
0.000001
Y = -1220.246883 + 1.248875882*X1 + 0.2438278982*X2
(二)异方差的检验和修正
a.辅助函数为:σ2t=α0+α1 x1t+α2 x1t2+α3 x2t+α4 x2t2+α5 x1t x2t+υt
b.由White检验可得:
White Heteroskedasticity Test:
F-statistic
0.580576
Probability
0.717400
Obs*R-squared
4.040513
Probability
0.543598
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/12/09 Time: 18:54
Sample: 1998 2008
Included observations: 11
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1141304.
2507738.
-0.455113
0.6681
X1
1334.546
3522.151
0.378901
0.7203
X1^2
-0.408505
1.397830
-0.292243
0.7818
X1*X2
0.023132
0.186821
0.123818
0.9063
X2
-13.02877
198.9384
-0.065491
0.9503
X2^2
-0.001035
0.007122
-0.145332
0.8901
R-squared
0.367319
Mean dependent var
96407.74
Adjusted R-squared
-0.265361
S.D. dependent var
99300.72
S.E. of regression
111701.7
Akaike info criterion
26.38750
Sum squared resid
6.24E+10
Schwarz criterion
26.60454
Log likelihood
-139.1313
F-statistic
0.580576
Durbin-Watson stat
2.715809
Prob(F-statistic)
0.717400
c. 在H0:α1=α2=α3=α3=α5=0,H1:α1、α2、α3、α4、α5至少有一个不为0的假设条件下,从上表可以看出,n R2=4.040513,由 White 检验知,在α=0.05下,查χ2分布表,得到临界值χ20.05(5)=11.0705,比较χ2统计量与临界值,因为n R2=4.040513<χ20.05(5)=11.0705,所以接受原假设,表明模型不存在异方差。
三)自相关的检验和修正
在给定显著性水平0.05时,查n=11,k=2的DW分布值,得dL=0.658,,dU=1.604,而模型中dL<DW=1.159448< dU,DW值落在不能确定的区域,绘制e和e(-1)的散点图,如下:
由图示,表明模型中存在自相关。
修正:
为解决自相关问题,采用科可伦-奥克特迭代法。生成命名为et的残差序列,使用et进行滞后一期的自回归,在命令窗口中输入:ls y c x1 x2 Ar(1),得到如下结果:
Dependent Variable: Y
Method: Least Squares
Date: 12/12/09 Time: 19:44
Sample (adjusted): 1999 2008
Included observations: 10 after adjustments
Convergence achieved after 6 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1440.385
772.7312
-1.864018
0.1116
X1
1.181302
0.533114
2.215850
0.0686
X2
0.260916
0.048099
5.424563
0.0016
AR(1)
0.308722
0.365278
0.845172
0.4304
R-squared
0.978267
Mean dependent var
5672.100
Adjusted R-squared
0.967401
S.D. dependent var
1932.981
S.E. of regression
349.0043
Akaike info criterion
14.83722
Sum squared resid
730824.0
Schwarz criterion
14.95825
Log likelihood
-70.18610
F-statistic
90.02690
Durbin-Watson stat
1.291496
Prob(F-statistic)
0.000022
Inverted AR Roots
.31
由于使用了广义差分数据,样本容量减少了1个,为10个。在给定显著性水平0.05时,查n=10,k=2的DW分布值,得dL=0.697,,dU=1.641,而模型中dL<DW=1.291496< dU,DW值也落在不能确定的区域。
再使用et进行滞后两期的自回归,在命令窗口中输入:ls y c x1 x2 Ar(2),得到如下结果:
Dependent Variable: Y
Method: Least Squares
Date: 12/12/09 Time: 19:55
Sample (adjusted): 2000 2008
Included observations: 9 after adjustments
Convergence achieved after 5 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1746.939
722.7027
-2.417231
0.0603
X1
1.560271
0.767333
2.033368
0.0977
X2
0.232504
0.066928
3.473924
0.0178
AR(2)
-0.390257
0.431292
-0.904857
0.4070
R-squared
0.974440
Mean dependent var
5922.111
Adjusted R-squared
0.959104
S.D. dependent var
1870.903
S.E. of regression
378.3473
Akaike info criterion
15.01060
Sum squared resid
715733.5
Schwarz criterion
15.09826
Log likelihood
-63.54772
F-statistic
63.53970
Durbin-Watson stat
1.249495
Prob(F-statistic)
0.000211
由于使用了广义差分数据,样本容量减少了2个,为9个。在给定显著性水平0.05时,查n=9,k=2的DW分布值,得dL=0.629,,dU=1.699,而模型中dL<DW=1.249495< dU,DW值仍然落在不能确定的区域。
再使用et进行滞后三期的自回归,在命令窗口中输入:ls y c x1 x2 Ar(3),得到如下结果:
Dependent Variable: Y
Method: Least Squares
Date: 12/12/09 Time: 19:59
Sample (adjusted): 2001 2008
Included observations: 8 after adjustments
Convergence achieved after 16 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1318.249
693.8615
-1.899873
0.1303
X1
1.042956
0.670842
1.554695
0.1950
X2
0.277570
0.055015
5.045377
0.0073
AR(3)
-0.638755
0.365644
-1.746930
0.1556
R-squared
0.979627
Mean dependent var
6216.750
Adjusted R-squared
0.964348
S.D. dependent var
1762.780
S.E. of regression
332.8443
Akaike info criterion
14.76008
Sum squared resid
443141.4
Schwarz criterion
14.79980
Log likelihood
-55.04032
F-statistic
64.11384
Durbin-Watson stat
2.209993
Prob(F-statistic)
0.000773
Inverted AR Roots
.43+.75i
.43-.75i
-.86
由于使用了广义差分数据,样本容量减少了3个,为8个。在给定显著性水平0.05时,查n=8,k=2的DW分布值,得dL=0.559,,dU=1.777,而模型中dU <DW=2.209993<4- dU,说明广义差分模型已无自相关,同时可见,可决系数R2、t、F统计量也均达到理想水平。
所以修正自相关后的模型结果为:
Y = -1318.248661 + 1.042955613*X1 + 0.2775700787*X2 + [AR(3)=-0.638754612]
五、结论与政策建议
(一)经济意义检验
模型估计结果说明,上海市商品房平均售价的确受城市人口密度和城市居民人均可支配收入的影响,而且商品房平均售价与两者呈同向变动关系。在假定其他解释变量不变的情况下,城市人口每平方公里增加1人,上海市商品房平均售价每平方米就增加1.042955613元;在假定其他解释变量不变的情况下,城市居民人均可支配收入每增加1元,上海市商品房平均售价每平方米就增加0.2775700787元。这与理论分析和经验判断相一致。
所以,本研究模型估计的最终结果为:
Y = -1318.248661 + 1.042955613*X1 + 0.2775700787*X2 + [AR(3)=-0.638754612]
se=(693.8615) (0.670842) (0.055015) (0.365644)
t= (-1.899873) (1.554695) (5.045377) (-1.746930)
R2=0.979627 R2=0.964348 F=64.11384 DW=2.209993
(二)模型的不足
1、变量选取不够准确
2、由于数据不易搜集,样本容量太小,从而导致模型估计误差较大
(三)政策建议
上海房产市场发展的主要驱动因素,同时也是中国房产市场发展的驱动因素,是政府决定为经济注入流动资金,这造成了现金充足的投资者,包括国有企业的资金大规模涌入。如果要抑制高房价就要限制资金大规模流入房地产行业。
我国将完善住房消费和调控政策,增加中低价位和限价商品房的供应,抑制投机性购房。中央经济工作会议也提出,要增加普通商品住房供给,继续支持自住型和改善型住房需求。
为调节二手房市场的价格,国家决定转让营业税优惠政策终止,征免时限由2年恢复到5年。此举将遏制投机性购房行为和需求。优惠政策的调整将导致二手房市场交易量下降,包括投机性交易。对于市场来说,需求减少,投机性的需求也减少,供求关系将有一定的平衡,有利于降低房价。
参考文献
1. 施灿彬:我国房地产价格波动行为分析及对策研究[J]. 价格理论与实践2004(9)
2.《计量经济学基础》(上下册)(第四版)甘扎拉蒂,人民大学出版社
3.《计量经济学基础》(第二版)张晓峒,机械工业出版社
4.《Eview使用指南与案例》张晓峒,机械工业出版社
展开阅读全文