资源描述
多元统计分析实验报告
——研究房价与人民生活水平的关系
一、实验目的
本文旨在研究全国各省市住宅型商品房的平均价格水平,同时分析各省市住宅型商品房平均销售价格与其人民生活水平的关系。本文将用各省市人均GDP、城镇居民人均可支配收入、农村居民人均纯收入三个变量来衡量各省市的人民生活水平。住宅型商品房平均销售价格应该与人民生活水平成正相关关系。接下来,本文不仅要根据2012年全国各省市住宅型商品房平均销售价格如表1-1进行聚类分析和判别分析,还会根据2012年全国各省市人民生活水平数据如表1-2进行聚类分析与判别分析,观察房价较高的省市与人民生活水平较高的省市是否相符合,用以评价各省市房地产市场的定价是否符合该省市人民生活水平。
表1-1 2012年全国各省市住宅型商品房平均销售价格(元/平方米)
地区
X
地区
X
北京
16553.48
湖南
3669.63
天津
8009.58
广东
7667.89
河北
4141.96
广西
3909.83
山西
3690.88
海南
7811.26
内蒙古
3656.41
重庆
4804.80
辽宁
4717.21
四川
4959.19
吉林
3875.10
贵州
3695.36
黑龙江
3725.51
云南
3861.01
上海
13869.88
西藏
2982.19
浙江
10679.69
甘肃
3376.08
安徽
4495.12
陕西
4803.05
福建
8365.92
青海
3692.21
江西
4381.18
宁夏
3620.77
山东
4556.63
新疆
3593.82
河南
3511.26
江苏
6422.85
湖北
4668.00
其中,X表示住宅型商品房平均销售价格。
数据来源:国家统计局、各省市统计部门官方网站。
表1-2 2012年全国各省市人民生活水平数据 单位:元
人均GDP
城镇居民人均PI
农村人均纯收入
北京
88167.51
36469.00
16476.00
上海
85630.13
40188.00
17605.00
浙江
63346.70
34550.00
14552.00
广东
54324.53
30227.00
10542.80
江苏
68438.52
29677.00
12202.00
天津
95123.06
29626.00
13537.00
福建
52961.77
28055.00
9967.00
山东
51895.49
25755.00
9446.00
辽宁
56585.22
23223.00
9384.00
吉林
43419.57
20208.00
9224.00
黑龙江
35710.93
17760.00
8604.00
河北
36703.23
20543.00
8081.00
湖北
38642.17
20840.00
7851.70
江西
28848.51
19860.00
7828.00
内蒙古
64424.69
23150.00
7611.00
河南
31753.45
20443.00
7524.94
湖南
33589.41
21319.00
7440.00
海南
32543.03
20918.00
7408.00
安徽
28840.57
21024.00
7160.50
四川
29627.08
20307.00
7001.00
重庆
39256.59
22968.00
7383.00
新疆
33803.99
17921.00
6394.00
山西
33709.62
20412.00
6356.60
宁夏
36285.02
19831.00
6180.30
广西
28053.91
21243.00
6008.00
陕西
38612.68
20734.00
5763.00
西藏
23051.53
18028.00
5645.00
贵州
19608.53
18701.00
5616.00
云南
22262.58
21075.00
5417.00
青海
33168.59
17566.00
5364.38
甘肃
22035.03
17157.00
4495.00
数据来源:国家统计局、各省市统计部门官方网站。
二、实验过程
(一)2012年全国各省市住宅型商品房平均销售价格分析
基于SPSS 16.0,对2012年全国各省市住宅型商品房平均销售价格进行系统聚类分析,得到结果如下。
表2-1为参与系统聚类分析的样本统计表。表中显示,有效值为31个,无缺失值。分析中选择的聚类方法为类间连接法,距离测度方法为欧式距离的平方。
表2-1 样本统计表
Case Processing Summarya,b
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
31
100.0
0
.0
31
100.0
a. Squared Euclidean Distance used
b. Average Linkage (Between Groups)
表2-2为系统聚类进度表。类合并的详细步骤都体现了出来。在第一步中,将类4和类28合并成一类,其距离测度系数为1.769,合并两项都是第一次出现,故第一次出现的步序号都为0,合并结果取小的序号4,并在“Next Stage”表示的步中出现,即第三步出现。依次类推。
表2-2 系统聚类进度表
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage
Cluster 1
Cluster 2
Cluster 1
Cluster 2
1
4
28
1.769
0
0
3
2
21
27
3.062
0
0
13
3
4
23
14.996
1
0
7
4
5
17
174.768
0
0
7
5
7
24
198.528
0
0
8
6
29
30
726.302
0
0
12
7
4
5
935.063
3
4
9
8
7
19
1794.783
5
0
17
9
4
8
2222.907
7
0
12
10
6
16
2421.624
0
0
13
11
11
14
3783.480
0
0
16
12
4
29
7219.105
9
6
17
13
6
21
12998.314
10
2
18
14
15
26
18273.632
0
0
20
15
18
20
20554.957
0
0
19
16
11
13
21882.513
11
0
21
17
4
7
47806.267
12
8
20
18
6
22
47890.477
13
0
21
19
2
18
78041.439
0
15
23
20
4
15
94886.761
17
14
22
21
6
11
112970.372
18
16
25
22
3
4
230612.882
0
20
24
23
2
12
307290.597
19
0
26
24
3
25
570484.836
22
0
25
25
3
6
1.108E6
24
21
29
26
2
31
2.443E6
23
0
28
27
1
9
7.202E6
0
0
30
28
2
10
9.581E6
26
0
29
29
2
3
1.908E7
28
25
30
30
1
2
1.120E8
27
29
0
表2-3是系统聚类成员表。该表显示,若聚成3类,则分类结果为:
第一组:北京、上海;
第二组:天津、浙江、广东、江苏、海南、福建;
第三组:山西、青海、贵州、内蒙古、湖南、黑龙江、宁夏、新疆、吉林、云南、广西、河南、甘肃、河北、西藏、安徽、山东、江西、重庆、山西、辽宁、湖北、四川。
表2-3 系统聚类成员表
Cluster Membership
Case
6 Clusters
5 Clusters
4 Clusters
3 Clusters
1:北京
1
1
1
1
2:天津
2
2
2
2
3:河北
3
3
3
3
4:山西
3
3
3
3
5:内蒙古
3
3
3
3
6:辽宁
3
3
3
3
7:吉林
3
3
3
3
8:黑龙江
3
3
3
3
9:上海
4
4
1
1
10:浙江
5
5
4
2
11:安徽
3
3
3
3
12:福建
2
2
2
2
13:江西
3
3
3
3
14:山东
3
3
3
3
15:河南
3
3
3
3
16:湖北
3
3
3
3
17:湖南
3
3
3
3
18:广东
2
2
2
2
19:广西
3
3
3
3
20:海南
2
2
2
2
21:重庆
3
3
3
3
22:四川
3
3
3
3
23:贵州
3
3
3
3
24:云南
3
3
3
3
25:西藏
3
3
3
3
26:甘肃
3
3
3
3
27:陕西
3
3
3
3
28:青海
3
3
3
3
29:宁夏
3
3
3
3
30:新疆
3
3
3
3
31:江苏
6
2
2
2
表2-4为系统聚类树状图,该图显示了样本逐步合并的过程。其结果与系统聚类进度表反应的结果一致。
表2-4 系统聚类树状图
* * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
山西 4 ─┐
青海 28 ─┤
贵州 23 ─┤
内蒙古 5 ─┤
湖南 17 ─┤
黑龙江 8 ─┤
宁夏 29 ─┤
新疆 30 ─┤
吉林 7 ─┤
云南 24 ─┤
广西 19 ─┤
河南 15 ─┤
甘肃 26 ─┤
河北 3 ─┤
西藏 25 ─┤
安徽 11 ─┼───────┐
山东 14 ─┤ │
江西 13 ─┤ │
重庆 21 ─┤ │
陕西 27 ─┤ │
辽宁 6 ─┤ │
湖北 16 ─┤ ├───────────────────────────────────────┐
四川 22 ─┘ │ │
广东 18 ─┐ │ │
海南 20 ─┤ │ │
天津 2 ─┤ │ │
福建 12 ─┼───┐ │ │
江苏 31 ─┘ ├───┘ │
浙江 10 ─────┘ │
北京 1 ───┬─────────────────────────────────────────────┘
上海 9 ───┘
基于spss 16.0,对2012年全国各省市住宅型商品房平均销售价格做判别分析得到结果如下所示。
表2-5为组数据统计表,可以看出,房价最高的为第一组,均值为15212元每平方米,其次是第二组,为8159.5元每平方米,最后是第三组,均值为4016.8元每平方米。
表2-5 组数据统计表
Group Statistics
Average Linkage (Between Groups)
Mean
Std. Deviation
Valid N (listwise)
Unweighted
Weighted
1
住宅行性商品房家平均销售价格(元/平方米)
1.5212E4
1897.59176
2
2.000
2
住宅行性商品房家平均销售价格(元/平方米)
8.1595E3
1399.66764
6
6.000
3
住宅行性商品房家平均销售价格(元/平方米)
4.0168E3
543.08589
23
23.000
Total
住宅行性商品房家平均销售价格(元/平方米)
5.5409E3
3170.17410
31
31.000
表2-6为组间均值相等性检验。原假设为3组均值相等。伴随概率为0.000,小于常用显著性水平0.05,所以拒绝原假设,认为3组均值显著不相等。
表2-6 组间均值相等性检验
Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
住宅行性商品房家平均销售价格(元/平方米)
.066
198.271
2
28
.000
表2-8是协方差矩阵相等性检验——Box’s M检验成果表。表中列出了Box’s M值、近似F值、第一自由度、第二自由度和显著性概率。零假设为组的协方差矩阵相等。由于显著性概率小于0.05,所以拒绝原假设,认为协方差矩阵不相等,即差异显著。
在前面我们说到,均值相等性检验表明各组均值显著不相等。但是均值相等性检验的前提是协方差矩阵相等。而协方差矩阵显著不相等,使得均值相等性检验没有了讨论的前提,是不准确的。
表2-7 协方差矩阵相等性检验——Box’s M 值检验
Test Results
Box's M
12.635
F
Approx.
5.780
df1
2
df2
98.396
Sig.
.004
Tests null hypothesis of equal population covariance matrices.
表2-8为特征值表。表中显示判别函数的特征值为14.163,占总方差的百分比为100%,第一变量解释了96.2%的总方差。
表2-8 特征值表
Eigenvalues
Function
Eigenvalue
% of Variance
Cumulative %
Canonical Correlation
1
14.162a
100.0
100.0
.966
a. First 1 canonical discriminant functions were used in the analysis.
表2-9为Wilk 值表,表中显示,Wilk 值为0.066,卡方统计量的值为76.127,自由度为2,伴随概率为0.000,小于常用显著性水平0.05,所以可以拒绝原假设,认为三组均值不相等。
表2-9 Wilk 值表
Wilks' Lambda
Test of Function(s)
Wilks' Lambda
Chi-square
df
Sig.
1
.066
76.127
2
.000
表2-10为费歇尔线性判别函数系数表。利用该表得到的分类判别函数为:
将样本数据代入三个判别函数中,哪个函数的值最大,则该样本就属于哪一类。
表2-10 费歇尔线性判别函数系数表
Classification Function Coefficients
Average Linkage (Between Groups)
1
2
3
住宅行性商品房家平均销售价格(元/平方米)
.021
.011
.006
(Constant)
-164.013
-47.973
-12.458
Fisher's linear discriminant functions
(二)2012年全国各省市人民生活水平分析
基于SPSS 16.0,对表1-1数据进行聚类分析与判别分析,得到结果如下所示。
表3-1为聚类分析记录数统计表。由表中可以看出,有效值为31,缺失值为零。聚类方法为组间链接法,距离测度方法为欧式距离的平方。
表3-1 记录数统计表
Case Processing Summarya,b
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
31
100.0
0
.0
31
100.0
a. Squared Euclidean Distance used
b. Average Linkage (Between Groups)
表3-2为系统聚类分类表。当分为三组时,分类结果为:
第一组:北京、上海、浙江、天津;
第二组:广东、江苏、福建、山东、辽宁、内蒙古;
第三组:吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃。
Cluster Membership
Case
6 Clusters
5 Clusters
4 Clusters
3 Clusters
1:北京
1
1
1
1
2:上海
1
1
1
1
3:浙江
2
2
1
1
4:广东
3
3
2
2
5:江苏
3
3
2
2
6:天津
4
4
3
1
7:福建
3
3
2
2
8:山东
5
3
2
2
9:辽宁
5
3
2
2
10:吉林
6
5
4
3
11:黑龙江
6
5
4
3
12:河北
6
5
4
3
13:湖北
6
5
4
3
14:江西
6
5
4
3
15:内蒙古
5
3
2
2
16:河南
6
5
4
3
17:湖南
6
5
4
3
18:海南
6
5
4
3
19:安徽
6
5
4
3
20:四川
6
5
4
3
21:重庆
6
5
4
3
22:新疆
6
5
4
3
23:山西
6
5
4
3
24:宁夏
6
5
4
3
25:广西
6
5
4
3
26:陕西
6
5
4
3
27:西藏
6
5
4
3
28:贵州
6
5
4
3
29:云南
6
5
4
3
30:青海
6
5
4
3
31:甘肃
6
5
4
3
表3-3为树状图,其显示的结果与上图一致。
表3-3 系统聚类树状图
* * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
湖南 17 ─┐
海南 18 ─┤
河南 16 ─┤
安徽 19 ─┤
四川 20 ─┤
江西 14 ─┤
河北 12 ─┤
湖北 13 ─┤
重庆 21 ─┤
山西 23 ─┤
宁夏 24 ─┤
陕西 26 ─┼─┐
新疆 22 ─┤ │
青海 30 ─┤ │
吉林 10 ─┤ ├─────────┐
黑龙江 11 ─┘ │ │
广西 25 ─┐ │ │
云南 29 ─┼─┘ │
西藏 27 ─┤ ├───────────────────────────────────┐
贵州 28 ─┤ │ │
甘肃 31 ─┘ │ │
山东 8 ─┐ │ │
辽宁 9 ─┼───┐ │ │
内蒙古 15 ─┘ ├───────┘ │
广东 4 ─┬─┐ │ │
福建 7 ─┘ ├─┘ │
江苏 5 ───┘ │
北京 1 ─┬─────┐ │
上海 2 ─┘ ├─┐ │
浙江 3 ───────┘ ├───────────────────────────────────────┘
天津 6 ─────────┘
表3-4为各组中的数据信息。包括均值、方差等。
表3-4 分组数据信息
Group Statistics
Average Linkage (Between Groups)
Mean
Std. Deviation
Valid N (listwise)
Unweighted
Weighted
1
Zscore(人均GDP(元))
1.9772495E0
.68797869
4
4.000
Zscore(城镇居民人均PI(元))
2.0514797E0
.75222734
4
4.000
Zscore(农村人均纯收入(元))
2.1470264E0
.56163376
4
4.000
2
Zscore(人均GDP(元))
.7278890
.33822883
6
6.000
Zscore(城镇居民人均PI(元))
.5924543
.53411699
6
6.000
Zscore(农村人均纯收入(元))
.4097317
.46191669
6
6.000
3
Zscore(人均GDP(元))
-5.8458723E-1
.31737038
21
21.000
Zscore(城镇居民人均PI(元))
-5.6003070E-1
.25975432
21
21.000
Zscore(农村人均纯收入(元))
-5.2602362E-1
.36945764
21
21.000
Total
Zscore(人均GDP(元))
-3.4381100E-16
1.00000000
31
31.000
Zscore(城镇居民人均PI(元))
.0000000
1.00000000
31
31.000
Zscore(农村人均纯收入(元))
.0000000
1.00000000
31
31.000
表3-5为均值相等性检验。由表中可以看出,伴随概率均为0.000,小于常用显著性水平0.05,所以拒绝原假设,认为各变量的组均值显著不相等。
表3-5 均值相等性检验表
Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
Zscore(人均GDP(元))
.134
90.832
2
28
.000
Zscore(城镇居民人均PI(元))
.149
79.889
2
28
.000
Zscore(农村人均纯收入(元))
.158
74.549
2
28
.000
表3-6为协方差矩阵相等性检验表。零假设为组的协方差矩阵相等。由于显著性概率大于0.05,所以不能拒绝原假设,可以认为各组的协方差矩阵是相等的。
表3-6 协方差矩阵相等性检验表
Test Results
Box's M
30.523
F
Approx.
1.704
df1
12
df2
359.354
Sig.
.064
Tests null hypothesis of equal population covariance matrices.
表3-7为特征值表。由该表可以看出前两个判别函数的特征值分别为11.475、0.0210,占总方差的百分比分别为98.2%、1.8%。第一个变量解释了98.2%的方差。
表3-7 特征值表
Eigenvalues
Function
Eigenvalue
% of Variance
Cumulative %
Canonical Correlation
1
11.475a
98.2
98.2
.959
2
.210a
1.8
100.0
.417
a. First 2 canonical discriminant functions were used in the analysis.
表3-8为费歇尔线性判别函数。三个判别函数分别为:
表3-8 费歇尔先行判别函数
三、 实验对比分析结论
表4-1为住宅型商品房价格与人民生活水平的分类对比表。根据统计的2012年的数据,通过对住宅型商品房平均销售价格的聚类分析,将31个省市分别分为3、4、5、6个类,并根据类均值的大小对类进行排名,如表中的三类州中的rank,表示按住宅型商品房价格水平将31个省分为三类时,第一类为北京、上海,且其均值最高,即其房价水平最高,其次是第二类,房价水平最低的是第三类。依次类推,分为4、5、6组的组排名也在表中有所体现。然后再根据收集到的人民生活水平的数据对31个省市进行分类,并根据组均值进行排名。根据这两个数据样本对31个省市进行分类,比较对应组对应水平上的省市是否相似。图中,红色标记和蓝色标记为两列相同的省市。
表4-1 住宅型商品房价格水平与人民生活水平分类对比统计表
住宅型商品房价格与人民生活水平分类对比统计表
分类数
rank
住宅型商品房价格
人民生活水平
三类
1
北京、上海
北京、上海、浙江、天津
2
天津、浙江、福建、广东、海南、江苏
广东、江苏、福建、山东、辽宁、内蒙古
3
河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆
吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃
四类
1
北京、上海
北京、上海、浙江
2
浙江
天津
3
天津、福建、广东、海南、江苏
广东、江苏、福建、山东、辽宁、内蒙古
4
河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆
吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃
五类
1
北京
北京、上海
2
上海
浙江
3
浙江
天津
4
天津、福建、广东、海南、江苏
广东、江苏、福建、山东、辽宁、内蒙古
5
河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆
吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃
六类
1
北京
北京、上海
2
上海
浙江
3
浙江
天津
4
天津、福建、广东、海南
广东、江苏、福建
5
江苏
山东、辽宁、内蒙古
6
河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆
吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃
由表4-1可以看出,绝大多数住宅型商品房价格水平高的省市,人民生活水平较高,即住宅型商品房价格水平与当地人民生活水平呈现正相关关系。
但是,我们仍然可以观察到,有几个省市住宅型商品房价格以及人民生活水平存在明显地不匹配。如山东、辽宁、内蒙古三个省在人民生活水平中的排名始终比在房价排名上要高出一名。由于我们衡量人民生活水平的数据是人均GDP、城镇居民人均可支配收入、农村居民人均纯收入。所以可以说,这三个省的人民生活水平相对于房价来说,是较为优越的。也可以说,这三个省的房价普遍偏低,人民在购房上的压力普遍偏小。山东、辽宁、内蒙古是正在逐步发展起来的大省,虽然其经济、政治低位在不断上升,朝着北京、上海、广东等传统强势省市靠近,人民生活水平不断提高,但是由于其相对于传统强势省市的硬实力、软实力仍有差距,所以人们对这些省的购房需求并没有实现与高速发展的竞技水平相匹配的程度。随着这三个省市不断地发展经济,不断引进外资,建立高度发展的产业集群,成为人们理想的生活、工作场所,那时,房价定会提升。
同时,海南省也比较特殊。可以看到,海南省的住宅型商品价格水平的排名均比人民生活水平的排名要低一名。说明对于海南省人民来说,海南省的房价水平相对偏高,人们的购房压力相对偏大。海南省住房需求旺盛,不仅与海南快速发展的经济速度相关,还与海南省自然地理优势相关。海南是我国的第二大岛屿省,环境优美、空气清新,是生活、工作的理想场所。
最后,还有一点需要提及的是,就算人民生活水平和住宅型商品房价格在同一水平上的省份,其房价也有可能过高。比如,2012年北京的住宅型商品房平均销售价格为16553.48(元/平方米),而北京城镇居民人均可支配收入为36469元,也就是说,平均上来说,城镇居民一年的可支配收入仅能够购买到两平方米的住宅型商品房,房价相对于收入水平来说过高。上海也是如此。北京、上海等地房价过高主要是住房需求过高。很多人把北京、上海作为最佳的生活、工作场所,努力奋斗旨在买房,住房需求旺盛导致了房价远远高于其他省市的房价水平。
16
展开阅读全文