收藏 分销(赏)

聚类分析与判别分析实验报告.doc

上传人:仙人****88 文档编号:11319753 上传时间:2025-07-17 格式:DOC 页数:16 大小:395.26KB 下载积分:10 金币
下载 相关 举报
聚类分析与判别分析实验报告.doc_第1页
第1页 / 共16页
聚类分析与判别分析实验报告.doc_第2页
第2页 / 共16页


点击查看更多>>
资源描述
多元统计分析实验报告 ——研究房价与人民生活水平的关系 一、实验目的 本文旨在研究全国各省市住宅型商品房的平均价格水平,同时分析各省市住宅型商品房平均销售价格与其人民生活水平的关系。本文将用各省市人均GDP、城镇居民人均可支配收入、农村居民人均纯收入三个变量来衡量各省市的人民生活水平。住宅型商品房平均销售价格应该与人民生活水平成正相关关系。接下来,本文不仅要根据2012年全国各省市住宅型商品房平均销售价格如表1-1进行聚类分析和判别分析,还会根据2012年全国各省市人民生活水平数据如表1-2进行聚类分析与判别分析,观察房价较高的省市与人民生活水平较高的省市是否相符合,用以评价各省市房地产市场的定价是否符合该省市人民生活水平。 表1-1 2012年全国各省市住宅型商品房平均销售价格(元/平方米) 地区 X 地区 X 北京 16553.48 湖南 3669.63 天津 8009.58 广东 7667.89 河北 4141.96 广西 3909.83 山西 3690.88 海南 7811.26 内蒙古 3656.41 重庆 4804.80 辽宁 4717.21 四川 4959.19 吉林 3875.10 贵州 3695.36 黑龙江 3725.51 云南 3861.01 上海 13869.88 西藏 2982.19 浙江 10679.69 甘肃 3376.08 安徽 4495.12 陕西 4803.05 福建 8365.92 青海 3692.21 江西 4381.18 宁夏 3620.77 山东 4556.63 新疆 3593.82 河南 3511.26 江苏 6422.85 湖北 4668.00 其中,X表示住宅型商品房平均销售价格。 数据来源:国家统计局、各省市统计部门官方网站。 表1-2 2012年全国各省市人民生活水平数据 单位:元 人均GDP 城镇居民人均PI 农村人均纯收入 北京 88167.51 36469.00 16476.00 上海 85630.13 40188.00 17605.00 浙江 63346.70 34550.00 14552.00 广东 54324.53 30227.00 10542.80 江苏 68438.52 29677.00 12202.00 天津 95123.06 29626.00 13537.00 福建 52961.77 28055.00 9967.00 山东 51895.49 25755.00 9446.00 辽宁 56585.22 23223.00 9384.00 吉林 43419.57 20208.00 9224.00 黑龙江 35710.93 17760.00 8604.00 河北 36703.23 20543.00 8081.00 湖北 38642.17 20840.00 7851.70 江西 28848.51 19860.00 7828.00 内蒙古 64424.69 23150.00 7611.00 河南 31753.45 20443.00 7524.94 湖南 33589.41 21319.00 7440.00 海南 32543.03 20918.00 7408.00 安徽 28840.57 21024.00 7160.50 四川 29627.08 20307.00 7001.00 重庆 39256.59 22968.00 7383.00 新疆 33803.99 17921.00 6394.00 山西 33709.62 20412.00 6356.60 宁夏 36285.02 19831.00 6180.30 广西 28053.91 21243.00 6008.00 陕西 38612.68 20734.00 5763.00 西藏 23051.53 18028.00 5645.00 贵州 19608.53 18701.00 5616.00 云南 22262.58 21075.00 5417.00 青海 33168.59 17566.00 5364.38 甘肃 22035.03 17157.00 4495.00 数据来源:国家统计局、各省市统计部门官方网站。 二、实验过程 (一)2012年全国各省市住宅型商品房平均销售价格分析 基于SPSS 16.0,对2012年全国各省市住宅型商品房平均销售价格进行系统聚类分析,得到结果如下。 表2-1为参与系统聚类分析的样本统计表。表中显示,有效值为31个,无缺失值。分析中选择的聚类方法为类间连接法,距离测度方法为欧式距离的平方。 表2-1 样本统计表 Case Processing Summarya,b Cases Valid Missing Total N Percent N Percent N Percent 31 100.0 0 .0 31 100.0 a. Squared Euclidean Distance used b. Average Linkage (Between Groups) 表2-2为系统聚类进度表。类合并的详细步骤都体现了出来。在第一步中,将类4和类28合并成一类,其距离测度系数为1.769,合并两项都是第一次出现,故第一次出现的步序号都为0,合并结果取小的序号4,并在“Next Stage”表示的步中出现,即第三步出现。依次类推。 表2-2 系统聚类进度表 Agglomeration Schedule Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2 1 4 28 1.769 0 0 3 2 21 27 3.062 0 0 13 3 4 23 14.996 1 0 7 4 5 17 174.768 0 0 7 5 7 24 198.528 0 0 8 6 29 30 726.302 0 0 12 7 4 5 935.063 3 4 9 8 7 19 1794.783 5 0 17 9 4 8 2222.907 7 0 12 10 6 16 2421.624 0 0 13 11 11 14 3783.480 0 0 16 12 4 29 7219.105 9 6 17 13 6 21 12998.314 10 2 18 14 15 26 18273.632 0 0 20 15 18 20 20554.957 0 0 19 16 11 13 21882.513 11 0 21 17 4 7 47806.267 12 8 20 18 6 22 47890.477 13 0 21 19 2 18 78041.439 0 15 23 20 4 15 94886.761 17 14 22 21 6 11 112970.372 18 16 25 22 3 4 230612.882 0 20 24 23 2 12 307290.597 19 0 26 24 3 25 570484.836 22 0 25 25 3 6 1.108E6 24 21 29 26 2 31 2.443E6 23 0 28 27 1 9 7.202E6 0 0 30 28 2 10 9.581E6 26 0 29 29 2 3 1.908E7 28 25 30 30 1 2 1.120E8 27 29 0 表2-3是系统聚类成员表。该表显示,若聚成3类,则分类结果为: 第一组:北京、上海; 第二组:天津、浙江、广东、江苏、海南、福建; 第三组:山西、青海、贵州、内蒙古、湖南、黑龙江、宁夏、新疆、吉林、云南、广西、河南、甘肃、河北、西藏、安徽、山东、江西、重庆、山西、辽宁、湖北、四川。 表2-3 系统聚类成员表 Cluster Membership Case 6 Clusters 5 Clusters 4 Clusters 3 Clusters 1:北京 1 1 1 1 2:天津 2 2 2 2 3:河北 3 3 3 3 4:山西 3 3 3 3 5:内蒙古 3 3 3 3 6:辽宁 3 3 3 3 7:吉林 3 3 3 3 8:黑龙江 3 3 3 3 9:上海 4 4 1 1 10:浙江 5 5 4 2 11:安徽 3 3 3 3 12:福建 2 2 2 2 13:江西 3 3 3 3 14:山东 3 3 3 3 15:河南 3 3 3 3 16:湖北 3 3 3 3 17:湖南 3 3 3 3 18:广东 2 2 2 2 19:广西 3 3 3 3 20:海南 2 2 2 2 21:重庆 3 3 3 3 22:四川 3 3 3 3 23:贵州 3 3 3 3 24:云南 3 3 3 3 25:西藏 3 3 3 3 26:甘肃 3 3 3 3 27:陕西 3 3 3 3 28:青海 3 3 3 3 29:宁夏 3 3 3 3 30:新疆 3 3 3 3 31:江苏 6 2 2 2 表2-4为系统聚类树状图,该图显示了样本逐步合并的过程。其结果与系统聚类进度表反应的结果一致。 表2-4 系统聚类树状图 * * * * H I E R A R C H I C A L  C L U S T E R   A N A L Y S I S * * * *  Dendrogram using Average Linkage (Between Groups)                        Rescaled Distance Cluster Combine    C A S E     0         5        10        15        20        25   Label   Num  +---------+---------+---------+---------+---------+   山西      4   ─┐   青海     28   ─┤   贵州     23   ─┤   内蒙古    5   ─┤   湖南     17   ─┤   黑龙江    8   ─┤   宁夏     29   ─┤   新疆     30   ─┤   吉林      7   ─┤   云南     24   ─┤   广西     19   ─┤   河南     15   ─┤   甘肃     26   ─┤   河北      3   ─┤   西藏     25   ─┤   安徽     11   ─┼───────┐   山东     14   ─┤       │   江西     13   ─┤       │   重庆     21   ─┤       │   陕西     27   ─┤       │   辽宁      6   ─┤       │   湖北     16   ─┤       ├───────────────────────────────────────┐   四川     22   ─┘       │                                       │   广东     18   ─┐       │                                       │   海南     20   ─┤       │                                       │   天津      2   ─┤       │                                       │   福建     12   ─┼───┐   │                                       │   江苏     31   ─┘   ├───┘                                       │   浙江     10   ─────┘                                           │   北京      1   ───┬─────────────────────────────────────────────┘   上海      9   ───┘ 基于spss 16.0,对2012年全国各省市住宅型商品房平均销售价格做判别分析得到结果如下所示。 表2-5为组数据统计表,可以看出,房价最高的为第一组,均值为15212元每平方米,其次是第二组,为8159.5元每平方米,最后是第三组,均值为4016.8元每平方米。 表2-5 组数据统计表 Group Statistics Average Linkage (Between Groups) Mean Std. Deviation Valid N (listwise) Unweighted Weighted 1 住宅行性商品房家平均销售价格(元/平方米) 1.5212E4 1897.59176 2 2.000 2 住宅行性商品房家平均销售价格(元/平方米) 8.1595E3 1399.66764 6 6.000 3 住宅行性商品房家平均销售价格(元/平方米) 4.0168E3 543.08589 23 23.000 Total 住宅行性商品房家平均销售价格(元/平方米) 5.5409E3 3170.17410 31 31.000 表2-6为组间均值相等性检验。原假设为3组均值相等。伴随概率为0.000,小于常用显著性水平0.05,所以拒绝原假设,认为3组均值显著不相等。 表2-6 组间均值相等性检验 Tests of Equality of Group Means Wilks' Lambda F df1 df2 Sig. 住宅行性商品房家平均销售价格(元/平方米) .066 198.271 2 28 .000 表2-8是协方差矩阵相等性检验——Box’s M检验成果表。表中列出了Box’s M值、近似F值、第一自由度、第二自由度和显著性概率。零假设为组的协方差矩阵相等。由于显著性概率小于0.05,所以拒绝原假设,认为协方差矩阵不相等,即差异显著。 在前面我们说到,均值相等性检验表明各组均值显著不相等。但是均值相等性检验的前提是协方差矩阵相等。而协方差矩阵显著不相等,使得均值相等性检验没有了讨论的前提,是不准确的。 表2-7 协方差矩阵相等性检验——Box’s M 值检验 Test Results Box's M 12.635 F Approx. 5.780 df1 2 df2 98.396 Sig. .004 Tests null hypothesis of equal population covariance matrices. 表2-8为特征值表。表中显示判别函数的特征值为14.163,占总方差的百分比为100%,第一变量解释了96.2%的总方差。 表2-8 特征值表 Eigenvalues Function Eigenvalue % of Variance Cumulative % Canonical Correlation 1 14.162a 100.0 100.0 .966 a. First 1 canonical discriminant functions were used in the analysis. 表2-9为Wilk 值表,表中显示,Wilk 值为0.066,卡方统计量的值为76.127,自由度为2,伴随概率为0.000,小于常用显著性水平0.05,所以可以拒绝原假设,认为三组均值不相等。 表2-9 Wilk 值表 Wilks' Lambda Test of Function(s) Wilks' Lambda Chi-square df Sig. 1 .066 76.127 2 .000 表2-10为费歇尔线性判别函数系数表。利用该表得到的分类判别函数为: 将样本数据代入三个判别函数中,哪个函数的值最大,则该样本就属于哪一类。 表2-10 费歇尔线性判别函数系数表 Classification Function Coefficients Average Linkage (Between Groups) 1 2 3 住宅行性商品房家平均销售价格(元/平方米) .021 .011 .006 (Constant) -164.013 -47.973 -12.458 Fisher's linear discriminant functions (二)2012年全国各省市人民生活水平分析 基于SPSS 16.0,对表1-1数据进行聚类分析与判别分析,得到结果如下所示。 表3-1为聚类分析记录数统计表。由表中可以看出,有效值为31,缺失值为零。聚类方法为组间链接法,距离测度方法为欧式距离的平方。 表3-1 记录数统计表 Case Processing Summarya,b Cases Valid Missing Total N Percent N Percent N Percent 31 100.0 0 .0 31 100.0 a. Squared Euclidean Distance used b. Average Linkage (Between Groups) 表3-2为系统聚类分类表。当分为三组时,分类结果为: 第一组:北京、上海、浙江、天津; 第二组:广东、江苏、福建、山东、辽宁、内蒙古; 第三组:吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃。 Cluster Membership Case 6 Clusters 5 Clusters 4 Clusters 3 Clusters 1:北京 1 1 1 1 2:上海 1 1 1 1 3:浙江 2 2 1 1 4:广东 3 3 2 2 5:江苏 3 3 2 2 6:天津 4 4 3 1 7:福建 3 3 2 2 8:山东 5 3 2 2 9:辽宁 5 3 2 2 10:吉林 6 5 4 3 11:黑龙江 6 5 4 3 12:河北 6 5 4 3 13:湖北 6 5 4 3 14:江西 6 5 4 3 15:内蒙古 5 3 2 2 16:河南 6 5 4 3 17:湖南 6 5 4 3 18:海南 6 5 4 3 19:安徽 6 5 4 3 20:四川 6 5 4 3 21:重庆 6 5 4 3 22:新疆 6 5 4 3 23:山西 6 5 4 3 24:宁夏 6 5 4 3 25:广西 6 5 4 3 26:陕西 6 5 4 3 27:西藏 6 5 4 3 28:贵州 6 5 4 3 29:云南 6 5 4 3 30:青海 6 5 4 3 31:甘肃 6 5 4 3 表3-3为树状图,其显示的结果与上图一致。 表3-3 系统聚类树状图   * * * H I E R A R C H I C A L  C L U S T E R   A N A L Y S I S * * *   Dendrogram using Average Linkage (Between Groups)                        Rescaled Distance Cluster Combine    C A S E     0         5        10        15        20        25   Label   Num  +---------+---------+---------+---------+---------+   湖南     17   ─┐   海南     18   ─┤   河南     16   ─┤   安徽     19   ─┤   四川     20   ─┤   江西     14   ─┤   河北     12   ─┤   湖北     13   ─┤   重庆     21   ─┤   山西     23   ─┤   宁夏     24   ─┤   陕西     26   ─┼─┐   新疆     22   ─┤ │   青海     30   ─┤ │   吉林     10   ─┤ ├─────────┐   黑龙江   11   ─┘ │         │   广西     25   ─┐ │         │   云南     29   ─┼─┘         │   西藏     27   ─┤           ├───────────────────────────────────┐   贵州     28   ─┤           │                                   │   甘肃     31   ─┘           │                                   │   山东      8   ─┐           │                                   │   辽宁      9   ─┼───┐       │                                   │   内蒙古   15   ─┘   ├───────┘                                   │   广东      4   ─┬─┐ │                                           │   福建      7   ─┘ ├─┘                                           │   江苏      5   ───┘                                             │   北京      1   ─┬─────┐                                         │   上海      2   ─┘     ├─┐                                       │   浙江      3   ───────┘ ├───────────────────────────────────────┘   天津      6   ─────────┘ 表3-4为各组中的数据信息。包括均值、方差等。 表3-4 分组数据信息 Group Statistics Average Linkage (Between Groups) Mean Std. Deviation Valid N (listwise) Unweighted Weighted 1 Zscore(人均GDP(元)) 1.9772495E0 .68797869 4 4.000 Zscore(城镇居民人均PI(元)) 2.0514797E0 .75222734 4 4.000 Zscore(农村人均纯收入(元)) 2.1470264E0 .56163376 4 4.000 2 Zscore(人均GDP(元)) .7278890 .33822883 6 6.000 Zscore(城镇居民人均PI(元)) .5924543 .53411699 6 6.000 Zscore(农村人均纯收入(元)) .4097317 .46191669 6 6.000 3 Zscore(人均GDP(元)) -5.8458723E-1 .31737038 21 21.000 Zscore(城镇居民人均PI(元)) -5.6003070E-1 .25975432 21 21.000 Zscore(农村人均纯收入(元)) -5.2602362E-1 .36945764 21 21.000 Total Zscore(人均GDP(元)) -3.4381100E-16 1.00000000 31 31.000 Zscore(城镇居民人均PI(元)) .0000000 1.00000000 31 31.000 Zscore(农村人均纯收入(元)) .0000000 1.00000000 31 31.000 表3-5为均值相等性检验。由表中可以看出,伴随概率均为0.000,小于常用显著性水平0.05,所以拒绝原假设,认为各变量的组均值显著不相等。 表3-5 均值相等性检验表 Tests of Equality of Group Means Wilks' Lambda F df1 df2 Sig. Zscore(人均GDP(元)) .134 90.832 2 28 .000 Zscore(城镇居民人均PI(元)) .149 79.889 2 28 .000 Zscore(农村人均纯收入(元)) .158 74.549 2 28 .000 表3-6为协方差矩阵相等性检验表。零假设为组的协方差矩阵相等。由于显著性概率大于0.05,所以不能拒绝原假设,可以认为各组的协方差矩阵是相等的。 表3-6 协方差矩阵相等性检验表 Test Results Box's M 30.523 F Approx. 1.704 df1 12 df2 359.354 Sig. .064 Tests null hypothesis of equal population covariance matrices. 表3-7为特征值表。由该表可以看出前两个判别函数的特征值分别为11.475、0.0210,占总方差的百分比分别为98.2%、1.8%。第一个变量解释了98.2%的方差。 表3-7 特征值表 Eigenvalues Function Eigenvalue % of Variance Cumulative % Canonical Correlation 1 11.475a 98.2 98.2 .959 2 .210a 1.8 100.0 .417 a. First 2 canonical discriminant functions were used in the analysis. 表3-8为费歇尔线性判别函数。三个判别函数分别为: 表3-8 费歇尔先行判别函数 三、 实验对比分析结论 表4-1为住宅型商品房价格与人民生活水平的分类对比表。根据统计的2012年的数据,通过对住宅型商品房平均销售价格的聚类分析,将31个省市分别分为3、4、5、6个类,并根据类均值的大小对类进行排名,如表中的三类州中的rank,表示按住宅型商品房价格水平将31个省分为三类时,第一类为北京、上海,且其均值最高,即其房价水平最高,其次是第二类,房价水平最低的是第三类。依次类推,分为4、5、6组的组排名也在表中有所体现。然后再根据收集到的人民生活水平的数据对31个省市进行分类,并根据组均值进行排名。根据这两个数据样本对31个省市进行分类,比较对应组对应水平上的省市是否相似。图中,红色标记和蓝色标记为两列相同的省市。 表4-1 住宅型商品房价格水平与人民生活水平分类对比统计表 住宅型商品房价格与人民生活水平分类对比统计表 分类数 rank 住宅型商品房价格 人民生活水平 三类 1 北京、上海 北京、上海、浙江、天津 2 天津、浙江、福建、广东、海南、江苏 广东、江苏、福建、山东、辽宁、内蒙古 3 河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆 吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃 四类 1 北京、上海 北京、上海、浙江 2 浙江 天津 3 天津、福建、广东、海南、江苏 广东、江苏、福建、山东、辽宁、内蒙古 4 河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆 吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃 五类 1 北京 北京、上海 2 上海 浙江 3 浙江 天津 4 天津、福建、广东、海南、江苏 广东、江苏、福建、山东、辽宁、内蒙古 5 河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆 吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃 六类 1 北京 北京、上海 2 上海 浙江 3 浙江 天津 4 天津、福建、广东、海南 广东、江苏、福建 5 江苏 山东、辽宁、内蒙古 6 河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南、西藏、甘肃、陕西、青海、宁夏、新疆 吉林、黑龙江、河北、湖北、江西、河南、湖南、海南、安徽、四川、重庆、新疆、山西、宁夏、广西、陕西、西藏、贵州、云南、青海、甘肃 由表4-1可以看出,绝大多数住宅型商品房价格水平高的省市,人民生活水平较高,即住宅型商品房价格水平与当地人民生活水平呈现正相关关系。 但是,我们仍然可以观察到,有几个省市住宅型商品房价格以及人民生活水平存在明显地不匹配。如山东、辽宁、内蒙古三个省在人民生活水平中的排名始终比在房价排名上要高出一名。由于我们衡量人民生活水平的数据是人均GDP、城镇居民人均可支配收入、农村居民人均纯收入。所以可以说,这三个省的人民生活水平相对于房价来说,是较为优越的。也可以说,这三个省的房价普遍偏低,人民在购房上的压力普遍偏小。山东、辽宁、内蒙古是正在逐步发展起来的大省,虽然其经济、政治低位在不断上升,朝着北京、上海、广东等传统强势省市靠近,人民生活水平不断提高,但是由于其相对于传统强势省市的硬实力、软实力仍有差距,所以人们对这些省的购房需求并没有实现与高速发展的竞技水平相匹配的程度。随着这三个省市不断地发展经济,不断引进外资,建立高度发展的产业集群,成为人们理想的生活、工作场所,那时,房价定会提升。 同时,海南省也比较特殊。可以看到,海南省的住宅型商品价格水平的排名均比人民生活水平的排名要低一名。说明对于海南省人民来说,海南省的房价水平相对偏高,人们的购房压力相对偏大。海南省住房需求旺盛,不仅与海南快速发展的经济速度相关,还与海南省自然地理优势相关。海南是我国的第二大岛屿省,环境优美、空气清新,是生活、工作的理想场所。 最后,还有一点需要提及的是,就算人民生活水平和住宅型商品房价格在同一水平上的省份,其房价也有可能过高。比如,2012年北京的住宅型商品房平均销售价格为16553.48(元/平方米),而北京城镇居民人均可支配收入为36469元,也就是说,平均上来说,城镇居民一年的可支配收入仅能够购买到两平方米的住宅型商品房,房价相对于收入水平来说过高。上海也是如此。北京、上海等地房价过高主要是住房需求过高。很多人把北京、上海作为最佳的生活、工作场所,努力奋斗旨在买房,住房需求旺盛导致了房价远远高于其他省市的房价水平。 16
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服