资源描述
基于多维多规则云模型的上海市普通住宅定价及实证研究
鲁东大学 樊思维、王文杰、梁绍倩
目 录
1·问题的提出 - 1 -
2·研究思路 - 2 -
3·数据分析 - 3 -
3.1 定价体系的选取及假设 - 3 -
3.1.1定价体系的选取 - 3 -
3.1.2 若干假设 - 4 -
3.1.3 符号的约定 - 4 -
3.2基于双对数回归模型的剔除性最小二乘法分析 - 5 -
3.2.1 剔除性最小二乘法模型的引入 - 5 -
1.双对数回归模型的构建 - 5 -
2. 剔除性最小二乘法的引入 - 6 -
3.2.2 剔除性最小二乘法模型的定义及变量假设 - 6 -
3.2.3 剔除性最小二乘法模型的构造及本案例中的应用 - 7 -
1. 模型的构造 - 7 -
2. 在本案例中的应用及分析 - 9 -
3.3双对数回归模型 - 11 -
3.4多维多规则的云预测模型 - 14 -
3.4.1 云模型引入及概述 - 14 -
1. 云模型引入 - 14 -
2. 云模型概述 - 14 -
3.4.2 多维云的定义及分类 - 14 -
1.多维云概述 - 14 -
2. 多维云的分类 - 16 -
3.4.3 多维云模型在本案例中的应用 - 17 -
1.定量到定性的转化 - 17 -
2.五维多规则逆向云发生器的实现 - 19 -
3.五维多规则生成器的实现 - 19 -
3.5模型对比分析 - 22 -
3.5.1 模型的对比 - 22 -
3.5.2 模型的优点及不足 - 22 -
3.5.3模型的改进及建议 - 23 -
4·结论与建议 - 23 -
附录 - 24 -
参考文献 - 32 -
摘 要
针对于上海房地产定价体系的问题,根据上海房地产的实际现状,我们从供求原理的角度来选取定价指标。在建立预测模型时,考虑到在进行多元回归分析,选取的变量可能具有多重相关性,且变量过多时系统可能会自动排除掉一些具有重要解释意义的量。于是,我们引入了剔除相关性最小二乘法,在排除了多重相关性后,剔除出相关性较大的自变量,进行相关分析。
从定量的角度考虑,我们应用了简单的双对数多元回归分析,应用基于剔除相关性最小二乘法选取出的相关性较大的一些自变量,建立双对数模型进行分析。
从定性的角度考虑,根据定量与定性相互转化的方法,我们认为房价的产生是随机的,而房价高低的概念是模糊的,依据这些考虑,我们融随机性与模糊性为一体,在运用剔除相关性最小二乘法选取变量的条件下,引入一个多维多规则云模型,使之在定性和定量相结合的基础上,解决房价的预测,并与双对数回归分析结果进行比较,得出更为准确的房价预测模型。
模型在构建的过程中,我们运用了SPSS19.0及Matlab2009来实现有关上海房地产定价的实证研究。
本文的创新之处有三点:
1) 在定价指标选取的方面,我们不是根据经验直接选取,首先从供求原理的角度来选取,再根据这些指标的数据特点并结合实际进行筛选;
2) 在数据分析方面,针对于传统模型筛选变量的不足,引入了剔除性最小二乘法,实证表明基于剔除性最小二乘法的回归模型要优于传统多元回归模型。
3) 在数据预测方面,基于剔除性最小二乘法的分析,引入了多维多规则云模型进行预测,从定量与定性相互转化的角度,解决预测数据的模糊性与随机性问题,使研究更具有科学性。
关键词:多维多规则云模型;剔除相关性的最小二乘法;房地产;定价体系
1·问题的提出
房地产市场的健康发展与否关系到国家经济发展,同时与老百姓的生活更是息息相关的,房价成为人们越来越关注的焦点。就上海而言,经过二十多年的改革及发展,上海房地产也走出了多年的调整期,呈现持续繁荣的状态。显然房价过高已成了不争的事实,国家也已经开始着手于房价的调控,那么房价的高低到底是有什么决定的呢?虽然房地产业已经得到了足够的重视,但是对于房地产定价模型和方法的研究却没有像房地产市场那样得到应有发展。
早期文献选取的宏观经济变量指标比较单一,一般认为从长期看房价与宏观经济步调保持一致,房价是由宏观经济因素决定的。较为经典的有Clapp和Giaccotto(1994)利用简单回归分析,认为宏观经济的变化对于房价有很好的预测能力;Quigley(1999)采用了平衡确定价格的模型,认为宏观经济基本面的相关指标可以解释房价的变化,宏观经济因素对于房地产市场短期的影响不大,但是长期的影响显著;Miki Seko(2003)通过利用计量模型分析出日本各地区的住宅价格和经济基本面有着比较强的相关性,可以预测房地产市场的发展。Dipasquale和Wheaton(2002)采用存量流量模型来分析房地产业发展对国民经济增长具有明显的拉动效应。
而且,大多相关研究采用了简单线性回归模型和VAR模型,还有DSGE模型。简单线性回归模型无法避免因素之间的多重相关性,变量太多时可能会剔除重要变量,会使模型在整体上不够精确。VAR模型不依赖具体的经济理论,直接对数据的动力性质进行分析,结构参数的估计是不稳定的。DSGE模型则建立在坚实的经济理论基础之上,从而避免了卢卡斯判断,但是以实际数据不完全匹配。
由这些我们发现这些研究均存在着不足的地方,需要进行进一步的讨论。于是我们引入了双对数模型以及云预测模型,特别是云预测模型几乎没有在房地产价格方面应用,本文通过对比双对数模型以及云模型与实际房价的拟合度,尝试拓展云模型的应用范围以及为房价预测提供新的思路。
2·研究思路
基本概念及房地产文献研究
前人研究的不足之处
构建定价
指标体系
结论与建议
剔除性最小二乘法分析
双对数模型
多维多规则云模型
3·数据分析
3.1 定价体系的选取及假设
3.1.1定价体系的选取
在选取指标时,我们从供求原理出发,从影响供给和需求两个方面来刻画房价。
从供给的角度出发,影响供给方的主要因素是成本和对房价的预期,以及宏观因素中的物价指数,因此我们在选用描述供给指标的时候,我们从这些方面入手。土地成本投入是房地产商成本投入的一大部分,因此,我们选用土地交易价格指数来刻画成本的一个方面;投资额的增加也意味着成本的增加,在上海,随着国际化的日益加深,越来越多的外资涉足上海房地产市场,并且其在投资总额中所占的比重越来越大,所以汇率和对房价的预期也是对成本的一个重要影响因素。对于国内的房地产商而言,企业的贷款利率会在一定程度上影响着其贷款额,所以,企业贷款利率也是不得不考虑的因素。为了用来描述投资商或供给商对于房价的预期这一因素,我们选取了房地产景气指数和新建住宅价格指数来从宏观和微观共同刻画。
从需求[1]的角度来看,需求由投机需求,投资需求和正常需求构成。影响房屋的正常需求的因素有房价,收入效应,替代效应,以及购房方式。由于房屋的不可替代性,所以我们只考虑收入效应和房价对正常需求的影响,因此我们呢选取了新建住宅价格指数,房价比收入,个人存款利率和贷款利率来刻画正常需求。而投资需求主要体现在出租房市场上,因此出租房价格指数可以用来描述投资需求。投机需求一般受到房价和对房价的预期的影响,因此我们在选取影响投机需求的指标时,可以从这两方面入手,因此,我们选用房地产景气指数和新建住宅价格指数来从宏观和微观共同刻画投机需求。
基于以上分析我们选取出下列指标:
房地产景气指数、土地交易价格指数,这两个影响房屋投资及成本的因素,并以上一年的数据,作为房地产商对当年房地产业的预期。
消费者价格指数(CPI),房价收入比、新建住宅价格指数及房屋租凭价格指数衡量,同时也均选用上一年的数据,作为影响人们或房地产商对当期价格预期的因素,从而影响需求。
从宏观经济态势方面来看,选取了人民币汇率、GDP、利率、通货膨胀率来考察;选取企业贷款年利率(即中长期贷款利率一至三年)、个人定期存款利率(即定期存款整存整取(一年))、个人住房商业贷款年利率(一至三年)来衡量利率。
3.1.2 若干假设
本文从房地产商的角度出发,模拟房地产商的定价模型,从供求原理出发,提出以下假设:
(1)房地产商是理性的,对于房地产商来说,利润是其定价的出发点,但从长远看,房地产商是理性的,即在定价时,在考虑利润的基础上,充分考虑需求。
(2)房屋的地理位置对于房价以及购房人的购买意愿没有影响
(3)假设二手房交易市场对普通住房价格没有影响。
(4)房地产市场是非理性的,非均衡的,即炒房投机对需求有很大影响。
3.1.3 符号的约定
:普通住宅房价;
:房地产景气指数;
:人民币汇率(年平均汇率);
:居民消费价格指数;
:土地交易价格指数;
:企业贷款年利率(即中长期贷款利率一至三年);
:个人定期存款利率(即定期存款整存整取(一年));
:个人住房商业贷款年利率(一至三年);
:房价收入比;
:新建住宅价格指数;
:房屋租凭价格指数;
3.2基于双对数回归模型的剔除性最小二乘法分析
3.2.1 剔除性最小二乘法模型的引入
1.双对数回归模型[2]的构建
在处理多变量的问题时,一般采用多元线性回归模型进行分析,在这里考虑使用非线性模型中的双对数模型。
多元双对数模型函数
其中,在本案例中,,,…,是多元线性回归方程的未知参数。由于参数估计的工作是基于样本数据的,由此得到的参数只有参数真值,,,…,的估计值,记为,,,…,,于是有:
=+++…+
称为估计的多元线性回归方程。
运用SPSS软件[3]对与 ,,…,进行双对数模型分析时,自动剔除出了,等变量后,得出了与,,, ,,,,,八个变量之间的双对数回归方程(即简单模型):
=104.085+12.509-20.661-26.431+3.964-7.984+6.一五5-5.419-3.943
应用在SPSS对双对数模型进行拟合优度的检验,结果如下:
表1 双对数模型拟合优度表
模型
双对数回归模型
1.000
1.000
由表1可知,双对数模型回归方程的拟合优度,说明其回归自变量与因变量具有较强的相关性。但是在用双对数模型分析,或者说使用回归方程时,变量的多少对的影响很大,即自变量的个数与评价回归方程拟合效果的一个重要指标复测定系数有很大的关系,自变量的个数越多,复测定系数的值就越大。而且由于影响房价的各个因素之间互相影响,存在着多重线性相关,又会使一些重要的变量被排除。因此我们无法明确的从此模型得出房价与各个变量之间是否存在着回归关系,而这两个问题是多元回归分析是难以回避的。所以许多统计学家都主张在回归建模时,应采用尽可能少的自变量。
2. 剔除性最小二乘法[4]的引入
在大量的社会、经济、工程问题中,对于因变量Y的全面解释往往需要多个自变量的共同作用。在变量的选取中,为了不漏掉重要信息,总希望能考察到的指标尽量考察到。这样会导致变量过多,增加分析难度,且往往会扩大估计的方差,降低模型的精度。在既兼顾到不遗漏重要的解释变量,由遵循参数节省原则,使自变量的个数尽可能的少。在这里我们引入剔除相关性的最小二乘法,剔除变量间的复相关性,有效地对变量进行筛选。
3.2.2 剔除性最小二乘法模型的定义及变量假设
设多元线性回归模型为+ +,其中为因变量,为变量,为回归系数,为随机误差,~(0,)。
定义 1 设)是维随机向量。随机向量期望=;随机变量和的协方差=-)(-);随机变量和的相关系数为=/(),若=0,则称与不相关,若=1,则称与相关很大。
定义2 复测定系数 为估计值,为观测值,为的均值,则复测 定系数为:
定义3 偏F检验:设有个自变量和因变量,满足多元线性回归模型。
若采用其中个自变量拟合,即,记其复测定系数为;从这个自变量中找出一个自变量,异于,这是用个自变量拟合,即,记其复测定系数为。
记,若几乎为零,则说明增加对的解释能力没明显提高;否则,若不显著为零,则就可以为回归模型提供显著的解释信息。
假设
统计检验量为
在假设成立的条件下,服从分布,第一自由度为1,第二个自由度为,有检验水平,得到拒绝与的临界值,若,拒绝,说明显著不为零,则说明增加对的解释能力有明显的提高;若,接受,说明显著不为零,则说明增加对的解释能力没明显提高;
上述检验称为偏检验,它是变量筛选的统计依据。
3.2.3 剔除性最小二乘法模型的构造及本案例中的应用
1. 模型的构造
1)数据对数化处理
用SPSS软件将自变量与因变量集(,,…,,)对数化处理,以保证得到可控的平滑聚合函数,故可得到新的自变量与因变量集(,,…,,Y)
2)计算相关矩阵
用SPSS软件计算出标准化的自变量与因变量集(,,…,,Y)的相关矩阵,记与的相关系数为。
3)找出自变量与因变量的性关系数的绝对值最大的自变量。
4)相关性剔除
令=-/(ji)(j=1,2,…,10),由于与不相关。这样就剔除对其他变量的影响。在此处由于为自变量与因变量的性关系数的绝对值最大的自变量,故令i=10。(用MATLAB编程[5]见附录B)
即可算出(j=1,2,…,一三),如表2所示:
表2 新变量相关矩阵表
Y
-0.2一三1
0.0928
0.2752
0.2599
0.67一八
0.509
0.5844
-0.1291
-0.3172
8.167027
-0.0576
0.0688
0.2069
-0.1一三8
-0.0795
-0.0198
-0.1一八3
-0.4674
0.5一五9
8.24589
-0.0727
-0.0277
0.042
-0.0962
-0.3957
-0.3066
-0.3867
-0.1788
0.2一八
8.480785
-0.0126
-0.2512
-0.5723
-0.1951
-0.7582
-0.6714
-0.6588
0.8002
-0.3一八7
8.691662
0.604
-0.4275
-0.578
0.0993
-0.6864
-0.565
-0.5372
1.4746
-0.6792
8.752481
-0.4999
2.436
-0.6761
-0.0829
-0.0977
-0.4604
0.05一八
0.9205
-0.585
8.723391
0.5306
-0.5405
-0.2955
0.0331
1.0591
0.8581
1.一三38
-0.7565
-0.172
8.90826
1.6272
-0.6378
0.277
0.0462
1.31一五
1.572
1.3736
-0.0719
0.5025
8.919106
-1.9059
-0.7一三
1.3207
0.0496
-1.025
-0.9一五9
-1.4427
-1.5917
0.8357
9.267521
5)用与因变量Y做最小二乘回归分析,及其复测定系数为.
6)对进行标准化处理后仍记为,目的是把剔除后的变量与同等对待。计算与因变量Y的相关系数矩阵。依次重复第3)4)步的工作。及第k次找出的基变量为,由第3)4)步知,,…,不相关。用,,…,与因变量Y做最小二乘回归分析,记其复测定系数为。由定义3,如果偏F检验通过,则停止计算,否则,重复3)4)5)的计算。
2. 在本案例中的应用及分析
由标准化的自变量与因变量集(,,…,,Y)的相关系数矩阵可以看出与因变量Y存在严重的相关性,所以把当做基变量,记=;作相关性剔除(ji)(j=1,2,…,10)并标准化处理,得到剔除的影响后的相关系数矩阵。从相关系数矩阵可看出与Y的相关系数最大,所以把作为第二基变量;记;用以为因变量经最小二乘法计算后得到如下结果:=0.857,偏F检验不存在。
然后以同样的方法继续剔除相关变量,剔除及相关检验结果如表3:
表3 剔除的自变量与因变量的拟合度及偏F检验值表
自变量
0.857
不存在
不存在
,
0.927
8.597
3.36
,,
0.952
4.297
3.46
,,,
0.976
7.061
3.59
,,,,
0.991
9.912
3.78
,,,,,
0.992
0.425
4.06
注:的值对应的显著性水平=0.10
由表3可知,以,,,,,,为因变量最小二乘计算后得到如下结果:=0.992,偏F检验=0.425<(, =),则通过检验也就是说及其他的变量对因变量的影响可以忽略,所以用,,,,,为因变量做回归分析,是非常好的。
在应用剔除性最小二乘法分析时,剔除了企业贷款年利率(即中长期贷款利率一至三年)、个人定期存款利率(即定期存款整存整取(一年))、个人住房商业贷款年利率(一至三年)、房价收入比、房屋租凭价格指数这些指标,选取出影响房价最主要的因素是新建住宅价格指数、居民消费价格指数(CPI)、人民币汇率(年平均汇率)、房地产景气指数、土地交易价格指数。从实际的角度来看,CPI是央行决定利息变化的主要指标,即间接影响利率的大小,因此剔除有关利率的三个因素是可行的。根据图2,可以观察到2000年至2009年上海市房价收入比一直在0.2~0.3之间波动,其波动幅度不大。再者,房价收入比的大小是受房价与收入的影响,国家在调控收入时主要参照了CPI的变化,且CPI会影响房价,因此剔除了房价收入对房价的影响。
图1 2000年至2009年上海市房价收入比
从需求的构成中可以看出,投机需求和直接需求所占的比重最大,而投资需求却比较少,因此用来描述投资需求的指标出租房租赁指数可以排除。从下图中可以看出上海市普通房价与需求整体来说是正相关的,需求上升,房价上升,房价上升,需求上升.
图2 上海市普通住宅销售量与销售价的关系图
(注:上表中价格单位为元每平方米)
从传统的需求曲线来看,房价与需求应该是负相关的;而在投机需求中,投资者投机资金以赚取差价为根本目的,无论是需求者还是供给者,他们对期望价格是不断上涨的,购买者获得了商品增值带来的利润,供给者则获得了更高的销售利润,这样就使的价格与需求实现暂时性的一致与房价却是正相关的。当投机需求占总需求的比重过大时,就会出现房价与总需求正相关的情况,而由上图可以知道,上海市正是出于这种情况。因此,相比其他指标,最终剔除房价比收入这个影响正常需求的量是可行的。
可见,使用剔除性最小二乘法分析得到的结果具有很高的可行性。
3.3双对数回归模型
在应用了剔除相关性的最小二乘法后,我们只保留了被选的基变量中与因变量无关的噪声,即,,,,,而,,,,所对应的是,, , ,这些原始变量,因此对它们进行多元线性回归分析。则可得到新变量标准化后的方程式:
通过新变量与原变量之间的对应关系及对数转换可以得到有关原变量的双对数回归方程式:
在运用SPSS进行回归分析时,可以得出该模型的拟合优度检验结果表和残差图,如下:
表4 剔除变量后双对数模型拟合优度表
模型
新变量回归模型
0.996
0.991
原变量回归模型
0.977
0.955
图3 残差图
由上表可知新变量=0.991,原变量=0.955,模型拟合度都很高;有残差图(图3)可知标准化预测值与Student化残差所构成的点均落在(-2,+2)的水平带状区间中,且不带任何系统趋势、完全随机的分布在该带状之中,说明采用的回归方程对样本数据的拟合是良好的,故两者都表明该模型是合理的。
根据观察新变量系数,可以发现影响房价最主要的因素是新建住宅价格指数、居民消费价格指数(CPI)、人民币汇率(年平均汇率)、房地产景气指数、土地交易价格指数对房价的影响是逐渐减弱的。但这是建立在剔除了所选因素的相互影响的情况下,实际上这些因素是存在着相关关系的。因此,我们需要将新变量还原进行分析。由新方程各变量的系数可以发现居民消费价格指数、人民币汇率(年平均汇率)、新建住宅价格指数、房地产景气指数、土地交易价格指数对房价的影响逐渐减弱。实际上我们知道,CPI是央行决定利息变化的主要指标,而利息则是决定房价的最为重要的因素,可见其对房价有着决定性的作用,只不过是通过间接的方式在传导,而根据此模型我们可以直观的观察出其影响的程度。同时这也说明了,通过该模型我们能观测各个原变量对房价影响大小,以及原变量对房价是抑制还是促进,即相关系数能表示的是新变量与房价的关系:影响大小,促进还是抑制。
双对数模型预测结果如下:
表5 上海市2000年至2009年预测值与实际值的比较
时间
普通住宅实际价格
普通住宅预测价格
2001
3522.85
3482.76
2002
3811.93
4207.9
2003
4821.23
4587.04
2004
5953.07
5403
2005
6326.37
6435.47
2006
6144.98
6860.46
2007
7392.79
6777.95
2008
7473.41
7743.27
2009
10588.47
10414.98
注:上表中价格单位为元每平方米
3.4多维多规则的云预测模型
3.4.1 云模型引入及概述
1. 云模型[6]引入
以上使用的双对数回归模型,是从定量的角度来研究有关房价的研究。而我们一般情况下还会采用:时间序列预测模型,灰色模型GM,模糊数学,神经网络等,这些将定量与定性相互转化的方法。而我们采用了同样是定量与定性相互转化,却鲜有在房价分析方面进行拓展和应用的云预测模型。在此,本文试图进行这个方面的尝试与研究。
2. 云模型概述
云是用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型,或者简单地说云模型是定性定量间转换的不确定性模型,云的数字特征用期望,熵,超熵三个数值表征,它把模糊性和随机性完全集成到一起,构成定性和定量相互间的映射。其中是云的重心位置,标定了相应的定性概念的中心值。是概念不确定的度量,它的大小反应了在论域中可被定性概念接受的元素数,即亦此亦彼性的裕度。是熵的不确定的度量,即熵的熵,它反映了云的离散程度。云的数学定义式如下:
在[0,1]中取值,云是从论域U 到区间[0,1]的映射,
,,
构成一个云滴
3.4.2 多维云的定义及分类
1.多维云概述
对于大自然的不确定的信息,需要一种形式化的符号系统去刻画,当我们在描述这些量的时候,很多情况下并不是靠着精确计算某种数值来把握,而是通过感知概念和事物的整体特征来描述的。比如房价的高低,汇率的高低,此处的高低并没有一个明确的划分标准,因此说语言固有的不确定性与客观世界普片存在的亦此亦彼性有着很好的对应关系。而以云模型为工具来描述语言原子,则正好能体现这一关系。
对于简单的定性规则[7],我们可以这样描述:IF A THEN B.同理对于复杂的定性规则我们可以这样表述:IF A and B and C…THEN E。也就是说我们可以根据多维空间的云对象来表示这一复杂的定性规则。通过构造高维云发生器来解决复杂的不确定性的推理问题。所以我们在一维云的基础上,可以引出多维云的概念。
定义 设是一个普通集合,称为论域,关于论域X中的模糊集合, 是指对于任意元素都存在一个有稳定倾向的随机数,叫做对的隶属度.如果论域中的元素是简单有序的, 则可以看作是基础变量;如果论域中的元素不是简单有序的, 而根据某个法则, 可将映射到另一个有序的论域中,中的一个且只有一个和对应, 则为基础变量, 隶属度在基础变量上的分布称为云.
多维云的数字特征 期望值、熵、超熵,它们的含义如下:
期望值,多维云覆盖范围下的某一平面上投影面积的形心, 它反映了相应的由两个定性概念原子组合成的定性概念的信息中心值。
熵,多维云在各个平面上投影后的边缘曲线——期望曲线的熵,它反映了定性概念在坐标轴方向上的亦此亦彼性的裕度。由()的数字特征值, 分别确定了各平面上的具有正态分布形式的云期望曲线方程:
超熵。()间接反映了多维云在某一平面上投影一维云的厚度, 即其离散程度。
2. 多维云的分类
1)多维正向云
基本云:通过两个方向给定多维云的三组数字特征、和,产生满足多维正态云分布规律的点——,称为云滴,其云发生器PGG(Planar Clouds Generator)的如图4
…
,(为产生云滴的时间间隔
为个数)
图4 多维云发生器
条件云:通过两个方向给定云的三组数字特征、、 和特定的值, ,…,产生满足上述条件的云滴——;也可以只给定一个()值组——即某平面上的点。
条件云通过两个方向给定云的三组数字特征、、 和产生满足上述条件的云滴组——即某横截面上的点;也可以再给定,产生满足上述条件的云滴——。
2)多维逆向云
给定符合某一正多维云分布规律的一组云滴作为样本, 产生描述二维云所对应的定性概念的三组数字特征、和。即两个方向上的期望值、熵和超熵其云发生器如图5
图5 多维逆向云发生器
3.4.3 多维云模型在本案例中的应用
1.定量到定性的转化
基于剔除性最小二乘法,我们选取出了与房价相关性较强且相互影响较小的五个指标。由于选取的这些指标全部是定量的,因此,首先必须将定量的指标转化为定性的量。我们采用SPSS对选取的五个指标进行聚类分析,得到了4类,由于数据的个数问题,导致09自成一类,因此我们在利用基于信息的多维云逆向发生器(由于2001年至2003年人民币汇率值相同导致熵和超熵不能求出,故对这些数值做细微改动)只能得到三个规则(如表6)(注:多维云逆向发生器的Matlab编程见附录C)
表6 多规则划分表
规则一
房地产景气指数
人民币汇率
居民消费价格指数
土地交易价格指数
新建住宅价格指数
普通住宅销售价格
2001
100
8.279
100
100
100
0.352285
2002
100.77
8.277
100
92.2
102.1
0.381193
2003
101.17
8.275
100.5
102.3
111
0.482123
100.6467
8.277
100.1667
98.1667
104.3667
0.4052
0.5403
0.0017
0.2785
4.9854
5.5424
0.0604
0.2484
0.0011
0.0759
1.7802
1.8398
0.0227
规则二
房地产景气指数
人民币汇率
居民消费价格指数
土地交易价格指数
新建住宅价格指数
普通住宅销售价格
2004
102.5100
8.2768
100.6
125.1000
一三4.7000
0.595307
2005
106.0500
8.1917
102.8
161.8000
一五6.0000
0.632637
2006
101.7400
7.97一八
103.7
170.6000
170.4000
0.614498
103.4333
8.1468
102.3667
一五2.5000
一五3.7000
0.6141
2.一八63
0.1462
1.4761
22.8939
一五.8753
0.0一五7
0.7095
0.0583
0.6036
7.6355
8.4003
0.0100
规则三
房地产景气指数
人民币汇率
居民消费价格指数
土地交易价格指数
新建住宅价格指数
普通住宅销售价格
2007
106.0500
7.604
105
169.7000
165.0000
0.739279
2008
111.2500
6.9451
108.3
177.2000
170.6000
0.747341
108.6500
7.2745
106.65
173.4500
167.8000
0.7433
4.6084
0.5839
2.9245
6.6467
4.9629
0.0071
2.7780
0.352
1.7629
4.0067
2.9917
0.0043
注:上表中人民币汇率单位为%,价格单位为万元每平方米
根据上表可以得出以下三个规则(使用IF A THEN B语句):
a) If 房地产景气指数低,人民币汇率高,居民消费价格指数低,土地交易价格指数低,新建住宅价格指数低,then 普通住宅销售价格低;
b) If 房地产景气指数中等,人民币汇率中等,居民消费价格指数中等,土地交易价格指数高,新建住宅价格指数中等,then 普通住宅销售价格中等;
c) If 房地产景气指数高,人民币汇率低,居民消费价格指数高,土地交易价格指数高,新建住宅价格指数中等,then 普通住宅销售价格高。
2.五维多规则逆向云发生器的实现
在本案例中,由上述多维逆向云发生器的实现可以得到五维三规则逆向云发生器,如图6所示
图6 逆向云发生器
3.五维多规则生成器的实现
1)理论依据
① 二维单规则生成器的算法:
用二维条件云发生器和一维条件云发生器可以构造一条复杂的定性规则生成器。比如规则IF A and B THEN F的云发生器示意图如图7所示:
,(为产生云滴的时间间隔
为个数)
…
图7 云发生器示意图
② 将单个二维单规则生成器组合起来作用是,就构成了二维多规则生成器,如图8所示:
图8 二维多规则生成器的实现
注:就是,的预测值
2) 理论拓展
由二维多规则生成器的理论知,由3个五维单规则生成器组合起来作用时,就构成了五维多规则生成器,在本例中,它反映如表6分析得出的三条定性规则。
3.五维多规则生成器的应用
1)参数整理
将表6重新整理可得到运处理后的数字特征和特征参数如表7所示:
表7 三规则参数表
房地产景气指数
人民币汇率
居民消费价格指数
规则一
100.6467
0.5403
0.2484
8.277
0.0017
0.0011
100.1667
0.2785
0.0759
规则二
103.4333
2.一八63
0.7095
8.1468
0.1462
0.0583
102.3667
1.4761
0.6036
规则三
108.65
4.6084
2.778
7.2745
0.5839
0.352
106.65
2.9245
1.7629
土地交易价格指数
新建住宅价格指数
普通住宅销售价格
规则一
98.1667
4.9854
1.7802
104.3667
5.5424
1.8398
0.4052
0.0604
0.0227
规则二
一五2.5
22.8939
7.6355
一五3.7
一五.8753
8.4003
0.6141
0.0一五7
0.0100
规则三
173.45
6.6467
4.0067
167.8
4.9629
2.9917
0.7433
0.0071
0.0043
2)五维多规则正向云发生器的实现
基于上表所示的定性规则集,由上述五维多规则生成器图,我们可以推广出本案例中的五维正向云发生器PGG构造方法。由表(规则表)所示的定性规则集,由于多维规则发生器中,有很多量是随机产生的,因此,当我们每次输出的云滴也许会有很大不同,所以我们在选云滴时,仔细衡量,最终观察每次所选云滴构成的正态曲线的期望围绕哪个值左右波动,确定最终的预测房价,预测结果如表8(注:五维正向云发生器PGG实现的具体MATLAB程序见附录C)。
表8 基于云模型的房地产价格预测表
年份
实际房价(万/平方米)
预测房价(万/平方米)
2001
0.352285
0.3625
2002
0.381193
0.367
2003
0.482123
0.5012
2004
0.595307
0.60055
2005
0.632637
0.6325
2006
0.614498
0.6079
2007
0.739279
0.7433
2008
0.747341
0.7433
注:上表中价格单位为元每平方米
3.5模型对比分析
3.5.1 模型的对比
图9 上海普通住宅预测价格与实际价格的对比图
由于数据的限制,09年与三个规则的隶属度都趋近于0,也就是说几乎不属于给出的三个规则,所以我们无法给出09年的预测数据,但是由上表可以看出,对于可以确定规则的年份(2001到2008年)云预测模型拟合的效果比双对数多元线性回归要好很多。
3.5.2 模型的优点及不足
通过剔除性最小二乘法分析,剔除出相关性大的变量,重新组合运用到以下两个模型中。首先从定量的角度考虑,我们选用了双对数多元回归模型。根据新变量及原变量的系数,可以明确得出所选取的变量分别在剔除其他量带的影响前后对房价的影响程度,根据这些来为政府调控房价提出建议。但是此模型只是从定量的角度来分析的,缺乏对房价的定性考虑,因此引入了云模型,从定量与定性相互转换的方面来进行研究。
研究证实,云模型预测的精度要高于双对数模型,但是云预测模型必须要求能够将定量的指标转化为定性指标,如果不能,比如本文这个例子,就会出现无法预测的情况,并且,云预测模型的过程较为复杂,由于多为规则发生器中,我们有时为了得到更为准确的期望,我们不得不进行利用多规则发生器进行多次重复的计算。
由于我们没有预测所选指标的未来趋势,所以我们无法用双对数模型与云模型对房价进行长期的预测,只能根据所选指标预测下一年房价,这也正是这两个模型的缺陷与不足。
3.5.3模型的改进及建议
基于以上分析,可以知道本模型无法对房价进行长期的预测,结合时间序列的长期预测的优点,我们建议在数据足够多的情况下,可以将时间序列模型与云模型结合起来即基于时间序列的云预测模型,从而可以预测出房价的长期走向。
4·结论与建议
房价是房地产市场的调控的杠杆,基于以上实证分析,我们建议政府从以下几个方面进行调控:
1) 通过升高存款利率来缓解通货膨胀,降低消费者价格指数;
2) 在拆迁征用土地时,不能过度竞标土地,使土地价格增大,应该适当的控制或者降低土地价格,从而减少开发商的开发成本;
3) 竭力保证汇率的稳定性,做好金融监管,严格控制国际炒房基金的投入;
4) 出台限购令,限制炒房、囤房。
附录
附录A:处理前的原始数据:由于数据量大,原始数据暂不附于此处。
数据出处:国家统计局(网址:xxstats.govx/)
上海统计局(网址:xxstats-sh.govx/)
凤凰网(网址:xxifengx/)
附录B:处理后所选
展开阅读全文