资源描述
全国大学生统计建模大赛论文
论文题目: 笔记本电脑特征价格指数的实证研究
——基于非线性Hedonic模型实证分析
参赛队员:顾光同 王江 高丽
指导老师: 费宇 王力宾
参赛单位: 云南财经大学
提交日期: 二零零九年九月
目 录
摘 要 - 2 -
一、问题的提出 - 3 -
二、研究现状及存在的问题 - 4 -
三、模型构建前的准备 - 6 -
(一)若干假设 - 6 -
(二)数据的来源 - 7 -
(三)特征变量的选择与数据量化处理 - 7 -
1、借鉴国内外的研究经验 - 7 -
2、根据消费者的喜好 - 8 -
3、选取的特征变量与笔记本电脑价格具有较高的相关关系 - 8 -
四、笔记本电脑的传统Hedonic模型的构建 - 10 -
(一)传统模型的三种形式 - 10 -
(二)基于传统模型的Hedonic模型构建 - 11 -
五、基于Box-Cox变换的非线性Hedonic模型的构建 - 13 -
(一)非线性特征价格概念 - 13 -
(二)Box-Cox变换的基本思想 - 14 -
(三)非线性Hedonic模型的统计诊断方法 - 16 -
1、非线性Hedonic模型的引入 - 16 -
2、非线性Hedonic模型变换参数的Atkinson假设检验 - 16 -
3、非线性Hedonic模型变换参数的Atkinson估计 - 17 -
(四)非线性Hedonic模型的选取 - 17 -
六、基于非线性的Hedonic模型的价格指数的编制 - 18 -
(一)笔记本电脑的特征价格模型的确定 - 18 -
(二)基于传统模型和非线性模型编制的特征价格指数的对比 - 21 -
六、结论与建议 - 22 -
附录 - 24 -
参考文献 - 25 -
摘 要
商品价格指数的编制是一个古老而又新鲜的问题。商品的异质性问题会使普通价格指数不能真实反映商品的价格变化,特征价格是针对上述问题来构建商品价格指数的一种有效方法,本文应用特征价格法研究异质性明显的商品——笔记本电脑的价格指数编制问题,基于非线性模型来估计笔记本电脑的价格,力求消除特征变动引起的价格变化,更加合理的度量笔记本电脑的价格变化,从而编制更能反映价格变化的价格指数。
本文首先使用了传统的线性、半对数和双对数三种形式的Hedonic模型,对笔记本电脑的特征价格进行了实证研究,研究结果表明,半对数模型优于线性模型和双对数模型,这和以往研究特征价格指数的学者的经验是相吻合的。但是,半对数Hedonic模型,需要将被解释变量取自然对数,研究表明,这一变换后的被解释变量不能通过正态性检验。
考虑到半对数模型的不足之处,本文提出了基于Box-Cox变换的非线性的Hedonic模型,并给出了模型统计诊断的方法和实证分析过程。构建了适合的非线性的Hedonic模型,并根据判决系数以及模型评价标准AIC准则、BIC准则与半对数Hedonic模型拟合结果进行比较研究,发现非线性Hedonic模型拟合结果明显优于半对数Hedonic模型拟合结果,而且基于Box-Cox变换后的被解释变量显著地通过正态性检验,最后基于确定的季度非线性Hedonic模型,构建了笔记本电脑的特征价格指数(HPI),并与基于半对数Hedonic模型编制的价格指数进行比较,研究表明,基于非线性Hedonic模型编制的特征价格指数更合理。
模型在建立的过程中,用的统计软件是SPSS15.0以及Matlab7.0,用逐步回归法消除特征变量间的共线性以及剔除不显著的特征变量,被解释变量的正态性检验应用了非参数的Kolmogorow-Smirnov正态性检验方法。在非线性Hedonic模型构建过程中,引入了非线性特征价格概念和Box-Cox变换以及变换参数的假设检验和参数估计的Atkinson方法。
比较文献中模型与方法,可以发现本文提出的的非线性的Hedonic模型更有效,估计的结果也更准确。
本文的创新之处有三点:(1)模型选择不是根据经验直接选取而是根据数据自身特点进行选择;(2)针对传统模型的不足,提出了基于Box-Cox变换的非线性Hedonic模型,实证表明优于传统三种Hedonic模型;(3)在基于Box-Cox变换非线性模型构建中,引入了变换参数的Atkinson假设检验和参数估计方法,使得研究更具科学性。
关键词:特征价格法 特征价格指数 特征变量 Hedonic模型 笔记本电脑 Box-Cox变换
一、问题的提出
从笔记本电脑的发展趋势及特点来看,笔记本电脑于1985年诞生于日本东芝公司,我国笔记本电脑市场萌芽于1993年,开始之初,笔记本电脑与台式机电脑的性能价格比差距很大,其产品和同期台式机电脑相比,同样运算能力的产品其价格比台式机高出2至3倍。随着技术的进步和产业的逐渐成熟,笔记本电脑的性能快速得到提升,价格持续下降,市场需求量也急剧增加。随着市场需求的不断扩大,笔记本电脑的销量在一路增长。据有关资料显示,我国的笔记本电脑市场销量从1995年5.2万台到2002年超过60万台,而2003年达到150万台,8年增长28倍。截至2005年底,我国笔记本电脑年销售量己突破性的增长到近340万台,占全球笔记本电脑市场的份额约为5.2%。同时,我国笔记本电脑市场的需求增长速度还远远高于台式机市场的需求增长速度[1]。笔记本电脑在我国短短几年内迅速走进了千家万户,笔记本“挤压”市场并将逐步代替台式机,已成为业界一个不争的断言。根据艾凯数据研究中心提供数据表明[2],2008年,我国规模以上计算机行业实现销售收入17134亿元,同比增长7.3%,规模继续在世界保持前列,计算机产量占全球比重超过四成。2008年我国笔记本电脑市场规模突破600亿元,我们预计到2012年我国笔记本电脑市场规模将达到1000亿。该中心的还提供了2008年1-12月全国计算机类产品生产、出口情况,见表1。
表1 2008年1-12月全国计算机类产品生产、出口情况(单位:万台)
生产
出口
完成
增速%
同期增速%
完成
增速%
同期增速%
台式计算机
2807.9
-17.5
0.66
768.2
-12.2
7.3
笔记本电脑
10858.7
25.2
46.7
10111.4
38.5
40.5
注:数据来源于艾凯数据研究中心,见文献[2].
由以上分析可看出,笔记本电脑逐渐在普通家庭中得到普及。对于笔记本电脑这类技术比较成熟的商品,商家之间的促销手段和价格战也加快了人们对笔记本电脑的更新换代。我国消费者物价指数的查价商品中也增加了电脑这类商品,可见电子信息商品在国民经济消费中的比重也越来越大,研究构建这些电子信息商品的价格指数也就十分必要。
另一方面,由于笔记本电脑是整机销售,即便是同一种品牌,其特征也随着型号的不同在不断发生变化,而且更新换代的速度很快。新机型不断代替旧机型,许多机型上市一段时间后即停产不再生产,成为退市商品。如此快速的变化,笔记本的观察价格的变化已经不代表实际价格的变化,传统价格指数已经不能反映真实的价格变化趋势,只有编制笔记本电脑的特征价格指数,才能较为准确的反映实际价格的变化。特征价格指数(Hedonic Price Index,HPI)是采用特征法编制的个体价格指数的统称,反映该类商品的“纯价格变化”,其基本思想是以特征理论为基础,建立反映商品特征和商品的价格之间的特征价格函数,根据特征价格函数计算的价格指数。据相关资料显示,对于一般的消费品,我国政府统计部门在编制物价指数的实践中通常采用“纯样本匹配法”编制反映“纯价格变化”的指数。但像一些异质性产品,如笔记本电脑、汽车、住房等高技术、高消费产品来说,人们对其的需求是缺乏弹性的,它们不仅已成为人们必须的生活消费品,而且其更新换代速度加快,产品品种、规格和价格等的变化十分明显。相应的,不同时期观察到的此类产品市场价格水平的波动可能源于市场供求情况的改变,也可能源于市场中产品品质、技术的整体提升或物业聚集地的整体变化,还可能源于各期交易量中不同特征产品组成结构的变化。这就违背了价格指数编制中的“同质可比性”原则。此时,特征价格理论无疑为解决这一难题带来了福音。与传统价格指数编制方法相比,HPI方法是一种严密的、含有较少主观色彩的方法,用统计手段科学地将特征变化过程加以量化,避免了主观原因引起的测量误差。而且随着笔记本电脑市场的市场化及信息化程度的不断地提高,由于本身的优越性,特征价格法编制笔记本电脑的特征价格指数在我国具有广阔的推广前景。
二、研究现状及存在的问题
特征价格指数法可以追溯到上世纪30年代的Court[3]发表的“Hedonic Price Indexes with Automobile Examples”,之后该方法及其经济上的解释等相关理论被建立起来了。上世纪60年代的Griliches[4]利用Hedonic方法编制了汽车产业的价格指数。随着技术的发展特征理论逐步完善,美国学者Lancaster(1966)提出的特征消费理论,又被称为Lancaster偏好理论。与萨缪尔森等经济学家在考察偏好和效用时从个体行为出发的做法不同,Lancaster从产品的差异出发,分析了构成产品的基本“元素”空间,认为对产品的需求并不是基于产品本身,而是因为产品所内含的特征,并且认为商品(特别是像住宅、汽车和劳动力这样的异质商品)具有一系列的特征,这些特征结合在一起形成影响效用的特征包,商品是作为内在特征的集合来出售的。家庭购买和使用这些商品,把它们转化为效用,效用水平的高低取决于商品所包含的各种特征的数量和质量。美国经济学家Rosen[5]等学者扩展了Lancaster理论,其将竞价理论融入到Lancaster特征消费理论中,就商品特征提出了特征供需均衡模型。在完全竞争市场条件下,Rosen以消费者效用最大化和生产者利润最大化作为目标,从理论上分析了异质性产品市场的短期均衡和长期均衡,为特征价格理论的建模、特征价格函数的估计奠定了基础。
在国内,根据所搜集的文献,王力宾[6]是中国较早将特征价格法应用到实践中来的学者,他将特征价格法运用到房地产价格分析研究中,温海珍、贾生华(2004)连续发表三篇论文定量分析房地产属性对房地产价格的影响,并建立杭州市总体市场和细分市场的特征价格模型。夏祥谦、王力宾[7]在研究汽车特征价格指数时,采用汽车功率、扭矩、最高车速和整备质量作为特征变量,得到特征价格函数,并指出特征价格模型剔除了“异质性”因素,能很真实的反映汽车价格的变动趋势。鉴于国内外学者的研究成果,我们可以肯定本文所研究对象的合理性及科学性,也相信其研究成果对的现实的指导有很高的实践意义。王力宾[8]是国内较早研究计算机特征价格指数编制方法的,不过用的不是我国的样本数据;次年,王晓玲、王力宾[9]运用我国笔记本电脑的数据资料编制笔记本电脑特征价格指数。徐国祥、牟嫣[10][11]以2005年1月至2006年12月我国计算机硬盘价格为例,编制并实证了我国计算机硬盘特征价格指数,分析了硬盘价格的变化趋势。
上述学者在计算机这类商品方面做了大量研究工作,为后续研究做了很好的铺垫,但是,我们发现一个共同的存在的问题:大多是根据经验,直接采用适合于其他商品(汽车、住房、轨道交通等)的传统模型的三种形式(简单线性模型、双对数模型、半对数模型)中的一种拟合较好的模型来进行指数编制的研究,比如,雷怀英(2007,2008)在《统计研究》中分别发表的关于质量调整的Hedonic价格指数研究以及关于汽车价格指数研究中的价格模型也是直接选用了半对数模型进行指数编制。这样的经验方式存在几个不足之处(这里指的是值得商榷的地方,更合理的是我们觉得可以进行改进的地方):
(1)不同商品有明显的异质性会导致根据经验的模型不是万能的;
(2)没有很好解决被解释变量的正态性检验,事实上,很多商品价格即使用自然对数变换,仍然不能理所当然地把这些变换后的变量看作为近似正态,所以,上述研究在模型选择上存在一些可改进的地方;
(3)即使有学者在研究特征价格指数时提到了可用Box-Cox变换来选择模型,但是为何要进行变换,也就是对变量的变换必要性即假设检验问题至今没有引入Hedonic模型选择中;
(4)还有一些不足,可能是本文中也可能存在的,需要进一步研究。
三、模型构建前的准备
(一)若干假设
本文从研究的背景以及前辈们对所研究商品的特征指数中的不足出发,我们提出下列假设:
(1)被解释变量即使通过取自然对数变换,仍然可能不满足正态性假定;
(2)在特征价格指数研究中,存在非线性Hedonic模型;
(3)对某些商品的特征价格指数研究的模型选择中,数据变换是必要的,而且变换的假设检验的引入也是必要的;
(4)针对某些商品的Hedonic模型,基于Box-Cox变换所得的非线性Hedonic模型优于传统三种Hedonic模型,并适合用于特征价格指数的编制和经济意义解释。
本文将在编制笔记本电脑特征价格指数的实证性研究中逐一验证上述假设。国外学者Laurice和Bhattacharya(2005)认为在研究美国南加州地区三郡的房价特征价格时,增加二次的及立方的函数形式这样的非线性模型对改善模型的解释程度有相当良好的帮助作用。Griliches(1967)甚至建议可利用Box-Cox转换函数方法,在有关的统计结构下,从这些不同的特征函数形式选出其中一种形式。这建议说明,特征价格函数除了线性关系外,还存在非线性关系。Box和Draper(1969)也证明性的说明了,若在正态分布的线性模型下,采用Box-Cox变换函数后,将使误差得到正确的修正,更有修匀线性模型的效果。Raimond Maurer, Martin Pitzer, Steffen Sebastian (2004)指出根据所观察的数据得出,Box-Cox变换是确定特征价格函数最恰当的方法,并且在指数形成的基础上,选择特征价格的方程式,应优先考虑Box-Cox模型。因此,以上这些学者的观点说明,我们提出的假设是合理的,我们的研究是具有实际意义的。
(二)数据的来源
根据IT权威中关村在线发布的2009年第一季度中国笔记本市场研究报告[17]资料显示,笔记本电脑用户的关注度状况,第一季度中国市场关注度从高到低的品牌为:联想(31.6%)、惠普(18.6%)、华硕(9.9%)、戴尔(9.8%)、神州(8.2%)、宏基(6.1%)、索尼(3.4%)、东芝(2.9%)、三星(2.4%)。前面9个品牌就占了关注度的92.9%,其他被关注的品牌中我们还注意到苹果的关注度为1.7%,方正的关注度为0.8%,清华同方的关注度为0.68%,富士通的关注度为0.4%。本文就从这十三个关注度累积达到96.5%品牌出发,进行编制基于非线性Hedonic模型的笔记本电脑的特征价格指数的实证研究。
用于构建特征价格指数的笔记本电脑数据来源于中关村在线、太平洋电脑网以及IT主流资讯平台IT168公布的2009年1月至9月的上述13个品牌的报价和相应特征参数。9期数据,共580个样本,其中第一季度176个样本(1月-3月样本数分别为62、56和58),第二季度177个样本(4月-6月样本数分别为54、60和63),第三季度227个样本(7月-9月样本数分别为72、66和89)。
(三)特征变量的选择与数据量化处理
构建特征价格指数,首先须选择正确的特征指标,所选特征指标既是笔记本电脑特征的代表,又是消费者较为敏感、能够引起价格变化的指标。因此,我们按照下面三个方面选择特征变量,并对数据进行量化处理。
1、借鉴国内外的研究经验
从国内有关笔记本电脑的特征变量的选择来看,随着时间的推移以及研究侧重点的不同,笔记本电脑特征变量的选择也在不断地发生变化,王晓玲、王力宾(2007)对特征变量的考虑最为全面,他们从基本规格、存储设备、显示屏、外观特征、电池规格、显卡类型、品牌等方面进行了特征变量的选择与组合,选取了处理器主频、内存容量、硬盘容量、重量、电池工作时间、品牌作为特征变量。但是,他们所研究的笔记本电脑样本数据是按年份收集的,时间跨度大,Hedonic模型也是经验性地采用传统模型。
2、根据消费者的喜好
从消费者角度来看,配置、产品类型、品牌、外观以及功能是消费者购买笔记本电脑时必定考虑的四大因素,因此笔记本电脑特征的选择主要从这四方面着手,所选变量要尽可能地反映消费者的消费理念。
中关村的第一季度资料显示[17],硬件配置已经成为制约消费的最大因素,有近36%会看重笔记本电脑的配置。由于笔记本电脑的功能扩展能力较强,因此功能因素所占的比例仅占13%。而着重笔记本电脑的款式和售后服务的消费者各占4%,只有极个别消费者重视笔记本电脑的产地。14.1英寸屏幕大小是笔记本市场主流需求趋势,获得65.6%的关注比例;迅驰2笔记本关注度最高,获得19.5%关注比例,其次是奔腾双核机型;独立显卡笔记本更胜一筹,以66.8%的关注比例领先于集成显卡机型。
从配置来看,消费者主要关注处理器标称主频、标配内存容量、处理器型号、显存、显卡类型、硬盘容量等指标;从产品类型来看,主要关注家用和商用等类型;从品牌来看,消费者主要关注13个品牌;从外观来看,主要关注笔记本电脑的屏幕尺寸以及厚薄、轻重等;从功能来看,主要关注蓝牙、无线上网、指纹识别、内置摄像头等功能。
3、选取的特征变量与笔记本电脑价格具有较高的相关关系
利用统计软件SPSS15.0,将第二步初步选定的定量的一些特征变量与价格的相关性进行分析,结果见表2,结果显示笔记本重量和屏幕尺寸2个变量与价格()的相关性较小,因此在构建Hedonic模型直接将这些变量从模型中剔除。
根据以上分析,从笔记本定量的特性来看,可初步将标称主频、标配内存容量和硬盘容量等变量纳入模型,分别用、、表示。由于变量之间存在较高的相关关系,会引起多重共线性问题,而笔记本电脑配置存在性能搭配问题,比如标称主频高其标配内存容量大些,硬盘容量也大一些。从相关系数看,标配内存容量和标称主频之间的相关系数为0.392,伴随概率为0.000,通过了显著性检验,另外内存容量和硬盘容量二者的相关系数为0.558,伴随概率为0.000,通过了显著性检验。因此,在建模过程中,还需根据实际情况对变量进行再一次的筛选,以避免多重共线性问题的出现。
表2 笔记本特征变量与价格的相关系数表
特征变量
标称主频
(GHZ)
标配内存容量(GB)
硬盘容量(GB)
笔记本重量(kg)
屏幕尺寸
(英寸)
Pearson 相关系数
0.275(**)
0.474(**)
0.256(**)
0.053
-0.019
伴随概率
0.000
0.000
0.000
0.197
0.643
注:**表示在显著水平处极显著;*表示在显著水平处显著。
表3 笔记本特征变量及其定义
特征
分类
特征变量定义(单位)
代码
基
本
规
格
1、标称主频(GHZ)
2、标配内存容量(GB)
3、硬盘容量(GB)
4、处理器型号
5、集成显卡
6、中低端独立显卡
类型
7、产品类型
功能
特征
8、蓝牙
9、摄像头
品
牌
10、联想
11、惠普
12、华硕
从定性的特征变量来看,首先考虑不同类型的笔记本其产品定位的不同以及面向的消费群的不同,其降价的幅度与快慢也不同,因此引入虚拟变量以反映笔记本的不同产品类型,如将笔记本分为家用和商用两种,引入1个虚拟变量,用来表示,=1,表示家用,=0,表示商用。
其次,从笔记本配置方面考虑,消费者比较关心处理器型号,因此,引入1个虚拟变量,用来表示,=1,表示迅驰2及以上,=0,表示奔腾双核、赛扬双核及单核等。
另外,消费者比较关心显卡是不是独立的,尤其对图像处理功能要求高的消费者更关心这个问题,通过收集数据发现,现在显卡情况有集成显卡、中低端独立显卡和中高端独立显卡,因此,引入2个虚拟变量,用和来表示,=1,表示中低端独立显卡或中高端独立显卡,=0,表示集成显卡,=1,表示中低端独立显卡,=0,表示集成显卡或中高端独立显卡,即=1,=1表示中低端独立显卡;=0,=0表示集成显卡。
从功能来看,现代电子产品越来越追求无线传输,是否支持蓝牙是消费者购机考虑的因素,因此,引入1个虚拟变量,用来表示,=1,表示支持蓝牙,否则表示不支持蓝牙;现在网上联络即聊天已经是“家常便饭了”,消费者也很关心,笔记本是否有内置摄像头,因此,引入1个虚拟变量,用来表示,=1,表示有内置摄像头,否则表示没有内置摄像头。
从品牌来看,不同品牌,消费者关注度不同,三大关注品牌为联想、惠普、华硕,其关注度分别为31.6%、18.6%、和9.9%,共占市场上关注度总额的60%以上,因此,引入3个虚拟变量,用、和来表示,=1,表示联想,=0表示其他品牌,=0表示惠普,=1,表示其他品牌,=0表示华硕,=1,表示其他品牌,即=1,=1,=1表示联想;=0,=0,=1表示惠普;=0,=1,=0表示华硕;=0,=1,=1表示其他品牌。
当然,还有些特征如指纹识别、人脸识别、双键盘以及迅驰4等高端的功能和配置虽说是顺应潮流,逐渐成为购买笔记本的消费者喜爱的配置,但从收集到的数据资料来看,现阶段只有少数的高档笔记本才配有这些装置,因此本文暂不把这些变量引入模型。
综合以上分析,首批选定包含基本规格、类型、功能特征、品牌四个方面的12个特征变量,见表3。
四、笔记本电脑的传统Hedonic模型的构建
(一)传统模型的三种形式
Hedonic回归文献中经常使用的函数形式有三种:线性模型、半对数模型和双对数模型,也就是本文所指的三种传统Hedonic模型。
(1)线性模型
(1)
(2)半对数模型
(2)
(3)双对数模型
(3)
这三种模型中,指在时期第种商品的价格,表示时期第种商品的第个特征,是常数项,是误差项,是特征变量系数,表示第个单位特征对价格的影响程度。在Hedonic模型中,暗含着一个假设条件:消费者购买的是一组特征的组合,由此可将特征变量的系数解释为特征的“隐含价格”或“影子价格”。因为特征的“价格”也就不能直接观察到,从而只能通过观察由不同特征组合成的商品的价格来估计各单位特征的“隐含价格”或“影子价格”。[12]
(二)基于传统模型的Hedonic模型构建
许多学者根据经验就直接选取半对数模型,这主要是该模型与双对数模型相比有一个优点[12]:半对数模型能够处理一个或更多的特征为零的情况,而双对数模型则不能。下面为了和我们提出的基于Box-Cox非线性模型比较优劣,利用合并的数据(三个季度的数据放一起,这里我们假定特征价格不受时间的影响)以及统计软件SPSS15.0依次对笔记本电脑的传统Hedonic模型建模,其间用逐步回归方法消除特征间的共线性以及剔除不显著的特征变量,得到显著的线性模型、半对数模型和双对数模型(这里只对定量特征取对数,虚拟变量不加处理)的判决系数分别为:0.515、0.600、0.587。由此可知,半对数模型优于其他两个传统模型。我们又假设,季度内的特征价格不受时间的影响,利用半对数模型建立合并数据和季度数据的Hedonic模型,利用逐步回归方法,得到回归输出结果见表4所示。由该表可得基于合并数据的笔记本电脑的半对数Hedonic模型为
第一季度的半对数Hedonic模型为
第二季度的半对数Hedonic模型为
第三季度的半对数Hedonic模型为
表4 基于半对数回归模型(2)的输出结果
数据
类型
纳入模型
(2)的特征变量
特征变量系数
t值
P值(t值)
VIF
(膨胀因子)
合
并
数
据
(Constant)
8.581
182.454
0.000
C5
0.325
13.336
0.000
1.146
C2
-0.238
-7.801
0.000
1.290
C1
-0.305
-10.856
0.000
1.063
X2
0.144
9.630
0.000
1.191
C7
-0.139
-3.625
0.000
1.026
C6
0.110
-3.356
0.001
1.096
C4
-0.0670
-2.900
0.004
1.033
F值=8.409 P值(F值)=0.004 R(相关系数)=0.775 R2(判决系数)=0.600
DW值(自相关检验)=1.554 残差平方和=42.378 AIC=-1501.51 BIC= -1466.61
第
一
季
度
数
据
(Constant)
8.467
88.209
0.000
C5
0.393
8.430
0.000
1.119
X2
0.207
5.950
0.000
1.315
C1
-0.354
-6.504
0.000
1.041
C2
-0.155
-2.517
0.013
1.374
c6
0.128
2.186
0.030
1.053
F值=4.779 P值(F值)=0.030 R(相关系数)=0.783 R2(判决系数)=0.612
DW值(自相关检验)=1.564 残差平方和=14.421 AIC=-428.32 BIC=-409.29
第
二
季
度
数
据
(Constant)
8.363
100.057
0.000
C5
0.368
9.123
0.000
1.161
C2
-0.252
-5.027
0.000
1.328
X2
0.142
4.508
0.000
1.529
C1
-0.216
-4.603
0.000
1.072
C3
-0.174
-3.852
0.000
1.464
X3
0.001
2.948
0.004
1.752
C6
0.153
2.778
0.006
1.135
C7
-0.184
-2.230
0.027
1.042
F值=4.971 P值(F值)=0.027 R(相关系数)=0.817 R2(判决系数)=0.668
DW值(自相关检验)=1.536 残差平方和=10.309 AIC= -485.23 BIC= -482.24
第
三
季
度
数
据
(Constant)
8.433
69.070
0.000
C2
-0.265
-5.866
0.000
1.237
C5
0.249
6.807
0.000
1.129
C1
-0.321
-7.689
0.000
1.075
X2
0.124
6.023
0.000
1.252
X1
0.110
2.037
0.043
1.265
F值=4.148 P值(F值)=0.04 R(相关系数)=0.785 R2(判决系数)=0.616
DW值(自相关检验)=1.656 残差平方和=14.370 AIC= -614.48 BIC= -593.93
基于合并数据的半对数模型相应的残差图如图1所示,这些结果都说明拟合得还可以。为了检验我们提出的第一个假设(被解释变量即使通过取自然对数变换,仍然可能通不过正态性检验),应用非参数的Kolmogorov-Smirnov正态性检验方法,借助统计软件SPSS15.0,得到结果见表5所示,由结果可知,即使半对数模型是三种Hedonic模型中最好的,但是第一季度的在显著水平0.05处不能通过正态性检验。而且我们注意到合并数据以及季度的判决系数还有提升的空间,这就是本文要重点解决的问题(这是基于我们提出的问题和假设的)。下文引入基于Box-Cox变换的非线性模型进行比较研究。
表5 的Kolmogorov-Smirnov正态性检验
数据类型
第一季度数据
第二季度数据
第三季度数据
Kolmogorov-Smirnov
统计量值
1.702
1.129
1.300
P值
0.006
0.156
0.068
图1 合并数据的笔记本电脑特征变化的残差图
五、基于Box-Cox变换的非线性Hedonic模型的构建
(一)非线性特征价格概念
Wallace(1996)以特征前缘的概念,来说明房屋特征与房价之间的非线性关系。在这里我们也可以引申到笔记本特征与其价格之间的非线性关系上来。其价格看作由处理器标称主频,标配内存容量,处理器型号,硬盘容量等特征及其它有关的要素所组成的商品,将笔记本价格模型定义为种特征及个产品的特征价格函数。图2表现出此非线性关系的产生,假设一定期间内,及为
图2 特征价格前缘
以及等两种特征因素,如内存容量与硬盘容量的大小,所表示的两种非线性笔记本特征价格弧线,弧线上为所销售笔记本种类的所有可能的及组合。在弧线之上,任何已知一点的斜率,定义了在该点上固定特征因素时,消费者的边际采购成本。图中及为笔记本的生产提供者;消费者L及K在消费相同或不同水平笔记本特征时所获得的效用,以(或)及来表示。Rosen(1974)及Wallance(1996)均认为,在有许多买方及卖方中市场中,特征价格弧线会在买卖双方的讨价还价中,循着三条曲线的切点的轨迹而走,如图2中的所连成特征价格曲线。[19]
图2所探讨的是笔记本电脑价格与其各种属性间可能存在非线性的特征价格关系。点到点的价格线,可能是由左下往右上的直线或是曲线,交易价格也可能有翻转的结果,形成幂次方的非线性结果或是其它不同的函数形式。
所以,若直观地决定使用水平,半对数或双对数等线性形式的模型,则可能对价格的估算产生相当大的误差,因此,在笔记本电脑价格的研究中仍有必要进一步考虑采用非线性的特征价格函数,下面引入Box-Cox变换的思想。
(二)Box-Cox变换的基本思想
在一般回归模型中,我们经常使用如下的线性模型
(4)
给定一组数据(),,若用模型(4)进行拟合,则要求数据满足以下条件:
(1)线性性,即因变量的数学期望和未知参数之间有线性关系;
(2)同方差性,即误差项,;
(3)正态性,在某些情况下要求~。
但是在实际检验中,我们发现某些数据不完全满足上述条件。为了有效的提高回归精度,可以使用一种常用的数据变换工具——Box-Cox变换(1964年由Box和Cox提出)。其特点在于引入一个新的变换参数,通过数据本身估计出该参数,从而确定所应采取的数据变换形式。实践证明,Box-Cox变换对许多数据都是行之有效的,对因变量的Box-Cox变换可以明显地改善数据的正态性,方差齐性和对称性。
现在假设因变量是一组取值为正的变量,对于考虑作如下变换
(5)
称为因变量的Box-Cox变换。它包含了许多常见变换,诸如对数变换(),倒数变换()和平方根变化()。变量经过上述幂变换后形成如下的线性模型
,~ (6)
其中是设计阵,是随机向量且,称为变换参数,且,我们使用变换的主要目地就是通过找出合适的变换参数进行数据变换,使变换后的数据满足模型假定,从而使模型回归拟合的效果更好。但是形如(6)式的幂变换族,只能适用于正值变量,对于变量可取负值的情况,Box和Cox用带有移动参数的变换取代(6),该修正办法是给变量加上移动参数,使得>0,即使(6)变为
(7)
(三)非线性Hedonic模型的统计诊断方法
1、非线性Hedonic模型的引入
根据上面的非线性Box-Cox变换模型的思想以及本文的研究的笔记本电脑的特征变量的定义和对半对数模型的分析,为了更好的与半对数模型做比较,我们可以引入下面的非线性Hedonic(考虑被解释变量的Box-Cox)模型
(8)
由(5)或(7)式可知,。
当=0时,(8)式就等价于(2)式,即为半对数模型;当≠0或者不能近似看作0时,说明不能忽视其非线性的可能性,这也验证了我们提出的第二个假设,并为验证第三、第四个假设提供了基础。
2、非线性Hedonic模型变换参数的Atkinson假设检验
非线性的Box-Cox转换模型的假设检验的目的是要确定某个是否为合适的变换参数,以下是因变量的数据变换模型中变换参数的假设检验问题。对于因变量的数据变换模型(8),考虑变换参数的假设检验问题原假设和被择假设分别为
(9)
例如:在Box-Cox变换中,对于的情形,若被否定,则说明(9)中,因而需要做数据变换;若未否定,则可以为,因而等价于无需做数据变换:又如,对于的情形,若未否定,则可以认为(9)中,因而需要进行对数变换,即模型为半对数模型。
对于这个检验问题,Atkinson(1973,1982)提出了Atkinson检验统计量,常用的检验统计量还有似然比统计量和Score统计量,但是这两个统计量在计算上都比较复杂,韦博成等(1991)证实了三个统计量的检验效果是一致的,因此,本文就用比较实用且计算相对不复杂的Atkinson检验统计量来进行检验。
对于基于Box-Cox变换的非线性模型(8),其变换参数的假设检验问题(9)的Atkinson检验统计量可表为
(10)
其中,
,
,表示P各分量的几何平均值,为阶的单位阵,,表示全是1的阶的列向量,见(5)或(7)式,,为样本容量,为特征变量个数。
通常取=1,那么检验(9)变为
(11)
此时,,=。
3、非线性Hedonic模型变换参数的Atkinson估计
本文用很有实用价值的Atkinson估计,这是Atkinson(1973,1982)首先提出来的。对于模型(8),其变换参数的Atkinson估计可表示为
(12)
其中,。
(四)非线性Hedonic模型的选取
有了模型(8)的结构以及统计诊断方法,现在就可以进行模型的选取分析,为了避免值不至于大到计算机认为无穷大值,这里先把价格变为单位为万元的值,也就是原来的值除以10000来处理,这样不影响编制笔记本电脑的特征价格指数,之后我们基于假设检验(11),利用Atkinson检验统计量(10),并借用Matlab7.0软件编程(程序见附录B.程序部分)计算得Atkinson统计量值和转换参数的估计值,见表6所示,由于本文研究的笔记本电脑样本数据足够用正态分布近似分布,取显著水平为0.05,所以用正态分布的临界值=1.96代替,由表6可知,不管是合并数据的还是分季度的检验结果均拒绝原假设,即需要对价格进行Box-Cox转换,就检验了模型(8)的提出是合理的。表6还给出了合并数据以及分季度的转换参数的Atkinson估计值,而且估计值也不接近0,也就是说用半对数模型是不合理的,分季度和合并数据的转换参数的估计值相差不大,为了更好的编
展开阅读全文