1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 经典单方程计量经济学模型:专门问题,5.1,虚拟变量模型,5.2,滞后变量模型,5.3,模型设定误差,5.1,虚拟变量模型,Dummy Variables Regression Models,一、虚拟变量的基本含义,二、虚拟变量的引入,三、虚拟变量的设置原则,一、虚拟变量的基本含义,1,、虚拟变量,(,dummy variables,),许多经济变量是,可以定量度量,。,一些影响经济变量的因素是,无法定量度量。,为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。,这种“量化”
2、通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,,构造只取“,0”,或“,1”,的人工变量,,通常称为,虚拟变量,,记为,D,。,虚拟变量只作为解释变量。,一般地,在虚拟变量的设置中:,基础类型、肯定类型取值为,1,;,比较类型,否定类型取值为,0,。,例如,反映文程度的虚拟变量可取为,:,D=1,,本科学历,D=0,,非本科学历,虚拟变量能否取,1,、,0,以外的数值?,1,、加法方式,虚拟变量作为解释变量引入模型有两种基本方式:,加法方式,和,乘法方式,。,上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。,在该模型中,如果仍假定,E(,i,),=0,,则,企业男、女职工
3、的平均薪金为:,假定,2,0,,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差,2,。,可以通过对,2,的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。,0,2,将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、大学及其以上。,高中以下,高中,大学及以上,在上例中同时引入性别和教育水平:,女职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,男职工本科以下学历的平均薪金:,男职工本科以上学历的平均薪金:,2,、乘法方式,加法方式引入虚拟变量,考察:截距的不同。,许多情况下,斜率发生变
4、化,或斜率、截距同时发生变化。,斜率的变化可通过以乘法的方式引入虚拟变量来测度,。,例如,,根据消费理论,收入决定消费。但是,农村居民和城镇居民的边际消费倾向往往是不同的。这种消费倾向的不同可通过在消费函数中引入虚拟变量来考察。,农村居民:,城镇居民:,例如,,根据消费理论,收入决定消费。但是,在自然灾害、战争等反常年份,消费倾向往往发生变化。这种消费倾向的变化可通过在消费函数中引入虚拟变量来考察。,例如,,根据消费理论,收入决定消费。但是,从某一个时点开始,消费倾向发生变化。这种消费倾向的变化也可通过在消费函数中引入虚拟变量来考察。,3,、同时引入加法与乘法形式的虚拟变量,当截距与斜率发生变
5、化时,则需要同时引入加法与乘法形式的虚拟变量。,对于一元模型,有两组样本,则有可能出现下述四种情况中的一种:,1,=,1,,且,2,=,2,,即两个回归相同,称为,重合回归,(,Coincident Regressions,);,1,1,但,2,=,2,,即两个回归的差异仅在其截距,称为,平行回归,(,Parallel Regressions,),;,1,=,1,,但,2,2,,即两个回归的差异仅在其斜率,称为,汇合回归,(Concurrent Regressions),;,1,1,,且,2,2,,即两个回归完全不同,称为,相异回归,(,Dissimilar Regressions,)。,例如
6、以,1978-2009,年的数据为样本,以,GDP,作为解释变量,建立居民消费函数。根据分析,,1992,年前后,自发消费和消费率都可能发生变化。,通过统计检验,判断两个时期中消费函数的截距和斜率是否发生变化。,例5.1.1,以,中国,2007,年各个地区城镇居民家庭人均可支配收入与人均生活消费支出,以及农村居民家庭人均纯收入与人均生活消费支出的相关数据,建立居民消费函数模型。,可以采用邹氏稳定性检验来考察农村居民与城镇居民边际消费倾向是否有差异。,也可以建立虚拟变量模型,考察农村居民与城镇居民边际消费倾向是否有差异。,估计得到,由变量显著性检验得到:,2007,年农村居民与城镇居民的边际
7、消费倾向并无显著差异,他们有着共同的消费函数。,三、虚拟变量的设置原则,每一,定性变量,(qualitative variable),所需的虚拟变量个数要比该定性变量的,状态类别数,(categories),少,1,。即如果有,m,种状态,只在模型中引入,m-1,个虚拟变量。,例如,季节定性变量有春、夏、秋、冬,4,种状态,只需要设置,3,个虚变量:,如果设置第,4,个虚变量,则出现“,虚拟变量陷井,”(,Dummy Variable Trap,),为什么?,包含季节变量的正确模型:,解释变量完全共线性,如果在服装需求函数模型中必须包含,3,个定性变量:季节(,4,种状态)、性别(,2,种状态
8、职业(,5,种状态),,应该设置多少虚变量?,模型含常数项,模型不含常数项,讨论:定序定性变量可否按照状态赋值?,例如:表示居民对某种服务的满意程度,分,5,种状态:非常不满意、一般不满意、无所谓、一般满意、非常满意。在模型中按照状态分别赋值,0,、,1,、,2,、,3,、,4,或者,2,、,1,、,0,、,1,、,2,。,被经常采用,尤其在管理学、社会学研究领域。,正确的方法:,设置多个虚拟变量,理论上正确,带来自由度损失。,以定性变量为研究对象,构造多元排序离散选择模型,然后以模型结果对定性变量的各种状态赋值。但需要更多的信息支持。,赋值的方法等于是对虚变量方法中的各个虚变量的参数施加
9、了约束,而这种约束经常被检验为错误的。,讨论:虚变量与状态的不同对应关系对估计结果有无影响?,例,3.2.2,中引入经济区位因素:东、中、西,Y=9.198829575-249.8125832*DD1-95.22159634*DD2,+0.6090284838*X1+0.2032206892*X2,Y=-240.6137536+249.8125832*D1+154.5909868*D2,+0.6090284838*X1+0.2032206892*X2,从上述2个得到:东部与中部自发性消费相差,154.6,,中部与西部相差,95.2,。,虚变量与状态的不同对应关系对估计结果无影响。,5.2,滞后
10、变量模型,Lagged Variables Regression Models,一、滞后变量模型,二、分布滞后模型的参数估计,三、自回归模型的参数估计,四、格兰杰因果关系检验,一、滞后变量模型,1,、滞后变量,滞后被解释变量(,Lagged explained variable,)和滞后解释变量(,Lagged explanatory variable,)作为模型的解释变量。,一般出现在时间序列数据样本的模型中。,模型中出现滞后变量的原因,:,心理原因,技术原因,制度原因,2,、滞后变量模型,以滞后变量作为解释变量,就得到,滞后变量模型,也称动态模型,。,自回归分布滞后模型,(,Autoreg
11、ressive Distributed Lag Model,ADL,),:,既含有,Y,对自身滞后变量的回归,还包括着,X,分布在不同时期的滞后变量。,有限自回归分布滞后模型:,滞后期长度有限,无限自回归分布滞后模型:,滞后期无限,分布滞后模型(,distributed-lag model,),:,模型中没有滞后被解释变量,仅有解释变量,X,的当期值及其若干期的滞后值。,0,:,短期,(short-run),或,即期乘数,(impact multiplier),,表示本期,X,变化一单位,对,Y,平均值的影响程度。,i,(i=1,2,s),:,动态乘数,或,延迟系数,,,表示各滞后期,X,的变
12、动对,Y,平均值影响的大小。,如果各期的,X,值保持不变,则,X,与,Y,间的长期或均衡关系即为,称为,长期,(,long-run,),或,均衡乘数,(,total distributed-lag multiplier,),,,表示,X,变动一个单位,由于滞后效应而形成的对,Y,平均值总影响的大小。,自回归模型,(,autoregressive model,),:,模型中的解释变量仅包含,X,的当期值与被解释变量,Y,的一个或多个滞后值。,称为,一阶自回归模型,(,first-order autoregressive model,),。,二、分布滞后模型的参数估计,1,、分布滞后模型估计的困难
13、无限期的分布滞后模型,,由于样本观测值的有限性,使得无法直接对其进行估计。,有限期的分布滞后模型,,,OLS,会遇到如下问题:,没有先验准则确定滞后期长度;,如果滞后期较长,将缺乏足够的自由度进行估计和检验;,同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。,2,、分布滞后模型的修正估计方法,通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。,经验加权法:,根据实际问题的特点和实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的变量。,权数据的类型有:,递减型、,矩型、倒,V,型等。,经验权数法,的,优点,是:简单
14、易行;,缺点,是:设置权数的随意性较大。,阿尔蒙(,Almon,)多项式法,主要思想:,针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用,OLS,法估计参数。,主要步骤为:,第一步,阿尔蒙变换,i,=0,1,s,例如取,m=2,第二步,模型的,OLS,估计,对变换后的模型进行,OLS,估计,得,的估计值;,计算滞后分布模型参数,的估计值。,在实际估计中,阿尔蒙多项式的阶数,m,一般取,2,或,3,,不超过,4,,否则达不到减少变量个数的目的。,由于,m+1F,(m,n-k),,则拒绝原假设。,能否说,“,X,是,Y,的格兰杰原因,”,?为什么?,如果,F,F,(m,n
15、k),,则不拒绝原假设。,综合上述检验:,X,是,Y,的格兰杰原因。,格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。,一般首先以模型随机误差项不存在序列相关为标准选取滞后期,然后进行因果关系检验。,3,、,例,5.2.4,检验,19782006,年间中国当年价,GDP,(,X,)与居民消费,(Y),之间的因果关系。,数据,选择,Granger,检验,选择检验的序列,确定滞后阶数(,1,阶),检验结果,由相伴概率知,在,5%,的显著性水平下,既拒绝“,X,不是,Y,的格兰杰原因”的假设,也拒绝“,Y,不是,X,的格兰杰原因”的假设。因此,从,1,阶
16、滞后的情况看,可支配收入,X,的增长与居民消费支出,Y,增长互为格兰杰原因。,从检验模型随机干扰项,1,阶序列相关的,LM,检验看,以,Y,为被解释变量的模型的,LM=0.897,,对应的伴随概率,P=0.343,,表明在,5%,的显著性水平下,该检验模型不存在序列相关性;但是,以,X,为被解释变量的模型的,LM=11.37,,对应的伴随概率,P=0.001,,表明在,5%,的显著性水平下,该检验模型存在严重的序列相关性。,检验结果,从,2,阶滞后期开始,检验模型都拒绝了“,X,不是,Y,的格兰杰原因”的假设,而不拒绝“,Y,不是,X,的原因”的假设。,滞后阶数为,2,或,3,时,两类检验模型
17、都不存在序列相关性。,由赤池信息准则,发现滞后,2,阶检验模型拥有较小的,AIC,值。,可判断:,可支配收入,X,是居民消费支出,Y,的格兰杰原因,而不是相反,即国民收入的增加更大程度地影响着消费的增加。,对于同阶单整的非平稳序列:,理论上讲不能直接采用。,经过差分以后采用,经济意义发生变化。,模拟试验表明,当,2,个序列逐渐由平稳过程向非平稳过程过渡时,检验存在因果关系的概率出现一定程度的上升。但上升幅度远小于,2,个序列之间因果关系的显著性增强时所引起的上升幅度。,同阶单整非平稳序列的,Granger,因果检验结果具有一定的可靠性。,Granger,因果检验是必要条件,不是充分条件。,数据
18、检验结果,统计检验必须建立在经济关系分析的基础之上,结论才有意义。,5.3,模型设定偏误问题,Model Specification Error(Bias),一、模型设定偏误的类型,二、模型设定偏误的后果,三、模型设定偏误的检验,一、模型设定偏误的类型,Types of Specification errors(bias),Omission of a relevant variable(s),Inclusion of an unnecessary variable(s),Adopting the wrong functional form,Errors of measurement,Inco
19、rrect specification of the stochastic error term,To distinguish between,model specification errors,and,model mis-specification errors,1,、相关变量的遗漏(,omitting relevant variables,),例如,,如果,“,正确,”,的模型为,而我们将模型设定为,即设定模型时漏掉了一个相关的解释变量。,这类错误称为,遗漏相关变量,。,2,、无关变量的误选,(including irrevelant variables),例如,,如果“真”的模型为,Y
20、0,+,1,X,1,+,2,X,2,+,但我们将模型设定为,Y=,0,+,1,X,1,+,2,X,2,+,3,X,3,+,即设定模型时,,多选了一个无关解释变量,。,3,、错误的函数形式,(wrong functional form),例如,,如果,“,真实,”,的回归函数为,但却将模型设定为,二、模型设定偏误的后果,1,、,遗漏相关变量偏误,(,omitting relevant variable bias,),如果,X,2,与,X,1,相关,,1,的估计量在小样本下有偏,在大样本下非一致。,如果,X,2,与,X,1,不相关,则,1,的估计量满足无偏性与一致性;但这时,0,的估计却是有偏
21、的。,随机扰动项的方差估计也是有偏的。,1,估计量的方差是有偏的。,2,、包含无关变量偏误,(,including irrelevant variable bias,),对包含无关变量的模型进行估计,参数估计量是无偏的,但不具有最小方差性。,3,、错误函数形式偏误,(,wrong functional form bias,),产生的偏误是全方位的。,三、模型设定偏误的检验,1,、检验是否含有无关变量,检验的基本思想,:,如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。,t,检验,:检验某,1,个变量是否应包括在模型中;,F,检验,:检验若干个变量是否应
22、同时包括在模型中。,2,、检验是否有相关变量的遗漏或函数形式设定偏误,残差图示法,残差序列变化图,(,a,)趋势变化,:,模型设定时可能遗漏了一随着时间的推移而持续上升的变量,(,b,)循环变化:,模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量,模型函数形式设定偏误时残差序列呈现正负交替变化,图示:,一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。,一般性设定偏误检验,拉姆齐,(,Ramsey),于,1969,年提出的,RESET,检验(,regression error specification test,),。,RESET,检验基本思想:,如果事先知道遗漏了哪
23、个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;,问题是不知道遗漏了哪个变量,需寻找一个替代变量,Z,,来进行上述检验。,RESET,检验中,采用所设定模型中被解释变量,Y,的估计值,的若干次幂来充当该,“,替代,”,变量。,RESET,检验步骤,估计原模型,得到残差和被解释变量的估计量;,根据它们的图形判断应该引入,的若干次幂;,对增加变量的模型进行估计,并进行,F,检验或者,t,检验来判断是否增加这些,“,替代,”,变量。,RESET,检验也可用来检验函数形式设定偏误的问题。,将非线性模型设定为线性可以近似认为遗漏了解释变量的,2,次、,3,次项;,引入模型,再进行检验。,RESET,检验例题,根据,19782006,年间中国当年价,GDP,(,X,)与居民消费,(Y),之间的因果关系检验结果,以,Y,为被解释变量,,X,为解释变量,建立中国总量消费函数模型。,下面仅演示如何进行,RESET,检验,其它内容见教科书例,5.3.1,。,原模型估计,随机项具有强烈的,1,阶自相关性,是否遗漏了重要的相关变量?,选择,RESET,检验,选择引入的变量数,检验结果,拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。,线性模型与双对数线性模型的选择,(仅供有兴趣的同学自学),






