1、回归分析中的回归分析中的伪回归伪回归及其处理方法及其处理方法 长期均衡关系长期均衡关系误差修正回归模型误差修正回归模型回归分析的主要作用1.描述分析与探索分析2.预测分析3.结构分析与实证分析4.政策评价回归分析的主要作用1.描述分析与探索分析2.预测分析3.结构分析与实证分析4.政策评价回归分析应用预测中经常出现的问题回归分析应用预测中经常出现的问题1、根据解释变量的预测值测算被解释变量的未来值,扩大了最后的预测误差要预测某期的GDP,需要知道解释变量的同期数值,而实际上,在预测GDP之前,上述解释变量的同期数值也是未知的,因此,需要首先通过其他方法对解释变量的数值进行预测,然后,再利用回归
2、模型预测GDP。这种根据解释变量的预测值回归测算被解释变量未来值的方法无形之中扩大了最后的预测误差。回归分析应用预测中经常出现的问题2、利用非平稳时间序列直接建模容易产生“伪回归伪回归”问题如:回归分析应用预测中经常出现的问题2、利用非平稳时间序列直接建模容易产生“伪回伪回归归”问题印度的人口增长比较快,中国的GDP增长也比较快,这两个序列有着共同的趋势,能否把这两个序列建立一个模型。回归分析应用预测中经常出现的问题2、利用非平稳时间序列直接建模容易产生“伪回归伪回归”问题?较为普遍的现象!很多经济时间序列都是非平稳的(从直观上看,随着经济的发展,多数经济时间序列呈明显的上升趋势),而直接采用
3、非平稳时间序列建立回归模型,很容易产生“伪回归”问题。回归分析应用预测中经常出现的问题回归分析应用预测中经常出现的问题n3、存在着因果关系的变量间建立的回归预测存在着因果关系的变量间建立的回归预测模型的预测效果越来越差模型的预测效果越来越差 我们建立的模型是一个均衡的模型,而实际我们建立的模型是一个均衡的模型,而实际情况不可能总是在均衡状态下,实际往往会偏情况不可能总是在均衡状态下,实际往往会偏离其均衡状态而处于不均衡状态。这时,则需离其均衡状态而处于不均衡状态。这时,则需要根据上一期的不均衡程度调整本期的预测值。要根据上一期的不均衡程度调整本期的预测值。利用非平稳时间序列直接建模容易产生“伪
4、回归伪回归”问题存在着因果关系的变量间建立的回归预测模型的预测效果越来越差怎么办?检验是否存在长期稳定的均衡关系,误差修正一、长期均衡关系一、长期均衡关系1.问题的提出问题的提出经经典典回回归归模模型型(classical regression model)是是建建立立在在稳定数据变量基础上的。稳定数据变量基础上的。对对于于非非稳稳定定变变量量,不不能能使使用用经经典典回回归归模模型型,否否则则会会出出现虚假回归现虚假回归(伪回归伪回归)等诸多问题。等诸多问题。由由于于许许多多经经济济变变量量是是非非稳稳定定的的,这这就就给给经经典典的的回回归归分分析方法带来了很大限制。析方法带来了很大限制。
5、但但是是,如如果果变变量量之之间间有有着着长长期期的的稳稳定定关关系系(即即它它们们之之间间是是协协整整的的cointegration),则则是是可可以以使使用用经经典典回回归归模模型方法建立回归模型的。型方法建立回归模型的。例例如如,中中国国居居民民人人均均消消费费水水平平与与人人均均GDP变变量量之之间间的的回回归归预预测测模模型型要要比比ARMA模模型型有有更更好好的的预预测测功功能能,其其原原因因在在于于,从从经经济济理理论论上上说说,人人均均GDP决决定定着着居居民民人人均消费水平,而且它们之间有着长期的稳定关系。均消费水平,而且它们之间有着长期的稳定关系。某某些些经经济济变变量量间
6、间确确实实存存在在着着长长期期均均衡衡关关系系,这这种种均均衡衡关关系系意意味味着着经经济济系系统统不不存存在在破破坏坏均均衡衡的的内内在在机机制制,如如果果变变量量在在某某时时期期受受到到干干扰扰后后偏偏离离其其长长期期均均衡衡点点,则则均均衡衡机机制制将将会会在在下下一一期期进进行行调调整整以以使其重新回到均衡状态。使其重新回到均衡状态。假设假设X与与Y间的长期间的长期“均衡关系均衡关系”由式描述由式描述:2.长期均衡长期均衡式中式中:t t是随机扰动项。是随机扰动项。该均衡关系意味着该均衡关系意味着:给定给定X的一个值,的一个值,Y相应相应的均衡值也随之确定为的均衡值也随之确定为0 0+
7、1 1X。n在在t-1期末,存在下述三种情形之一:期末,存在下述三种情形之一:(1)Y等于它的均衡值:等于它的均衡值:Yt-1=0 0+1 1Xt-1;(2)Y小于它的均衡值:小于它的均衡值:Yt-1 0 0+1 1Xt-1;在在时时期期t,假假设设X有有一一个个变变化化量量 Xt,如如果果变变量量X与与Y在在时时期期t与与t-1末末期期仍仍满满足足它它们们间间的的长长期均衡关系,则期均衡关系,则Y的相应变化量由式给出的相应变化量由式给出:式中,式中,v vt t=t t-t-1t-1。实际情况往往并非如此实际情况往往并非如此如如果果t-1期期末末,发发生生了了上上述述第第二二种种情情况况,即
8、即Y的的值值小小于于其其均均衡衡值值,则则Y的的变变化化往往往往会会比比第第一一种情形下种情形下Y的变化的变化 Yt大一些;大一些;反反之之,如如果果Y的的值值大大于于其其均均衡衡值值,则则Y的的变变化往往会小于第一种情形下的化往往会小于第一种情形下的 Yt。可见,如果可见,如果Yt=0+1Xt+t正确地提示了正确地提示了X与与Y间的长期稳定的间的长期稳定的“均衡关系均衡关系”,则意味着,则意味着Y对其均衡点的偏离从本质上说是对其均衡点的偏离从本质上说是“临时性临时性”的。的。因此,因此,一个重要的假设就是一个重要的假设就是:随机扰动项随机扰动项 t必须是平稳序列。必须是平稳序列。显然,如果显
9、然,如果 t有随机性趋势(上升或下降),有随机性趋势(上升或下降),则会导致则会导致Y对其均衡点的任何偏离都会被长期累对其均衡点的任何偏离都会被长期累积下来而不能被消除。积下来而不能被消除。式式Yt=0 0+1 1Xt+t t中的随机扰动项也被称为中的随机扰动项也被称为非均衡误差非均衡误差(disequilibrium error),它是变量),它是变量X与与Y的一个线性组合:的一个线性组合:(*)因此,如果因此,如果Yt=0 0+1 1Xt+t t式所示的式所示的X与与Y间的长期均衡间的长期均衡关系正确的话,(关系正确的话,(*)式表述的)式表述的非均衡非均衡误差应是一平稳误差应是一平稳时间
10、序列,并且具有零时间序列,并且具有零期望值,即是具有期望值,即是具有0均值的均值的I(0)序列。序列。3.协整协整 从这里已看到,从这里已看到,非稳定的时间序列,它非稳定的时间序列,它们的线性组合也可能成为平稳的们的线性组合也可能成为平稳的。假设假设Yt=0+1Xt+t式中的式中的X与与Y是是I(1)序列,如果该式所表述的它们间的长期均衡序列,如果该式所表述的它们间的长期均衡关系成立的话,则意味着由关系成立的话,则意味着由非均衡误差非均衡误差(*)式给出的线性组合式给出的线性组合是是I(0)序列序列。这时我们称变。这时我们称变量量X与与Y是协整是协整的(的(cointegrated)。检检验验
11、变变量量之之间间的的协协整整关关系系,在在建建立立计计量量经经济学模型中是非常重要的。济学模型中是非常重要的。而而且且,从从变变量量之之间间是是否否具具有有协协整整关关系系出出发发选选择择模模型型的的变变量量,其其数数据据基基础础是是牢牢固固的的,其其统统计性质是优良的计性质是优良的。建立回归模型时建立回归模型时,如如 只要变量选择是合理的只要变量选择是合理的(具有长期稳定的关系具有长期稳定的关系,即协整关系即协整关系),随机误差项一定是,随机误差项一定是“白噪声白噪声”(即均(即均值为值为0,方差不变的稳定随机序列),模型参数有合,方差不变的稳定随机序列),模型参数有合理的经济解释。理的经济
12、解释。这也解释了尽管这两时间序列是非稳定的,但却这也解释了尽管这两时间序列是非稳定的,但却可以用经典的回归分析方法建立回归模型的原因。可以用经典的回归分析方法建立回归模型的原因。二、协整检验二、协整检验 为为了了检检验验两两变变量量Yt,Xt是是否否为为协协整整,Engle和和Granger于于1987年年提提出出两两步步检检验验法法,也也称称为为EG检验。检验。第一步,用第一步,用OLS方法估计方程:方法估计方程:Yt=0 0+1 1Xt+t t并计算非均衡误差,得到:并计算非均衡误差,得到:称为协整回归称为协整回归(cointegrating)或静态回归或静态回归(static regre
13、ssion)。第二步第二步,检验员检验员 的单整性的单整性,如果如果 是稳定的序列是稳定的序列,则则认为因变量与自变量之间具有协整关系。检验的方认为因变量与自变量之间具有协整关系。检验的方法仍然是法仍然是DFDF检验或检验或ADFADF检验。检验。进进行行检检验验时时,拒拒绝绝零零假假设设H0:=0,意意味味着着误误差差项项et是是平平稳稳序序列列,从从而而说说明明X与与Y间间是是协协整的。整的。而而OLS法采用了残差最小平方和原理,因法采用了残差最小平方和原理,因此估计量此估计量 是向下偏倚的,这样将导致拒绝零假是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。设的机会比实际情形大。于是
14、对于是对et平稳性检验的平稳性检验的DF与与ADF临界值应临界值应该比正常的该比正常的DF与与ADF临界值还要小。临界值还要小。MacKinnon(1991)通过模拟试验给出了协整检验通过模拟试验给出了协整检验的临界值,下表是双变量情形下不同样本容量的的临界值,下表是双变量情形下不同样本容量的临界值。临界值。例例检验中国居民人均消费水平检验中国居民人均消费水平CPCCPC与人均国内生与人均国内生产总值产总值GDPPCGDPPC的协整关系。的协整关系。已知已知C与与GDP都是都是I(2)序列,它们的回归式:序列,它们的回归式:R2=0.9981 通过对该式计算的残差序列作通过对该式计算的残差序列
15、作ADF检验,检验,得适当检验模型得适当检验模型 (-4.47)(3.93)(3.05)t=-4.47-3.75=ADF0.05,拒绝存在单位根的,拒绝存在单位根的假设,残差项是稳定的,因此假设,残差项是稳定的,因此中国居民人均消费中国居民人均消费水平与人均水平与人均GDP是是(2,2)阶协整的,说明了该两变阶协整的,说明了该两变量间存在长期稳定的量间存在长期稳定的“均衡均衡”关系。关系。三、误差修正模型三、误差修正模型前文已经提到,对于非稳定时间序列,可通过前文已经提到,对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经差分的方法将其化为稳定序列,然后才可建立经典的回归分析
16、模型。典的回归分析模型。例例如如:建建立立人人均均消消费费水水平平(Y)与与人人均均可可支支配配收入(收入(X)之间的回归模型:)之间的回归模型:1、误差修正模型、误差修正模型式中,式中,vt=t t-t-1t-1差分差分X,Y成为成为平稳平稳序列序列建立差分回归模型建立差分回归模型 如果如果Y与与X具有共同的具有共同的向上或向下向上或向下的变化趋势的变化趋势然而,然而,这种做法会引起两个问题这种做法会引起两个问题:(1)(1)如果如果X X与与Y Y间存在着长期稳定的均衡关系:间存在着长期稳定的均衡关系:Y Yt t=0 0+1 1X Xt t+t t且误差项且误差项 t t不存在序列相关,
17、则差分式:不存在序列相关,则差分式:Y Yt t=1 1 X Xt t+t t 中的中的 t t是一个一阶移动平均时间序列,因而是序是一个一阶移动平均时间序列,因而是序列相关的;列相关的;(2)如如果果采采用用差差分分形形式式进进行行估估计计,则则关关于于变变量量水水平平值值的的重重要要信信息息将将被被忽忽略略,这这时时模模型型只只表表达达了了X与与Y间间的的短短期期关关系系,而而没没有有揭揭示示它它们们间间的的长长期关系。期关系。因因为为,从从长长期期均均衡衡的的观观点点看看,Y在在第第t期期的的变变化化不不仅仅取取决决于于X本本身身的的变变化化,还还取取决决于于X与与Y在在t-1期末的状态
18、,尤其是期末的状态,尤其是X与与Y在在t-1期的不平衡程度。期的不平衡程度。例如,使用例如,使用 Yt=1 Xt+t回归时,很少出回归时,很少出现截距项显著为零的情况,即我们常常会得到如现截距项显著为零的情况,即我们常常会得到如下形式的方程:下形式的方程:在在X保持不变时,如果模型存在静态均衡保持不变时,如果模型存在静态均衡(static equilibrium),),Y也会保持它的长期均衡也会保持它的长期均衡值不变。值不变。(*)但如果使用(但如果使用(*)式,即使)式,即使X保持不变,保持不变,Y也会处也会处于长期上升或下降的过程中,这意味着于长期上升或下降的过程中,这意味着X与与Y间间不
19、存在静态均衡。不存在静态均衡。这与大多数具有静态均衡的经济理论假说这与大多数具有静态均衡的经济理论假说不相符。不相符。可见,简单差分不一定能解决非平稳时间可见,简单差分不一定能解决非平稳时间序列所遇到的全部问题,因此,误差修正模型序列所遇到的全部问题,因此,误差修正模型便应运而生。便应运而生。误差修正模型(误差修正模型(Error Correction Model,简记,简记为为ECM)是一种具有特定形式的模型,它的主要形)是一种具有特定形式的模型,它的主要形式是由式是由Davidson、Hendry、Srba和和Yeo于于1978年提年提出的,称为出的,称为DHSY模型。模型。通过一个具体的
20、模型来介绍它的结构。通过一个具体的模型来介绍它的结构。假设两变量假设两变量X X与与Y Y的长期均衡关系为的长期均衡关系为:Yt=0 0+1 1Xt+t t 由于现实经济中由于现实经济中X与与Y很少处在均衡点上,很少处在均衡点上,因此实际观测到的只是因此实际观测到的只是X与与Y间的短期的或非均间的短期的或非均衡的关系。衡的关系。实际上,实际上,第第t期的期的Y值,不仅与值,不仅与X的变化有的变化有关,而且与关,而且与t-1期期X与与Y的状态值有关。的状态值有关。假设具有假设具有如下如下(1,1)阶分布滞后形式:阶分布滞后形式:上面回归方程不能直接运用上面回归方程不能直接运用OLS法。对上述分法
21、。对上述分布滞后模型适当变形得:布滞后模型适当变形得:或,或,式中,式中,(*)上面回归方程不能直接运用上面回归方程不能直接运用OLS法。对上述分法。对上述分布滞后模型适当变形得:布滞后模型适当变形得:或,或,式中,式中,(*)Y的变化决定于的变化决定于X的变化以及前的变化以及前一时期的非均一时期的非均衡程度衡程度。上面回归方程不能直接运用上面回归方程不能直接运用OLS法。对上述分法。对上述分布滞后模型适当变形得:布滞后模型适当变形得:或,或,式中,式中,(*)Y的变化决定于的变化决定于X的变化以及前的变化以及前一时期的非均一时期的非均衡程度衡程度。t-1期的非均期的非均衡误差项衡误差项 上面
22、回归方程不能直接运用上面回归方程不能直接运用OLS法。对上述分法。对上述分布滞后模型适当变形得:布滞后模型适当变形得:或,或,式中,式中,(*)Y的变化决定于的变化决定于X的变化以及前的变化以及前一时期的非均一时期的非均衡程度衡程度。t-1期的非均期的非均衡误差项衡误差项Y的值已对前期的非的值已对前期的非均衡程度作出了修正均衡程度作出了修正。(*)表示误表示误差修正差修正项项 ecmecm的修正作用:的修正作用:(1)若若(t-1)时刻时刻Y大于其长期均衡解大于其长期均衡解 0+1X,ecm为正,则为正,则(-ecm)为负,使得为负,使得 Yt减少;减少;(2)若若(t-1)时刻时刻Y小于其长
23、期均衡解小于其长期均衡解 0+1X,ecm为负,则为负,则(-ecm)为正,使得为正,使得 Yt增大。增大。知,一般情况下知,一般情况下|1 ,由关系式,由关系式=1-=1-得:得:00 11。可以据此分析。可以据此分析 ecmecm的修正作用:的修正作用:(1)若若(t-1)时刻时刻Y大于其长期均衡解大于其长期均衡解 0+1X,ecm为正,则为正,则(-ecm)为负,使得为负,使得 Yt减少;减少;(2)若若(t-1)时刻时刻Y小于其长期均衡解小于其长期均衡解 0+1X,ecm为负,则为负,则(-ecm)为正,使得为正,使得 Yt增大。增大。(*)体现了长期非均衡误差对的控制。)体现了长期非
24、均衡误差对的控制。其主要原因在于变量对数的差分近似地等于其主要原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是稳定该变量的变化率,而经济变量的变化率常常是稳定序列,因此适合于包含在经典回归方程中。序列,因此适合于包含在经典回归方程中。在实际分析中,变量常以对数的形式出现。在实际分析中,变量常以对数的形式出现。于是于是:(1):(1)长期均衡模型长期均衡模型 Yt=0 0+1 1Xt+t t中的中的 1 1可视为可视为Y关于关于X的长期弹性(的长期弹性(long-run elasticity)(2)(2)短期非均衡模型短期非均衡模型 Y Yt t=0 0+1 1X Xt
25、t+2 2X Xt-1t-1+Y Yt-1t-1+t t中的中的 1 1可视为可视为Y关于关于X的短期弹性(的短期弹性(short-run elasticity)。)。更复杂的误差修正模型更复杂的误差修正模型可依照一阶误差修正可依照一阶误差修正模型类似地建立。模型类似地建立。引入二阶滞后的模型为引入二阶滞后的模型为:多变量的误差修正模型也可类似地建立多变量的误差修正模型也可类似地建立。如三个变量如果存在如下长期均衡关系:如三个变量如果存在如下长期均衡关系:则其一阶非均衡关系可写成:则其一阶非均衡关系可写成:于是它的一个误差修正模型为:于是它的一个误差修正模型为:参数估计法(一)参数估计法(一)
26、参数估计法(二)参数估计法(二)可以采用打开误差修整模型中非均衡误差项括号可以采用打开误差修整模型中非均衡误差项括号的方法直接用的方法直接用OLS法估计模型法估计模型。可打开非均衡误差项的括号直接估计下式:可打开非均衡误差项的括号直接估计下式:这时短期弹性与长期弹性可一并获得。这时短期弹性与长期弹性可一并获得。经经济济理理论论指指出出,居居民民消消费费支支出出是是其其实实际际收收入入的函数。的函数。以以中中国国国国民民经经济济核核算算中中的的居居民民消消费费支支出出经经过过居居民民消消费费价价格格指指数数缩缩减减得得到到中中国国居居民民实实际际消消费费支支出时间序列出时间序列(C););以以支
27、支出出法法GDP对对居居民民消消费费价价格格指指数数缩缩减减近近似似地代表国民收入时间序列地代表国民收入时间序列(GDP)。时间段为时间段为19782000 例例 中国居民消费的误差修正模型中国居民消费的误差修正模型 (1 1)对数据)对数据lnC与与lnGDP进行单整检验进行单整检验 容易验证容易验证lnC与与lnGDP是一阶单整的是一阶单整的 首先,建立首先,建立lnC与与lnGDP的回归模型的回归模型:(2)检验)检验lnC与与lnGDP的协整性,并建立长期均衡关系的协整性,并建立长期均衡关系 (0.30)(57.48)R2=0.994 DW=0.744 发现有残关项有较强的一阶自相关性
28、。考发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得虑加入适当的滞后项,得lnC与与lnGDP的分布的分布滞后模型滞后模型:(1.63)(6.62)(4.92)(-2.17)R2=0.994 DW=1.92 LM(1)=0.00 LM(2)=2.31 自相关性消除,因此可初步认为是自相关性消除,因此可初步认为是lnC与与lnGDP的长期稳定关系。的长期稳定关系。(*)残差项的稳定性检验残差项的稳定性检验:(-4.32)R2=0.994 DW=2.01 LM(1)=0.04 LM(2)=1.34 t=-4.32-3.64=ADF0.05 说明说明lnC与与lnGDP是(是(1,1)阶协
29、整的,)阶协整的,(*)式即为它们长期稳定的均衡关系)式即为它们长期稳定的均衡关系:(*)以稳定的时间序列以稳定的时间序列 如下如下:(3)建立误差修正模型)建立误差修正模型 做为误差修正项,可建立做为误差修正项,可建立误差修正模型误差修正模型:(6.96)(2.96)(-1.91)(-3.15)R2=0.994 DW=2.06 LM(1)=0.70 LM(2)=2.04(*)可得可得lnC关于关于lnGDP的长期弹性:的长期弹性:(0.698-0.361)/(1-0.622)=0.892;由(由(*)式可得)式可得lnC关于关于lnGDP的短期弹性:的短期弹性:0.686由由(*)式式:用打开误差修正项括号的方法直接估计误差修正用打开误差修正项括号的方法直接估计误差修正模型,适当估计式为模型,适当估计式为:(1.63)(6.62)(-2.99)(2.88)R2=0.791 =0.0064 DW=1.93 LM(2)=2.31 LM(3)=2.78 写成误差修正模型的形式如下写成误差修正模型的形式如下:(*)由(由(*)式知,)式知,lnC关于关于lnGDP的短期弹的短期弹性为性为0.698,长期弹性为,长期弹性为0.892。可见可见两种方法的结果非常接近两种方法的结果非常接近。