资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,*,*,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,单击此处编辑母版标题样式,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,单击此处编辑母版标题样式,*,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,单击此处编辑母版标题样式,*,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,单击此处编辑母版标题样式,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,计 量 经 济 学,Econometrics,2014-2015-1,任课教师:范国斌,第六章 自相关,引子,T,检验和,F,检验一定可靠吗,?,研究居民储蓄存款,Y,与居民收入,X,的关系:,用普通最小二乘法估计其参数,结果为,(,1.8690,),(0.0055),t=(14.9343)(64.2069),F=4122.531,检验结果:回归系数标准误差非常小,,t,统计量较大,说明居,民收入,X,对居民储蓄存款,Y,的影响非常显著。同时可决系数,也非常高,,F,统计量,=4122.531,,也表明模型异常的显著。,但若有人说此估计结果有可能是虚假的,,t,统计量和,F,统计量,都被虚假地夸大了,因此所得结果是不可信的。为什么呢,?,2,第六章 自相关,本章讨论四个问题:,自相关的概念和产生的原因,自相关的后果,自相关的检验方法,自相关的补救方法,3,第一节 自相关的概念,一、什么是自相关,一般概念,:,自相关是指以时间和空间为顺序的,观测值序列,中各部分之间的相关关系,也称序列相关。,计量经济学中的概念:,特指,随机扰动项逐次观测值,相互之间的相关关系。,一般表示为:,自相关程度的度量,自相关系数,4,如果 称 序列存在一阶自相关,如果 的自相关形式为,:,其中:满足,OLS,基本假定,:,称 呈现,一阶自回归形式,称为一阶自回归系数,近似于一阶,自相关系数,因为,(回归系数公式)(相关系数公式),自相关的形式,在样本容量大时有,5,也可能是,二阶自回归形式,,可记为,的,K,阶自回归形式,,可记为,自回归的形式将在时间序列中讨论。,这里只讨论一阶自回归形式的自相关问题,一阶自回归形式较为简单,在实际计量分析中处理一阶自回归形式常能取得较好效果,.,6,一阶自回归形式的自相关性质,对于,可以证明:,一般关系,:,期望,7,方差,协方差,(P159,证明,),类推可得,8,二、,自相关产生的原因,(,1,)经济变量本身的惯性作用,经济变量与前几个时期的数值往往有关,如本期消费常与,前期消费有关,(,2,)经济行为本身的滞后性,如本期消费还依赖于前期收入,而前期收入未纳入模型,(,3,)设定偏倚,如省略重要解释变量、不正确的函数形式可引起自相关,(,4,)数据的加工引起自相关,如数据修匀平滑,,用,内插和外推取得数据,(,5,)扰动项自身特性引起自相关,(真实自相关),某些偶然因素如灾害、政治因素的长期影响、蛛网现象等,9,第二节 自相关的后果,一、,对参数估计的影响,1.,参数的,OLS,估计式仍然是无偏的,(,无偏性证明中未涉及自相关,),2.,用,OLS,估计的参数的方差不再具有最小方差,(,可以找到比,OLS,更小方差的估计式,),存在自相关时仍用经典假定下公式可能严重低估真实方差,其中 是经典假定下公式,计算的方差,是存在自相关时所估计参数的,真实方差,3.,用 估计 的方差,会低估 的真实方差,(可以证明),将低估真实的,10,对于,由,在,同方差且无自相关,时,在,异方差但无自相关,时,在,同方差但自相关,时,回顾:异方差和自相关对方差的影响,11,因为,由于 未知,,的估计出现困难,12,存在自相关时 ,在经济问题中常见的是 ,,且解释变量经常正自相关,交叉项 为正,大多数经济应用中,为正。通常只用,会低估,OLS,估计量的真实方差。,如果 ,为奇数时 ,为偶数时 ,,的符号难以断定,用 也可能高估,OLS,估计量的真实方差,但对,OLS,估计量方差的估计也是有偏的。,13,用 还会低估 的真实方差,因为,证明见教材,p160(6.20),只用 会过低估计 。,这样,,将会进一步低估 的真实方差,因为,在低估 的,基础上 用 可能更加过低估计参数真实方差。,经济问题中自相关时通常为正值,结论:,在大多数经济应用中,存在自相关时将使,OLS,估计量不再具有最小方差性(要大于无自相关时的方差),.,14,二、对模型检验的影响,1.,参数的显著性检验将失效,可能过低估计参数真实方差和标准误差,则可能过高估计 ,而夸大 的显著性,,使得,t,检验失效,同理,,F,检验也将失效,2.,区间估计变得无意义,由于方差标准误差,的估计是有偏的,或,被过低估计,,区间估计不可信,变得无意义。,15,3,、对模型预测的影响,模型预测的精度决定于:,抽样误差,的方差,抽样误差来自于对 的估计,存在自相关时,,OLS,估计的 变大,会影响抽样误差。,在自相关情形下,用,对,的估计也会不可靠。,影响预测精度的两个因素都可能因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低预测的精度。,16,第三节,自相关的检验,一、图解法,用样本回归剩余 代替 ,绘制以 为纵坐标,以,或时间顺序,t,为横坐标的坐标图,观测是否存在自相关,,如,17,1.,基本思想:,将 视为对 的估计,寻求适当的检验统计量,原假设,:,建立,DW,统计量(也称,d,统计量,),:,关键是设法确定,D,的分布,。,二、德宾,沃森,D,检验,(,DurbinWatson,检验,),18,可以证明,:,大样本时,:,(,只差一次观测的,),可见,对,=0,的检验等价于对,d=2,的检验,19,2.,德宾,沃森,DW,检验的假定条件,:,(,1,)解释变量非随机,(,2,)模型包括截距项(不是通过原点的回归),(,3,)解释变量中不含滞后被解释变量,如,(,4,)的自相关是一阶自回归形式,即,(,5,)无缺损数据,20,3.,具体作法,(1),进行,OLS,回归得,剩余,(2)计算,统计量,(3),确定,d,的概率分布,:它与 、样本容量,n,、解释变量个数,k,都有关,具体确定其分布性质很困难。,但,D-W,给出了,d,统计量有价值的临界值(,d,统计量表),(4),给定显著性水平,,查,D,W,的,d,统计量表,得与样本容量为,n,,解释变量个数为,k,对应的,临界值,和,(5),判断是否存在自相关,临界值 和 把,d,值分为五个区域,:(,见下页,),21,和 把,d,值可分为五个区域:,判断:,(,1,),时,拒绝 ,存在正自相关,(,2,),时,不能确定是否存在自相关,(,3,),时,不拒绝 和 ,不存在一阶自相关,(,4),时,不能确定是否存在自相关,(,5),时,拒绝 ,存在负自相关,假设:,:无正自相关,或,:无负自相关,无结论,区域,无结论,区域,无自相关,区域,不拒绝,和,负自相关,区域,拒绝,正自相关,区域,拒绝,22,4.,DW,检验的优点和局限,优点:,依据通常要计算的 ,使用方便,局限,:,(,1,)有假定前提条件(,5,个条件,),(,2,)要求有足够样本量,(一般要求,n15,),(3,)有不确定区域,修订方式:,时,接受 ,认为不存,在自相关,或 就拒绝 ,认为存在,自相关,(这是扩大拒绝区域,不确定时宁可拒绝而不宜接受的,“,宁左勿右,”,的作法,),23,第四节 自相关的补救办法,一、纠正设定误差,可减弱自相关,设定误差造成的自相关,只能通过改变模型的设定去消除,1.,引入导致自相关的省略解释变量,1,)发现和确认引起自相关的解释变量(如滞后变量),可将剩余 对省略的主要解释变量逐个回归,2,)将确认的变量引入模型,消除或减轻自相关,2.,改变导致自相关的函数形式,1,)发现错误的函数形式,用剩余 对解释变量较高次幂回归,检验新剩余是,否还有自相关,2,)改变函数形式,减弱自相关影响,注意:如果是真实自相关,纠正设定误差方法无效,24,二、已知自相关系数,时对模型的变换,当 为一阶自相关形式,并已知,时,,可用,广义差分法,基本思想:,原模型,因为 ,已知 无自相关,,可设法将模型的扰动项变换为 ,即广义差分形式,方法:,用,“,(原模型),(滞后一个期的模型),”,得,=+,满足基本假定:,零均值,同方差,无自相关,25,估计变换后的模型,得 和 ,再由,可计算出 :,因为 则,注意:,前提条件是已知自相关系数,广义差分后只有,n-1,个观测值,为避免观测值损失,,Y,和,X,的第一个观测值可用如下普莱斯温斯腾变换得第一个观测值,模型已成为变换了的新变量之间的回归,具体方法:,(其他解释变量用同样方法变换得第一个观测值),26,三、自相关系数,未知时模型的变换,思想,:,通常,未知,为用模型变换处理自相关,必须,设法找到,的估计值,方法,1.,用,dw,统计量估计,在大样本时,已知,因此,从,DW,检验中已得到,d,统计量,即可估计出,注意:,此方法只有在,大样本,时才有效,27,思想,:,由于,一阶自回归系数,近似于一阶自相关系数,用,替代 去估计,原模型作,OLS,估计,计算,作过原点的回归,在,Eviews,中生成新变量,e=resid,,在命令栏输入,“,ls e e,(,-1,),”,/,回车,得到估计的,可视为估计的,方法,2:,用残差 直接估计,28,方法,3.,科克兰,(,Cochrane,),奥卡特,(,Orcutt,),迭代法,基本思想:,利用剩余 去获得未知的 的信息。,通过逐次迭代寻求,(,逐步逼近,),更满意的 的估计值,原模型 且,可,用剩余,e,替代,u,去,估计,方法,:,作回归,用估计的 对原模型作广义差分回归,得剩余项,由所得剩余 重新估计 ,再用 对原模型作广义差分回归,得剩余项,用剩余 再估计 ,又用 对原模型作广义差分回归直到估计的,收敛,满足精度要求,或回归所得,DW,统计量通过零假设(,不存在自相关,)为止。,29,迭代的方法步骤:,1,)用,OLS,估计原模型,计算回归剩余 ,并估计,2,)用 作一阶差分回归,检验 的自相关性,若还有自相关,用 第二次估计,3,)用 作一阶差分回归,检验 的自相关性,若无自相关,迭代停止,得到 的估计值。若还有自相关,再用 第三次估计 ,继续广义差分回归,直到经检验无自相关为止。,30,停止迭代,用,OLS,估计原模型,计算,估计,用 作广义差分回归,计算,检验 是否有自相关,与上次估计的 的差别,自相关,相差较大,用 再估计,用 再估计,相差很小,无自相关,原模型,31,方法,4.,德宾两步法,基本思想和作法:,设法间接地估计出 ,再利用 作广义差分变换原模型,1,)如果已知 ,可对原模型作广义差分变换,2,)将上式中 移项到方程右边,其中 满足基本假定,无自相关,3),可用,OLS,法估计上式,估计出 ,它是 的一致估计式。,(以上为第一步),4),用估计的 对原模型作广义差分变换,并用,OLS,估计其参数,得原模型参数估计值。,(第二步),原模型,32,案例:中国农村居民收入消费模型,研究范围:中国农村居民收入消费(,19852003,),研究目的:,消费模型是研究居民消费行为的工具和手段。通过消费模型的分析可判断居民消费边际消费倾向,而边际消费倾向是宏观经济系统中的重要参数。,Yt,居民消费,,Xt,居民收入,,ut,随机误差项。,数据收集:,19852003,年农村居民人均收入和消费,建立模型:,第五节 案例分析,33,年份,全年人均纯收入,(,现价,),全年人均消费,性支出,(,现价,),消费价格,指数,(1985=100),人均实际纯,收入,(1985,可比价,),人均实际消费,性支出,(1985,可比价,),1985,397.60,317.42,100.0,397.60,317.40,1986,423.80,357.00,106.1,399.43,336.48,1987,462.60,398.30,112.7,410.47,353.42,1988,544.90,476.70,132.4,411.56,360.05,1989,601.50,535.40,157.9,380.94,339.08,1990,686.30,584.63,165.1,415.69,354.11,1991,708.60,619.80,168.9,419.54,366.96,1992,784.00,659.80,176.8,443.44,373.19,1993,921.60,769.70,201.0,458.51,382.94,1985-2003,年农村居民,人均收入,和消费 单位:元,34,年份,全年人均纯,收入,(,现价,),全年人均消费性支出,(,现价,),消费价格,指数,(1985=100),人均实际纯,收入,(1985,可比价,),人均实际消费,性支出,(1985,可比价,),1994,1221.00,1016.81,248.0,492.34,410.00,1995,1577.70,1310.36,291.4,541.42,449.69,1996,1923.10,1572.10,314.4,611.67,500.03,1997,2090.10,1617.15,322.3,648.50,501.77,1998,2162.00,1590.33,319.1,677.53,498.28,1999,2214.30,1577.42,314.3,704.52,501.75,2000,2253.40,1670.00,314.0,717.64,531.85,2001,2366.40,1741.00,316.5,747.68,550.08,2002,2475.60,1834.00,315.2,785.41,581.85,2003,2622.24,1943.30,320.2,818.86,606.81,续 表,35,t,和,F,很显著,但,DW,表明,可能有自相关,使用普通最小二乘法估计消费模型得:,36,该回归方程可决系数较高,回归系数均显著。对样本量为,19,、一个解释变量的模型、,5%,显著水平,查,DW,统计表可知,,dL,=1.18,,,dU,=1.40,,模型中,DW,dL,,显然消费模型中有正自相关。,点击,EViews,方程输出窗口,的按钮,Resids,可得到残差,图,从残差 与时间,t,的图中也看出存在正自相关,,自相关检验,37,或者作残差 与 (,ET,表示,),的图形,从图中也看出可能存在正自相关,38,自相关的修正:,广义差分法:,关键是 未知需要估计,1.,由,DW=0.770478,计算,生成广义差分变量,:,或输入,:ls Y-0.614761*Y(-1)C X-0.614761*X(-1)/,回车,由于使用了广义差分数据,样本,容量减少了,1,个,为,18,个。,查,5%,显著水平的,DW,统计表可,知,dL=1.158,,,dU=1.391,,模型,中,说明广义差分模型中已无自相关。,39,2.,德宾两步法估计,第一步,:,作回归,估计结果,第二步,:,以 作广义差分,生成新序列,作 的回归,结果为,表明还不能判断是否有,一阶自相关,40,3.,用残差序列估计,由模型可得残差序列,,使用,进行滞后一期的自回归,在,EViews,命今栏中输入,ls e e(-1),可得回归方程:,可知,=0.4960,,对原模型进行广义差分,得到广义差分方程:,作广义差分方程回归,在,EViews,命令栏中输入,ls Y,0.4960*Y(,1)c X,0.4960*X(,1),回车后可得方程输出结果,41,广义差分输出结果,42,可得回归方程为:,R2=0.9609 F=393.3577 df=16 DW=1.3975,式中,,由于使用了广义差分数据,样本容量减少了,1,个,为,18,个。查,5%,显著水平的,DW,统计表可知,dL=1.158,,,dU=1.391,,模型中,说明广义差分模型中已无自相关。,同时,可决系数,R2,、,t,、,F,统计量均达到理想水平,。,43,4.,科克兰内,(Cochrane),奥克特,(Orcutt),迭代法:,估计模型参数:,Eviews,中命令栏输入“,LS Y C X AR(1),”/,回车,即自动迭代,得科克兰内,-,奥克特法估计结果,:,由于,表明已消除一阶自相关,44,原模型最初估计:,还原为原模型结果:,德宾两步法,:,还原为,还原为,用,DW,估计,:,45,科克兰内,-,奥克特法:,用残差直接估计 :,还原为,46,方法,估计结果,DW,值,原模型,0.7705,D,统计量,0.614761,1.4781,德宾两步,0.387861,1.2952,残差直接估计,0.4960,1.3975,科,-,奥迭代,1.3984,由中国农村居民消费模型可知,中国农村居民的边际消费倾向为,0.5833,,即中国农民每增加收入,1,元,将增加消费支出,0.5833,元。,(无自相关),(无自相关),(无自相关),(正自相关),(不能确定),各种方法结果的比较:,(非大样本),(,4,次迭代),47,本 章 作 业,练习题,6.5,48,
展开阅读全文