1、基本假定违背基本假定违背:不满足基本假定的情况。主要 包括:(1)随机误差项序列存在异方差异方差性;(2)随机误差项序列存在序列相关序列相关性;(3)解释变量之间存在多重共线多重共线性;(4)解释变量是随机变量且与随机误差项相关 (随机解释变量随机解释变量);此外:(5)模型设定有偏误(6)解释变量的方差不随样本容量的增而收敛 计量经济检验:计量经济检验:对模型基本假定的检验对模型基本假定的检验 本章主要学习:前本章主要学习:前4类类4.1 异方差性异方差性一、异方差的一、异方差的概念概念二、异方差的类型二、异方差的类型三、实际经济问题中的异方差性三、实际经济问题中的异方差性四、异方差性的后果
2、四、异方差性的后果五、异方差性的检验五、异方差性的检验六、异方差的修正六、异方差的修正七、案例七、案例对于模型如果出现即对于不同的样本点对于不同的样本点,随机误差项的方差不再随机误差项的方差不再是常数是常数,而互不相同而互不相同,则认为出现了则认为出现了异方差性异方差性(Heteroskedasticity)。一、异方差的概念一、异方差的概念 二、异方差的类型二、异方差的类型 同方差同方差性假定性假定:i2=常数 f(Xi)异方差异方差时:时:i2=f(Xi)异方差一般可归结为异方差一般可归结为三种类型三种类型:(1)单调递增型:i2随X的增大而增大 (2)单调递减型:i2随X的增大而减小 (
3、3)复 杂 型:i2与X的变化呈复杂形式 三、实际经济问题中的异方差性三、实际经济问题中的异方差性 例例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化 例例4.1,2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+I将居民按照收入等距离分成n组,取组平均数为样本观测值。一般情况下,居民收入服从正态分布一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而
4、人数多的组平均数的误差小,人数少的组平均数的误差大。所以所以样本观测值的观测误差观测误差随着解释变量观测值的不同而不同,往往引起异方差性。以上例子均为随机误差项的方差随着解释变量的变化而有规律变化的情形有规律变化的情形。例例4.1.3,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A,那么:每个企业所处的外外部部环环境境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随随机机误误差差项项的的方方差差并并不不随随某某一一个个解解释释变变量量观观测
5、值的变化而呈规律性变化,呈现复杂型。测值的变化而呈规律性变化,呈现复杂型。对于横横截截面面数数据据而言,不同样本点之间解释变量以外的其他因素的差异较大,往往存在异方差。四、异方差性的后果四、异方差性的后果 计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1 1、参数估计量非有效、参数估计量非有效 OLS估计量仍然具有仍然具有无偏性无偏性,但不具有不具有有效性有效性 因为在有效性证明中利用了 E()=2I 而且,在大样本情况下,尽管参数估计量具有一致性一致性,但仍然不具有渐近有效性渐近有效性。参数估计量不具有一致性。2 2、变量的显著性检验失去意义、变量的显著性
6、检验失去意义 变量的显著性检验中,构造了t统计量 其他检验也是如此。3 3、模型的预测失效、模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。五、异方差性的检验五、异方差性的检验检验思路:检验思路:由于异方差性异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相方差与解释变量观测值之间的相关性及其相关的关的“形式形式”。问题在于用什么
7、来表示随机误差项的方差问题在于用什么来表示随机误差项的方差 一般的处理方法:一般的处理方法:几种异方差的检验方法:几种异方差的检验方法:1 1、图示法、图示法(1)用)用X-Y的散点图进行判断的散点图进行判断 看是否存在明显的散点扩大散点扩大、缩小缩小或复杂型复杂型趋势趋势(即不在一个固定的带型域中)看是否形成一斜率为零的直线2 2、帕克、帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验 基本思想基本思想:偿试建立方程:或选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如:帕克检验常用的函数形
8、式:或 若若 在统计上是显著的,表明存在异方差性在统计上是显著的,表明存在异方差性。3 3、戈德菲尔德、戈德菲尔德-匡(夸)特匡(夸)特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以F检验为基础,适用于样本容量较大、样本容量较大、异方差递增或递减异方差递增或递减的情况。G-QG-Q检验的思想检验的思想:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。G-Q G-Q检验的步骤:检验的步骤:将
9、n对样本观察值(Xi,Yi)按观察值Xi的大小排队排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和 在同方差性假定下,构造如下满足F分布的统计量 给定显著性水平,确定临界值F(v1,v2),若F F(v1,v2),则拒绝同方差性假设,表明存在异方差存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。3 3、怀特(、怀特(White)检验)检验 怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤怀特检验的基本思
10、想与步骤(以二元为例):然后做如下辅助回归 可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。注意:注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。六、异方差的修正异方差的修正 模型检验出存在异方差性,可用加权最小二乘加权最小二乘法法(Weighted Least Squares
11、,WLS)进行估计。加权最小二乘法的基本思想:加权最小二乘法的基本思想:加权最小二乘法加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。在采用OLS方法时:对较小的残差平方ei2赋予较大的权数,对较大的残差平方ei2赋予较小的权数。例如例如,如果对一多元模型,经检验知:新模型中,存在 即满足同方差性,可用OLS法估计。一般情况下一般情况下:对于模型 Y=X+存在 即存在异方差性异方差性。W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD 用D-1左乘 Y=X+两边,得到一个新的模型:该模型具有同方差性。因为 这就是原模型 Y=X+的加权最小二乘估计量
12、加权最小二乘估计量,是无偏、有效的估计量。这里权矩阵为D-1,它来自于原模型残差项 的方差-协方差矩阵2W。如何得到如何得到2W?从前面的推导过程看,它来自于原模型残差项 的方差-协方差矩阵。因此 仍对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵的估计量,即 这时可直接以 作为权矩阵。(该方法称为广义最小二乘法(该方法称为广义最小二乘法)广义最小二乘法 通过对模型的修改来调整原数据的数值,从而使其误差项满足高斯-马尔可夫定理中对最小二乘法的应用所要求的假设条件。即我们要通过某种修正和调整,把变化不定的误差项的方差固定下来。注意:注意:在实际操作中人们通常采用如下的经验方法
13、:不对原模型进行异方差性检验,而是直接不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据选择加权最小二乘法,尤其是采用截面数据作样本时。作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法七、案例七、案例-中国农村居民人均消费函数中国农村居民人均消费函数 例例4.1.4 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(4)转移支付收入。考察从事农业经营的收入从事农业经营的收入(X1 1)和其他收入其他收入(X
14、2 2)对中国农村居民消费支出农村居民消费支出(Y)增长的影响:普通最小二乘法的估计结果:异方差检验进一步的统计检验进一步的统计检验(1)G-Q检验检验 将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:子样本1:(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648子样本2:(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729计算计算F F统计量:统计量:F=RSS2/RSS1=0.2792/0.0648=4.31 查表查表 给定=5%,查得临界值 F0
15、.05(9,9)=2.97判断判断 F F0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性存在递增异方差性。(2 2)怀特检验)怀特检验 作辅助回归:(-0.04)(0.10)(0.21)(-0.12)(1.47)(-1.11)R2=0.4638似乎没有哪个参数的t检验是显著的。但 n R2=31*0.4638=14.38=5%下,临界值 20.05(5)=11.07,拒绝拒绝同方差性同方差性 去掉交叉项后的辅助回归结果 (1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374X2项与X2的平方项的参数的t检验是显著的,且 n R2=31
16、0.4374=13.56 =5%下,临界值 20.05(4)=9.49 拒绝拒绝同方差同方差的原假设的原假设 原模型的加权最小二乘回归原模型的加权最小二乘回归 对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量;再以1/|i|为权重进行WLS估计,得各项统计检验指标全面改善各项统计检验指标全面改善4.2 序列相关性序列相关性 Serial Correlation一、一、序列相关性概念序列相关性概念二、实际经济问题中的序列相关性二、实际经济问题中的序列相关性 三、序列相关性的后果三、序列相关性的后果四、序列相关性的检验四、序列相关性的检验五、具有序列相关性模型的估计
17、五、具有序列相关性模型的估计六、案例六、案例4.2 序列相关性序列相关性 一、序列相关性概念一、序列相关性概念 如果对于不同的样本点,随机误差项之间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性。对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n称为一阶列相关一阶列相关,或自相关自相关(autocorrelation)其中:被称为自自协协方方差差系系数数(coefficient of autoc
18、ovariance)或一一阶阶自自相相关关系系数数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(i i+1)0 i=1,2,n 自相关自相关往往可写成如下形式:i=i-1+i -11 由于序列相关性经常出现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。二、实际经济问题中的序列相关性二、实际经济问题中的序列相关性 大多数经济时间数据都有一个明显的特点:惯性惯性,表现在时间序列不同时间的前后关联上。由于消费习惯消费习惯
19、的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例如,例如,绝对收入假设绝对收入假设下居民总消费函数模型居民总消费函数模型:Ct=0+1Yt+t t=1,2,n 1 1、经济变量固有的惯性、经济变量固有的惯性 2 2、模型设定的偏误、模型设定的偏误 所谓模型设定偏误设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt因此,vt=3X3t+t,如果X3确实影响Y
20、,则出现序列相关。但建模时设立了如下模型:Yt=0+1Xt+vt 因此,由于vt=2Xt2+t,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+t其中:Y=边际成本,X=产出,3 3、数据的、数据的“编造编造”例如:季度数据季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。还有就是两个时间点之间的“内插内插”技术往往导致随机项的序列相关性。在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。计量经济学模型
21、一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:二、序列相关性的后果二、序列相关性的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(NN)=2I 即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有参数估计量虽然具有一致性,但仍然不具有渐近有效性。一致性,但仍然不具有渐近有效性。2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。其他检验也是如此。3、模型的预测失效模型的预测失效 区间预测与参数估计量
22、的方差有关,在区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准方差有偏误的情况下,使得预测估计不准确,预测精度降低。确,预测精度降低。所以,所以,当模型出现序列相关性时,它的当模型出现序列相关性时,它的预测功能失效。预测功能失效。三、序列相关性的检验三、序列相关性的检验 然然后后,通过分析这些“近近似似估估计计量量”之间的相关性,以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:三、序列相关性的检验三、序列相关性的检验 1 1、图示法、图示法 2 2、回归检验法、回归检验法 如果存在某
23、一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。3 3、杜宾、杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检检验验是是杜杜宾宾(J.Durbin)和和瓦瓦(沃沃)森森(G.S.(G.S.Watson)Watson)于于19511951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法,该方法的假定条件是该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模型中不应
24、含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项 该统计量该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到精确的分布很难得到。但是但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:D.W.统计量统计量:D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0D.W.dL 存在正自相关 dLD.W
25、.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 0 dL dU 2 4-dU 4-dL 正相关不能确定无自相关不能确定负相关 当D.W.值在2左右时,模型不存在一阶自相关。证明:证明:展开D.W.统计量:(*)如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关,即即=0,则,则 D.W.2这里,为一阶自回归模型 i=i-1+i 的参数估计。4、拉格朗日乘数(、拉格朗日乘数(Lagrange multiplier)检
26、)检验验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验检验。对于模型如果怀疑随机扰动项存在p阶序列相关阶序列相关:GB检验可用来检验如下受约束回归方程 约束条件为:H0:1=2=p=0约束条件H0为真时,大样本下其中,n为样本容量,R2为如下辅助回归的可决系数:给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法广义最小二乘法
27、(GLS:Generalized least squares)和广义差分法广义差分法(Generalized Difference)。四、序列相关的补救四、序列相关的补救 1 1、广义最小二乘法、广义最小二乘法 对于模型 Y=X+如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵D,使得 =DD变换原模型:D-1Y=D-1X +D-1 即 Y*=X*+*(*)(*)式的OLS估计:这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。是无偏的、有效的估计量。该模型具有同方差性和随机误差项互相独立性该模型具
28、有同方差性和随机误差项互相独立性:如何得到矩阵如何得到矩阵?对 的形式进行特殊设定后,才可得到其估计值。如设定随机扰动项为一阶序列相关形式 i=i-1+i 则 2 2、广义差分法、广义差分法 广广义义差差分分法法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。如果原模型存在可以将原模型变换为:该模型为广义差分模型广义差分模型,不存在序列相关问题。可进行OLS估计。注意:广义差分法广义差分法就是上述广义最小二乘法广义最小二乘法,但是却损失了部分样本观测值。如:如:一阶序列相关的情况下,广义差分是估计这相当于去掉第一行后左乘原模型Y=X+。即运用了GLS法,但第一次观测值被排除了。3 3
29、、随机误差项相关系数的估计、随机误差项相关系数的估计 应应用用广广义义最最小小二二乘乘法法或或广广义义差差分分法法,必必须须已已知知随随机误差项的相关系数机误差项的相关系数 1,2,L。实实际际上上,人人们们并并不不知知道道它它们们的的具具体体数数值值,所所以以必必须首先对它们进行估计。须首先对它们进行估计。常用的估计方法有:常用的估计方法有:科克伦科克伦-奥科特奥科特(Cochrane-Orcutt)迭代法迭代法。杜宾杜宾(durbin)两步法两步法 (1)科克伦科克伦-奥科特迭代法奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”
30、,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i求出i新的“近拟估计值”,并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科科克克伦伦-奥奥科科特特两两步法步法。(2)杜宾)杜宾(durbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1,2,l,再对差分,再对差分模型进行估计模型进行估
31、计 第一步第一步,变换差分模型为下列形式进行OLS估计,得各Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值应用软件中的广义差分法应用软件中的广义差分法 在在Eview/TSP软软件件包包下下,广广义义差差分分采采用用了了科科克克伦伦-奥科特(奥科特(Cochrane-Orcutt)迭代法估计)迭代法估计。在在解解释释变变量量中中引引入入AR(1)(1)、AR(2)(2)、,即即可可得得到参数和到参数和1、2、的估计值。的估计值。其其中中AR(m)表表示示随随机机误误差差项项的的m阶阶自自回回归归。在在估估计过程中自动完成了计过程中自动完成了1、2、的迭代。的迭代。如果能够找到一种
32、方法,求得如果能够找到一种方法,求得或或各序列相关系各序列相关系数数j的估计量,使得的估计量,使得GLS能够实现,则称为能够实现,则称为可可行的广义最小二乘法行的广义最小二乘法(FGLS,Feasible Generalized Least Squares)。)。FGLS估计量估计量,也称为也称为可行的广义最小二乘估计可行的广义最小二乘估计量量(feasible general least squares estimators)可行的广义最小二乘估计量不再是无偏的,但可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦却是一致的,而且在科克伦-奥科特迭代法下,奥科特迭代法下,估计量
33、也具有渐近有效性。估计量也具有渐近有效性。前面提出的方法,就是前面提出的方法,就是FGLS 注意:注意:4 4、虚假序列相关问题、虚假序列相关问题 由于随机项的序列相关往往是在模型设由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为数形式设定有误,这种情形可称为虚假序虚假序列相关列相关(false autocorrelation),应在模型,应在模型设定中排除。设定中排除。避免产生虚假序列相关性的措施是在开避免产生虚假序列相关性的措施是在开始时建立一个始时建立一个“一般一般”的模型,然后逐渐的模型,然后逐渐剔
34、除确实不显著的变量。剔除确实不显著的变量。五、案例:中国商品进口模型五、案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国内价格指数指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。1.通过通过OLS法建立如下中国商品进口方程:法建立如下中国商品进口方程:(2.32)(20.12)2.进行序列相关性检验。进行序列相关性检验。DW检验检验 取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628
35、20.05(2)故:存在正自相关存在正自相关2 2阶滞后:阶滞后:3阶滞后:(0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615 于是,LM=210.6614=13.89取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3)表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说的参数不显著,说明不存在明不存在3 3阶序列相关性。阶序列相关性。3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型(1.76)(6.64)(-1.76)(5.88
36、)(-5.19)(5.30)第二步第二步,作差分变换:则则M*关于关于GDP*的的OLS估计结果为:估计结果为:(2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关于是原模型为:与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 在在Eviews软包下,软包下,2阶广义差分的结果为:阶广义差分的结果为:取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。(3.81)(18.45)(6.11)(-3.61)可以验证可以验证:仅采用1阶广义差分,变
37、换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。4.3 多重共线性多重共线性Multi-CollinearityMulti-Collinearity一、多重共线性的概念一、多重共线性的概念二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例*七、分部回归与多重共线性七、分部回归与多重共线性 4.3 多重共线性多重共线性 一、多重共线性的概念一、多重共线性的概念 在多元回归模型中,解释变量之
38、间存在的线性或近似线性的关系,称为共线性。共线性理论最早由弗瑞斯在1934年提出,对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Multicollinearity)。如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中:ci不全为0,则则称称为为解解释释变变量量间间存存在在完完全全共共线线性性(perfect multicollinearity)。如果存在 c1X1i+c2X2i+ckXki+vi=0
39、 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近近似似共共线线性性(approximate multicollinearity)或交交互互相相关关(intercorrelated)。注意:注意:完全共线性的情况并不多见,一般出完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共现的是在一定程度上的共线性,即近似共线性。线性。共线性不是有或无的问题,关键是看共线性不是有或无的问题,关键是看他们的严重程度。严重的共线性会给模型他们的严重程度。严重的共线性会给模型参数估计及假设检验带来重大影响。参数估计及假设检验带来重大影响。我们应该把重点放在防止可能出现的我们应该把
40、重点放在防止可能出现的严重的共线性上。严重的共线性上。二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面:(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。(2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。
41、(3 3)样本数量少于自变量的个数。)样本数量少于自变量的个数。(4)样本资料的限制样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。(在针对所研究的问题确定解释变量的时候,由于受到某些条件的限制,可供选择的范围比较小,只好把具有相关关系或相近解释功能的变量一同纳入到模型中)一般经验一般经验:时间序列数据时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据截面数据样本:问题不那么严重,但多重共线性仍然是存在的。二、多重共线性的后果二、多重共线性的后果 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全
42、共线性完全共线性,则,则(XX)-1不存在,无法得不存在,无法得到参数的估计量。到参数的估计量。的OLS估计量为:例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:2 2、近似共线性下、近似共线性下OLS估计量非有效估计量非有效 近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLS参参数数估估计计量量非非有有效。效。仍以二元线性模型 y=1x1+2x2+为例:恰为X1与X2的线性相关系数的平方r2由于 r2 1,故 1/(1-r2)1
43、多重共线性使参数估计值的方差增大重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子方差膨胀因子(Variance Inflation Factor,VIF)当完全不共线完全不共线时,r2=0 当近似共线近似共线时,0 r2 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)2 2、检验简单相关系数、检验简单相关系数发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数
44、矩阵:3 3、找出最简单的回归形式、找出最简单的回归形式可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。回归方程以回归方程以Y=f(Y=
45、f(X1,X2,X3)为最优:为最优:5 5、结论、结论*七、分部回归与多重共线性七、分部回归与多重共线性1 1、分部回归法、分部回归法(Partitioned Regression)(Partitioned Regression)对于模型在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:将解释变量分为两部分,对应的参数也分为两部分:如果存在则有同样有这就是仅以这就是仅以X X2 2作为解释变量时的参数估计量作为解释变量时的参数估计量。这就是仅以这就是仅以X X1 1作为解释变量时的参数估计量作为解释变量时的参数估计量2 2、由分部回归法导出、由分部回归法导出如果一个多
46、元线性模型的解释变量之间完全正交,如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、可以将该多元模型分为多个一元模型、二元模型、进行估计,参数估计结果不变;进行估计,参数估计结果不变;实际模型由于存在或轻或重的共线性,如果将它实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、们分为多个一元模型、二元模型、进行估计,进行估计,参数估计结果将发生变化;参数估计结果将发生变化;严格地说,实际模型由于总存在一定程严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量
47、之间的真正反映对应变量与被解释变量之间的结构关系。结构关系。当模型存在共线性,将某个共线性变量去当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;而且经济含义有发生变化;4.4 随机解释变量问题随机解释变量问题一、一、随机解释变量问题随机解释变量问题二、实际经济问题中的随机解释变量问题二、实际经济问题中的随机解释变量问题 三、随机解释变量的后果三、随机解释变量的后果四、工具变量法四、工具变量法五、案例五、案例 基本假设:解释变量X1,X2,Xk是确定性变量。如果存在一个或多个随机变量作为解释变量,则称原模型出
48、现随机解释变量问题随机解释变量问题。假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况:一、随机解释变量问题一、随机解释变量问题对于模型 1.随机解释变量与随机误差项独立随机解释变量与随机误差项独立(Independence)2.随机解释变量与随机误差项同期无关随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。,但异期相关。3.随机解释变量与随机误差项同期相关随机解释变量与随机误差项同期相关(contemporaneously correlated)。二、实际经济问题中的随机解释变量问题二、实际经济问题中的随机解释变量问题
49、在实际经济问题中,经济变量往往都具有随机性。但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。于是于是随机解释变量问题随机解释变量问题主要主要表现于:表现于:用滞用滞后被解释变量作为模型的解释变量的情况后被解释变量作为模型的解释变量的情况。例如:例如:(1 1)耐用品存量调整模型:)耐用品存量调整模型:耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定:Qt=0+1It+2Qt-1+t t=1,T这是一个滞后被解释变量作为解释变量的模型。但是,如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与t-1相关,与t不相关,属于上述的第2种情况。(2)合理预期
50、的消费函数模型)合理预期的消费函数模型 合理预期理论合理预期理论认为消费Ct是由对收入的预期Yte所决定的:预期收入Yte与实际收入Y间存如下关系的假设 容易推出Ct-1是一随机解释变量,且与(t-t-1)高度相关(Why?)。属于上述第3种情况。计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。下面以一元线性回归模型为例进行说明 三、随机解释变量的后果三、随机解释变量的后果 随机解释变量与随机误差项相关图随机解释变量与随机误差项相关图(a)正相关(b)负相关 拟合的样本回归拟合的样本回归线可能低估截距项,线可能
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100