1、一、多重共线性的概念一、多重共线性的概念二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例*七、分部回归与多重共线性七、分部回归与多重共线性 4.3 多重共线性多重共线性 一、多重共线性的概念一、多重共线性的概念 对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Mult
2、icollinearity)。如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中:ci不全为0,则则称称为为解解释释变变量量间间存存在在完完全全共共线线性性(perfect multicollinearity)。如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近近似似共共线线性性(approximate multicollinearity)或交交互互相相关关(intercorrelated)。在矩阵表示的线性回归模型 Y=X+中,完全共线性完全共线性指:指:秩秩(X)k+1,即中,至少有一列向量可由其他列向
3、量(不包括第一列)线性表出。如:X2=X1,则X2对Y的作用可由X1代替。注意:注意:完全共线性的情况并不多见,一般出完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共现的是在一定程度上的共线性,即近似共线性。线性。二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面:(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小
4、。(2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)样本资料的限制样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验一般经验:时间序列数据时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据截面数据样本:问题不那么严重,但多重共线性仍然是存在的。二、多重共线性的后果二、多重共线性的后果 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则(
5、XX)-1不存在,无法得不存在,无法得到参数的估计量。到参数的估计量。的OLS估计量为:例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:2 2、近似共线性下、近似共线性下OLS估计量非有效估计量非有效 近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLS参参数数估估计计量量非非有有效。效。仍以二元线性模型 y=1x1+2x2+为例:恰为X1与X2的线性相关系数的平方r2由于 r2 1,故 1/(1-r2)1多重共线性使参数估计值的方
6、差增大重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子方差膨胀因子(Variance Inflation Factor,VIF)当完全不共线完全不共线时,r2=0 当近似共线近似共线时,0 r2 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)2 2、检验简单相关系数、检验简单相关系数发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:3 3、找出最简单的
7、回归形式、找出最简单的回归形式可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。回归方程以回归方程以Y=f(Y=f(X1,X2,X3)为最
8、优:为最优:5 5、结论、结论*七、分部回归与多重共线性七、分部回归与多重共线性1 1、分部回归法、分部回归法(Partitioned Regression)(Partitioned Regression)对于模型在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:将解释变量分为两部分,对应的参数也分为两部分:如果存在则有同样有这就是仅以这就是仅以X X2 2作为解释变量时的参数估计量作为解释变量时的参数估计量。这就是仅以这就是仅以X X1 1作为解释变量时的参数估计量作为解释变量时的参数估计量2 2、由分部回归法导出、由分部回归法导出如果一个多元线性模型的解释变量之间完
9、全正交,如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、可以将该多元模型分为多个一元模型、二元模型、进行估计,参数估计结果不变;进行估计,参数估计结果不变;实际模型由于存在或轻或重的共线性,如果将它实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、们分为多个一元模型、二元模型、进行估计,进行估计,参数估计结果将发生变化;参数估计结果将发生变化;严格地说,实际模型由于总存在一定程严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的真正反映对应变量与被解释变量之间的结构关系。结构关系。当模型存在共线性,将某个共线性变量去当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;而且经济含义有发生变化;