1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,多元线性回归,南开大学商学院,周宝源,回归模型诊断,第一节 多重共线性,一、基本概念,(一)完全多重共线性,指线性回归模型中的若干解释变量或全部解释变量的样本观察值之间具有某种严格的线性关系。,(二)近似多重共线性,指线性回归模型中的若干解释变量或全部解释变量的样本观察值之间存在着近似的线性关系。,二、多重共线性的产生原因,1,、经济变量间的内在关系,2,、经济变量在时间上有同方向变动的趋势,3,、分布滞后变量模型的广泛应用,4,、模型设定的偏误,5,、其他,三、多重共线性的后果,随着多重共线性程度的提高,
2、参数方差会急剧上升到很大的水平,理论上使最小二乘法估计的有效性、可靠性和价值都受到影响,实践中参数估计的稳定性和可靠程度下降,1,、具有较大的方差与协方差,难以得到精确的估计,2,、使得参数估计值很不稳定,3,、使得,t,检验得出误导性的结果,4,、产生有偏的预测置信区间,使预测失效,。,四、,多重共线性的诊断,(一)方差扩大因子,(二)容忍度,(三)状态指数,(一)方差扩大因子,方差扩大因子,VIF,对每个解释变量,X,k,,,可以计算,VIF,k,通常认为方差扩大因子大于,10,时,第 个解释变量存在较强的、必须加以处理的多重共线性。,(二)容忍度,容忍,度(,tolerance,),,也
3、称为容许度,它是方差膨胀因子的倒数。,因此,一般认为容忍度小于,0.1,时(对应于,VIF,大于,10,),相应自变量存在较强的、必须加以处理的多重共线性。,(二)状态指数,状态指数(,condition index,),:,通常简称为,CI,。,通常认为:,CI,值介于,10,与,30,之间时,认为存在中等程度的多重共线性。,CI,值在,30,以上时,认为存在严重多重共线性。,例:,分析以,Y,为因变量,,X1,和,X2,为自变量的回归模型是否存在多重共线性问题。,S,SS,操作,从,Analyze,Regression,Linear,打开,Linear,线性回归主对话框,将自变量与因变量分
4、别选入相应框中。,点击,“,Statistics,”,按钮,在新打开的对话框中选中,“,Collinearity,diagnostic,”,,,点击,“,Continue,”,点击,“,OK,”,两个自变量对应的,VIF,均显著超过,10,(,tolerance,均小于0.1),,所以回归模型存在严重的多重共线性。,最大的,CI,显著超过,30,,表明回归模型模型存在严重的多重共线性。,多重共线性的其他诊断方法,1.R,2,很高,,Y,与各自变量的相关系数也很高,但自变量的回归系数均不显著或显著不为零的回归系数较少;,2.,某两个自变量的相关系数较高;,3.,从直观上知,某自变量与其他自变量存
5、在函数关系,4.,回归系数估计结果在符号上与有关理论或经验相反。,5.,其他方法,第二节 异方差性,一、异方差的概念,二、异方差产生的原因,(一)数据质量原因,(二)模型设定原因,1,、因变量的测量误差,2,、省略某些自变量,3,、模型数学形式设定错误,4,、随机系数模型,5,、异常值的出现,三、异方差性的后果,1,、回归系数估计结果误差较大,2,、有关统计检验失去意义,3,、模型的预测失效,例:变量,X,、,Y,的部分数据如右表所示。,下面运用图示法进行分析模型是否存在严重的异方差现象。,从,Analyze,Regression,Linear,打开,Linear,线性回归主对话框,将自变量与
6、因变量分别选入相应框中。,点击,“,Plot,”,按钮,在新打开的对话框中,将,“,DEPENDNT,”,选,入,“,X,”,框中,,,将,“,*,ZRESID,”,选,入,“,Y,”,框中,.,点击,“,Continue,”,点击,“,OK,”,该图表明本回归模型存在严重的已方差问题。,方差,越来越小,第三节 自相关,一、问题和原因,(一,),自相关概念,各随机误差项之间不独立,则称其存在自相关或序列相关性。,(二)原因,1,、经济变量的惯性,2,、模型设定偏琦:省略解释变量的影响,3,、模型设定偏琦:错误的函数形式的影响,4,、滞后效应,5,、其他原因,二、自相关主要后果,很可能高估,R,
7、2,。,t-,检验与,F-,检验结果都变得无效。,其他,三、,杜宾,-,瓦森检验,检验误差序列正自相关性,D-W,检验区域图,一阶自相关,无法判断,无一阶自相关性,无法判断,一阶负自相关,粗略地说:当,D-W,指标在,2,附近,即可认为模型不存在明显的(一阶)自相关。,四、自相关诊断举例,自变量,X,与因变量,Y,如右表,所示。,从,Analyze,Regression,Linear,打开,Linear,线性回归主对话框,将自变量与因变量分别选入相应框中。,点击,“,Statistics,”,按钮,在新打开的对话框中选中,“,Durbin-Watson,”,,,点击,“,Continue,”,点击,“,OK,”,查,D-W,检验统计表知:,N=25(,样本容量,);k=1,(,自变量个数),d,L,=1.288,d,U,=1.454,由于,D-W,值为,0.353,,小于,d,L,,,所以认为存在一阶正自相关。,结 束,