马永政——异方差多重共线性自相关的总结.doc

资源描述

《计量经济学》中多重共线性、异方差性、自相关三者之间的联系与区别 ———经济121班马永政学号：1202010155 首先我们先来回顾一下经典线性回归模型的基本假设： 1、为什么会出现异方差性我们可以从一下两方面来分析：第一，因为随即误差项包括了测量误差和模型中被省略的一些因素对因变量的影响；第二，来自不同抽样单元的因变量观察值之间可能差别很大。因此，异方差性多出现在截面样本之中。至于时间序列，则由于因变量观察值来自不同时期的同一样本单元，通常因变量的不同观察值之间的差别不是很大，所以异方差性一般不明显。含义及影响: y=Xb+e，var(ei)var(ej), ij，E(e)=0，或者记为即违背假设3。用OLS估计，所得b是无偏的，但不是有效的。由于E(e)=0，所以有E(b)=b。即满足无偏性。但是，b的方差为其中 2、自相关产生的原因：（1）、经济数据的固有的惯性带来的相关（2）、模型设定误差带来的相关（3）、数据的加工带来的相关含义及影响: 影响：和异方差一样，系数的ls估计是无偏的，但不是有效的。 D－W检验（Durbin－Watson）其中是样本一阶自相关函数。直观上，有若，则；若，则；若，则检验正自相关 r>0 无结论不能拒绝H0: r＝0 dL dU 检验负自相关 r<0 无结论不能拒绝H0: r＝0 dL dU DW检验的缺点：只适用于一阶自相关。 3、多重共线性产生的原因：多重共线问题在金融数据中是普遍存在的，不仅存在于世间序列数据中，也存在于横截面数据中。具体而言，多重共线性产生的原因主要有以下几点：（1）、数据收集及计算方法（2）、模型从中取样的总体受到限制（3）、模型设定偏误此外，在观测值个数较少，以至于小于解释变量个数时，也会产生多重共线性；时间序列数据中，若同时使用解释变量的当期值和滞后值，由于当期值和滞后值之间往往高度相关，也容易产生多重共线性。含义及后果 1）完全的多重共线性如果存在完全的多重共线性（perfect multicollinearity），即在X中存在不完全为0的ai，使得 a1x1+…+aKxK=0 即X的列向量之间存在线性相关。因此，有Rank(X)<K，从而|X’X|=0，即b=(X’X)-1X’y不存在，OLS失效。也即违背了基本假设2。 2）近似共线性常见为近似共线性，即 a1x1+…+aKxK0 则有|X’X|0，那么(X’X)-1对角线元素较大。由于，，所以bk的方差将较大。因此根据上面的各种情况产生的原因我们从以下几方面来对比该三种情况之间的一些联系与区别，以便于找出它们之间的不同，更好地掌握每一种情况的具体表现。原因后果检验方法补救措施多重共线性 1. 经济变量之间具有共同变化趋势。 2. 在截面数据中，变量间从经济意义上具有密切的关联度。 3.模型中包含滞后变量。 4.样本数据自身的原因。完全：1、参数的估计值不确定 2、参数估计值的方差无限大不完全：1、参数估计值的方差增大 2、变量的显著性检验失去意义 3、区间估计和区间预测预测功能失效 4、参数估计量经济含义不合理 1、简单相关系数检验法 2、方差膨胀因子法 3、直观判断法 4、逐步回归检测法 1、经验方法 2、逐步回归法 3、岭回归法异方差性 1、模型设定误差 2、数据的测量误差 3、截面数据中总体各单位的差异参数估计式统计特性： 1、仍然具有线性性 2、仍然具有无偏性 3、仍然具有一致性 4、不再具有最小方差性参数显著性检验：使t统计量值变小。而且，异方差情况下，通常由OLS法得到的t统计量不再服从t分布，F统计量也不再服从F分布。t检验和F检验失去存在的基础。预测：会扩大估计区间和预测区间，降低精度。 1、图示检验法 2、Goldfeld-Quanadt检验 3、White检验 4、ARCH检验 5、Glejser检验 1、模型变换法 2、加权最小二乘法 3、模型的对数变换自相关 1、经济系统的惯性 2、经济活动的滞后效应 3、数据处理造成的相关 4、蛛网现象 5、模型设定偏误参数估计: 1、无偏性仍成立 2、不再具有最小方差性模型检验和预测： 1、参数显著性检验失效 2、区间预测和预测区间的精度降低 1、图示检验法 2、DW检验法 3、相关图和Q统计量 4、序列相关LM检验 1、广义差分法 2、科克伦－奥克特迭代法 3、一阶差分法检验方法基本方法特点多重共线性简单相关系数检验法： 1、简单相关系数 2、交叉相关系数 1、利用解释变量之间的线性相关程度去判断是否存在严重多重共线性。 2、相关系数计算的是两组样本的同期相关程度，交叉相关则可以表示不同期之间的相关程度。较高的简单相关系数只是多重共线性存在的充分条件，而不是必要条件。因此并不能简单地依据相关系数进行多重共线性的准确判断，可以结合交叉相关系数。方差膨胀因子法以为被解释变量，对其他解释变量做辅助回归。该辅助回归的可决系数为。（1）引入方差扩大因子，即；（2）度量了与其他解释变量的线性相关程度，这种相关程度越强，说明变量之间的多重共线性越严重，也就越大；方差膨胀因子越接近于1，多重共线性越弱。直观判断法根据经验判断： 1、当增加或剔除一个解释变量，或者改变一个观测值时，回归参数的估计值发生较大变化时，回归方程可能存在严重的多重共线性； 2、从定性分析认为，一些重要的解释变量的回归系数的标准误差较大，在回归方程中没有通过显著性检验，可初步判断可能存在严重的多重共线性； 3、有些解释变量的回归系数所带正负号与定性分析结果违背时，可能存在多重共线性； 4、解释变量的相关矩阵中，自变量之间的相关系数较大时，可能存在多重共线性；（1）参数估计值有很大的偶然性。（2）参数显著性检验未通过。（3）经济意义检验未通过。（4）相关系数大。逐步回归检测法将变量逐个的引入模型，每引入一个解释变量后，都要进行Ｆ检验，并对已经选入的解释变量逐个进行t 检验。当原来引入的解释变量由于后面解释变量的引入而变得不再显著时，将其剔除。（这是一个反复过程）当原来引入的解释变量由于后面解释变量的引入而变得不再显著时，就存在多重共线性。如果解释变量之间是高度相关的，则先前引入的解释变量可能会因为后来引入与之相关的解释变量而被剔除。检验方法基本方法特点异方差性图示检验法： 1、相关图形分析 2、残差图形分析 1、以X为横轴，Y为纵轴，画散点图，可以粗略地看到Y的离散程度与X之间是否有相关关系，以及Y与其样本均值的离散程度。 2、绘制出对的散点图，如果不随而变化，则表明不存在异方差；如果随而变化，则表明存在异方差。 Goldfeld-Quanadt检验将样本分为两部分；然后分别对两个样本进行回归；并通过计算两个子样的残差平方和的比来判断两子样的剩余平方和是否存在明显差异，以此为统计量来判断是否存在异方差。（1）适用于大样本；（2）检验递增型或递减型异方差；（3）只能判断异方差是否存在，在多个解释变量的情下，对哪一个变量引起异方差的判断存在局限；（4）该检验的功效取决于C，C值越大，检验功效越好；（5）两个子样回归所用的观测值个数如果不相等时，也可以用该检验，需要通过改变自由度和统计量的计算公式来调整；（6）当模型中包含多个解释变量时，应对每个可能引起异方差的解释变量都进行检验。 White检验构造残差平方序列与解释变量之间的辅助函数，通过判断辅助函数的显著性来判断原方程是否存在异方差。（一般而言，辅助回归的解释变量包括常数项、原模型中的解释变量、解释变量平方、其交叉乘积。）（1）要求变量的取值为大样本；（2）适用于各种类型的异方差检验；（3）不仅能够检验异方差的存在性，同时在多变量的情况下，还能判断出是哪一个变量引起的异方差；（4）辅助回归中可引入解释变量的相对于原模型的更高次幂；（5）在多元回归中，由于解释变量个数太多，可去掉辅助回归式中解释变量的交叉项。 ARCH检验在时间序列数据中，可认为存在的异方差性为ARCH过程，并通过检验这一过程是否成立来判断是否存在异方差。（1）变量的样本值为大样本；（2）数据是时间序列数据；（3）只能判断模型中是否存在异方差，而不能诊断出哪一个变量引起的异方差。 Glejser检验由OLS法得到残差，取得绝对值，然后将对某个解释变量回归，根据回归模型的显著性和拟合优度来判断是否存在异方差。（1）可用于各种类型的异方差检验；（2）由于异方差形式未知，因此需要进行各种测试；（3）不仅能对异方差的存在进行判断，还能给出异方差的具体形式；（4）该检验要求变量的观测值为大样本。检验方法基本方法适用情况/前提条件局限性自相关图示检验法图示法是一种直观的诊断方法，它是把给定的回归模型直接用普通最小二乘法估计参数，求出残差项，作为随机项的真实估计值，再描绘的散点图，根据图形来判断的相关性。 DW检验法根据公式计算DW的值，显著性水平，查得和，同时根据DW检验决策规则判断自相关状态；（1）解释变量X为非随机的；（2）随机误差项为一阶自回归形式，即，其中满足古典假定；（3）线性回归模型中不应含有滞后内生变量作为解释变量；（4）模型的截距项不为零；（5）数据无缺失项。（6）小样本（7）只能用于检验随机误差项具有一阶自回归形式的自相关问题。（1）DW检验有两个不能确定的区域，一旦DW值落在这两个区域，就无法判断。这时，只有增大样本容量或选取其他方法; （2）DW统计量的上、下界表要求n15，这是因为样本如果再小，利用残差就很难对自相关的存在性做出比较正确的诊断; （3）DW只能检验一阶自相关， DW检验不适应随机误差项具有高阶序列相关的检验; （4）只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量。相关图和Q统计量应用所估计回归方程残差序列的自相关和偏自相关系数，以及Ljung-Box Q - 统计量来检验序列相关。在方程工具栏选择View/Residual Tests/correlogram-Q-statistics 。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-Box Q统计量。当滞后期为p时，柱体没有超过虚线，表示p阶Q统计量都没有超过由设定的显著性水平决定的临界值，则接受原假设，即不存在序列相关。（此时，对应的自相关和偏自相关系数接近于0。）反之，当滞后期为p时，柱体超过虚线，表示p阶Q统计量超过由设定的显著性水平决定的临界值，则拒绝原假设，即存在序列相关，（前提：样本量较大）序列相关LM检验 LM检验（Breush-Godfrey LM检验）是构造拉格朗日乘数来检验高阶序列相关；而且在方程中存在滞后因变量的情况下，LM检验仍然有效。在方程结果窗口，View/Residual Tests/Serial Correlation LM Test，输入滞后期。根据AIC最小化确定滞后期（AIC值在序列相关LM 检验窗口中）。 F统计量表示辅助回归方程的整体显著性，而后面的Obs*R-squared 才是我们所重点观察的LM统计量（一般情况下，它统计量服从渐进的分布）。 10

展开阅读全文