资源描述
第三章 现代多元回归模型
Chapter3 现代多元线性回归模型
有了条件期望的知识,我们重新对第一章多元线性回归模型进行阐释。本章是伍书第4——6章内容的缩写。
§3.1正确设定下的多元回归
一、 关于模型
仍设模型基本形式(结构式)为:…,其中、为可观测或受到限制或不可观测的随机变量,与存在因果关系,且、的联合分布存在,是不可观测的随机误差,模型中等式是严格成立的,且它是条件期望的正确设定,则。
模型中设定有截距项(Unit),可认为中不再含有的影响(但中可能含有影响的其他因素)。当把投影到空间上时,为避免条件期望的麻烦,我们可以把的条件减弱假定模型和,。
注:如果某一,,即与相关。则称解释变量有内生性。内生性产生的原因是多方面的,在应用中,一般归结为三种方式:
(1)隐性解释变量(omitted)。不是有意遗漏的,客观实际存在的某些因素,但数据不可观测,如果不对模型加以处理,它们只能包含在随机误差项中。
(2)测量误差。数据获取有明显失误,数据不能做到准确测量,如自报数据,传递失误等。
(3)同时同步性。结果和原因的数据同时获取时,由与的相关性,导致某一与的相关性,即存在某一随机因素既影响也影响原因。如是犯罪率,而是警力。又如产出与投资,等等。内生性问题是我们在后面主要讨论的问题。
为了保证传统模型与基本模型的一致性,将其改写成向量形式:,记,且,。又假定我们可以获得个随机样本:,于是,对每一次观测,有,。括号表示第几次观测,不产生混淆时省略括号,按行排列,则也可认为是矩阵形式。
二、 关于一致估计
因为模型正确设定,现在对随机向量和随机误差给出假定:
假定OLS1:,。
假定OLS2:,即随机矩阵列满秩。
于是,由,得,两边取期望,根据假定、,求得真值:。
如果和可观测,则称未知参数是可识别的。由大数定律,利用样本矩估计代替期望值和,可得到的估计:
。又由,
。
由WLLN和连续映射定理及非奇异,得:
,和。
所以,即是的一致估计。
注:(1)现代回归模型的实质就是把结果投影到原因上,只要能随机从和中抽样,且满足假定、,得到的就是的一致估计。模型的背景,的含义无关紧要。只有当模型是正确设定时,的含义才是边际效果。
(2)如果不成立,即,一致性就不成立。且条件比正确设定条件要弱。即,则OLS1成立。
如果不成立,不可识别。于是解释变量线性相关,传统观点是存在多重共线性,则模型就不是正确设定的,因为有某一解释变量是完全多余的。
进一步,如果成立,那么。故OLS也是条件无偏的,又当认为是确定性的,不是随机的,这又回到了传统观点。
(3)现代回归模型没有限制与独立,允许与有联系,仅限制与,没有线性关系。因此,条件方差可以是的函数,但若限制与独立,则=即就与无关了,这也回到了传统观点。
三、关于渐近检验
完成了估计,接着就是检验。要检验就要知道统计分布,现代回归模型对和的分布没有任何规定。只有误差项的期望、方差存在有限和样本独立同分布的规定。所以现代回归模型采用大样本的渐近检验。我们要考虑渐近正态性。
,
由大数律,,。
又序列是来自随机变量母体的随机样本,故是,且有期望0(假定),进一步,假定有有限方差。那么由中心极限定理(CLT),则:
,其中,是k×k正定阵。所以(有界),从而
假定OLS3:。
注:,即与可分别取期望,不一定就与独立。其含义是与每一不相关。一个充分条件是,条件方差 与无关。
于是,由正态随机向量的线性变换定理,我们有如下结果:
,其中。
按照渐近理论的说法,此意味着具有渐近正态分布,且期望和方差分别为。未知,用残差,容易证明是的一致估计,故我们可得到的渐近方差估计。
假定OLS3不是本质的,不影响估计的一致性,只影响有效性和假设检验。当OLS3不成立的时候,即传统观点下的异方差假定,,那么的渐近方差估计是,但是B未知,由于,我们用OLS残差代替,可得到B的一致估计,。(习题)进而得到的渐近方差估计是:
。此称为异方差下稳健协方差估计。
矩阵中对角线元素的平方根称为的标准差,称为异方差稳健标准差。(也称White标准差)将异方差稳健标准差同OLS3条件成立时的标准差相比较,常放在的下方,可对异方差的严重性有一个初步认识。
有了一致估计和渐近分布,现代回归模型的假设检验问题同传统模型要检验的问题提法是一致的,在OLS1——3成立时,可直接用t和F检验。特别,对有关的部分参数为0的检验,仍可采用残差形式的F检验。具体做法为:
设,其中为列,为列。欲检验?
1.,得残差;
2.,得残差;
3.;
4。给出临界值,和给出值:。
注:现代观点在假设检验中更强调值的重要性,有了分布函数,计算值就很方便了,值既可以省掉查表找临界值,也可以自主地选择接受或者拒绝原假设,特别当值拒绝或接受比较敏感时,值能揭示更多的信息,促使我们进一步考虑V值,检验的势,或者用其他检验方法等,更全面的考察检验的效果。又上述过程用MATALAB编程非常方便。
但是当OLS3的条件不成立时,即传统观点下存在异方差或序列相关,则有关线性约束的检验问题,采用F检验就不适用了(why?),转而采用一般的Wald统计量:,。 。
当按传统模型处理,采用F检验没有把握时,建议按现代回归模型的方式采用W检验相互比较,使检验更加可信。现代观点的原则是,估计可以粗糙一些,但是检验必须通过。最好通过多种方式的检验,检验通不过模型一定不可取。检验通过了,模型中的估计才能有统计意义。特别,当要检验有关的部分参数为零的检验时,这是一种常见的检验。采用基于OLS方法的拉格朗日得分(LM)检验更为方便。
拉格朗日乘数(得分)检验的基本思想:
假设约束为,其中可以是的非线性函数,设秩,最大化对数似然函数:,由一阶条件:
;
。
求得约束条件下的对数似然函数估计。
统计思想:若约束有效,加入约束将不会导致似然函数最大值的显著不同,这意味着会是一个小量。特别,求得约束条件下,为已知,则将是一个小量,常称为得分,故。但是是一个向量,为便于检验,改成二次型的形式,使其成为标量。只要具有渐近正态性,特定的二次型就会有分布的形式。于是,可得拉格朗日检验统计量。可以证明:
。
于是对假设检验问题,可做LM检验,大的LM值拒绝。
特别当为线性约束,则LM统计量就有非常好的约化形式。
设约束条件为,且,得到对数似然函数是:
,。求得约束条件下的。再由,,令,,
则,。(习题)
注意,。(习题)
。称为非中心(不去均值)的。
所以,,欲检验?用拉格朗日得分检验十分方便。
因为如果命题真,则就是的。从而就是残差。
就是对做的,就是回归拟合值。故在3成立条件下LM检验的步骤为:
1.得残差,和残差平方和;
2.得拟合值,和残差平方和;
3.,;
4.临界值,值:。
但当3不成立,统计量就没有这么简单的处理方式,但仍可采用基于的方法,分析处理如下:
因为独立,故对数似然函数是:
。
是的一致估计,用残差平方作为的无偏估计,代入到似然函数中,得:
。
称为条件似然函数。特别约束为,得似然函数是:
。
求得约束极大似然解是。
令,其中。经过有点麻烦的运算,(Wooldrige 1991a)可得,。。其中,是的随机误差,是中每个分量,
的随机误差。于是,用残差代替随机误差,得LM统计量是:
。利用LM公式,可采用基于的方法处理。具体做法:, ?
1.对做,() 得残差;
2.把中每个分量,分别代替,对做,()并由此得残差,;(即中去掉与相关的贡献);
3.用同做内积,。并记;
4.再用常数项对做,()并得到残差平方和:
;
5.可以证明,。大的LM值拒绝,表示显著。
举例略。
§3.2内生性问题
数据和模型不一定满足OLS1和OLS2的条件,从而估计OLS就不能保证是一致的。因为现实经济中存在大量解释变量与误差项相关的情况,如前所述,我们把它们归结为:隐形变量、测量误差、同时同步性,统称为内生性问题。这是现代观点要处理的重要问题,解决的办法是,引入工具变量和二阶段最小二乘。
(一)建模遗漏或模型存在隐形的解释变量问题
设影响的原因有和,其中为建模中遗漏的或模型中潜在的未意识到的忽略因素,由于经济中影响结果的原因很复杂,这种现象是经常遇到的。为讨论简单,假设模型如果考虑了因素,则模型是正确设定的,那么有:
所以把投影到()上,有,且成立。不失一般性,(由于设定有常数项),设,但由于实际模型被忽略,故投影为:,且。但是不相关。若与某一Xj 相关,则,所以将对1,投影为,代入到正确设定的模型中得:
所以,若仅对()做投影,实际模型回归值有,故只要与X中某一因素相关,OLS在忽略下是有偏和不一致的。
例:设模型为,可以认为,因素能力abil不可观测,且与exper和不相关,仅与有关,于是,,所以,而和是一致估计。所以当,那么。即忽略能力因素会造成教育对工资增长率贡献的高估。
代理变量法:
意识到忽略因素产生的问题,如果能找到合适的代理变量(proxy variables),则可消除OLS的不一致性。代理变量Z是指,如果Z满足,含义是已知X和的条件下,Z与Y是不相关的,换句话说,如果可观测且不被忽略,那么Z相对于Y作为解释变量是多余的,例如,上例,是能力,令Z是毕业成绩单(),如果能力已知的话,则成绩单就无所谓了。
但是,代理变量Z的要求,这个条件过于苛刻,当我们的命题对被忽略的变量并不关心,那么,我们可以将条件减弱成:。含义是在上投影等价于在1,Z上投影,即与不相关。那么,一般认为(即Z与正相关),且,代入得,
,对回归可得到一致估计。于是,用代理变量Z做,仍可得到的一致估计。但是当代理变量Z选择的不是很好,,即与相关。那么,则就回不到的一致估计。不过,只要,采用代理变量Z,由于,所以。即使代理变量Z选择得不好,仍可以减少的渐近方差和有偏性。
注:1.有关代理变量,常选取因变量的时滞,如果效果变好,则说明有隐形变量存在。
2.我们也可以用多个代理变量,等来代替,要求是它们与不相关,
。
3.更复杂的情况是,忽略变量既影响,又影响某一,如:
,不再深入讨论了。
(二)测量误差问题
数据存在测量误差是不可避免的。尤其是宏观经济数据,是由多次传递、加总、平均、加工而得到的,有的甚至是自报的。我们把有问题的数据认为存在测量误差,问题的关键在于对测量误差怎么看?
如果因变量怀疑存在测量误差,,。这里是真实值,不可观测,可观测,那么本质上就是一个含有随机因素的数据,模型设定时,将随机因素放在方程左边或右边没有关系。因此,OLS和相应的和检验不受影响,只会影响估计的精度(方差增加)。
但当某个或某些解释变量存在测量误差,则可能导致OLS的不一致和有偏的严重后果。设,是真值,不可观测,,从而是正确设定。由于不可观测,把作为的代理变量看,那么应有,,此意味着一旦能确定,那么对没有影响。由,又模型设有常数项,可以认为。又认为是仅是与相关的内部误差,故如果假定,即。那么由是正确投影,得到。从而由
,且。所以,测量误差的存在同一样,增大随机误差项的方差,但是不会影响OLS的其他性质。
但是,如果假定,(变量中的典型误差,真值与不相关。含义是误差是其他因素造成的。)那么,,对回归,得。因为,所以,
,所以,而且的表达式非常复杂。例如:
如果不相关,,则不相关,于是将投影到上, ,令,那么可以推得:,,所以存在CEV的测量误差,会造成的低估或高估,即估计值的绝对值变小了,称为缩水偏差。并且如果与其他解释变量有更多的共线性,即越大,则缩水偏差越大,的估计越糟。同时,假设检验,命题假却接受了,大大增加了第二类错误的概率,出现伪回归。
注:如果有多于一个的解释变量存在测量误差,问题会变得更严重,几乎不能用。
(三)工具变量法与二阶段最小二乘(2SLS)
解释变量不论是隐形变量,还是测量误差,并由此导致的内生性问题是客观存在,其后果导致一致性不成立,本节引入工具变量以消除或减轻内生性问题,达到一致性效果。特别是二阶段最小二乘,它是方法的直接推广,计算方便,同时回归模型的适用范围大大扩大了。先看一个简单情形:
设模型:满足。怀疑存在测量误差,。我们希望选择一个可观测的变量Z1 ,当它代替时,应当满足条件:(1),即二者不相关,否则选择Z1 也不满足条件;(2)将在所有和Z1 上投影,应当有,否则选择Z1 代替意义不大。于是,且。通俗的理解为Z1 与不相关,且与高度相关。
将(2)代入(1)中,得: (3),这里,且。于是可得到OLS,但当不可观测,或者Z1 选择不好,使得,则无法得到或偏差太大,我们仍然不能得到模型(1)中的估计,这样的问题我们称为可识别问题(identification problem)。
一个完全由可测量的外生变量表达的线性式,称为显式(reduced form);一个不能完全由可测量的外生变量表达的线性式称为结构式(structural form)。显式前的回归系数称为显式参数,结构式前的回归系数称为结构参数。
一般,结构参数是赋予经济意义的,但是我们只能对显式(3)进行回归,得到显式参数的估计,这就有一个如何从显式参数得到结构参数,并保证结构参数估计有良好的统计性质。这个问题,称为系统可识别问题,我们将在联立性问题中统一加以讨论。
基于上述讨论,将工具变量法叙述为:
设,怀疑存在测量误差,选择工具变量代替,令,假定1:;(相当于)2:秩。(相当于)那么,,取期望、移项有:。根据大数定律,从母体中抽取次独立样本,可得到的一致估计,,称为的估计或记为。
注:(1)意味成立,(2),意味秩。故是可识别的必要条件。操作上只要对回归,采用简单的检验即可。由于条件没有规定,建议对(2)式采用异方差稳健标准差做检验。
(2)工具变量法的统计思想是,通过增加与解释变量相关和随机误差不相关的外生信息来取代有“问题”的解释变量,保证成立。因此,,没有问题,就选择,这就是;当已知,就选择,这就是。
设;,所以
。即是渐近正态的。又令为估计的残差,那么,可以证明,和是的一致估计。(习题)
例:同上例,去除解释变量能力abil,用教育educ代替,原模型改写成:,那么中包含有,所以,即有内生性。引入母亲的教育程度作为工具变量,则要求,毫无疑问能得到满足,但是则难以满足。因为和是偏相关的。但是,如果换上某人的身份证号最后几位,作为工具变量,问题则正好相反,显然有保证,但则不能保证。
上例说明,寻求一个好的工具变量代替一个有问题的内生性解释变量并不容易,因为工具变量的两个要求(1)、(2)在现实中往往是冲突的。这也是信息不完全要付出的代价。解决的办法自然想到用多个工具变量。产生的问题是的逆不存在。
多工具变量与二阶段最小二乘法:
模型,,,有内生性。令是的工具变量,满足:,
那么,由工具变量的定义知,的每一个且任何线性组合也是的工具变量,即,满足:。它们构成的工具变量线性类。问题是选择哪一个工具变量代替?
当然选择与最相关的。暂时把理论放后,先介绍具体做法如下:
(1) on ;即对做,得到拟合值,;
(2) on 。即再对做,得到参数估计,称为2SLS。
注:1)(1)称为第一阶段回归,(2)称为第二阶段回归。第一阶段一定要把其余无测量误差的解释变量放入回归中,否则,2SLS可能是不一致的。
2)为保证第二阶段具有可识别性,在第一阶段中,对回归模型要做假设检验:。这是模型部分系数为零的检验,可用检验或者和检验,一般而言,值小于10,则认为Z为弱工具变量。特别当取离散值,建议采用不成立的检验方法。
3)实质是一种工具变量法,其核心是合适的选择工具变量集,找到对测量误差变量的工具变量集的线性组合来代替。这与选择的有关,多少增加了人为的因素,不同工具变量的选择得到的不一定是一样的,这与不同,但是的一致性和渐近正态性是有保证的。
以下说明方法其实就是工具变量法:
选择多工具变量向量,抽样N次,得多工具变量矩阵仍记为,则第一阶段得:,
令,得第二阶段的为。
由工具变量法,把作为的新的工具变量,。则的IV估计为。注意对称幂等,且是一个到的投影矩阵,即,。所以,。所以,
,所以,。
对忽略(不可观测)变量的多指标处理:
对忽略变量模型:,。由于不可观测,将放入误差项中,,模型实质成为: 。不妨设导致产生了内生性,。考虑选择既满足代理变量要求又满足工具变量要求的向量集:
1.;满足代理性。
2.;;满足工具性。
那么,用方法可得到的,它是一致的和渐近正态的。
换一个思路。如果我们有反映的两个以上的指标,和可测,其中有一个满足代理条件:,。这意味着是一类典型测量误差CEV。如果,将直接代替,,代入到原模型,直接用OLS,是可识别的。
一般情况下,假定(否则,不相关,则选择为代理变量没有意义),于是将代入到原模型。代入后的模型中,和 必相关,从而与 相关。所以用代理变量法得到的估计不一致。为保证一致性,我们需要一个替代的工具变量,设对指标有:,且进一步,(,从不同角度反映的性质)从而,作为原模型的代理变量的模型为:
因为,与,不相关,且和不相关,可作为的工具变量。于是采用2SLS方法,可得到一致的2SLS,不过由于不可知,不可识别,但是有意义的。
注:1)隐形变量的系数不可识别是可以理解的,这种对隐形变量问题采用的工具变量法称为多指标的解,在实际中有广泛应用。
2)多指标解同直接把放入到误差项中的工具变量解的重要区别在于,当我们把放入到误差项中,我们必须在中决定哪些解释变量同相关,然后我们找相应工具变量替代它们,这是件麻烦事。而多指标解过程,我们不需要在中找到哪些变量与相关,只要把作为的代理变量,作为的工具变量即可。(请自己写出的步骤)
注:方法与方法的比较:
由于,(有偏)不一致,但它的标准差较小;渐近无偏、一致,但它的标准差较大。这意味着的有效性比的有效性差,特别,当工具变量选择得不好,与内生性变量只有很弱的相关性,即很小,且工具集与误差项,那么IV是不一致的,估计效果很差。因此,不论是否有内生性,只要假设检验接受的外生性,就用,而不用,而一旦有内生性,则不可取,我们只能损失估计的有效性,保证一致性,转向用。
§3.3 的理论
本节一般的对理论做一个系统介绍。
模型:把分块写成,,, 两部分。其中为外生性部分,为有内生性部分。适当的选择工具变量集,是一个向量(),且中包含,(常数项和外生变量部分必须包括在工具集中),除非是空集,否则至少要从系统外部获取多于怀疑有内生性的变量的个数的可观测变量(系统可识别的阶条件)。
假定:1:垂直性条件;
2:秩列满秩条件; 秩可识别条件;
3:,同方差条件。
则是一致的,渐近正态的,相对有效的估计。
证明:当,。则1就回到1,且2回到2。
当且有和2的列满秩条件,令,是LK矩阵,由秩,所以秩,令,则秩。注意的每一列实质是把相应的每一列投影到上,此意味着每个对做。即做第一阶段的回归。所以,对做,得就是做第二阶段的回归。
我们先说明是一个估计。
因为可作为的工具变量,对,得。
将写成,则
。。
所以, 。因为,
,
,
所以,取样次,得随机样本。从而有:
。由大数定律、连续映射定理,是的一致估计。写成抽样后的矩阵形式就是。(不必记忆)
又,
(注意:,。 习题。)
所以在2SLS3假定之下,是渐近正态的。
又,已知的工具是,。设是任何其他以为线性组合的估计,的工具是,。要证:是半正定的。由正定矩阵的性质:正定,正定,且半正定,则半正定。由列满秩条件,和是正定的,故要证,半正定即可。,。
。所以,
半正定。这里是对做回归的残差。所以在给定工具集的线性估计类中是渐近有效的。
又,是一特殊的估计,所以,残差,且是的一致估计。将上述讨论总结为如下定理:
定理:在假定1—3之下,是一致、渐近正态的,且有零均值,方差矩阵,且在以为线性工具的变量类中是有效的。又规定,的残差(),(注意,不是)则是的一致估计。 第个分量的标准差就是矩阵的第个对角线元素的平方根。
注:如果2SLS3假设不成立,那么异方差稳健协方差估计就是。
下一个问题是工具变量法要求被怀疑的解释变量是可观测的,对不可观测的忽略解释变量,如何运用工具变量法?我们有广义工具变量定理:
广义工具变量定理:
模型,不可观测。如果可写成,其中变量w可以观测,形式已知,是未知参数(例如是的线性函数)。如果我们能得到未知参数的一致估计,那么用可一致估计,即用做为的广义工具变量,且当=0,时,那么用代替对原模型的估计是渐近一致的。(详细的讨论参见伍德里奇中文版P98——101)
再一个问题是,尽管或方便自由,且有良好的统计性质。是不是选择工具变量越多越好?这个问题有点微妙,多的工具变量当然能更好的保证估计的一致性效果,但会增大估计的标准差。特别工具变量选择不好,标准差很大,有限样本下估计有偏,几乎没什么用。 因此,我们需要对工具变量进行筛选。(详细的讨论参见伍德里奇中文版P86——89)
§3.4存在内生性的假设检验
在有了和有了之后,究竟用还是用?这需要通过假设检验来判断。
(1)内生性问题的检验
设是模型的不同估计,是模型不同估计下的协差阵。理论上,豪斯曼(Hauseman 1978)证明了:(证明略)
。有了这个分布,可做检验:
。
不能拒绝H0 ,表示整体不存在内生性,采用OLS 方法,拒绝H0 ,表示中至少有一个解释变量存在内生性。
但是这个方法,往往存在奇异性,这需要通过麻烦的求广义逆的计算方式。Hauseman(1983)又提出了一个基于回归形式的方便的内生性检验方法。
为要抓住检验的思路,考虑仅有一个变量具有内生性的情况:
设,我们怀疑变量 有内生性,选择工具变量,使得,且中至少有一个不在中的元与是相关的。那么,对回归,,满足。则,
,因为是工具变量,故与不相关。所以 是内生的。将改写成,且。因此是外生的。
,由与和不相关,满足条件OLS1和OLS2。于是我们可以做检验,或检验,。但是,不可观测,依据广义工具变量定理,我们用残差代替是的一致估计,那么对,可以进行检验,。如果拒绝原假设,就认为有内生性。我们就采用估计,否则,采用估计。
注:在异方差稳健假定下,只怀疑一个变量有内生性,可选用异方差稳健标准差构造统计量进行检验,检验步骤:
(1)对回归,得残差;
(2)对回归,;
(3),做检验。(用异方差稳健标准差)
容易推广到怀疑有多个解释变量有内生性的情形,设 有个可能的内生性变量,,设是工具变量,,且至少包含个不在Z1 中的外生变量。那么检验步骤是:
(1)中每一变量对Z做回归,得,和残差;
(2)再对做假设检验;
(3) 用残差形式的检验,拒绝表示至少有一个存在内生性。
另外,也可采用LM检验方法,步骤也很简便:
(1)做OLS,得残差;
(2) 同上(1),得;
(3)再对回归,得的决定系数;
(4)真,则。
又异方差假定下,条件不成立,那么,视,,再参照第一节所述异方差假定下的检验,采用Wald统计量,或LM统计量。做假设检验。
(2)过渡识别检验
我们需要对选择的工具变量的外生性进行检验。,设工具集,其中中外生变量的个数大于中个可能怀疑的内生性变量个数,为要检验, 步骤为:
(1)用对做,得残差;
(2) ,得决定系数;
(3)3成立下,。
拒绝,说明工具变量的外生性有问题,应当重新选择工具变量。例如从中减少工具的个数。但当工具的个数减到接近或等于个,不能拒绝,有可能存在很低的势。即假,接受。犯第二类错误的概率很大。
3不成立之下,检验过程要麻烦些:在已得的基础上,
(4) ,得拟合值;
(5)从中任取个子集, 、,得残差;
(6)与做内积;
(7)1 ,得;
(8)。
拒绝,表示作为工具集不合适。
注:当工具集的个数不是很大,过度识别的检验意义不是很大。
其他的检验方法:函数形式的检验(检验)、异方差的检验等相对不重要。因为函数形式和异方差客观总是存在的,关键是影响程度的大小。除非特别需要外,例如:OLS和2SLS都不理想,样本容量又不能增加,那么检验函数形式或检验异方差性尝试采用广义最小二乘GLS来提高有效性,有关GLS我们在联立方程模型中,统一介绍。(参见伍德里奇中文版P106——110)
(3)的假设检验
1.的单参数的假设检验问题同是一样的,仅需说明,在3不成立之下,标准差需要做如下调整:
已知1—3成立下,第个分量的标准差就是矩阵的第个对角线元素的平方根,且,记成“”。然后,将所得的每一个解释变量,,对的其余的解释变量,,做偏回归,得残差。同时定义。最后的调整后的标准差为。
2.对于整体性或部分系数为零的检验问题,1—3成立,用也不能简单的用检验,因为分布不再成立,但我们希望有一个类似于那样的,基于残差表达的类型的检验,这里给出检验的步骤:
,有列,包含常数项,有列,且和 都可能有内生性解释变量,没有关系。设是有个工具变量集,有。检验:
(1)对做,并由此得到残差向量和;
(2)和得拟合值:和;
(3)对做,记残差平方和为;又对做,记残差平方和为;
(4)当为真,
。
注:不可用普通的统计量,它没有已知的极限分布。
用得分检验也很方便,步骤如下:
(1)对,如果中没有内生性变量,就做;如果中有内生性变量,就以为工具做,得残差;
(2)和得拟合值:和
(3)对做,得到非中心判定系数;
(4)。
3不成立之下的检验:
同方法类似,不过统计量中渐近方差矩阵的估计改成,,有限样本时再乘上作为自由度的调整,这里,是残差,。
3不成立之下用检验更方便:
(1)残差和拟合值和如前述;
(2)中每个分量, ,得残差;
(3) ,得残差平方和;
(4)。
例1:同上例,。用作为的代理,怀疑有内生性。选择的工具集是父母亲的教育和丈夫的教育:、、。做,那么,(1) 1、、、、
、,得和残差;(2) 1、、、得估计:。得到教育对工资增长率的贡献为,标准差为0.022。而方法估计的结果是10.7%,标准差为0.014。但Hausman检验的结果: 1、、、和,得,。给,则拒绝。故内生性存在,选择估计。方法存在教育对工资增长率的高估。(习题,参见伍德里奇中文版P82)
例2:自然实验与工具变量的选择。如何寻找有效的工具变量?我们知道,解释变量有内生性,那么,作为它的工具集要求与高度相关,且与误差项不相关。所谓自然实验指的是,它不是研究者有计划安排的社会事件。于是,该事件与我们研究的问题是没有直接联系的,故可认为这个(社会事件中发生的某项纪录)与无关,如果这个纪录与有关系,那么,就是一个很好的工具。
例如,警力与犯罪率互为因果,故“警力规模”作为解释变量具有内生性。Steven Levitt
(1997),在《美国经济评论》发文,选择“市政选举时机”作为工具变量来识别警力对犯罪率的影响。这里“市政选举时机”就是一个自然实验。显然选举期与误差项不相关,但与警力规模密切相关。因此,经理规模变化的那部分恰恰就反映了警力的外生性变化而不受到犯罪率的影响。
又如,joshua Angrist(1990),同样在《美国经济评论》发文,他考察美国越战老兵的入伍经历对他日后工资的影响。建立的模型是:
这里为工资有三个下标,是组标、是时标、是个标。是同组的工资效应;是同时的工资效应;为关注的越战老兵的工资效应,是虚拟变量表示个体是否在越战中服役。问题是“应召入伍”不是一个随机样本,是一个复杂的自我选择的过程。其中有太多不可观测的因素存在,且这些因素也同时影响工资。一般而言,那些在市场上选择机会不多,工资又少的人更可能应征。因此具有明显的内生性,用方法会造成的“缩水”。
自然实验选择的是当时的“抽签”征兵制度。该制度对19—26岁男公民按生日分配一个随机号,那一年的门槛号是195,即凡是低于195的公民将应征。于是选择小于门槛号的随机数作为虚拟变量作为的工具变量。它与是强相关的,但同时抽签号是一个随机号,它与工资水平是无关的。结果表明,白人老兵的工资水平大大低于没有服过兵役的白人,差距约为3500美元。而对非白人组群则没有显著性。(具体推导略,有兴趣的学生请参阅相关文献。)
例3.
注:自然实验方法常与政策评价联系在一起,样本常是独立但不同分布的。政策评价通过跨时的虚拟变量和分组加以对比,最简单的是设定控制组和实验组,类似于方差分析。
第四章小结:
本章(伍书4、5、6三章)是基础性的,理论上应掌握以下要点:
1.正确设定下的多元回归模型
第一节是以后讨论问题的缩影。基本提法是:依据数据特点给出模型、假定、估计、方法、性质、和检验。
1.模型:;
2.假定:OLS1 ;
OLS2 秩(按惯例,也记成);
OLS3 ,且;
3.真值;
4.抽样,,
得,即是一致估计;
5.性质:,其中,。
又当成立时,。
;又为主对角线第元素的平方根,称为的标准差。
。又为主对角线元素的第平方根,称为的异方差稳健标准差。
6.假设检验:
(1)当OLS1——3成立时,用t、F检验或LM检验;
(2)当OLS3不成立,用W检验,部分系数为零的检验用LM检验更方便。
2.内生性问题
1.隐形变量(omitted variables)
,如果与不相关,则忽略,方法不会影响估计的一致性,只会影响估计的精度。但若与中某一变量相关,。那么产生内生性,OLS有偏,不一致。选择代理变量,要求:,则OLS是一致的,否则只能减轻有偏性,提高精度。
2.测量误差(measure error)
如果有测量误差,方法无实质影响,只是增加估计的方差;
如果某一解释变量存在测量误差,:
(i)当,把加入到中,方法没有实质影响。
(ii)当,(CEV)则方法有偏、不一致(低估)。
3.工具变量(instrument variables)
要求:,秩,秩,且可观测。
4.二阶段最小二乘()
,怀疑部分有测量误差,选择工具集;
1) ,得;
2) 、,得。
不可观测变量的多指标解:
1)选择其中某一工具变量作为的代理变量;
2)再把和其余的工具变量作为的工具变量,做。
5.内生性假设检验---豪斯曼检验
(1),怀疑部分有个内生性变量,,选择工具变量,且中至少包含个不在中的外生变量;
1)on ,,得广义工具变量;
2)on 、、,;
3),用残差形式的F检验。不能拒绝,表示不存在内生性,采用方法;拒绝,采用方法。还可进一步分析中哪些变量存在内生性。
(2)过度识别检验;
(3)下的参数检验;
(4)工具变量选择——自然实验方法。
25
展开阅读全文