1、第五讲第五讲内生性内生性 OLS OLS经典假设经典假设 所有的解释变量所有的解释变量X Xi i与随机误与随机误差项彼此之间不相关。差项彼此之间不相关。若解释变量若解释变量Xi和和ui相关,则相关,则OLS估计量是非一估计量是非一致的,也就是即使当样本容量很大时,致的,也就是即使当样本容量很大时,OLS估估计量也不会接近回归系数的真值。计量也不会接近回归系数的真值。当解释变量和随机误差项相关时,模型存在着当解释变量和随机误差项相关时,模型存在着内生性内生性问题。问题。n n在计量经济学中,把所有与扰动项相关在计量经济学中,把所有与扰动项相关的解释变量都称为的解释变量都称为“内生变量内生变量”
2、。这与。这与一般经济学理论中的定义有所不同。一般经济学理论中的定义有所不同。n n1。与误差项相关的变量称为。与误差项相关的变量称为内生变量内生变量(endogenous variable)。n n2。与误差项不相关的变量称为。与误差项不相关的变量称为外生变量外生变量(exogenous variable)。n n造成误差项与回归变量相关(内生性)的原造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:因很多,但我们主要考虑如下几个方面:n n遗漏变量偏差遗漏变量偏差n n变量有测量误差变量有测量误差n n双向因果关系双向因果关系。遗漏变量偏差遗漏变量偏差n变量有测量误差
3、变量有测量误差n n测量数据正确时:假设方程为:测量数据正确时:假设方程为:测量数据正确时:假设方程为:测量数据正确时:假设方程为:当存在测量误差时:方程为:当存在测量误差时:方程为:所以我们有:所以我们有:可知,误差项中包含可知,误差项中包含所以可以得到:如果所以可以得到:如果则回归结果有偏,非一致则回归结果有偏,非一致我们假设我们假设则有则有结论:结论:1。由于。由于 2。回归的性质决定于。回归的性质决定于w的标准差的标准差 n双向因果关系双向因果关系n n之前我们假定因果关系是从回归变量到因变之前我们假定因果关系是从回归变量到因变量的量的(X导致了导致了Y)。但如果因果关系同时也。但如果
4、因果关系同时也是从因变量到一个或多个回归变量是从因变量到一个或多个回归变量(Y导致导致了了X)的呢?如果是这样的话,因果关系是的呢?如果是这样的话,因果关系是向前的也是向前的也是“向后向后”的,即存在双向因果的,即存在双向因果关系,如果存在双向因果关系,则关系,如果存在双向因果关系,则OLS回归回归中同时包含了这两个效应,因此中同时包含了这两个效应,因此OLS估计量估计量是有偏的、非一致的。是有偏的、非一致的。可以推导出:可以推导出:检验方法:豪斯曼检验检验检验方法:豪斯曼检验检验n n豪斯曼检验(豪斯曼检验(Hausman specification test)n nH0:所有解释变量均为外
5、生变量。:所有解释变量均为外生变量。n nH1:至少有一个解释变量为内生变量。:至少有一个解释变量为内生变量。quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age)est store iv hausman iv ols,若,若 Hausman 检验失效(检验统计量为负值)检验失效(检验统计量为负值),则使用,则使用dmexogxt,否则仍,否则仍Hausman检验检验为主。为主。使用Davidson-MacK
6、innon检验n nxtivreg 后后 使用使用 dmexogxtn n*Davidson-MacKinnon(1993)检验检验*H0:OLS 和和 xtivreg 都是一致的,即内生都是一致的,即内生性问题对性问题对OLS的估计结果影响不大的估计结果影响不大 xtivreg tl size ndts tang(npr=tobin L1.npr),fe dmexogxtn nDavidson-MacKinnon检验得到检验得到F统计量的统计量的P值小于值小于0.05,代表有内生性,代表有内生性n n遗漏变量偏差遗漏变量偏差可采用在多元回归中加入遗漏变可采用在多元回归中加入遗漏变量的方法加以
7、解决,但前提是只有当你有遗漏量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。变量数据时上述方法才可行。n n双向因果关系偏差双向因果关系偏差是指如果有时因果关系是从是指如果有时因果关系是从X到到Y又从又从Y到到X时,此时仅用多元回归无法消时,此时仅用多元回归无法消除这一偏差。同样,除这一偏差。同样,n n变量有测量误差变量有测量误差也无法用我们前面学过的方法也无法用我们前面学过的方法解决。解决。n n因此我们就必须寻找一种新的方法。因此我们就必须寻找一种新的方法。二、内生性的解决方案二、内生性的解决方案 n n事实上,仅仅为了解决内生性问题,并不需要我事实上,仅仅为了解决内生
8、性问题,并不需要我们对内生性问题的缘起有很深入的理解。对于应们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言,我们只需要掌握解决内生用型的实证研究而言,我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案性问题的具体方案即可。内生性问题的解决方案一共四种,理论上来讲,这四种方案应对内生性一共四种,理论上来讲,这四种方案应对内生性问题都很有效。但于我个人而言,我对四种方法问题都很有效。但于我个人而言,我对四种方法的评价是有高低的,由高到低分别介绍如下。的评价是有高低的,由高到低分别介绍如下。n n1.自然实验法自然实验法n n所谓自然实验,就是发生了某些外部突发事件,使得
9、研究所谓自然实验,就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组。对象仿佛被随机分成了实验组或控制组。n n这是我最喜欢的方法,只是自然实验需要寻找一个事件,这是我最喜欢的方法,只是自然实验需要寻找一个事件,并且这个事件只影响解释变量而不影响被解释变量。遇着并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分,还要能识别出来,这对学者的眼光这种事件是一种缘分,还要能识别出来,这对学者的眼光也是一种挑战。也是一种挑战。n n有很多文章声称使用了自然实验,但严格来讲,并没有做有很多文章声称使用了自然实验,但严格来讲,并没有做到对研究对象进行了随机分组。虽然如
10、此,我对此类文章到对研究对象进行了随机分组。虽然如此,我对此类文章仍然很是喜欢。仍然很是喜欢。n nn n自然实验包括的要素有自然实验包括的要素有:一个政策措施一个政策措施(treatment),(treatment),一个观察到的结果一个观察到的结果(outeome),(outeome),一个对照组一个对照组(contorlgoruP)(contorlgoruP)。在评估。在评估“政策措施政策措施”对对“结果结果”是否发挥作用时是否发挥作用时,对照组充当一个参照系。而一个对照组充当一个参照系。而一个“准自然实验准自然实验”和自然实验的区别在于处理组和和自然实验的区别在于处理组和对照组的选取是
11、否随机。对照组的选取是否随机。n n这里的这里的“结果结果”是以受政策影响的县和没有受政是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。策影响的县之间在增长速度上的差异来衡量。n n简单连接改革措施和被直管县绩效的做法并不恰简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济当。这样的做法无法排除其他政策或是整体经济的影响的影响,因而是无法衡量改革真实效果的。因而是无法衡量改革真实效果的。172.双重差分法双重差分法 n nDifference-in-DifferenceDifference-in-Difference (DIDDID)一般称
12、为双重差分一般称为双重差分法,或倍差法。倘若出现了一次外部冲击,这次冲击影响法,或倍差法。倘若出现了一次外部冲击,这次冲击影响了一部分样本,对另一部分样本则无影响,而我们想看一了一部分样本,对另一部分样本则无影响,而我们想看一下这次外部冲击到底有何影响,双重差分法就是用来研究下这次外部冲击到底有何影响,双重差分法就是用来研究这次冲击的净效应的。这次冲击的净效应的。n n其基本思想是,将受冲击的样本视作实验组,再按照一定其基本思想是,将受冲击的样本视作实验组,再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组,而标准在未受冲击的样本中寻求与实验组匹配的对照组,而后做差,做差剩下来的便是这次
13、冲击的净效应。后做差,做差剩下来的便是这次冲击的净效应。n n双重差分法实际上是固定效应的一个变种,差分的过程实双重差分法实际上是固定效应的一个变种,差分的过程实际上是排除固定效应的过程。际上是排除固定效应的过程。ZERAZERA在在计量论文写作和计量论文写作和计量论文写作和计量论文写作和发表的黑客教程发表的黑客教程发表的黑客教程发表的黑客教程有一个非常简明风趣的举例,我转述于有一个非常简明风趣的举例,我转述于此,以飨读者。此,以飨读者。19Difference in difference modelsn nMaybe the most popular identification strat
14、egy in applied work todayn nAttempts to mimic random assignment with treatment and“comparison”samplen nApplication of two-way fixed effects model 20Problem set upn nCross-sectional and time series datan nOne group is treated with interventionn nHave pre-post data for group receiving interventionn nC
15、an examine time-series changes but,unsure how much of the change is due to secular changes21Difference in difference modelsn nBasic two-way fixed effects modeln nCross section and time fixed effectsCross section and time fixed effectsn nUse time series of untreated group to establish what would have
16、 occurred in the absence of the interventionn nKey concept:can control for the fact that the intervention is more likely in some types of states22Three different presentationsn nTabularn nGraphicaln nRegression equation23Difference in DifferenceBeforeBeforeChangeChangeAfterAfterChangeChangeDifferenc
17、eDifferenceGroup1Group1(Treat)(Treat)Y Yt1t1Y Yt2t2 Y Yt t=Y=Yt2t2-Y-Yt1t1Group2Group2(Control)(Control)Y Yc1c1Y Yc2c2 Y Yc c=Y=Yc2c2-Y-Yc1c1DifferenceDifferenceY Y Y Yt t Y Yc c24timeYt1t2Yt1Yt2treatmentcontrolYc1Yc2Treatment effect=(Yt2-Yt1)(Yc2-Yc1)25Key Assumptionn nControl group identifies the
18、time path of outcomes that would have happened in the absence of the treatmentn nIn this example,Y falls by Yc2-Yc1 even without the interventionn nNote that underlying levels of outcomes are not important(return to this in the regression equation)26Basic Econometric Modeln nData varies by n nstate(
19、i)state(i)n ntime(t)time(t)n nOutcome is YOutcome is Yit itn nOnly two periodsn nIntervention will occur in a group of observations(e.g.states,firms,etc.)27n nThree key variablesn nT Tit it=1 if obs i belongs in the state that will =1 if obs i belongs in the state that will eventually be treatedeven
20、tually be treatedn nA Ait it=1 in the periods when treatment occurs=1 in the periods when treatment occursn nT Tit itA Ait it -interaction term,treatment states -interaction term,treatment states after the interventionafter the interventionn nYit=0+1Tit+2Ait+3TitAit+it28Yit=0+1Tit+2Ait+3TitAit+itBef
21、oreBeforeChangeChangeAfterAfterChangeChangeDifferenceDifferenceGroup1Group1(Treat)(Treat)0 0+1 1 0 0+1 1+2 2+3 3 Y Yt t=2 2+3 3Group2Group2(Control)(Control)0 0 0 0+2 2 Y Yc c=2 2DifferenceDifferenceY=Y=3 329More general modeln nData varies by n nstate(i)state(i)n ntime(t)time(t)n nOutcome is YOutco
22、me is Yit itn nMany periodsn nIntervention will occur in a group of states but at a variety of times30n nui is a state effectn nvt is a complete set of year(time)effectsn nAnalysis of covariance modeln nYit=0+3 TitAit +ui+t+it31n nGroup effects n nCapture differences across groups that are Capture d
23、ifferences across groups that are constant over timeconstant over timen nYear effectsn nCapture differences over time that are Capture differences over time that are common to all groupscommon to all groups32其中,其中,d 就是双重差分估计量,就是双重差分估计量,Y 为研究的结局为研究的结局变量,右侧脚标中变量,右侧脚标中 treatment 和和 control 分布代表分布代表干预组和
24、对照组,干预组和对照组,t0 和和 t1 分别代表干预前和干预分别代表干预前和干预后。构造了差分估计量之后,就要根据不同的数后。构造了差分估计量之后,就要根据不同的数据类型和不同的结局变量据类型和不同的结局变量 Y,分别选用相应的参,分别选用相应的参数检验方法来进行建模数检验方法来进行建模。(1)适 用 于 独 立 混 合 横 截 面 数 据33独立混合横截面数据是在不同时点从同一个的独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样,将所得的数据大总体内部分别进行随机抽样,将所得的数据混合起来的一种数据集。该类数据的特点为每混合起来的一种数据集。该类数据的特点为每一条数据都是
25、独立的观测值。通过将不同时点一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来,从而可以加大样本量的多个观测值结合起来,从而可以加大样本量以获得更精密的估计量和更具功效的检验统计以获得更精密的估计量和更具功效的检验统计量量;也可加入新的变量也可加入新的变量时间时间(即干预前后即干预前后),以便判断干预前后的差别。对于总体一致、,以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的调查研究,多收范围较大、涉及不同时间点的调查研究,多收集此类数据集此类数据343536(2)适用于综列数据面板数据的 DID 模型37面板数据要求在不同时点调查相同的研究对象面板数据要求在不同时点
26、调查相同的研究对象。它与独立混合横截面数据最大的不同在于,。它与独立混合横截面数据最大的不同在于,不同时点的观测值并不是独立分布的不同时点的观测值并不是独立分布的。这类数据的特点在于。这类数据的特点在于:由于研究的个体相同,由于研究的个体相同,一些不随时间改变的不可观测的因素一些不随时间改变的不可观测的因素(如个如个人特质等人特质等)对不同时点的观测值会产生影响,对不同时点的观测值会产生影响,可以通过控制这些影响从而得到较为真实的结可以通过控制这些影响从而得到较为真实的结果果;383940由于一般大规模的人群调查存在较大由于一般大规模的人群调查存在较大的变异性问题,仅在模型中纳入虚拟的变异性问
27、题,仅在模型中纳入虚拟变量变量“分分 组组(A)”、“时时 间间(T)”是远是远远不够的。为了提高解释系数远不够的。为了提高解释系数 R2,需,需要加入其他可能影响被解释变量的因要加入其他可能影响被解释变量的因素,即控制除分组、时间变量以外的素,即控制除分组、时间变量以外的其他变量。其他变量。n nssc install diffhelp diffn ndiff y,t(treated)p(t)robustn n如果有控制变量,可以利用cov()添加41n n工具变量工具变量(instrumental variable,IV)回回归是当回归变量归是当回归变量X与误差项与误差项u相关时获得总相关
28、时获得总体回归方程未知系数一致估计量的一般方法。体回归方程未知系数一致估计量的一般方法。我们经常称其为我们经常称其为IV估计估计。n n其其基本思想基本思想是:假设方程是:是:假设方程是:我们假设我们假设ui与与Xi相关,则相关,则OLS估计量一定是估计量一定是有偏有偏的和的和非一致非一致的。的。工具变量估计工具变量估计是利用另是利用另一个一个“工具工具”变量变量Z将将Xi分离成与分离成与ui相关和相关和不相关的两部分。不相关的两部分。3.工具变量法工具变量法n n我们的工作就是要寻找相应的我们的工作就是要寻找相应的工具变量工具变量将解将解释变量分解成内生变量和外生变量,然后利释变量分解成内生
29、变量和外生变量,然后利用用两阶段最小二乘法两阶段最小二乘法(TSLS)进行估计。进行估计。工具变量的选取工具变量的选取 一个有效的工具变量必须满足称为一个有效的工具变量必须满足称为一个有效的工具变量必须满足称为一个有效的工具变量必须满足称为工具变量相关工具变量相关工具变量相关工具变量相关性性性性和和和和工具变量外生性工具变量外生性工具变量外生性工具变量外生性两个条件两个条件两个条件两个条件:即即即即 (1)工具变量相关性工具变量相关性:工具变量与所替代的:工具变量与所替代的随机解释变量高度相关;随机解释变量高度相关;(2)工具变量外生性:工具变量外生性:工具变量与随机误差项工具变量与随机误差项
30、不相关;不相关;n n一个合适的工具变量应该同时满足两个条件:第一个合适的工具变量应该同时满足两个条件:第一要能很好地解释内生变量,也就是说工具变量一要能很好地解释内生变量,也就是说工具变量和内生变量之间要足够相关;第二,工具变量要和内生变量之间要足够相关;第二,工具变量要来自系统之外,即工具变量具备外生性。来自系统之外,即工具变量具备外生性。n n如果内生性表现为联立性问题,第二个标准尤其如果内生性表现为联立性问题,第二个标准尤其必要。虽然统计证据可以告诉我们工具变量和内必要。虽然统计证据可以告诉我们工具变量和内生变量是否相关,但是其背后的因果链条和工具生变量是否相关,但是其背后的因果链条和
31、工具变量是否具备外生性的证明一样,必须依赖令人变量是否具备外生性的证明一样,必须依赖令人置信的逻辑推导置信的逻辑推导 。n n工具变量的外生性在回归中表现为和方程的残差工具变量的外生性在回归中表现为和方程的残差项正交,即工具变量不会对方程被解释变量产生项正交,即工具变量不会对方程被解释变量产生影响,如果产生影响则只能通过内生变量起作用影响,如果产生影响则只能通过内生变量起作用n n。两阶段最小二乘估计量两阶段最小二乘估计量n n若工具变量若工具变量Z满足工具变量相关性和外生性的满足工具变量相关性和外生性的条件,则可用称为条件,则可用称为两阶段最小二乘两阶段最小二乘(TSLS)的的IV估计量估计
32、系数估计量估计系数 1 1。n n两阶段最小二乘估计量分两阶段计算:两阶段最小二乘估计量分两阶段计算:n n第一阶段第一阶段把把X分解成两部分:即与回归误差项分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。相关的一部分以及与误差项无关的一部分。n n第二阶段第二阶段是利用与误差项无关的那部分进行估是利用与误差项无关的那部分进行估计。计。一般一般IV回归模型回归模型1.因变量因变量 Yi。2.外生解释变量外生解释变量 W1i、W2i、Wri。3.内生解释变量内生解释变量 X1i、X2i、Xki。4.我们引入工具变量我们引入工具变量Z1i、Z2i、Zmi。第一阶段回归:第一阶段回
33、归:利用利用OLS建立每个内生变量(建立每个内生变量(X1i、X2i、Xki)关于工具变量)关于工具变量(Z1i、Z2i、Zmi)和外生变量()和外生变量(W1i、W2i、Wri)的回归,)的回归,并得到所有回归结果的拟合值并得到所有回归结果的拟合值Xi_hat。第二阶段回归:第二阶段回归:用用Xi_hat取代原有的取代原有的Xi,与原有,与原有的外生变量的外生变量Wi一起进行第二次回归,得到一起进行第二次回归,得到TSLS统计量统计量TSLS。注意:注意:工具变量出现在第一阶段回归,但不出工具变量出现在第一阶段回归,但不出现在第二阶段回归。现在第二阶段回归。引入工具变量的个数引入工具变量的个
34、数n n假设我们有假设我们有n个内生解释变量,引入了个内生解释变量,引入了m个工个工具变量,具变量,n和和m的关系是什么?的关系是什么?n nn=m 恰好识别恰好识别 n nnm 不可识别不可识别 n n只有恰好识别和过度识别才能用只有恰好识别和过度识别才能用IV方法估计。方法估计。n n两阶段最小二乘法的两阶段最小二乘法的stata命令:命令:n nivregress 2sls depvar varlist1(varlist2=instlist),r,firstn n其中,其中,“depvar”为被解释变量,为被解释变量,varlist1为外生解释变量,为外生解释变量,varlist2为所有
35、的内生解为所有的内生解释变量集合,释变量集合,instlist为工具变量集合。为工具变量集合。n n选择项选择项r表示使用异方差稳健的标准误,选择表示使用异方差稳健的标准误,选择项项“first”表示显示第一阶段的回归。表示显示第一阶段的回归。工具变量有效性的检验工具变量有效性的检验n n工具变量相关性工具变量相关性工具变量相关性工具变量相关性n n工具变量相关性越强,也就是工具变量能解释越多的工具变量相关性越强,也就是工具变量能解释越多的工具变量相关性越强,也就是工具变量能解释越多的工具变量相关性越强,也就是工具变量能解释越多的X X变动,则变动,则变动,则变动,则IVIV回归中能用的信息就
36、越多,因此利用相回归中能用的信息就越多,因此利用相回归中能用的信息就越多,因此利用相回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。关性更强的工具变量得到的估计量也更精确。关性更强的工具变量得到的估计量也更精确。关性更强的工具变量得到的估计量也更精确。n n弱工具变量:弱工具变量:弱工具变量:弱工具变量:如果虽然如果虽然如果虽然如果虽然n n n n 但是但是但是但是n n弱工具变量弱工具变量弱工具变量弱工具变量几乎不能解释几乎不能解释几乎不能解释几乎不能解释X X的变动。的变动。的变动。的变动。弱工具变量检验准则弱工具变量检验准则n n1.偏偏R2(Sheas pa
37、rtial R2)n n含义:在第一阶段回归中,在控制外生变量含义:在第一阶段回归中,在控制外生变量 影响的前提下,看其它变量对某内生变量的影响的前提下,看其它变量对某内生变量的解释力,或者说,在第一阶段回归中,剔除解释力,或者说,在第一阶段回归中,剔除掉外生变量的影响。掉外生变量的影响。n n2.最小特征值统计量最小特征值统计量F:经验上:经验上F应该大于应该大于10。n nStata 命令:命令:n nestat firststage,all forcenonrobustn n3.Cragg-Donald Wald F 统计量统计量 n n4.Kleibergen-Paap Wald rk
38、 F 统计量统计量”(当假定残差项不满足独立同分布时,就看这个来判断是否弱工具,原假设是弱工具,所以拒绝原假设就可以)n nF检验临界值表 CHIDIST n n F(12(自变量数据(自变量数据m),600(自由度(自由度df=n(样本数)(样本数)-m-1))=87.06n nStata命令:命令:ivreg2如果存在弱工具变量该怎么办?如果存在弱工具变量该怎么办?n n1.1.如果有很多工具变量,有部分强工具变量和部分弱如果有很多工具变量,有部分强工具变量和部分弱如果有很多工具变量,有部分强工具变量和部分弱如果有很多工具变量,有部分强工具变量和部分弱工具变量,可以舍弃较弱的工具变量而选用
39、相关性较工具变量,可以舍弃较弱的工具变量而选用相关性较工具变量,可以舍弃较弱的工具变量而选用相关性较工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在强的工具变量子集。在强的工具变量子集。在强的工具变量子集。在statastata中,可以使用中,可以使用中,可以使用中,可以使用ivreg2ivreg2命命命命令进行令进行令进行令进行“冗余检验冗余检验冗余检验冗余检验”,以决定选择舍弃哪个工具变量。,以决定选择舍弃哪个工具变量。,以决定选择舍弃哪个工具变量。,以决定选择舍弃哪个工具变量。(直观上,冗余工具变量是那些第一阶段回归中不显(直观上,冗余工具变量是那些第一阶段回归中不显(
40、直观上,冗余工具变量是那些第一阶段回归中不显(直观上,冗余工具变量是那些第一阶段回归中不显著的变量。)著的变量。)著的变量。)著的变量。)n n2.2.如果系数是恰好识别的,则你不能略去弱工具变量。如果系数是恰好识别的,则你不能略去弱工具变量。如果系数是恰好识别的,则你不能略去弱工具变量。如果系数是恰好识别的,则你不能略去弱工具变量。在这种情况下,有两个选择:在这种情况下,有两个选择:在这种情况下,有两个选择:在这种情况下,有两个选择:n n第一个选择第一个选择第一个选择第一个选择是寻找其他较强的工具变量。是寻找其他较强的工具变量。是寻找其他较强的工具变量。是寻找其他较强的工具变量。(难度较大
41、难度较大难度较大难度较大)n n第二个选择第二个选择是利用弱工具变量继续进行实证分是利用弱工具变量继续进行实证分析,但采用的方法不再是析,但采用的方法不再是TSLS。而是对弱工。而是对弱工具变量不太敏感的有限信息极大似然法具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,。在大样本下,LIML 与与2SLS是渐近是渐近等价的,但在存在弱工具变量的情况下,等价的,但在存在弱工具变量的情况下,LIML 的小样本性质可能优于的小样本性质可能优于2SLS。n nLIML 的的 Stata 命令为命令为n nivregress liml depvar varlist1(varlist2=ins
42、tlist)工具变量外生性的检验工具变量外生性的检验n n刚才我们提到:只有刚才我们提到:只有恰好识别恰好识别和和过度识别过度识别才能才能用用IV方法估计。方法估计。n n一个很重要的命题是:一个很重要的命题是:只有过度识别只有过度识别情况下才情况下才能检验工具变量的外生性,而恰好识别情况能检验工具变量的外生性,而恰好识别情况下无法检验。下无法检验。过度识别约束检验过度识别约束检验n n基本思想:基本思想:n n假设有一个内生回归变量,两个工具变量且没假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的有包含的外生变量。则你可以计算两个不同的TSLS估计量:其中一个
43、利用第一个工具变量,估计量:其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,但如果两个工具性,这两个估计量不会相同,但如果两个工具变量都是外生的,则这两个估计量往往比较接变量都是外生的,则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不同,近。如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内则你可以得出其中一个或两个工具变量都有内生性问题的结论。生性问题的结论。n n识别标准:识别标准:n n Sargan Sargan 统计量:统计量:统计量:统计量:ivregre
44、ss 2slsivregress 2sls过程中,实际的工过程中,实际的工具变量(组)是具变量(组)是x*x*与与z*z*。SaganSagan检验即检验这些工具检验即检验这些工具变量是否外生(是否与扰动项相关),原假设是这些变量是否外生(是否与扰动项相关),原假设是这些变量都与扰动项不相关。利用残差对这些工具变量回变量都与扰动项不相关。利用残差对这些工具变量回归。归。n nsargensargen检验的检验的P P值应该越大越好,一般超过值应该越大越好,一般超过0.10.1既可以既可以说明不能拒绝工具变量有效的零假设,不宜接近于说明不能拒绝工具变量有效的零假设,不宜接近于1 1,一般大于,一
45、般大于0.40.4就是危险信号,工具变量过多,导致就是危险信号,工具变量过多,导致检验结果不可信。检验结果不可信。n nSarganSargan统计量服从自由度为统计量服从自由度为L-kL-k的卡方分布,查表。的卡方分布,查表。在在excelexcel中输入中输入CHIDISTCHIDIST(x x,iv-viv-v),其中),其中x x是是sargansargan统计量的值,统计量的值,iv iv是工具变量的秩,是工具变量的秩,v v是估计参数个数。是估计参数个数。回车。回车。n n n nHansen J统计量统计量n nC统计量,说明采用工具变量的合理性统计量,说明采用工具变量的合理性n
46、 n过度识别检验的过度识别检验的 Stata 命令:命令:n nestat overidn nxtabond2 also reports tests of over-identifying restrictions-xtabond2 also reports tests of over-identifying restrictions-of whether theof whether the instruments,as a group,appear instruments,as a group,appear exogenous.exogenous.For one-step,non-robus
47、t estimation,it reports For one-step,non-robust estimation,it reports the Sargan statistic,which is the minimized value of the the Sargan statistic,which is the minimized value of the one-step GMM criterion function.one-step GMM criterion function.The Sargan statistic is The Sargan statistic is not
48、robust to heteroskedasticity or autocorellation.not robust to heteroskedasticity or autocorellation.So for So for one-step,robust estimation(one-step,robust estimation(稳健估计稳健估计and for all two-step and for all two-step estimation),xtabond2 also reports the Hansen J statistic,estimation),xtabond2 also
49、 reports the Hansen J statistic,which is the minimized value of the two-step GMM criterion which is the minimized value of the two-step GMM criterion function,and is robust.xtabond2 still reports the Sargan function,and is robust.xtabond2 still reports the Sargan statistic in these cases because the
50、 J test has its own statistic in these cases because the J test has its own problem:it can be greatly weakened by instrument problem:it can be greatly weakened by instrument proliferation.proliferation.究竟该用究竟该用 OLS 还是工具变量法还是工具变量法n n豪斯曼检验豪斯曼检验n n原假设为:原假设为:n nH0:所有解释变量均为外生变量:所有解释变量均为外生变量n nreg y x1 x2