内生性产生的原因及解决方案.ppt

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第五讲内生性,OLS,经典假设,所有的解释变量,X,i,与随机误差项彼此之间不相关。,若解释变量,X,i,和,u,i,相关，则,OLS,估计量是非一致的，也就是即使当样本容量很大时，,OLS,估计量也不会接近回归系数的真值。,当解释变量和随机误差项相关时，模型存在着,内生性,问题。,在计量经济学中，把所有与扰动项相关的解释变量都称为,“,内生变量,”,。这与一般经济学理论中的定义有所不同。,1,。与误差项相关的变量称为,内生变量,(endogenous variable),。,2,。与误差项不相关的变量称为,外生变量,(exogenous variable),。,造成误差项与回归变量相关（内生性）的原因很多，但我们主要考虑如下几个方面：,遗漏变量偏差,变量有测量误差,双向因果关系,。,遗漏变量偏差,变量有测量误差,测量数据正确时：假设方程为：,当存在测量误差时：方程为：,所以我们有：,可知，误差项中包含,所以可以得到：如果,则回归结果有偏，非一致,我们假设,则有,结论：,1,。由于,2,。回归的性质决定于,w,的标准差,双向因果关系,之前我们假定因果关系是从回归变量到因变量的,(X,导致了,Y),。但如果因果关系同时也是从因变量到一个或多个回归变量,(Y,导致了,X),的呢？如果是这样的话，因果关系是向前的也是,“,向后,”,的，即存在双向因果关系，如果存在双向因果关系，则,OLS,回归中同时包含了这两个效应，因此,OLS,估计量是有偏的、非一致的。,可以推导出：,检验方法：豪斯曼检验检验,豪斯曼检验（,Hausman specification test,）,H0,：所有解释变量均为外生变量。,H1,：至少有一个解释变量为内生变量。,quietly reg lw80 s80 expr80 tenure80 iq,est store ols,quietly ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age),est store iv,hausman iv ols,，若,Hausman,检验失效（检验统计量为负值），则使用,dmexogxt,，否则仍,Hausman,检验为主。,使用,Davidson-MacKinnon,检验,xtivreg,后使用,dmexogxt,*Davidson-MacKinnon(1993),检验,*,H0,：,OLS,和,xtivreg,都是一致的，即内生性问题对,OLS,的估计结果影响不大,xtivreg tl size ndts tang(npr=tobin L1.npr),fe,dmexogxt,Davidson-MacKinnon,检验得到,F,统计量的,P,值小于,0.05,，代表有内生性,遗漏变量偏差,可采用在多元回归中加入遗漏变量的方法加以解决，但前提是只有当你有遗漏变量数据时上述方法才可行。,双向因果关系偏差,是指如果有时因果关系是从,X,到,Y,又从,Y,到,X,时，此时仅用多元回归无法消除这一偏差。同样，,变量有测量误差,也无法用我们前面学过的方法解决。,因此我们就必须寻找一种新的方法。,二、内生性的解决方案,事实上，仅仅为了解决内生性问题，并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言，我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种，理论上来讲，这四种方案应对内生性问题都很有效。但于我个人而言，我对四种方法的评价是有高低的，由高到低分别介绍如下。,1.,自然实验法,所谓自然实验，就是发生了某些外部突发事件，使得研究对象仿佛被随机分成了实验组或控制组。,这是我最喜欢的方法，只是自然实验需要寻找一个事件，并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分，还要能识别出来，这对学者的眼光也是一种挑战。,有很多文章声称使用了自然实验，但严格来讲，并没有做到对研究对象进行了随机分组。虽然如此，我对此类文章仍然很是喜欢。,自然实验包括的要素有,:,一个政策措施,(treatment),一个观察到的结果,(outeome),一个对照组,(contorlgoruP),。在评估,“,政策措施,”,对,“,结果,”,是否发挥作用时,对照组充当一个参照系。而一个,“,准自然实验,”,和自然实验的区别在于处理组和对照组的选取是否随机。,这里的,“,结果,”,是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。,简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法衡量改革真实效果的。,17,2.,双重差分法,Difference-in-Difference,（,DID,）,一般称为双重差分法，或倍差法。倘若出现了一次外部冲击，这次冲击影响了一部分样本，对另一部分样本则无影响，而我们想看一下这次外部冲击到底有何影响，双重差分法就是用来研究这次冲击的净效应的。,其基本思想是，将受冲击的样本视作实验组，再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组，而后做差，做差剩下来的便是这次冲击的净效应。,双重差分法实际上是固定效应的一个变种，差分的过程实际上是排除固定效应的过程。,ZERA,在,计量论文写作和发表的黑客教程,有一个非常简明风趣的举例，我转述于此，以飨读者。,19,Difference in difference models,Maybe the most popular identification strategy in applied work today,Attempts to mimic random assignment with treatment and,“,comparison,”,sample,Application of two-way fixed effects model,20,Problem set up,Cross-sectional and time series data,One group is,treated,with intervention,Have pre-post data for group receiving intervention,Can examine time-series changes but,unsure how much of the change is due to secular changes,21,Difference in difference models,Basic two-way fixed effects model,Cross section and time fixed effects,Use time series of untreated group to establish what would have occurred in the absence of the intervention,Key concept:can control for the fact that the intervention is more likely in some types of states,22,Three different presentations,Tabular,Graphical,Regression equation,23,Difference in Difference,Before,Change,After,Change,Difference,Group 1,(Treat),Y,t1,Y,t2,Y,t,=Y,t2,-Y,t1,Group 2,(Control),Y,c1,Y,c2,Y,c,=Y,c2,-Y,c1,Difference,Y,Y,t,Y,c,24,time,Y,t,1,t,2,Y,t1,Y,t2,treatment,control,Y,c1,Y,c2,Treatment effect=,(Y,t2,-Y,t1,)(Y,c2,-Y,c1,),25,Key Assumption,Control group identifies the time path of outcomes that would have happened in the absence of the treatment,In this example,Y falls by Y,c2,-Y,c1,even without the intervention,Note that underlying,levels,of outcomes are not important(return to this in the regression equation),26,Basic Econometric Model,Data varies by,state(i),time(t),Outcome is Y,it,Only two periods,Intervention will occur in a group of observations(e.g.states,firms,etc.),27,Three key variables,T,it,=1 if obs i belongs in the state that will eventually be treated,A,it,=1 in the periods when treatment occurs,T,it,A,it,-interaction term,treatment states after the intervention,Y,it,=,0,+,1,T,it,+,2,A,it,+,3,T,it,A,it,+,it,28,Y,it,=,0,+,1,T,it,+,2,A,it,+,3,T,it,A,it,+,it,Before,Change,After,Change,Difference,Group 1,(Treat),0,+,1,0,+,1,+,2,+,3,Y,t,=,2,+,3,Group 2,(Control),0,0,+,2,Y,c,=,2,Difference,Y=,3,29,More general model,Data varies by,state(i),time(t),Outcome is Y,it,Many periods,Intervention will occur in a group of states but at a variety of times,30,u,i,is a state effect,v,t,is a complete set of year(time)effects,Analysis of covariance model,Y,it,=,0,+,3,T,it,A,it,+u,i,+,t,+,it,31,Group effects,Capture differences across groups that are constant over time,Year effects,Capture differences over time that are common to all groups,32,其中，,d,就是双重差分估计量，,Y,为研究的结局变量，右侧脚标中,treatment,和,control,分布代表干预组和对照组，,t0,和,t1,分别代表干预前和干预后。构造了差分估计量之后，就要根据不同的数据类型和不同的结局变量,Y,，分别选用相应的参数检验方法来进行建模,。,(1),适用于独立混合横截面数据,33,独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样，将所得的数据混合起来的一种数据集。该类数据的特点为每一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来，从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量,;,也可加入新的变量,时间,(,即干预前后,),，以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的调查研究，多收集此类数据,34,35,36,(2),适用于综列数据面板数据的,DID,模型,37,面板数据要求在不同时点调查相同的研究对象,。它与独立混合横截面数据最大的不同在于，不同时点的观测值并不是独立分布的,。这类数据的特点在于,:,由于研究的个体相同，一些不随时间改变的不可观测的因素,(,如个,人特质等,),对不同时点的观测值会产生影响，可以通过控制这些影响从而得到较为真实的结果,;,38,39,40,由于一般大规模的人群调查存在较大的变异性问题，仅在模型中纳入虚拟变量“分组,(A)”,、“时间,(T)”,是远远不够的。为了提高解释系数,R2,，需要加入其他可能影响被解释变量的因素，即控制除分组、时间变量以外的其他变量。,ssc install diffhelp diff,diff y,t(treated)p(t)robust,如果有控制变量，可以利用,cov,（）添加,41,工具变量,(instrumental variable,IV),回归是当回归变量,X,与误差项,u,相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为,IV,估计,。,其,基本思想,是：假设方程是：,我们假设,u,i,与,X,i,相关，则,OLS,估计量一定是,有偏,的和,非一致,的。,工具变量估计,是利用另一个,“,工具,”,变量,Z,将,X,i,分离成与,u,i,相关和不相关的两部分。,3.,工具变量法,我们的工作就是要寻找相应的,工具变量,将解释变量分解成内生变量和外生变量，然后利用,两阶段最小二乘法,(TSLS),进行估计。,工具变量的选取,一个有效的工具变量必须满足称为,工具变量相关性,和,工具变量外生性,两个条件,:,即,（,1,）,工具变量相关性,：工具变量与所替代的随机解释变量高度相关；,（,2,）,工具变量外生性：,工具变量与随机误差项不相关；,一个合适的工具变量应该同时满足两个条件：第一要能很好地解释内生变量，也就是说工具变量和内生变量之间要足够相关；第二，工具变量要来自系统之外，即工具变量具备外生性。,如果内生性表现为联立性问题，第二个标准尤其必要。虽然统计证据可以告诉我们工具变量和内生变量是否相关，但是其背后的因果链条和工具变量是否具备外生性的证明一样，必须依赖令人置信的逻辑推导。,工具变量的外生性在回归中表现为和方程的残差项正交，即工具变量不会对方程被解释变量产生影响，如果产生影响则只能通过内生变量起作用,。,两阶段最小二乘估计量,若工具变量,Z,满足工具变量相关性和外生性的条件，则可用称为,两阶段最小二乘,(TSLS),的,IV,估计量估计系数,1,。,两阶段最小二乘估计量分两阶段计算：,第一阶段,把,X,分解成两部分：即与回归误差项相关的一部分以及与误差项无关的一部分。,第二阶段,是利用与误差项无关的那部分进行估计。,一般,IV,回归模型,因变量,Y,i,。,外生解释变量,W,1i,、,W,2i,、,W,ri,。,内生解释变量,X,1i,、,X,2i,、,X,ki,。,我们引入工具变量,Z,1i,、,Z,2i,、,Z,mi,。,第一阶段回归：,利用,OLS,建立每个内生变量（,X,1i,、,X,2i,、,X,ki,）关于工具变量,（,Z,1i,、,Z,2i,、,Z,mi,）和外生变量（,W,1i,、,W,2i,、,W,ri,）的回归，并得到所有回归结果的拟合值,X,i,_hat,。,第二阶段回归：,用,X,i,_hat,取代原有的,X,i,，与原有的外生变量,W,i,一起进行第二次回归，得到,TSLS,统计量,TSLS,。,注意：,工具变量出现在第一阶段回归，但不出现在第二阶段回归。,引入工具变量的个数,假设我们有,n,个内生解释变量，引入了,m,个工具变量，,n,和,m,的关系是什么？,n=m,恰好识别,nm,不可识别,只有恰好识别和过度识别才能用,IV,方法估计。,两阶段最小二乘法的,stata,命令：,ivregress 2sls depvar varlist1(varlist2=instlist),r,first,其中，,“,depvar,”,为被解释变量，,varlist1,为外生解释变量，,varlist2,为所有的内生解释变量集合，,instlist,为工具变量集合。,选择项,r,表示使用异方差稳健的标准误，选择项,“,first,”,表示显示第一阶段的回归。,工具变量有效性的检验,工具变量相关性,工具变量相关性越强，也就是工具变量能解释越多的,X,变动，则,IV,回归中能用的信息就越多，因此利用相关性更强的工具变量得到的估计量也更精确。,弱工具变量：,如果虽然,但是,弱工具变量,几乎不能解释,X,的变动。,弱工具变量检验准则,1.,偏,R,2,（,Shea,s partial R,2,）,含义：在第一阶段回归中，在控制外生变量影响的前提下，看其它变量对某内生变量的解释力，或者说，在第一阶段回归中，剔除掉外生变量的影响。,2.,最小特征值统计量,F,：经验上,F,应该大于,10,。,Stata,命令：,estat firststage,all forcenonrobust,3.Cragg-Donald Wald F,统计量,4.Kleibergen-Paap Wald rk F,统计量,”,（,当假定残差项不满足独立同分布时，就看这个来判断是否弱工具，原假设是弱工具，所以拒绝原假设就可以,）,F,检验临界值表,CHIDIST,F(12,（自变量数据,m,）,600,（自由度,df=n,（样本数）,-m-1,）,)=87.06,Stata,命令：,ivreg2,如果存在弱工具变量该怎么办？,1.,如果有很多工具变量，有部分强工具变量和部分弱工具变量，可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在,stata,中，可以使用,ivreg2,命令进行,“,冗余检验,”,，以决定选择舍弃哪个工具变量。（直观上，冗余工具变量是那些第一阶段回归中不显著的变量。）,2.,如果系数是恰好识别的，则你不能略去弱工具变量。在这种情况下，有两个选择：,第一个选择,是寻找其他较强的工具变量。,(,难度较大,),第二个选择,是利用弱工具变量继续进行实证分析，但采用的方法不再是,TSLS,。而是对弱工具变量不太敏感的有限信息极大似然法,(LIML),。在大样本下，,LIML,与,2SLS,是渐近等价的，但在存在弱工具变量的情况下，,LIML,的小样本性质可能优于,2SLS,。,LIML,的,Stata,命令为,ivregress liml depvar varlist1(varlist2=instlist),工具变量外生性的检验,刚才我们提到：只有,恰好识别,和,过度识别,才能用,IV,方法估计。,一个很重要的命题是：,只有过度识别,情况下才能检验工具变量的外生性，而恰好识别情况下无法检验。,过度识别约束检验,基本思想：,假设有一个内生回归变量，两个工具变量且没有包含的外生变量。则你可以计算两个不同的,TSLS,估计量：其中一个利用第一个工具变量，而另一个利用第二个工具变量。由于抽样变异性，这两个估计量不会相同，但如果两个工具变量都是外生的，则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不同，则你可以得出其中一个或两个工具变量都有内生性问题的结论。,识别标准：,Sargan,统计量：,ivregress 2sls,过程中，实际的工具变量（组）是,x*,与,z*,。,Sagan,检验即检验这些工具变量是否外生（是否与扰动项相关），原假设是这些变量都与扰动项不相关。利用残差对这些工具变量回归。,sargen,检验的,P,值应该越大越好，一般超过,0.1,既可以说明不能拒绝工具变量有效的零假设，不宜接近于,1,，一般大于,0.4,就是危险信号，工具变量过多，导致检验结果不可信。,Sargan,统计量服从自由度为,L-k,的卡方分布，查表。在,excel,中输入,CHIDIST,（,x,，,iv-v,），其中,x,是,sargan,统计量的值，,iv,是工具变量的秩，,v,是估计参数个数。回车。,Hansen J,统计量,C,统计量，说明采用工具变量的合理性,过度识别检验的,Stata,命令：,estat overid,xtabond2 also reports tests of over-identifying restrictions-of whether the,instruments,as a group,appear exogenous.,For one-step,non-robust estimation,it reports the Sargan statistic,which is the minimized value of the one-step GMM criterion function.,The Sargan statistic is not robust to heteroskedasticity or autocorellation.,So for one-step,robust estimation(,稳健估计,and for all two-step estimation),xtabond2 also reports the Hansen J statistic,which is the minimized value of the two-step GMM criterion function,and is robust.xtabond2 still reports the Sargan statistic in these cases because the J test has its own problem:it can be greatly weakened by instrument proliferation.,究竟该用,OLS,还是工具变量法,豪斯曼检验,原假设为：,H0,：所有解释变量均为外生变量,reg y x1 x2,est store ols,ivregress 2sls y x1(x2=z1 z2),est store iv,hausman iv ols,sigmamore,上述检验的缺点是，它假设在,H0,成立的情况下，,OLS,最有效率。但如果存在异方差，,OLS,并不最有效率,(,不是,BLUE),。故传统的豪斯曼检验不适用于异方差的情形。,此时可以使用杜宾,-,吴,-,豪斯曼检验,(DWH),，该检验在异方差的情况下也适用，更为稳健。,stata,命令：,estat endogenous,为负值不存在内生性,例一,Mincer(1958),最早研究了工资与受教育年限的正相关关系，但遗漏了,“,能力,”,这个变量，导致遗漏变量偏差。针对美国面板调查数据中的年轻男子组群,(Young Men,s Cohort of the National Longitudinal Survey,，简记,NLS-Y),，,Griliches(1976),采用工具变量法对遗漏变量问题进行了校正。,Blackburn and Neumark(1992),更新,了,Griliches(1976),的数据，即这个例子中将要使用的数据集,grilic.dta,。,该数据集中包括以下变量：,lw(,工资对数,),，,s(,受教育年限,),，,age(,年龄,),，,expr(,工龄,),，,tenure(,在现单位的工作年数,),，,iq(,智商,),，,med(,母亲的受教育年限,),，,kww(,在,“,knowledge of the World of Work,”,测试中的成绩,),，,mrt(,婚姻虚拟变量，已婚,=1),，,rns(,美国南方虚拟变量，住在南方,=1),，,smsa(,大城市虚拟变量，住在大城市,=1),，,year(,有数据的最早年份，,1966,1973,年中的某一年,),。,这是一个两期面板数据，初始期为当以上变量有数据的最早年份，结束期为,1980,年。不带,80,字样的变量名为初始期，带,80,字样的变量名为,1980,年数据。比如，,iq,指的是初始期的智商，而,lw80,指的是,1980,年的工资对数。,(1),先看一下数据的统计特征。,use grilic.dta,clear,sum,(2),考察智商与受教育年限的相关关系。,pwcorr iq s,sig,(3),建立如下方程：,reg lw80 s80 expr80 tenure80,继续对方程进行分析：我们发现了如下问题：,1,。遗漏变量问题：认为方程遗漏了,“,能力,”,这个变量，加入,iq,（智商）作为,“,能力,”,的代理变量。,reg lw80 s80 iq expr80 tenure80,2,。测量误差问题：,iq,（智商）对,“,能力,”,的测量存在误差。,3,。变量内生性问题：,s80,可能与扰动项中除,“,能力,”,以外的其他因素相关，因此是内生变量。,解决方法：引入四个变量,med,，,kww,，,mrt,，,age,，作为内生解释变量,iq,与,s80,的工具变量。,然后使用,TSLS,方法进行回归。,ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age),first,也可以使用,GMM,估计方法,使用两步,GMM,。,ivregress gmm lw80 expr80 tenure80(s80 iq=med kww mrt age),使用迭代,GMM,。,ivregress gmm lw80 expr80 tenure80(s80 iq=med kww mrt age),igmm,几点注意事项：,1,。,first,选项的目的是显示,TSLS,第一阶段的结果，如果省略，则仅显示第二阶段的结果。,2,。命令的用法比较严格，将被解释变量和所有外生解释变量放到括号外面，内生解释变量放到括号里面，等号后面为所有工具变量。,3,。,2SLS,只能通过,stata,完成，利用定义手动计算的结果是错误的，因为残差序列是错误的。,4,。不可能单独为每个内生变量指定一组特定的工具变量，而是给所有内生变量指定一系列工具变量。,5,。所有外生变变量都作为自己的工具变量。,6,。为了检验工具变量的外生性，本题为过度识别。,7,。在大样本下，,IV,估计是一致的，但在小样本下，,IV,估计并非无偏估计量，有些情况下偏误可能很严重。,弱工具变量检验,检验方法：,1,。初步判断可以用偏,R,2,(,partial R,2,),(,剔除掉模型中原有外生变量的影响,),。,2,。,Minimum eigenvalue statistic(,最小特征值统计量,),，经验上此数应该大于,10,。,这个方法类似于与书上的,“,第一阶段,F,统计量,”,。,工具变量外生性检验,我们一般称为,过度识别约束,J,检验。,检验工具变量是否与干扰项相关，即工具变量是否为外生变量。,TSLS,根据,Sargan,统计量进行过度识别检验。,命令为：,estat overid,检验工具变量的外生性。,H0,：所有工具变量都是外生的。,H1,：至少有一个工具变量不是外生的，与扰动项相关。,ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age),first,estat firststage,all forcenonrobust,estat firststage,estat overid,究竟该用,OLS,还是,IV,解释变量是否真的存在内生性？,假设能够找到方程外的工具变量。,1,。如果所有解释变量都是外生变量，则,OLS,比,IV,更有效。在这种情况下使用,IV,，虽然估计量仍然是一致的，会增大估计量的方差。,2,。如果存在内生解释变量，则,OLS,是不一致的，而,IV,是一致的。,4.,动态面板回归法,基本思想是将解释变量和被解释变量的滞后项作为工具变量（,IV,）。其实，我是不认可这种处理方法，除非万不得已，我不推荐这种方法，我也不太相信这种方法能真正缓解内生性问题。,广义矩估计法：,GMM,基本思想：,求解如下一般化目标函数,使之最小化,J(b_GMM)=n*g(b_GMM)*W*g(b_GMM),其中，,W,为权重矩阵,在球型扰动项的假定下，,2SLS,是最有效的。但如果扰动项存在异方差或自相关，则广义矩估计方法效果更好。,GMM,方法又分为两步,GMM,法和迭代,GMM,方法。,异方差性是相对于同方差而言的。所谓同方差，是为了保证回归参数估计量具有良好的统计性质，经典线性回归模型的一个重要假定：总体回归函数中的随机误差项满足同方差性，即它们都有相同的,方差,。如果这一假定不满足，即：,随机误差,项具有不同的方差，则称线性回归模型存在异方差性。,对于模型,如果,随机误差项,的各期望值之间存在着相关关系，即,这时，称随机误差项之间存在自相关性（,autocorrelation,）或序列相关,有关,GMM,的,Stata,命令为,ivregress gmm y x1(x2=z1 z2)(,两步,GMM),ivregress gmm y x1(x2=z1 z2),igmm(,迭代,GMM),estat overid(,过度识别检验,),例二,reg lw s expr tenure rns smsa,r,引入智商,(iq),作为“能力”的代理变量，再进行,OLS,回归。,reg lw s iq expr tenure rns smsa,r,(2),由于用,iq,来度量能力存在,“,测量误差,”,，故,iq,是内生变量，考虑使用变量,(med,kww,mrt,age),作为,iq,的工具变量，进行,2SLS,回归，并使用稳健标准误。,ivregress 2sls lw s expr tenure rns smsa(iq=med kww mrt age),r first,(3),进行过度识别检验，考察是否所有工具变量均外生，即与扰动项不相关。,estat overid,(4),我们怀疑,(mrt,age),不满足外生性，故使用,C,统计量检验这两个工具变量的外生性。,findit ivreg2,ivreg2 lw s expr tenure rns smsa(iq=med kww mrt age),r orthog(mrt age),(5),考虑仅使用变量,(med,kww),作为,iq,的工具变量，再次进行,2SLS,回归。,ivregress 2sls lw s expr tenure rns smsa(iq=med kww),r first,再次进行过度识别检验：,estat overid,(6),弱工具变量检验,estat firststage,all forcenonrobust,(7),为了稳健起见，下面使用对弱工具变量更不敏感的有限信息最大似然法,(LIML),：,ivregress liml lw s expr tenure rns smsa(iq=med kww),r,(8),进一步考察弱工具变量问题，对工具变量,kww,进行冗余检验,ivreg2 lw s expr tenure rns smsa(iq=med kww),r redundant(kww),(9),利用豪斯曼检验判断是否存在内生解释变量。,qui reg lw iq s expr tenure rns smsa,est store ols1,qui ivregress 2sls lw s expr tenure rns smsa(iq=med kww),estimates store iv1,hausman iv1 ols1,sigmamore,(10),由于传统的豪斯曼检验在异方差的情形下不成立，下面进行异方差稳健的,DWH,检验：,estat endogenous,异方差下也可以利用,ivreg2,命令进行文件的内生性检验：,ivreg2 lw s expr tenure rns smsa(iq=med kww),r endog(iq),(11),如果存在异方差，则,GMM,比,2SLS,更有效率。为此，进行如下最优,GMM,估计。,ivregress gmm lw s expr tenure rns smsa(iq=med kww),进行过度识别检验：,estat overid,考虑迭代GMM：,ivregress gmm lw s expr tenure rns smsa(iq=med,kww),igmm,(12),结果的完整展现：,qui reg lw s expr tenure rns smsa,r,est store ols_no_iq,qui reg lw iq s expr tenure rns smsa,r,est store ols_with_iq,qui ivregress 2sls lw s expr tenure rns smsa(iq=med kww),r,est store tsls,qui ivregress liml lw s expr tenure rns smsa(iq=med kww),r,est store liml,qui ivregress gmm lw s expr tenure rns smsa(iq=med kww),est store gmm,qui ivregress gmm lw s expr tenure rns smsa(iq=med kww),igmm,est store igmm,outreg2 ols_no_iq ols_with_iq tsls liml gmm igmm using output.doc,replace seeout,遇到内生性问题如何处理,1.,使用内生解释变量的滞后变量作为工具变量。,2.,寻找有创意的工具变量。,内生性的其它解决办法,（,1,）代理变量：某变量无法直接观测，而用其它变量替代。（,2,）前定变量：用变量的前一期或前几期数据。（,3,）面板数据模型。,到底如何对待内生性问题,（,1,）需要重点考虑的问题之一；（,2,）最好的收集数据之前就加以考虑，尤其是准备获取一手数据的情况下。如果考虑？应用经济理论。,本实例使用数据集,“,grilic.dta,”,。,考察智商与受教育年限的相关关系：,上表显示，智商（在一定程度上可以视为能力的代理变量）与受教育年限具有强烈的正相关关系（相关系数为,0.51,）。,作为一个参考系，先进行,OLS,回归，并使用稳健标准差：,其中,expr,tenure,rns,smsa,均为控制变量，而我们主要感兴趣的是变量受教育年限（,s,）。,回归的结果显示，教育投资的年回报率为,10.26%,，这个似乎太高了。可能的原因是，由于遗漏变量,“,能力,”,与受教育正相关，故,“,能力,”,对工资的贡献也被纳入教育的贡献，因此高估了教育的回报率。,引入智商,iq,作为能力的代理变量，再进行,OLS,回归：,虽然教育的投资回报率有所下降，但是依然很高。,由于用,iq,作为能力的代理变量有测量误差，故,iq,是内生变量，考虑使用变量（,med,（母亲的受教育年限）、,kww,（在,“,knowledge of the World of Work,”,中的成绩）、,mrt,（婚姻虚拟变量，已婚,=1,）,age,（年龄）作为,iq,的工具变量，进行,2SLS,回归，并使用稳健的标准差：,在此,2SLS,回归中，教育回报率反而上升到,13.73%,，而,iq,对工资的贡献居然为

展开阅读全文