资源描述
第五章 面板数据模型
Chaper5 面板数据模型
在联立方程模型中,我们已接触到面板数据模型,它仅是作为一种特殊的联立模式来讨论的。不同时间,到不同个体不加区别,仅是一种普通样本,采用POLS方法处理。不同时间段和不同个体的特征没有考虑,而这些特征往往有明确的经济背景。本章以存在不可观测效应(Unobserved effect)的现代观点重新阐释面板数据模型。
不可观测效应的含义是,从不同时间抽取的样本数据中,存在一个相对时间不变的不可观测的因素,称为异质性。例如,样本个体选择家庭而言,认知、动机、遗传等;样本个数选择企业而言,管理水平,创新能力等。如何处理这些潜在因素?除了前述的代理变量和多指标工具变量法外,合理应用面板数据的特征就是本章讨论的问题。此外,面板数据作为截面数据和时间序列数据动态混合,能反映模型的动态结构,故也可作为分析的内容加以讨论。深入的分析面板数据是学习时间分析之后,本章只是一个初步。合理运用面板数据,能给我们带来很多有意义的统计信息和模型。请看例:
例1:职业培训的评价:
欲评价培训的效果,(或实施某一政策的效果),一个标准的评价模型是:
这里t为二期,t=1,2; 表示随时间变化的项,是可观察的影响因素Y的随机变量;是虚拟变量,参加第二期培训为1,其它为0;为个人是否选择接受培训的选择,它是不可观测的,是一个与个人相关的与t无关的潜在因素。又为了消除政策因素外的其它影响,又在每个时间段中将Y分成控制组B和对照组A两部分。在t=1,无人处在控制组,在t=2,部分人处在控制组部分人处在对照组。并再设置一个虚拟变量,表示如t=2,处在控制组为1, 其余为为0。模型构成为:
,
则参数就反映了政策因素对Y的贡献。检验:
:=0.接受说明培训效果不是很显著。
例2:R&D的分布滞后模型
这里是厂商i在t期用于R&D的投入,滞后过去的投入对现在的影响。是专利收入,是不可观测的企业i内在的与时间段无关的因素;则,,,,反映的就是技术研究投入对企业的贡献。面板数据有广泛的来源,有大量的应用背景,并针对不同的问题设计的各种不同的模型。
先回忆联立方程模型中的PD模型的假设条件:,
假定:Pols1: ,;
Pols2: ,
Pols3:
注意,Pols1并没有要求与不相关,;Pols2仅仅是排除,的完全共线性,以保证可识别。
于是可行一致的Pols估计=,在假定Pols3下,所以,,又当(1×K)向量有某些解释变量同相关,令(1×L向量,L≥K)是工具变量,且满足工具变量的假定条件,那么P2SLS估计为:
1) on ,得,;
2) on,得P2sls估计为:
下面在上述PD模型的基础上,扩展各种特色的PD模型和估计检验方法。
第一节 不可观测效应模型和严格外生性假定
设不可观测效应模型(UEM)为:,。这里,作为不可观测的与时间无关的个体特有的潜在变量(latent variable)也称为不可观测的差异性(unobserved heterogenity)。它是面板数据基本模型的特色。
由于是一个不可观测的个体特有的随机变量,关键是要看与解释变量是否相关:若认为与不相关,则作为随机效果处理,将与合并=+;若认为与相关,则作为固定效果处理。
面板数据现代观点的另一个重要特点是,时间不是给定的,即可观测的可无限抽样。从而存在当前结果对未来原因的反馈(feedback),导致与之间复杂相关关系,为消除这种复杂性,引入严格外生性假定:
对,有==
含义是,一旦和给定,那么对,对没有边际影响(直观理解是,取与如前的相关,而与其它的时间s无关)。
由于不可观测,一个更严格的外生性假定:
==
=+
如果,即与某一相关,则更严格的外生假定就不成立。
UEM模型在严格外生假定下,实际应用中能被用误差项表述成:
=0, (1)
于是,推出=0, (2)
注:(1)意味着和,与都是不相关的,而(1),(2)与某相关没有要求与是相关的,但不影响估计的一致性,会影响检验。一般,在UEM下,我们总假定更强的(1)成立。
于是,UEM可以改写成:,
称为复合误差。
如果 =0, (3)
那么我们就可以采用Pooled OLS方法,得到POLS。这当然不是本章的意思。因为复合误差有许多信息没有提取出来。用“粗”的POLS方法显然能得到的一致估计。但在有限样本时,估计很差,而且统计推断需要用稳健的方法矩阵估计和采用稳健的检验量形式。这样,面板数据就没有提供任何其它帮助。又当中如果包含某项与含有的滞后项,由于与相关,从而条件(3)就不成立,Pooled OLS估计就不再是一致的,就不能用了。
对于面板数据的基本模型,在更强的假定条件下,可采用不同的统计方法,能取得更好的估计和推断效果。最基本的有随机效果(RE)、固定效果(FE)和一阶差分(FD)三种方法。
第二节 随机效果方法
一、关于模型与估计
对模型;=+;,
假定RE1:(a)=0,
(b)=0=,
=,且中包含有截距项,如设=1.所以无妨设 =0,不失一般性。条件(b)意味着是与t无关的个体特征。从而
将接到写成紧凑的矩阵式:
==+=+,
=+
又设=
假定RE2:秩=k, =
进一步,对复合误差的方差和协方差有如下信息:
(1)=, (与个体无关)
(2)=0, (与时间不相关)
从而,=+2+,
由RE1.a =0,又记=,则=+。
同样,对于,==
因此,有===+,称为随机效果结构。其中,,
又把(1),(2)用统一的条件期望的形式表达成如下
假定:RE3. (a)=,
(b)=,
注:假定RE3,条件比(1)(2)更强。
1、在假定RE1-3下,模型满足联立式GLS方法的一切条件,如果我们知道和的估计,那么可得=+,就可得到更有效的效果估计,=,且是一致的,并在一致估计类中是有效的。
下面完成和的估计。
由=+=,
设是的Pooled OLS估计,即=,由条件知,是一致的。从而可得=-,。由大数律,=。为保证有限样本时的精度,修正为(减去K个自由度)=,不会影响渐近性。
又由=,==
减去K个自由度,得到的一致估计为:
=
并由此得到,=-
注:1、有可能为负值,可能是中关于t存在负序列相关性。此意味着RE3(a)不成立,需要选择更一般的估计做FGLS。如=,=-,但当N不是充分大的时候,由于有个被估参数,所以,有限样本的性质很差。而当RE1-3成立时,对任意T只要估计二个方差参数。
2、当RE3不成立时,则没有随机效果结构,若没有其它信息作为限制,一般改用=,其中是Pooled OLS估计的残差,再回来联立式的FGLS方法,这就失去了面板数据的特色。特别地,尽管RE3不成立,但如果服从一个稳定的一阶自回归过程(=, iid)那么可以得到=+,=,则只有、和三个未知参数,从而也能得到好的(估计采用CO迭代法,略)。
二、关于检验
关于随机效果的检验,即不可观测的的影响是否存在?检验的命题自然是,:=0.关于的检验,我们可用一阶自回归的AR(1)检验。(:=0),如果误差项关于t的检验被检验出是AR(1)过程,,不成立,则随机效果的影响存在。
另一个基于Lagrange乘子的检验,:=0的方便方法是,统计量:
~N(0,1)
这里是Pooled OLS的残差。
第三节 固定效果方法
一、 关于模型与估计
认为基本模型中,中不可观测的因素,i可以是相关的,则复合误差必与中某个解释变量是相关的。因此随机效果的观点就不合适。于是将单列为一个仅与i有关的参数,将基本模型按列排与矩阵形式:,其中是T×1的每个元素为1的向量。
为消除不可观测影响对FE模型t求和,并求平均,即
,,,
于是有:,-=,
记=-,=-,=-,则=+,
称为去时间平均模型。这又回到联立式的面板数据模型。可用POLS的条件=0和秩=K。回到原模型就是:=0.
于是就可推得固定效果模型的假定条件为:
假定:FE1:=0,
=-=0
=0, POLS条件成立
on ,, i=1,…N。可得,具体的,令=,则对称,且秩=T-1.满足=0, =,=,=,从而乘以模型,可得。
假定:FE2:秩=K,对抽样,可得:
==
假定:FE3:=,
=,(再由FE1成立)
==。
此意味着关于t具有同方差性和序列不相关性。
==+-2
=+-2=
又=
=--+
=0--+=-<0.
相关系数===-
所以,去时间平均的误差是负相关的,且当T相关性趋于0.可以证明,是正态的,且=
为求得的一致估计,由=(),对t求和,得:
(T-1)= 。再对i求和,得:N(T-1)=
=。用=代替,其中是 on 用Pooled OLS方法所得。于是,可得到的一致估计为:
=,其中SSR=
=
二、 关于检验
1、在FE1~3条件成立的前提下,有Q个限制的整体性检验,直接用F统计量的残差形式:
F=
此外,对潜在的异方差性因素,可粗略地用:=,
如果T充分大,能反映的信息。
2、当FE3不成立时,例如存在序列相关性,F检验就不再适用。但有渐近方差估计,改用Wald检验,且渐近方差矩阵为:
=。
当然也可以用排除序列相关求得,再用FGLS的方法,不再详细讨论。
第四节 一阶差分方法
一、 关于模型与估计
对基本模型,,
关于t作差分变换,也可消除,得,
比较FE方法,区别仅在于失去了一个T=1的样本。
类似于FE方法。一阶差分方法FP的假定条件是:
假定:FD1:=0, 。此意味着与对一切的s,t是不相关成立时,FD1成立;
假定:FD2:秩=K
假定:FD3:=
这里将按列写成矩阵式:,其中误差项的差分意味着=,是随机行走。这是一种特殊的序列相关。从而由POLS,可得和=具有连续的序列依赖性。它是FE3假定,序列不相关的另一个极端。且由=,得的一致估计为:
=,
又当FD3不成立,则稳健的异方差矩阵估计为:
=
二、 关于检验
欲检验条件FD3成立,即检验的序列相关性,代替转向检验的序列相关性:=,,。:=0,接受.则FD3成立,拒绝,原方差要采用稳健的异方差矩阵。
注:采用一阶差分法的理由是,它比固定效果方法简便,但当不存在序列相关时,FE方法更有效。而当服从一个随机行走时,则FD方法更有效。实际的情况是,介乎于两者之间。=有()我们可采用FGLS的方法提高有效性。
第五节 三种方法RE,FE,FD的比较
一、 固定效果和一阶差分的比较
如果与相差很大,有理由相信怀疑的严格外生性假定不成立。因为任何内生性问题都会产生与现时的相关性。导致FD和FE方法的不一致及不同的概率极限。(t)此外,如果与,ts也会引致FD和FE估计的不一致。
我们可以采用豪斯曼检验验证二个结果的一致性,来验证严格外生性条件是否成立。但更方便的基于回归的检验方法是:
1、对FD:,
其中是的部分,(不包括时间的虚拟变量)。=,=(K2列)。做OLS,
:=0,
FD1-3成立时,用F统计量,FD3不成立用Wald统计量。接受表示严格外生假定成立,是一致的。
2、对FE:,
同样,是的子集,做FE估计。
:=0,再进行固定效果的检验。接受,表示严格外生性成立,固定效果估计有一致性。
注:通过了严格外生性假定,可对FD或FE模型再用可行的广义最小二乘
估计(FGLS)方法,=,其中是FD或FE估计的残差,可提高估计有效性。
二、 随机效果与固定效果的比较
模型采用随机效果还是固定效果。我们知道,如果不可观测变量与是不相关的,,那么随机效果估计就应当有比固定效果估计更小的方差。问题是,不可观测,无法检验。因此,我们需要把随机效果通过适当的变换,以便同固定效果进行比较。
因为随机效果结构是,=+。注意到=T,
所以,=+T
=+T=(+T)(+)
其中=-=
=
定义 =+,那么=+。
所以,=+ (即×=)
=+=
=
()
因此,=
=
如果已知,即和已知,则已知。
用=乘RE模型,两边得:
,即,则:==
且:=()=-,即-
=()=-,即-
因此有:-=(-)+-
在RE3成立的条件下,用POLS可得和的一致估计,从而可得的一致估计。再对 on ,做POLS,可得:
=
称为拟去时间平均,可以看出,=1-
当T或,1,此时,随机效果模型就回到了固定效果模型。特别是,潜在因素在模型的误差项中占主导地位。>>,即使T很小,FE和RE也没有很大区别。
下面我们证明,当条件RE1-3成立时,则随机效果模型估计就有比固定效果估计更小的方差。
设只包含时间变化的因素,不包含有关于时间常数的因素。那么,=,
=
其中=-,=-
-
=-
=(1-)
=(1-)T>0
-是正定的。
-是正定的。命题得证。
为要严格检验RE和FE的效果,采用如下的Hausman检验。设是已包含时间变化的解释变量,共有M个。:-=0. Hausman统计量:
H=。
拒绝,意味着两个估计有显著差异,即认为潜在变量与是相关的。应当采用固定效果的方法。
注:和中的未知方差,要用统一的一致估计
另一种基于回归形式的F统计量方法是:
,,
其中和是似去时间的平均。其中用代替,是中随时间变化的子集。设有M个。是去时间平均。
那么:=0,得到:
F=~F(M,NT-K—M)
接受,意味着RE1-3成立。采用随机效果,拒绝,采用固定效果。
注:有可能出现这样的情况,与相关很大,但它们的方差也相差很大,使得H统计量很小,导致不能拒绝而采用随机效果模型,而实际上,我们可能犯了第二类错误:与相关,真,但我们不能拒绝。
第六节 一些深入的专题
本节处理一些严格外生性条件不成立时和处理一些具有更多个体特征的面板数据模型。它们都有广泛的实际应用背景。
一、 模型
在基本模型()中,把严格外生假定:=0改成=0(),即与()的过去t,t-1,…1是严格外生的,而与,s>t可能是序列相关的。我们称是与不可观测因素有序列式条件外生效应。(Sequencially exogenous conentional on the unobserved effect)
例如:,。这里是严格外生的,且是序列式条件外生的。因此有=0.
特别,=,
则是满足序列式条件外生的条件,所以当0,严格外生性条件就不成立。
可以证明,当0,由于不可观测因素存在,采用FE和FD变换得到的估计和是有偏不一致的,但随着T,有一致性,而却不行。一般地的有=,满足与就是不相关的,对一切s和t,但与仅仅当st时是不相关的。充分条件是,=0.这种即有严格外生,又有序列式外生面板模型。典型例子是是相关的,称为现时相关的面板数据模型:隐含了一个重要的与时间相关的解释变量。中某些变量存在测量误差,以及与中某个或某些存在同时性,是一致的。同样可以证明,现时相关性和不可观测因素的存在,导致FE和FD变换得到的估计是有偏不一致的。
如同解决内生性问题一样,我们可以通过引入工具变量消除非严格外生性。但寻求工具变量并不是一件容易的事。这也失去了面板数据模型的意义。事实上,面板数据可用自身的数据的时间差异,在不同假定条件下,选择不同时间的数据作为其工具变量,然后再采用Pooled 2SLS方法,可等到模型的一致估计,或用GMM方法进一步提高有效性。详细的讨论参见伍德里奇的书第11章,或其它有关面板数据分析的书籍,(如《Econometric Analysis of Panel Data》, Badi H. Baltagi)。这里仅给出一般的说明。
首先,用FD或FE变换消除不可观测因素的影响。如FD变换得:
=
=
,
其次,在不同的假设条件下,选择不同的工具变量。例如,在满足序列式外生条件下,将, =写成矩阵紧凑式:
=
选取工具变量矩阵为:=,其中=。也可以选择的滞后项作为工具变量等等。
最后,选择Pooled 2SLS或GMM方法,统计检验则需要一些更细致的假设条件。又在FE和FD变换中,常采用FE的变换,理由是,它对各种非严格外生性条件都适用,并且几乎不加条件可以照搬原来的检验方法。
在基本模型中,=,还可以加入更多的特征,例如,扩展基本模型为:=,。称为随机趋势模型,也称随机增长模型,其中被认为是不同个体随时间增长率。
扩大严格外生性条件为:=0,作差分变换,消除,得=,
=0
于是,我们可用FE或FD方法(当T3)得到一致估计,特别当存在序列相关性时,采用FD方法,即二阶差分:=更稳妥。
一般地具有更多个体特征面板数据模型为:=,。其中(t固定)是1×J的。是J×1的,称为不可观测的异质性向量。特别当=1就是基本模型,当=就是随机趋势模型。引入更多时间常数的不可观测的个体特征后,我们除了关注,当然也关注,但当T很小时,我们无法得到好的估计(因为无法得到i的样本)。转而考虑估计=。
具体做法是:
1. 将=,按排成列,得紧凑式为:
=。这里是T×J的,是T×K的。
2. 定义投影矩阵=,则=0,用乘方程两边,得:=+,记成=。又在秩=K假定下,做OLS,得是的一致估计。
3. 又假定=,又知秩=tr=T-J。因此,
==
=
==(T-J)。
再用=-,代替,可得的一致估计。再考虑无偏性,得到的无偏一致估计为:==。
4. =-
由=0
==
=
记:=; =
=; =
可以证明,的渐近方差为:。
注:有更有效的同时给出和的非线性工具变量估计方法。
二、豪斯曼—泰勒模型
(一)提出问题
有时我们关注的是那些可观测的有关时间常数的解释变量,而不是时间变化的解释变量。然而,我们又认为某些解释变量又与不可观测因素是相关的。因此,前述的随机效果方法结果是不一致的。而固定效果或一阶差分方法又消除了我们所需要的时间常数的解释变量。所以,这三种方法都不适用。但是,如果时间常数的解释变量与是不相关的,而时间变化的解释变量与可能是相关的,那么我们就可把基本模型扩展成:
=,。
其中是时间常数的解释变量,满足条件:
=0。于是,我们可以按前述的方法按FE变换消除和,并获得一致估计。
如何估计?若再加上假定条件=0, =0,
=,又假定非奇异。
=是的一致估计。
Hausman和Taylor对上述模型做了一般的处理,称为H—T模型。
(二)模型构建
1、 将和分成=,且是1×,是1×的,
=,且是1×,是1×,
又假定:=0且=0,即对于一切t,即和的第一部分与是不相关的。仍假定:=0()成立。所以,和与对一切t和s是不相关的。
将排成列,模型写成: =(*),=,有随机效果结构,令=是T×T去时间平均矩阵,则=,又由假设是严格外生的,所以
====0.
是T×K矩阵,可作为模型(*)的工具变量,如果手头没有其它的工具变量,那么我们只能回到固定效果模型,消除时间常数,但由假设条件,可知=0 ,对一切t且=是1×T的,也满足=0。因此,矩阵是T×(K++T)的,是H-T模型的工具变量矩阵。
由可识别的阶条件,则K++TJ+K,即T。所以模型中必须是足够多到中变量个数的作为的工具变量。作为的工具变量,作为自身的工具变量。从而,我们可以用P2SLS方法来估计和。进一步,用GMM或3SLS方法提高估计的有效性。
特别,当=,有随机效果结构。则可以用所谓广义工具变量估计得到有效的GMM估计。步骤是:
1. 用工具变量,对=做P2SLS,并得P2SLS残差,记为;
2. 再回到随机效果方法,得到和,再求得拟去时间平均值。
3. 再对所有,,和工具变量做拟去时间平均变换。再用 P2SLS方法,得到所要的估计和。如果,即帮倒忙时间变化的解释变量的第一部分大于时间常数解释变量的第二部分。那么我们可用去时间平均作为的工具变量,即用作为H-T模型的工具变量,则可以代替,减少过多的工具变量。因为中冗余的工具变量导致与的偏相关性,会降低估计的有效性。
4. 此外,除从模型本身寻求工具变量之外,还可以从系统外寻找工具变量。例如,中某解释变量与是同时被决定的。那么,我们就可用其它方程中出现的外生变量作为该解释变量的工具。
H-T模型是最能体现面板模型特点的模型,有相当的灵活性,应用广泛。需要在实践中不断打磨才能提高。
最后提及的是串样本(Cluster Samples)模型。模型仍为=,不过下标i表示不再是一个个体,而是群或一串个体。下标s表示的是在第i串中的第s个个体。通常,不同的串有不同的个体数。因此,对每一串i,模型可写成=,。其中是第i串中样本的个数。
为要用面板数据的方法,我们假定串N足够大,且每串内样本是相互独立的,而串与串之间则不是独立同分布的。于是,只要假定与,是不相关的,则=。我们就可用POLS方法,类似于随机效果方法,只不过是×1向量,且方差矩阵是一个准对角阵。固定效果方法也可用于串样本模型。只要对每串分别做去时间平均,可消除,并可得和=。
此外,如果不可观测因素同某些解释变量有相互作用,导致内性,也可用前述的2SLS方法处理,不再赘述。
23
展开阅读全文