1、第五章 面板数据模型Chaper5 面板数据模型在联立方程模型中,我们已接触到面板数据模型,它仅是作为一种特殊的联立模式来讨论的。不同时间,到不同个体不加区别,仅是一种普通样本,采用POLS方法处理。不同时间段和不同个体的特征没有考虑,而这些特征往往有明确的经济背景。本章以存在不可观测效应(Unobserved effect)的现代观点重新阐释面板数据模型。不可观测效应的含义是,从不同时间抽取的样本数据中,存在一个相对时间不变的不可观测的因素,称为异质性。例如,样本个体选择家庭而言,认知、动机、遗传等;样本个数选择企业而言,管理水平,创新能力等。如何处理这些潜在因素?除了前述的代理变量和多指标
2、工具变量法外,合理应用面板数据的特征就是本章讨论的问题。此外,面板数据作为截面数据和时间序列数据动态混合,能反映模型的动态结构,故也可作为分析的内容加以讨论。深入的分析面板数据是学习时间分析之后,本章只是一个初步。合理运用面板数据,能给我们带来很多有意义的统计信息和模型。请看例:例1:职业培训的评价:欲评价培训的效果,(或实施某一政策的效果),一个标准的评价模型是:这里t为二期,t=1,2; 表示随时间变化的项,是可观察的影响因素Y的随机变量;是虚拟变量,参加第二期培训为1,其它为0;为个人是否选择接受培训的选择,它是不可观测的,是一个与个人相关的与t无关的潜在因素。又为了消除政策因素外的其它
3、影响,又在每个时间段中将Y分成控制组B和对照组A两部分。在t=1,无人处在控制组,在t=2,部分人处在控制组部分人处在对照组。并再设置一个虚拟变量,表示如t=2,处在控制组为1, 其余为为0。模型构成为:,则参数就反映了政策因素对Y的贡献。检验:0.接受说明培训效果不是很显著。例2:RD的分布滞后模型 这里是厂商i在t期用于RD的投入,滞后过去的投入对现在的影响。是专利收入,是不可观测的企业i内在的与时间段无关的因素;则,反映的就是技术研究投入对企业的贡献。面板数据有广泛的来源,有大量的应用背景,并针对不同的问题设计的各种不同的模型。先回忆联立方程模型中的PD模型的假设条件:, 假定:Pols
4、1: ,; Pols2: , Pols3: 注意,Pols1并没有要求与不相关,;Pols2仅仅是排除,的完全共线性,以保证可识别。于是可行一致的Pols估计,在假定Pols3下,所以,又当(1K)向量有某些解释变量同相关,令(1L向量,LK)是工具变量,且满足工具变量的假定条件,那么P2SLS估计为:1) on ,得,;2) on,得P2sls估计为:下面在上述PD模型的基础上,扩展各种特色的PD模型和估计检验方法。第一节 不可观测效应模型和严格外生性假定设不可观测效应模型(UEM)为:,。这里,作为不可观测的与时间无关的个体特有的潜在变量(latent variable)也称为不可观测的差
5、异性(unobserved heterogenity)。它是面板数据基本模型的特色。 由于是一个不可观测的个体特有的随机变量,关键是要看与解释变量是否相关:若认为与不相关,则作为随机效果处理,将与合并;若认为与相关,则作为固定效果处理。面板数据现代观点的另一个重要特点是,时间不是给定的,即可观测的可无限抽样。从而存在当前结果对未来原因的反馈(feedback),导致与之间复杂相关关系,为消除这种复杂性,引入严格外生性假定:对,有含义是,一旦和给定,那么对,对没有边际影响(直观理解是,取与如前的相关,而与其它的时间s无关)。由于不可观测,一个更严格的外生性假定:如果,即与某一相关,则更严格的外生
6、假定就不成立。UEM模型在严格外生假定下,实际应用中能被用误差项表述成:0, (1)于是,推出0, (2)注:(1)意味着和,与都是不相关的,而(1),(2)与某相关没有要求与是相关的,但不影响估计的一致性,会影响检验。一般,在UEM下,我们总假定更强的(1)成立。于是,UEM可以改写成:,称为复合误差。如果 0, (3)那么我们就可以采用Pooled OLS方法,得到POLS。这当然不是本章的意思。因为复合误差有许多信息没有提取出来。用“粗”的POLS方法显然能得到的一致估计。但在有限样本时,估计很差,而且统计推断需要用稳健的方法矩阵估计和采用稳健的检验量形式。这样,面板数据就没有提供任何其
7、它帮助。又当中如果包含某项与含有的滞后项,由于与相关,从而条件(3)就不成立,Pooled OLS估计就不再是一致的,就不能用了。 对于面板数据的基本模型,在更强的假定条件下,可采用不同的统计方法,能取得更好的估计和推断效果。最基本的有随机效果(RE)、固定效果(FE)和一阶差分(FD)三种方法。第二节 随机效果方法一、关于模型与估计对模型;,假定RE1:(a)=0, (b)=0=, =,且中包含有截距项,如设1.所以无妨设 0,不失一般性。条件(b)意味着是与t无关的个体特征。从而将接到写成紧凑的矩阵式:,又设假定RE2:秩k, 进一步,对复合误差的方差和协方差有如下信息:(1), (与个体
8、无关)(2)0, (与时间不相关)从而,2,由RE1.a =0,又记,则。同样,对于,因此,有,称为随机效果结构。其中,又把(1),(2)用统一的条件期望的形式表达成如下假定:RE3. (a)=, (b)=,注:假定RE3,条件比(1)(2)更强。1、在假定RE1-3下,模型满足联立式GLS方法的一切条件,如果我们知道和的估计,那么可得,就可得到更有效的效果估计,且是一致的,并在一致估计类中是有效的。 下面完成和的估计。 由,设是的Pooled OLS估计,即,由条件知,是一致的。从而可得,。由大数律,。为保证有限样本时的精度,修正为(减去K个自由度),不会影响渐近性。 又由,减去K个自由度,
9、得到的一致估计为:并由此得到,注:1、有可能为负值,可能是中关于t存在负序列相关性。此意味着RE3(a)不成立,需要选择更一般的估计做FGLS。如,但当N不是充分大的时候,由于有个被估参数,所以,有限样本的性质很差。而当RE1-3成立时,对任意T只要估计二个方差参数。2、当RE3不成立时,则没有随机效果结构,若没有其它信息作为限制,一般改用,其中是Pooled OLS估计的残差,再回来联立式的FGLS方法,这就失去了面板数据的特色。特别地,尽管RE3不成立,但如果服从一个稳定的一阶自回归过程(, iid)那么可以得到,则只有、和三个未知参数,从而也能得到好的(估计采用CO迭代法,略)。二、关于
10、检验关于随机效果的检验,即不可观测的的影响是否存在?检验的命题自然是,:0.关于的检验,我们可用一阶自回归的AR(1)检验。(:0),如果误差项关于t的检验被检验出是AR(1)过程,不成立,则随机效果的影响存在。另一个基于Lagrange乘子的检验,:0的方便方法是,统计量:N(0,1)这里是Pooled OLS的残差。第三节 固定效果方法一、 关于模型与估计认为基本模型中,中不可观测的因素,i可以是相关的,则复合误差必与中某个解释变量是相关的。因此随机效果的观点就不合适。于是将单列为一个仅与i有关的参数,将基本模型按列排与矩阵形式:,其中是T1的每个元素为1的向量。为消除不可观测影响对FE模
11、型t求和,并求平均,即,于是有:,记,则,称为去时间平均模型。这又回到联立式的面板数据模型。可用POLS的条件0和秩K。回到原模型就是:0.于是就可推得固定效果模型的假定条件为:假定:FE1:0, 00, POLS条件成立 on , i=1,N。可得,具体的,令,则对称,且秩T1.满足0, ,从而乘以模型,可得。假定:FE2:秩K,对抽样,可得:假定:FE3:,(再由FE1成立)。此意味着关于t具有同方差性和序列不相关性。2 2又 0,即使T很小,FE和RE也没有很大区别。下面我们证明,当条件RE1-3成立时,则随机效果模型估计就有比固定效果估计更小的方差。设只包含时间变化的因素,不包含有关于
12、时间常数的因素。那么,=,=其中,(1)(1)T0是正定的。是正定的。命题得证。为要严格检验RE和FE的效果,采用如下的Hausman检验。设是已包含时间变化的解释变量,共有M个。:0. Hausman统计量:H。拒绝,意味着两个估计有显著差异,即认为潜在变量与是相关的。应当采用固定效果的方法。注:和中的未知方差,要用统一的一致估计 另一种基于回归形式的F统计量方法是:,其中和是似去时间的平均。其中用代替,是中随时间变化的子集。设有M个。是去时间平均。那么:0,得到:FF(M,NTKM)接受,意味着RE1-3成立。采用随机效果,拒绝,采用固定效果。注:有可能出现这样的情况,与相关很大,但它们的
13、方差也相差很大,使得H统计量很小,导致不能拒绝而采用随机效果模型,而实际上,我们可能犯了第二类错误:与相关,真,但我们不能拒绝。第六节 一些深入的专题本节处理一些严格外生性条件不成立时和处理一些具有更多个体特征的面板数据模型。它们都有广泛的实际应用背景。一、 模型在基本模型()中,把严格外生假定:0改成0(),即与()的过去t,t-1,1是严格外生的,而与,st可能是序列相关的。我们称是与不可观测因素有序列式条件外生效应。(Sequencially exogenous conentional on the unobserved effect)例如:,。这里是严格外生的,且是序列式条件外生的。因
14、此有0.特别,则是满足序列式条件外生的条件,所以当0,严格外生性条件就不成立。可以证明,当0,由于不可观测因素存在,采用FE和FD变换得到的估计和是有偏不一致的,但随着T,有一致性,而却不行。一般地的有,满足与就是不相关的,对一切s和t,但与仅仅当st时是不相关的。充分条件是,0.这种即有严格外生,又有序列式外生面板模型。典型例子是是相关的,称为现时相关的面板数据模型:隐含了一个重要的与时间相关的解释变量。中某些变量存在测量误差,以及与中某个或某些存在同时性,是一致的。同样可以证明,现时相关性和不可观测因素的存在,导致FE和FD变换得到的估计是有偏不一致的。 如同解决内生性问题一样,我们可以通
15、过引入工具变量消除非严格外生性。但寻求工具变量并不是一件容易的事。这也失去了面板数据模型的意义。事实上,面板数据可用自身的数据的时间差异,在不同假定条件下,选择不同时间的数据作为其工具变量,然后再采用Pooled 2SLS方法,可等到模型的一致估计,或用GMM方法进一步提高有效性。详细的讨论参见伍德里奇的书第11章,或其它有关面板数据分析的书籍,(如Econometric Analysis of Panel Data, Badi H. Baltagi)。这里仅给出一般的说明。首先,用FD或FE变换消除不可观测因素的影响。如FD变换得: ,其次,在不同的假设条件下,选择不同的工具变量。例如,在满
16、足序列式外生条件下,将, 写成矩阵紧凑式:选取工具变量矩阵为:,其中=。也可以选择的滞后项作为工具变量等等。最后,选择Pooled 2SLS或GMM方法,统计检验则需要一些更细致的假设条件。又在FE和FD变换中,常采用FE的变换,理由是,它对各种非严格外生性条件都适用,并且几乎不加条件可以照搬原来的检验方法。在基本模型中,还可以加入更多的特征,例如,扩展基本模型为:,。称为随机趋势模型,也称随机增长模型,其中被认为是不同个体随时间增长率。扩大严格外生性条件为:0,作差分变换,消除,得,0于是,我们可用FE或FD方法(当T3)得到一致估计,特别当存在序列相关性时,采用FD方法,即二阶差分:更稳妥
17、。一般地具有更多个体特征面板数据模型为:,。其中(t固定)是1J的。是J1的,称为不可观测的异质性向量。特别当1就是基本模型,当就是随机趋势模型。引入更多时间常数的不可观测的个体特征后,我们除了关注,当然也关注,但当T很小时,我们无法得到好的估计(因为无法得到i的样本)。转而考虑估计。具体做法是:1. 将,按排成列,得紧凑式为:。这里是TJ的,是TK的。2. 定义投影矩阵,则0,用乘方程两边,得:,记成。又在秩K假定下,做OLS,得是的一致估计。3. 又假定,又知秩tr=TJ。因此, (TJ)。再用,代替,可得的一致估计。再考虑无偏性,得到的无偏一致估计为:。4. 由0记:; ; 可以证明,的
18、渐近方差为:。注:有更有效的同时给出和的非线性工具变量估计方法。二、豪斯曼泰勒模型(一)提出问题有时我们关注的是那些可观测的有关时间常数的解释变量,而不是时间变化的解释变量。然而,我们又认为某些解释变量又与不可观测因素是相关的。因此,前述的随机效果方法结果是不一致的。而固定效果或一阶差分方法又消除了我们所需要的时间常数的解释变量。所以,这三种方法都不适用。但是,如果时间常数的解释变量与是不相关的,而时间变化的解释变量与可能是相关的,那么我们就可把基本模型扩展成:,。其中是时间常数的解释变量,满足条件:0。于是,我们可以按前述的方法按FE变换消除和,并获得一致估计。如何估计?若再加上假定条件0,
19、 0,又假定非奇异。是的一致估计。Hausman和Taylor对上述模型做了一般的处理,称为HT模型。(二)模型构建1、 将和分成,且是1,是1的,且是1,是1,又假定:0且0,即对于一切t,即和的第一部分与是不相关的。仍假定:0()成立。所以,和与对一切t和s是不相关的。将排成列,模型写成: =(*),,有随机效果结构,令是TT去时间平均矩阵,则,又由假设是严格外生的,所以0.是TK矩阵,可作为模型(*)的工具变量,如果手头没有其它的工具变量,那么我们只能回到固定效果模型,消除时间常数,但由假设条件,可知0 ,对一切t且是1T的,也满足0。因此,矩阵是T(KT)的,是HT模型的工具变量矩阵。
20、由可识别的阶条件,则KTJK,即T。所以模型中必须是足够多到中变量个数的作为的工具变量。作为的工具变量,作为自身的工具变量。从而,我们可以用P2SLS方法来估计和。进一步,用GMM或3SLS方法提高估计的有效性。特别,当,有随机效果结构。则可以用所谓广义工具变量估计得到有效的GMM估计。步骤是:1. 用工具变量,对=做P2SLS,并得P2SLS残差,记为;2. 再回到随机效果方法,得到和,再求得拟去时间平均值。3. 再对所有,和工具变量做拟去时间平均变换。再用 P2SLS方法,得到所要的估计和。如果,即帮倒忙时间变化的解释变量的第一部分大于时间常数解释变量的第二部分。那么我们可用去时间平均作为
21、的工具变量,即用作为HT模型的工具变量,则可以代替,减少过多的工具变量。因为中冗余的工具变量导致与的偏相关性,会降低估计的有效性。4. 此外,除从模型本身寻求工具变量之外,还可以从系统外寻找工具变量。例如,中某解释变量与是同时被决定的。那么,我们就可用其它方程中出现的外生变量作为该解释变量的工具。 HT模型是最能体现面板模型特点的模型,有相当的灵活性,应用广泛。需要在实践中不断打磨才能提高。最后提及的是串样本(Cluster Samples)模型。模型仍为=,不过下标i表示不再是一个个体,而是群或一串个体。下标s表示的是在第i串中的第s个个体。通常,不同的串有不同的个体数。因此,对每一串i,模型可写成=,。其中是第i串中样本的个数。为要用面板数据的方法,我们假定串N足够大,且每串内样本是相互独立的,而串与串之间则不是独立同分布的。于是,只要假定与,是不相关的,则。我们就可用POLS方法,类似于随机效果方法,只不过是1向量,且方差矩阵是一个准对角阵。固定效果方法也可用于串样本模型。只要对每串分别做去时间平均,可消除,并可得和。此外,如果不可观测因素同某些解释变量有相互作用,导致内性,也可用前述的2SLS方法处理,不再赘述。23