面板数据模型设定检验方法.doc

资源描述

1、1：（STATA的双固定效应）xi：xtreg y x1 x2 i.year,fe2：变系数模型（1）生成虚拟变量tab id,gen(id)gen open1=id1*opengen open2=id2*open（2）变系数命令xtreg y open1 open2。，fe面板数据模型设定检验方法4.1 F检验先介绍原理。F统计量定义为其中RSSr 表示施加约束条件后估计模型的残差平方和，RSSu 表示未施加约束条件的估计模型的残差平方和，J表示约束条件个数，N 表示样本容量，k表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下，F统计量渐近服从自由度为( J, N k )

2、的F分布。以检验个体固定效应回归模型为例，介绍F检验的应用。建立假设H0：ai =a。模型中不同个体的截距相同（真实模型为混合回归模型）。H1：模型中不同个体的截距项ai不同（真实模型为个体固定效应回归模型）。F统计量定义为：F= (31)其中SSEr表示约束模型，即混合估计模型的残差平方和，SSEu表示非约束模型，即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N-1个被估参数。以案例1为例，已知SSEr= 4824588，SSEu= 2270386，F= = 8.1 (32)F0.05(6, 87) = 1.8因为F= 8.1 F0.05(14, 89) = 1.8，推翻原假设

3、，比较上述两种模型，建立个体固定效应回归模型更合理。4.2 Hausman检验对同一参数的两个估计量差异的显著性检验称作Hausman检验，简称H检验。H检验由Hausman1978年提出，是在Durbin（1914）和Wu（1973）基础上发展起来的。所以H检验也称作Wu-Hausman检验，和Durbin-Wu-Hausman检验。先介绍Hausman检验原理例如在检验单一方程中某个回归变量（解释变量）的内生性问题时得到相应回归参数的两个估计量，一个是OLS估计量、一个是2SLS估计量。其中2SLS估计量用来克服回归变量可能存在的内生性。如果模型的解释变量中不存在内生性变量，那么OLS估计

4、量和2SLS估计量都具有一致性，都有相同的概率极限分布。如果模型的解释变量中存在内生性变量，那么回归参数的OLS估计量是不一致的而2SLS估计量仍具有一致性，两个估计量将有不同的概率极限分布。更一般地，假定得到q个回归系数的两组估计量和，则H检验的零假设和被择假设是：H0: plim(-) = 0H1: plim(-) 0假定两个估计量的差作为统计量也具有一致性，在H0成立条件下， (-) N(0, VH)其中VH是(-)的极限分布方差矩阵。则H检验统计量定义为H = (-) (N-1)-1 (-) c2(q) （33）其中(N-1)是(-)的估计的方差协方差矩阵。在H0成立条件下，H统计量渐

5、近服从c2(q)分布。其中q表示零假设中约束条件个数。H检验原理很简单，但实际中VH的一致估计量并不容易。一般来说，N-1= Var(-) = Var()+Var()-2Cov(,) （34）Var()，Var()在一般软件计算中都能给出。但Cov(,)不能给出。致使H统计量（33）在实际中无法使用。实际中也常进行如下检验。H0：模型中所有解释变量都是外生的。H1：其中某些解释变量都是内生的。在原假设成立条件下， H = (-) (-)-1 (-)c2(k) （36）其中和分别是对Var()和Var()的估计。与（34）式比较，这个结果只要求计算Var()和Var()，H统计量（36）具有实用

6、性。当q表示一个标量时，H统计量（36）退化为， H = c2(1)其中和分别表示和的样本方差值。H检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定检验、模型嵌套检验、建模顺序检验等。下面详细介绍面板数据中利用H统计量进行模型形式设定的检验。假定面板模型的误差项满足通常的假定条件，如果真实的模型是随机效应回归模型，那么b的离差OLS估计量和随机GLS法估计量都具有一致性。如果真实的模型是个体固定效应回归模型，则参数b的离差OLS法估计量是一致估计量，但随机GLS估计量是非一致估计量。可以通过H统计量检验(-)的非零显著性，检验面板数据模型中是否存在个体固定效应。原假设与备

7、择假设是H0: 个体效应与回归变量无关（个体随机效应回归模型）H1: 个体效应与回归变量相关（个体固定效应回归模型）例：=0.7747，s() = 0.00868（计算结果对应图15）；=0.7246，s() = 0.0106（计算结果取自EViwes个体固定效应估计结果） H = = = 68.4因为H =68.4 c20.05 (1) = 3.8，所以模型存在个体固定效应。应该建立个体固定效应回归模型。5面板数据建模案例分析图13 混合估计散点图图14 平均估计散点图以案例1为例，图13是混合估计对应数据的散点图。回归结果如下CP = 129.63 + 0.76 IP(2.0) (79

8、.7)图14是平均值数据散点图。先对数据按个体求平均数和。然后用15组平均值数据回归，= -40.88+0.79(-0.3) (41.1) 图15 离差估计散点图图16 差分估计散点图图15是离差数据散点图。先计算CP、IP分别对、的离差数据，然后用离差数据计算OLS回归。CPM = 0.77 IPM (90)图16是一阶差分数据散点图。先对CP、IP各个体作一阶差分，然后用一阶差分数据回归。DCP = 0.71 DIP(24)案例2（file:5panel01a）美国公路交通事故死亡人数与啤酒税的关系研究见Stock J H and M W Watson, Introduction to

9、Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故，约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨13点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有19821988年48个州共336组美国公路交通事故死亡人数（number）与啤酒税（beertax）的数据。图17 1982年数据散点图(File: 5panel01a-graph01) 图18 1988年数据散点图(File:5panel01a- graph07)1982年数据的估计结果（散点图见图17）1982 = 2.01 + 0.15 beertax19

10、82 (0.15) (0.13)1988年数据的估计结果（散点图见图18）1988 = 1.86 + 0.44 beertax1988 (0.11) (0.13)图19 混合估计共336个观测值。估计结果仍不可靠。（file: 5panel01b）19821988年混合数据估计结果（散点图见图19）19821988 = 1.85 + 0.36 beertax19821988 (42.5) (5.9) SSE=98.75显然以上三种估计结果都不可靠（回归参数符号不对）。原因是啤酒税之外还有许多因素影响交通事故死亡人数。个体固定效应估计结果（散点图见图1）it = 2.375 + - 0.66 b

11、eertax it (24.5) (-3.5) SSE=10.35双固定效应估计结果（散点图见图1）it = 2.37 + - 0.65 beertax it (23.3) (-3.25) SSE=9.92以上两种回归系数的估计结果非常近似。下面的F检验证实参数-0.66和0.65比较合理。用F检验判断应该建立混合模型还是个体固定效应模型。H0：ai =a。混合回归模型（约束截距项为同一参数）。H1：ai各不相同。个体固定效应回归模型（截距项任意取值）F= （以EViwes5.0计算自由度） = 50.8F0.05(48, 286) = 1.2因为F= 50.8 F0.05(14, 89) = 1.2，推翻原假设，比较上述两种模型，建立个体固定效应回归模型更合理。下面讨论面板差分数据的估计结果。利用1988年和1982年数据的差分数据得估计结果（散点图见图3）1988 -1982 = -0.072 - 1.04 (beertax1988 - beertax1982) (0.065) (0.36) 图20 差分数据散点图(File:5panel01a- graph08)

展开阅读全文