资源描述
1:(STATA的双固定效应)xi:xtreg y x1 x2 i.year,fe
2:变系数模型
(1)生成虚拟变量
tab id,gen(id)
gen open1=id1*open
gen open2=id2*open
(2)变系数命令
xtreg y open1 open2。。。,fe
面板数据模型设定检验方法
4.1 F检验
先介绍原理。F统计量定义为
其中RSSr 表示施加约束条件后估计模型的残差平方和,RSSu 表示未施加约束条件的估计模型的残差平方和,J表示约束条件个数,N 表示样本容量,k表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F统计量渐近服从自由度为( J, N – k )的F分布。
以检验个体固定效应回归模型为例,介绍F检验的应用。建立假设
H0:ai =a。模型中不同个体的截距相同(真实模型为混合回归模型)。
H1:模型中不同个体的截距项ai不同(真实模型为个体固定效应回归模型)。
F统计量定义为:
F== (31)
其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N-1个被估参数。
以案例1为例,已知SSEr= 4824588,SSEu= 2270386,
F= =
== 8.1 (32)
F0.05(6, 87) = 1.8
因为F= 8.1 > F0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。
4.2 Hausman检验
对同一参数的两个估计量差异的显著性检验称作Hausman检验,简称H检验。H检验由Hausman1978年提出,是在Durbin(1914)和Wu(1973)基础上发展起来的。所以H检验也称作Wu-Hausman检验,和Durbin-Wu-Hausman检验。
先介绍Hausman检验原理
例如在检验单一方程中某个回归变量(解释变量)的内生性问题时得到相应回归参数的两个估计量,一个是OLS估计量、一个是2SLS估计量。其中2SLS估计量用来克服回归变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么OLS估计量和2SLS估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内生性变量,那么回归参数的OLS估计量是不一致的而2SLS估计量仍具有一致性,两个估计量将有不同的概率极限分布。
更一般地,假定得到q个回归系数的两组估计量和,则H检验的零假设和被择假设是:
H0: plim(-) = 0
H1: plim(-) ¹ 0
假定两个估计量的差作为统计量也具有一致性,在H0成立条件下,
(-) N(0, VH)
其中VH是(-)的极限分布方差矩阵。则H检验统计量定义为
H = (-)' (N-1)-1 (-) ® c2(q) (33)
其中(N-1)是(-)的估计的方差协方差矩阵。在H0成立条件下,H统计量渐近服从c2(q)分布。其中q表示零假设中约束条件个数。
H检验原理很简单,但实际中VH的一致估计量并不容易。一般来说,
N-1= Var(-) = Var()+Var()-2Cov(,) (34)
Var(),Var()在一般软件计算中都能给出。但Cov(,)不能给出。致使H统计量(33)在实际中无法使用。
实际中也常进行如下检验。
H0:模型中所有解释变量都是外生的。
H1:其中某些解释变量都是内生的。
在原假设成立条件下,
H = (-)' (-)-1 (-)~c2(k) (36)
其中和分别是对Var()和Var()的估计。与(34)式比较,这个结果只要求计算Var()和Var(),H统计量(36)具有实用性。
当q表示一个标量时,H统计量(36)退化为,
H = ~c2(1)
其中和分别表示和的样本方差值。
H检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定检验、模型嵌套检验、建模顺序检验等。
下面详细介绍面板数据中利用H统计量进行模型形式设定的检验。
假定面板模型的误差项满足通常的假定条件,如果真实的模型是随机效应回归模型,那么b的离差OLS估计量和随机GLS法估计量都具有一致性。如果真实的模型是个体固定效应回归模型,则参数b的离差OLS法估计量是一致估计量,但随机GLS估计量是非一致估计量。可以通过H统计量检验(-)的非零显著性,检验面板数据模型中是否存在个体固定效应。原假设与备择假设是
H0: 个体效应与回归变量无关(个体随机效应回归模型)
H1: 个体效应与回归变量相关(个体固定效应回归模型)
例:
=0.7747,s() = 0.00868(计算结果对应图15);
=0.7246,s() = 0.0106(计算结果取自EViwes个体固定效应估计结果)
H = = = 68.4
因为H =68.4 > c20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。
5.面板数据建模案例分析
图13 混合估计散点图 图14 平均估计散点图
以案例1为例,图13是混合估计对应数据的散点图。回归结果如下
CP = 129.63 + 0.76 IP
(2.0) (79.7)
图14是平均值数据散点图。先对数据按个体求平均数和。然后用15组平均值数据回归,
= -40.88+0.79
(-0.3) (41.1)
图15 离差估计散点图 图16 差分估计散点图
图15是离差数据散点图。先计算CP、IP分别对、的离差数据,然后用离差数据计算OLS回归。
CPM = 0.77 IPM
(90)
图16是一阶差分数据散点图。先对CP、IP各个体作一阶差分,然后用一阶差分数据回归。
DCP = 0.71 DIP
(24)
案例2(file:5panel01a)美国公路交通事故死亡人数与啤酒税的关系研究
见Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1~3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数(number)与啤酒税(beertax)的数据。
图17 1982年数据散点图(File: 5panel01a-graph01) 图18 1988年数据散点图(File:5panel01a- graph07)
1982年数据的估计结果(散点图见图17)
1982 = 2.01 + 0.15 beertax1982
(0.15) (0.13)
1988年数据的估计结果(散点图见图18)
1988 = 1.86 + 0.44 beertax1988
(0.11) (0.13)
图19 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b)
1982~1988年混合数据估计结果(散点图见图19)
1982~1988 = 1.85 + 0.36 beertax1982~1988
(42.5) (5.9) SSE=98.75
显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因素影响交通事故死亡人数。
个体固定效应估计结果(散点图见图1)
it = 2.375 +… - 0.66 beertax it
(24.5) (-3.5) SSE=10.35
双固定效应估计结果(散点图见图1)
it = 2.37 +… - 0.65 beertax it
(23.3) (-3.25) SSE=9.92
以上两种回归系数的估计结果非常近似。下面的F检验证实参数-0.66和0.65比较合理。
用F检验判断应该建立混合模型还是个体固定效应模型。
H0:ai =a。混合回归模型(约束截距项为同一参数)。
H1:ai各不相同。个体固定效应回归模型(截距项任意取值)
F= (以EViwes5.0计算自由度)
=== 50.8
F0.05(48, 286) = 1.2
因为F= 50.8 > F0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。
下面讨论面板差分数据的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图3)
1988 -1982 = -0.072 - 1.04 (beertax1988 - beertax1982)
(0.065) (0.36)
图20 差分数据散点图(File:5panel01a- graph08)
展开阅读全文