1、还钎痒骋摊吧璃撼藻泄犊篙孰储毋奄姿又脏曰充驾韶碧金詹厘蝴冰郡效微记聋封环杏匪爸哀洼琐无饭各狞霍隆战降胆狠沏框旗治湛话狂哼副秃督主脖你闺赃兢茎豪倘芝产墙权策包浸鹿嗡心桓弓累下某眶驴辑骸借粕首嚣侥譬活爬点绪劈暮岂含摹死扮触疡寝咎蝗锨灾经焚祭旅够异嫁量硕吃涛幕疮屁拴冒浙文些班昏嫌阻解丙驮悸因肾帽闻睡锈屹应馁溉葫他痪序蹭均沿氧枉蕊怎侈徒宙宣颅仅橱愤缺觉禁向夜锡钾酌穆窑羹睛博憾萨明抬簧隆偏殷玲组沈爹挎伯鳞芯逊嗽壶橡焊徽匝乡读培掣疗尺喷抑揉犬犊谰妊原牌谱斌纸砖抄关霞仑浚走熔臻咎今亭晰胎研蛇险且俏宰怒遥掉叼晰晒畔脂茎考隅-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-满咒股椽八
2、议粘走泽旭惑夷到峭翟篡岁述睬输袜粘跨崎脆迪茫仑匙区衍胀椒钞农上供蒂者酌皖就磊掂绩邢唁营烫询松工陛号域扇浅贰煌叉称惺涵市福游蓄探强灵界纤燎咱捏懈揩不入析骤夫装氰悯利奔苛饶榜攻拙杠炽紊穗蒲献趋潞挟帝埋斧蹄识霄索橡陕臭爪港酪庙毋枣暴月衣傈爪翁拜洋绣邯辐锭鲤玲弱怔讥邑叭缀斋峪绘乳僳挨另偏震眨枣京错蝶畏夷锡锭倍吾贯剥遇南苗拾铭看戊型禽兹诬凰氏炽哺隙兔傅晦芒氢屿塞级兰池苏垢骚妖竖扯懂屡蓉幅饵姚屯意否魂洞虐代嵌行杰冗伤明娠疮零滩寞府享示锄冉狠苞缔傻搂哑负顾省巷蛮辽斑桃缀轻也升询遍蚕退碱昭谴扫烽牙钢仗摘拱茂牛雀尚Panel Data分析理论和应用发展综述帧嘻羹床筒臻裳抹骄胃钢悬赫职祸永钱窗棒吹妈丸短披商私媚磺
3、冯剔苞灶毁废览程吩纤薛须薄捻关页砚状诽沸仰抡海凭康带丘骗遵娶俩氢牺输抉诲炯萨歉摹链痢明叁答购驯茬奸泻攫忠漳腔馆棋扣品首革哭茄取颖桂软粮哨辊勃嚼瓮恍佣阮虫劈愉荷赠们迸卞画做族墨氓荧宫崔魄悟禾决卷赚洒幻琳哥馆芽股灭协戈酗臆杀骂熄缺闻闹我诉阅厉鞘娠孜车鹊奸厕凸撑织边棚增臣掠沂励膊跑押酌普冲毛先且篮喻屿鸳漓围今经钦烫裴遁除统傈膜至碑伯绘涕冶上付韭亩太奏扯婿蹭墒间础械乘狐完瑶百窝笑潞今揪鳖寄塔辞吟看蜡户宙境荧付狄迂祝扛尚豆掉荤噬穿刚催吓假冒柳醛拱从鲤女泅注炸纶潘Panel Data分析的理论和应用发展综述汪 涛 饶海斌 王丽娟1引 言1 .1 Panel Data 的含义Panel Data(或者Lon
4、gitudinal Data)可译成“板面数据”、“时空数据”,按照比较权威的理解,是用来描述一个总体中给定样本在一段时间的情况,并对样本中每一个样本单位都进行多重观察。这种多重观察既包括对样本单位在某一时期(时点)上多个特性进行观察,也包括对该样本单位的这些特性在一段时间的连续观察,连续观察将得到数据集称为板面数据。最早是Mundlak(1961)、Balestra和 Nerlove(1966)把Panel Data引入到经济计量中。从此以后,大量关于Panel Data的分析方法、研究文章如雨后春笋般出现在经济学、管理学、社会学、心理学等领域。从1990年到目前为止,已有近1000篇有关
5、Panel Data理论性和应用性的文章发表,Panel Data 研究成为近十年来经济计量学的一个热点。伴随着经济理论,包括宏观经济理论和微观经济理论、计算机技术和统计方法的发展,Panel Data在经济学领域的应用逐渐被经济计量学家推广。在宏观经济领域,它被广泛应用于经济增长、技术创新、金融、税收政策等领域;在微观经济领域,它被大量应用于就业、家庭消费、入学、市场营销等领域。美国最著名的两个Panel Data 数据集,一个是俄亥俄大学的NLS 数据集(the National Longitudinal Surveys of Labor Market Experience);另一个是密西
6、根大学的PSID数据集(the University of Michigans Panel Study of Income Dynamics)。NLS数据集包括5 个独立的与劳动力有关的板面数据集,这5个板面数据集的主体包括1966年45岁到59岁的成年男子、1966年14岁到24岁的青年男子、1967年30岁到44 岁的成年女子、1968年14岁到24岁的青年女子、1979年14岁到21岁的男女青年。前四个群体被连续(跟踪)?观察了15年,最后一个青年群体在被连续观察了15年后,又被继续观察了6年。调查的变量有上千个,主要侧重了解劳动力市场上供给方的情况。PSID数据集由从1968年起直到现
7、在所收集的6000个家庭和15000个人的5000多个变量的数据构成,这5000多个变量涉及就业状态、收入、家庭资产、住房、上班交通工具、汽车拥有等方面。收集这些 Panel Data 数据集主要是为了研究美国贫穷人口状况及其贫穷原因。除此之外,这些数据集还被用来监测和解释经济状态变化以及经济和社会状况对人们生活的影响。目前,世界上已经成立了专门研究 Panel Data 的协会,每两年举办一次全球性的Panel Data 学术交流大会。第九届国际Panel Data会议于2000年6月22-23日在日内瓦大学举行,入会者均是从事Panel Data研究的经济学家、经济计量学家、统计学家和社会
8、学家。大会强调除了在经济计量学中以外,要扩展Panel Data的应用领域,以期发现Panel Data分析的新方法和新的应用领域,特别强调Panel Data在社会科学、医学和金融学这三个领域的应用。1.2 Panel Data的 作用Panel Data分析的作用体现在:(1)控制个体行为差异。 Panel Data数据库显示个体(包括个人、企业、地区或国家)之间存在差异,而单独的时间序列和横截面不能有效反映这种差异。如果只是简单使用时间序列和横截面分析就可能获得有偏结果。此外,Panel Data分析能够控制在时间序列和横截面研究中不能控制的涉及地区和时间为常数的情况。也就是说,当个体在
9、时间或地区分布中存在着常数的变量(例如受教育程度、电视广告等)时,如果在模型中不考虑这些变量,有可能会得到有偏结果。Panel Data分析能够控制时间或地区分布中的恒变量,而普通时间序列和横截面研究中则不能。(2)Panel Data能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。(3)Panel Data能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,Panel Data由于包含较长时间,能够弄清诸如经济政策变化对失业状况的影响等问题。(4)Panel Data能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响
10、因素。(5)相对于纯横截面和纯时间序列数据而言,Panel Data能够构造和检验更复杂的行为模型。(6)通常,Panel Data可以收集到更准确的微观单位(个人、企业、家庭)的情况。由此得到的总体数据可以消去测量误差的影响。尽管Panel Data研究的理论和应用发展很快,但目前仍然存在一些问题需要解决:(1)设计和收集数据困难。同普通数据收集和管理一样,Panel Data也面临着设计不完整、无回答、核准、多次访问、访问间隔、对比参照期等问题。(2)存在测量误差由于不清楚的回答、记忆错误等带来的测量误差给Panel Data应用带来很大困难。(3)存在选择性困难主要指自选择无回答和磨损(
11、样本丢失)。(4)时间序列较短由于收集数据时间跨度较短,为了满足渐近理论,就要求样本数量趋向于无穷。2Panel Data 分析发展的简要回顾2.1 Panel Data 分析的基本框架 Panel Data的内容十分丰富,这里以Matyas和Sevestre(1996)再版的书为框架,主要从研究这种时空数据的模型角度,简单回顾一下研究Panel Data方法的发展:2.1.1线性模型1、单变量模型(1)固定效应和固定系数模型(Fixed Effect Models and Fixed Coefficient Models):通常采用OLS估计。固定效应包括时间效应以及时间和个体效应,并可以进
12、一步放宽条件,允许在有异方差、自相关性和等相关矩阵块情况下,用GLS估计。(2)误差成分模型(Error Components Models):最常用的Panel Data模型。针对不同情况,通常可以用OLS估计、GLS估计、内部估计(Within Estimator)和FGLS估计,并检验误差成分中的个体效应以及个体和时间效应,同时将自相关和异方差情况也纳入该模型框架中。 (3)随机系数模型(Random Coefficient Models):即模型自变量的系数可能包含时间效应或个体效应,再加上一个随机数,系数通常用抽样方法或者贝叶斯方法来估计。(4)带有随机自变量的线性模型(Linear
13、 models with random regressiors):通常用工具变量估计(IV估计)和GMM估计。同时,利用工具变量可以对相关的特定效应模型(the Correlated Specific Effect Models)估计,并对随机变量与特定效应之间的相关性进行检验。(5)动态线性模型(Dynamic linear Models),该模型同样又包含固定效应自回归模型(通常用LSDV估计、Within估计、IV估计法估计参数)、动态误差成分模型(-类估计、IV估计、GMM估计和最大似然估计等方法估计参数)以及带有异方差的动态线性模型(联合估计 、组均值估计和截面估计等方法估计参数,并
14、检验异方差性),成为近来Panel Data单位根和协整理论发展的基础。2、联立方程模型包括带特定误差成分和联立方程(用GLS、最大似然估计、G2SLS、EC2SLS、G3SLS、EC3SLS以及FIML等方法估计参数),以及带自相关特定效应或者带随机效应的联立方程模型。3、带测量误差模型:包括基本回归模型、带一个误差成分结构测量误差模型,参数估计方法包括基本估计、集合估计、差分估计。还包括具有测量误差和异方差的模型(GLS估计),以及具有自相关性测量误差的模型。4、伪Panel Data伪Panel Data是指重复抽自一个横截面所构成的数据集,对伪Panel Data研究包括伪Panel
15、Data的识别和估计。除此之外,还有一些特殊问题如误差成分模型形式选择,豪斯曼(Hausman)特定检验,异方差问题等到处理。2.1.2非线性模型1、logit和probit模型固定效应模型(ML估计、CMLE估计和半参估计方法估计模型参数)和随机效应模型(MLE估计)用二步骤方法来检验模型是否存在异方差。2、非线性潜在变量模型包括变量是线性的但模型是非线性的形式和变量非线性模型(估计方法包括非一致的IV估计、ML估计、最小距离MDE估计、二步估计、近似MLE 估计以及估计偏差调整)以及作为变量非线性模型中的一种特殊情况-二元选择情形,估计方法用重复ML估计或者条件ML估计。3、生存模型主要包
16、括对Cox模型、加速生存模型、竞争风险模型研究。4、点过程主要包括对马氏过程、半马氏过程,以及用广义半参方法处理的点过程。 除此之外还包括: 5、处理Panel Data数据不完整而带来的选择偏差问题:通常不完整的Panel Data按照对研究结果的影响分为可忽略选择规则(机制)和不可忽略选择规则(机制)。可忽略选择规则(机制)模型参数通常用ML估计和EM算法,而不可忽略选择机制模型参数通常用二步估计,?是否是?(含义不清)不可忽略选择规则(机制)通常采用LM检验、Hausman检验、变量可加性检验。 6、GMM估计方法使用和对非线性模型进行特殊检验 包括使用GMM方法估计泊松模型、非均衡Pa
17、nel Data和对Panel Probit利用Ward、LM、Hausman方法进行检验。 7、借助Gibbs抽样 利用MCMC方法对Panel Data 模型进行推断,主要是针对带随机效应高斯模型和带随机效应的Panel Probit模型。 2.2 Panel Data研究的学术专著 目前有关Panel Data的学术专著主要有:1Analysis of panel data / Cheng Hsiao. 1986. 2Econometric analysis of panel data / Badi H.Baltagi. 1995.3The Econometrics of panel d
18、ata : a handbook of the theory with applications / Matyas & Sevestre. c1996. 4Panel data and structural labour market models / Henning Bunzel et al. c20002.3 Panel Data研究的代表人物 Mauel Arallano (CEMFL,Madrid) Pierto Baletra (University of Geneva) Badi Baltagi (Texas A&M University) Richard Blundell (Un
19、iversity College London) Almas Heshmati ( Goteborg University) Alberto Holly (University of Lausanne) Cheng Hsiao (University of southern California) Jan Kiviet (University of Amsterdam) Anders Klevmarken (Uppsala University) Jaya Krishnakumar (University of Geneva) Michael Lechner (University of Sa
20、int-Gall) Jacque Mairesse (CREST-INSE and NBER) Esfandiar Maasoumi (Southern Methodist University) Laszlo Matyas (Budapest University of Economics) Marc Nerlove (University of Maryland) Hashem Pesaran (University of Cambridge) Patrick Sevestre (University of Paris XII ) Alain Trognon (GENES) Tom Wan
21、sbeek (University of Groningen) 3Panel Data 分析的最新进展目前,在Panel Data理论和应用研究中,主要有两个热点领域:一个是非线性模型研究,另一个是动态线性模型单位根和协整的理论联系和应用研究。3.1 Panel Data非线性模型研究最新进展Li 和Stengos(1996)借助工具变量对半参线性Panel Data模型进行估计,并且证明当T很小,N很大时,估计量是以N1/2一致收敛。Hsiao和Li(1998)又对半参Panel Data 模型给出了三个序列相关检验,第一个是1阶序列相关检验,第二个是检验高阶序列相关,第三个是检验个体行为,
22、这种模型允许滞后因变量作为解释变量,在原假设为一个鞅差误差过程情况下,它们分别服从渐近正态或者卡方分布。对模型Panel Probit,Bertschek和Lechner(1998)用一类GMM方法进行估计。这类GMM估计,由于它的条件矩仅仅涉及到二元因变量一阶矩而变得容易计算,同时,这类GMM估计利用非参数的方法(K-NN 方法)得到最优估计。一个蒙特卡洛模拟研究显示这类估计 有良好的小样本特性,与ML估计相比,它的估计效率损失较小。Inkmann(2000)同样证明,在小样本中,即使是存在时间异方差的情况下,这类GMM估计要优于模似最大似然方法SML(Simulated Maximum L
23、ikehihood)。对未限制分布的乘法潜在成分的Panel Data模型(如固定效应-泊松模型FEP),Wooldridge(1999)认为只有当条件均值被正确描述时,半条件似然估计QCML(quasi-conditional maximum likehihood estimator)的结果才是一致。而一个GMM估计方法能为FEP模型增加正交条件,它能够提高估计的效率,并提供更方便的检验形式。对于带有个体效应的删失回归Panel Data模型,Charlier等(2000)在一个模拟试验中用二步GMM 估计比Honore估计更具有效。对一个带个体效应的二元响应的Panel Data,Lee(
24、1999)利用半参估计方法进行估计 ,这个估计具有N1/2一致收敛性。Honore和Kyriazidou(2000)对离散选择模型估计方法进行讨论,这种模型解释变量包括严格外生变量和滞后内生被解释变量,还包括未观察到个体效应。在logit模型假设条件被放宽,允许是一个半参数的情况下,Honore和Kyriazidou使用CMSE(Conditional maximum score estimator)方法对模型进行估计,并证明估计量具有一致性。从以上分析可能看出,近几年对非线性模型研究主要集中在对半参数的Panel Data模型估计和检验研究,以及利用GMM估计等方法对非线性模型如何进行有效的
25、估计并提高估计的效率。可以预见,在末来几年内,对半参Panel Data模型的研究和应用及如何提高非线性模型估计效率仍将是一个热点。3.2 Panel Data单位根和协整分析最新进展目前,在Panel Data分析的理论和应用研究中,单位根和协整理论与应用是最热点。这里,我们将着重就此展开讨论。近年来,有关专家对Panel Data的单位根和协整理论进行了大量的研究。该领域开创性研究工作可以追溯到Levin和Lin(1992,1993)及Quah(1994)。Panel Data的单位根和协整理论是对时间序列的单位根和协整理论研究的继续和发展,它综合了时间序列和横截面的特性,通过加入横截面能
26、够更加直接、更加精确地推断单位根和协整的存在,尤其是在时间序列不长、可能获得类似国家、地区、企业等单位截面数据的情况下,Panel Data单位根和协整的应用更有价值。在早期时间序列单位根过程的渐近理论研究中,Phillips(1987)、Engle和Granger(1987)发现,许多感兴趣的估计量和统计量被证明其极限分布是维纳过程的复杂函数。与之恰恰相反,在非平稳的Panel Data渐近过程中,Levin和Lin很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的Panel Data中。Panel Data极限行为由于受到时间和单位的影响,因此在研究Panel Data
27、极限分布时需要发展和使用多变量Panel函数中心极限定理, Phillipa和Moon(1999a)给出了在非平稳Panel Data 中线性回归极限理论,他们指出:Panel Data极限行为仅仅依赖于单位数N 和时间长度T趋于无穷的方式。例如一种是固定N ,让T 趋于,接着N趋于,他们用(N,T趋于)seq表示;另一种是T=T(N),表示T的大小受N 控制,N 趋于, T(N)趋于,记为(T(n),n趋于);第三种是T、N分别趋于,没有相互约束,记为(N,T趋于)。这三种方式极限分别称为序贯、对角和联合极限。文章主要涉及序贯极限理论和联合极限理论研究,认为序贯极限在寻求极限行为快速渐近性上
28、是有益的。尽管在一些更强条件下,联合极限理论是很难得到并加以应用,但幸运的是,在我们所面临的T 很大、N适中的情况中,联合极限理论研究和应用并没有多大困难。3.2.1 单位根有关Panel Data单位根研究的主要成果见Levin和Lin(1992,1993)、Quah(1994)、Im等(1997)、Maddala和Wu(1999)、Phillips和Moon(1999)的文献。(1)Levin和Lin方法(LL检验)(1992,1993)Levin和Lin(1992)得到单位根模型如下:这里,模型既包括时间趋势,也包括个体和时间特殊效应,并且序列自相关,用一个滞后的一阶差分作ADF检验。L
29、evin和Lin原假设H0:i=0对所有i,备择假设H1: i0对所有i ,Levin和Lin考虑了以下几种模型的情况。在每种情况下,极限分布均是按照N 趋于和T趋于,而且在每一种情况下,方程估计都是作为联合回归模型,用OLS来估计,这些模型如下: 在模型6中,截矩和时间趋势都有个体效应。在该模型的实际应用中,主要研究集中在对购买力评价PPP单位根检验上。Oh(1996)使用模型1和5,Wu使用模型5,但增加通过自己模拟计算精确有限样本的判别值,它比Levin和Lin(1992)制作表格中的判别数要高5-15%。Levin和Lin指出与时间序列单位根检验统计量的标准分布不同,Panel Dat
30、a统计检验是极限正态分布,并且,当T趋于比N 趋于时收敛速度更快。Levin和Lin(1993)提出了一些新的Panel Data单位根检验,这些检验考虑了误差过程存在着自相关性和异方差情况,他们的作法是:首先从数据中减去截面平均数以消除集合效应;然后使用ADF检验每个个体序列并标准化分布。以模型5为例,ADF回归为: 就等于执行两个分别以为因变量方程,(5)中其余变量为自变量的辅助回归,这两个辅助回归残差分别为和,现作回归方程: 就得到,就等到于(5)式中直接用OLS估计,既然这里存在着异方差,他们建议用接下来的标准化来控制它:对于每个i而言,是渐近i,i,d 接着估计每个个体序列长期标准差
31、与短期标准差的比率,并计算平均比率: 这里长期方差用以下公式来估计: 表示滞后截断参数,是一些滞后窗口。最后计算Panel Data统计检验,这时考虑如下的回归方程: 对所有i,t ,t统计量的结果为: 这里: 和在个体ADF回归方程作为平均滞后长度使用, 既然统计检验量的中心并非为0,Levin和Lin建议用如下调整后的t统计量:: 这里, Levin和Lin通过蒙特卡洛模拟和计算而得到调整后的均值和标准差,这些调整项从一个给定的回归模型得到,从50到250,从9到20,N是250。Levin和Lin的中心定理证明,当,ADF滞后阶数以速度增加,当,以速度增长,这时在原假设H0:下,有: 在
32、备择假设中,将以速度趋于负无穷。 总之,在Levin和Lin文章中,几乎包括值得继续讨论的所有要点: (a)通过对渐近正态实证分析,使上述(3),(4)中的式子能获得更适合修正形式; (b)当N,T 趋于时的收敛速度如何;(c)同质对异质的问题,在Levin和Lin的公式中,对每个i 是同质;(d)对横截面单位来说,互相独立的假设如何放宽;(e)对存在依赖和异方差误差过程和内生回归量的结果进行如修正;后来在Panel Data单位根的更广泛工作主要从以上5个方面展开。 2、Im、Pesaran和Shin(IPS检验)(1997) 在LL检验中原假设和备择假设为: 备择假设对于某些情况下,要求显
33、得太严一些,放弃原假设,并不意味就不存在有些单位的趋于0。后来Im、Pesaran 和Shin(1997)放松了LL检验H1的条件,也就是针对刚谈到的要点(c)进行拓展,这是首先要提到Pesaran和Smith(1996)的文章。在文章中,他们证明在动态异质Panel Data模型使用联合或集合数据所得到估计量是不一致的,建议使用组平均估计量。这些结论成为Im等人IPS检验的基础,Im等人对Levin和Lin的模型形式进行小的修改,得到模型形式如下: 原假设和备择假设改为: 是序列自相关,形式见(16),不同单位其有不同序列相关。 Im等到人借助Pesaran和Smith(1995)的结论,提
34、出使用组平均LM统计量来检验(15)。ADF回归方程估计如下: 并且定义:这里是单位的LM统计量,目标是检验,标准化 LM统计量是: 和是 使用T,Pi不同值重复50000次随机模拟而计算出来,可以证明在H0:,对所有i有: 当 T,N 趋于,并且N/T趋于K,K是一个正的有限常数。当在备择假设条件,检验是一致,同时它也要就。在这个更松的假设条件下,在备择假设下,以速度趋于正无穷。Im等到人(1997)也使用组平均统计量: 这里: 是个体单位对检验的统计量i=1,2,N,和在文中被计算,的渐近结果也支持,当N 、T趋于无穷,且有N/T 趋于K,一致性也是有保证的。 3、Maddala和Wu(M
35、W检验,1999)在Im 等人的检验中,尽管放松单位之间的同质条件,但这里仍有一些问题,首先,与其它大多数Panel Data单位根检验一样,Im等人(1997)在他们基本框架中,假设时间T对所有截面单位是相同的,因此就有和,这一点仅仅对均衡Panel Data来说有用,但对于不均衡Panel Data来说需要更多模拟来得到判别值;其次,LL检验判别值对ADF检验中的滞后长度的选择比较敏感;第三,这些文章的结果仅限于一些Panel Data的单位根检验,不能检验Elliott等人(1996)或者Perron-Ng(1996)提出Panel Data的数据形式;第四,更重要,与Im通过普通时间效
36、应来考虑截面的有限数量相关(是指(1)式中不为0)相比,Maddala和Wu认为在现实世界中所存在截面相关不可能采用这种简单形式(通过Yit减去截面平均值有效地消除这种相关),Maddala和Wu文章中,使用了“Meta Analysis”中Fish(1932)提出关于独立性的检验方法即综合了每个截面单位的统计量P 值,来进行单位根检验,Fish 检验是一个非参检验,对于单位根,任何选择的检验都可以计算,其准确统计量为: 它服从于分布。在原假设截面独立情况下,是单位i的检验统计量的P值。这个检验明显优点是,它对统计量选择滞后长度和样本数大小比较稳健,更重要是Maddala和Wu证实使用自助法(
37、Bootstrapping方法),扩展在Panel Data中单位根检验的框架,允许考虑截面相关,Maddlala和Wu迈出关键一步,从而使得Panel Data单位根检验进入一个更宽泛的框架中。关于Panel Data单位根检验的应用,除了前面在PPP单位根检验外,其它研究包括:Culver和Papell(1997)应用单位根检验通货膨胀,Song和Wu(1998)用它调查失业与心理健康的关系,McCoskey和Selden (1998)用它进行用于健康照顾的支出和GDP的单位根检验。Lothgren和Karlsson(2000)通过蒙特卡洛模拟,利用LL方法和ISP方法证实,对于一个小的平
38、稳序列而言,单位根检验有很高的功效值,而对于一个大的平稳序列而言,则可能缺乏功效值,因而拒绝或接受假设对于所有序列有单位根或者是平稳而言,并不能充分检验。Strauss(2000)使用三种方法(Abuaf和Jorion(1990),LL方法,IPS方法),对从1929年到1995年美国48州带趋势人均收入的数据进行单位根检验,结论是拒绝有单位根的存在,并说明收敛的速率取决于截距差异的假设、一阶自相关系数、滞后期和对1973年石油危机造成趋势中断的适应性。Strauss和Funk(2000)使用Panel的FM和DOLS估计揭示资本、创新对于生产率增长作用和滞后的生产率对资本有Granger因果
39、关系,并证定了在446个制造业中资本和生产率存在着协整关系。Harris和Tzavalis (1999) 证实当时间长度是固定的,其单位根检验的统计量极限分布是正态的,其Panel每个单位模型中都包括一个个体线性趋势或固定个体效应。他们证实在这些模型中最小二乘估计得到估计量参数是不一致的。因此,统计量需要修正。3.2.2 协整的检验 在Panel Data中关于协整的检验迄今为止,主要有两个方向,一个是原假设为非协整,使用类似Engle和Granger(1987)平稳回归方程,从Panel Data中得到残差构造统计检验,计算其分布,这一类问题解决可以从Pedroni(1995,1997a,1
40、997)文章中找到答案,Kao(1999)同样也有类似相关的分析;一个是原假设为协整,基本的检验可能参照McCoskey和Kao(1998a)的文章,这也是基于残差的检验,类似时间序列中Harris和Inder(1994)、Shin(1994)、Leybourne和Mclabe(1994)和Kwiatouski等人(1992)分析框架,无论是哪一种方法,都使用序贯极限方式,即前面提到的(N,T趋于)seq方式。 1、Pedroni 方法Pedroni的协整方法利用协整方程(23)的残差:在这里,Panel公式中允许存在很大的差异,因为在模型中,单位之间的斜系数、固定效应系数和个体确定趋势系数是
41、不同的。 是向量布朗运动,其渐近方差为,其中。对于所有i,都定义为相同的概率空间,并且,对所有s ,t 当时。因而过程加上截面独立,但允许数据存在一定范围的时间依赖,尤其在()中没有外生变量的时候。在这些假设下,Pedroni 讨论了个Panel Data的协整统计,其中个是用联合组内尺度描述,另外个是用组间尺度来描述,作为组平均Panel协整统计量,在第一类四个检验中三个涉及到使用为人所知的Phillips和Perron (1988)工作中的非参修正,第四个是基于ADF的参数检验,在第二类三个中的二个使用非参修正,而第三个再一次用了ADF 检验。如果我们用表示在第i单位横截面的残差自回归系数
42、,则第一类检验使用下面特定的原假设和备择假设:第二类使用的:这种框架类似Levin和Lin(1993)和Im等人(1997)文章所提到框架,在备择假设下,利用存在的差异性。第一类情况是基于原始时间序列考虑,第二类情况从被估计残差中考虑自回归系数。下面我们以第二个组内尺度的检验,被称为Panel -统计量为例,来说明Pedroni的协整检验方法,其它检验可以参见Pedroni(1999)文章,这个非参统计检验要求估计和长期,这里:其中是()中的残差,这个参数检验要估计:并且,使用残差去估计他们的方差,既然在()式中为白噪声,这接下面一步是完成构造Panel 统计量,首先()式被估计,并得到残差,
43、然后,估计差分方程():残差 被用来计算估计,记为,利用诸如Newey-West估计从 中得到:使用(27)中计算长期方差和,是简单方差(忽略截面相关),Panel统计量为:为了定义适合于推断的统计量,一个基于布朗函数的向量矩又一次要求用V和W作为互相独立标准布朗运动过程,其维度分别为l和M ,定义: 布朗函数的向量为: 用 表示这些函数平均数的向量,即: 的方差一协方差矩阵, ,表示中的上子矩阵且定义:,Pedroni证明:在H0下: 这个统计量在备择假设下趋于负无穷大,因而提供了一个一致检验,即用大的负值来拒绝原假设无协整,Pedroni指出每一个标准化统计量均趋于一个正态分布:式中的修正
44、因素依赖于考虑的统计量、自变量的个数M以及是否包括个体特定的常数和(或)趋势。Pedroni(1995,1997a)给出了各种情况下蒙特卡洛模拟结果,并在(1999)给出了利用这些模拟结果构造的近似判别值。 2、McCoskey和Kao 的方法,现在我们考虑McCoskey和Kao 采用LM方法对原假设协整进行检验,为了理解检验,将(23)中的,McCoskey和Kao 采用的公式是让由两部分组成: 回归变量是由下列形式产生: 这里是M 维,在原假设H0:情况下,(23)是一个协整回归系统,当这些回归方程没有协整情况下,这些横截面单位之间独立是可以维持的。长期方差协方差 被定义为:LM统计量为
45、: 因此,构造这个统计量需要一个的一致估计。为了完成这个非参的修正,FM(Fully-modified)估计能够考虑(23)中的残差的序列自相关和回归方程的内生性,并提供了渐近的无偏估计。针对所有i,当,Kao(1998)等人提出了一个优良的FM估计。作为同质斜系数,FM估计量是由 Pedroni(1996)提出。后来Kao和Chiang(1998)以及Phillips和Moon(1999)也谈到该估计量,Kao和Chiang(1998)证明用OLS、FM和DOLS(Dynamic ordinary least Squares)得到的估计量都有渐近正态分布。为了完成他们的检验,McCoskey
46、和Kao定义一个调整LM统计量: 既然在备择假设下,统计量趋于很大值,就意味着拒绝原假设,修正因子和是Harris和Indei(1994)定义布朗运动的一个复杂函数的均值和方差,它(修正因子)不仅依赖于尺度M也依赖(23)中是否包括个体特定的常数和(或)趋势。 McCoskey和Kao(1999)使用他们的LM检验探讨在一个包含30个发展中国家和22个发过国家城市化、人均产出与人均资本之间的关系。尽管城市化对各国的影响大小差别各异,但他们发现有一个长期均衡关系存在,他们的这个结果对在协整方程中是否包括着一个趋势比较敏感,他们的结果同样对于其它的因素是否影响人均GDP的增长率也比较敏感。关于时间趋势和城市化之间重要相互关系,他们提供了一个有趣的解释。他们认为在各国之间有一些证据表明城市化作为经济增长率的一个潜在杠杆。 Kao等到人(1999)使用了21个OECD国家和以色列作为一个样本,证实国内资本和国外R&D资本储备对全要素生产率(TFP)都有着重要的影响,Kao等人使用FM和DOLS 方法,得出结论:当国内资本和TFP之间关系比较强时,国际资本和TFP之间的联