收藏 分销(赏)

面板数据模型及金融相关案例分析.ppt

上传人:精*** 文档编号:9635038 上传时间:2025-04-01 格式:PPT 页数:122 大小:7.67MB 下载积分:20 金币
下载 相关 举报
面板数据模型及金融相关案例分析.ppt_第1页
第1页 / 共122页
面板数据模型及金融相关案例分析.ppt_第2页
第2页 / 共122页


点击查看更多>>
资源描述
王中昭制作,案例,2,:,储蓄,案例,4,:利用,VAR,模型对我国货币政策的有效性进行检验。,案例,5,:面板数据及其应用,案例,1,,货币供应量模型的建立与分析,案例,3,:银行革新措施 的效果分析,案例,6,:中国税收增长分析,案例,1,货币供应量模型建立与分析,体现货币总量的指标有,M0,,,M1,,,M2,,,M3,等,M0-,现金;,M1-M0+,活期存款,反映了社会的直接购买能力,是狭义货币供应量;,M2-M1+,定期存款,非支票性储蓄存款,反映了现实的购买力,也反映了潜在的购买力,广义货币供应量;,M3-M2+,私有机构和公司的大额定期存款,,L-M3+,各种有价证券。,影响货币供应量的变动因素取:居民消费物价指数(,1978=100,),CPI,,全国城乡人民币储蓄存款余额(,cky,单位:亿元),国内信贷(,Gsd,,亿元),国内生产总值(,gdp,,亿元),选取,1990-2003,年。,数据文件,al5.wf1,。,一、模型的选择,下面仅考察广义货币供量,M2,与,gdp,gsd,cky cpi,的关系。分别用这四个变量与,M2,的散点图,如下,前者三个均为线性关系,而最后一个不是。,故初步选取模型如下:,M2,t,=,0,+,1,gdp,t,+,2,gsd,t,+,3,cky,t,+,4,cpi,2,t,+,t,Gsd,系数为负,与理论不符,而且,T,检验也没通过。,进一步检验可知,gsd,和,cky,存在严重多重共线性。从下图可知,gsd,的,VIF,值达到,500,多,故去掉,cky,再计算。,下面的模型基本上合理。,GDP,每增加一个亿会使,M2,增加,1.347,亿,这是乘数的作用,对于国内信贷也有同样的解释。,也可以用广义差分进一步修改(见下页)。,广义差分模型。,命令方式:,Ls m2-0.106*m2(-1)c gsd-0.106*gsd(-1)gdp-0.106*gdp(-1)cpi2-0.106*cpi(-1)2,结果没有多大改善,也可用,AR,(,I),来处理。异方差检验?,改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存款也迅速增长。经济学界的一种观点认为,,20,世纪,90,年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(,Y,),以国民总收入,GNI,代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。,案例,2,:,储蓄,数据如下:下表为,1978-2003,年中国的国民总收入,GNI,和城乡居民人民币储蓄存款年底余额,Y,及增加额,YY,的数据。单位:亿元。数据来源:,中国统计年鉴,2004,。表中“城乡居民人民币储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。数据文件,al1.wf1,年,GNI,Y,YY,年,GNI,Y,YY,1978,3624.1,210.6,1991,21662.5,9241.6,2121.8,1979,4038.2,281,70.4,1992,26651.9,11759.4,2517.8,1980,4517.8,399.5,118.5,1993,34560.5,15203.5,3444.1,1981,4860.3,532.7,124.2,1994,46670,21518.8,6315.3,1982,5301.8,675.4,151.7,1995,57494.9,29662.3,8143.5,1983,5957.4,892.5,217.1,1996,66850.5,38520.8,8858.5,1984,7206.7,1214.7,322.2,1997,73142.7,46279.8,7759,1985,8989.1,1622.6,407.9,1998,76967.2,53407.5,7615.4,1986,10201.4,2237.6,615,1999,80579.4,59621.8,6253,1987,11954.5,3073.3,835.7,2000,88254,64332.4,4976.7,1988,14922.3,3801.5,728.2,2001,95727.9,73762.4,9457.6,1989,16917.8,5146.9,1374.2,2002,103935.3,86910.6,13233.2,1990,18598.4,7119.8,1923.4,2003,116603.2,103617.7,16631.9,为了研究,1978,2003,年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示:从图中尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量(,YY,),并作时序图。见下页。,从居民储蓄增量图可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:在,1996,年和,2000,年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看,也呈现出了相同的阶段性特征。,为了分析居民储蓄行为在,1996,年前后和,2000,年前后三个阶段的数量关系,引入虚拟变量,D,1,和,D,2,。,D,1,和,D,2,的选择,是以,1996,、,2000,年两个转折点作为依据,并设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:,计算结果如下:,思考:,1,、根据下面结果如何进行分析?这表明三个时期居民储蓄增加额的回归方程在统计意义上确实是不相同的。,1996,年以前收入每增加,1,亿元,居民储蓄存款的增加额为,0.14568,亿元;在,1996-2000,年,则为,-0.197523,亿元,,2001,年后为,0.337256,亿元。已发生了很大变化。上述模型与城乡居民储蓄存款与国民总收入之间的散布图是吻合的,与当时中国的实际经济运行状况也是相符的。,需要指出的是,在上述建模过程中,主要是从教学的目的出发运用虚拟变量法则,没有考虑通货膨胀因素。而在实证分析中,储蓄函数还应当考虑通货膨胀因素。,2,、其它形式的模型呢?如乘法和加法?,案例,3,:银行革新措施 的效果分析,Y,是某一银行提出某项革新措施直到革新技术被采用的间隔月数,,X,是银行总资产,,D1,是定性(虚拟)变量,表示:,1,是股份制银行,,0,是农村信用社。数据如下表。研究采取某项银行革新措施的速度,Y,与银行的规模,X,和银行类型的关系。数据文件,al6.wf1,。,Y,X,D1,Y,X,D1,17,151,0,28,164,1,26,92,0,15,272,1,21,175,0,11,295,1,30,31,0,38,68,1,22,104,0,31,85,1,0,277,0,21,224,1,12,210,0,20,166,1,19,120,0,13,305,1,4,290,0,30,124,1,16,238,0,14,246,1,要求建立虚拟变量模型,三种形式都要考虑找到比较好的模型,并分析系数的含义。,从加法模型知:,银行类型对采纳革新技术平均所需时间的差异表现为,D,1,的系数,它的值为,8.055,,,表明信用社采取革新技术平均比股份制银行少,8,个月多。,从乘法模型可知:银行总资产与采纳革新技术所需时间成反比。资产规模越大,则采纳革新技术措施间隔时间就越长,同时也表明,股份制银行总资产系数为,-0.082285,,而农村信用社为,-0.119044,,这说明农村信用社总资产对采纳革新技术所需时间的影响要比股份制银行大(负向影响大)。,混合模型效果不好。,案例,4,:利用,VAR,模型对我国货币政策的有效性进行检验。,1,、数据来源:,取我国狭义货币供应量,M1,,商品零售物价指数,CPI,(,1994,年,1,季度为,100,),以及代表产出水平的国内生产总值,GDP,的季度数据,时间为,1994,年第一季度到,2004,年第二季度。文件,aL3.wf1,滞后期,b=1,b=2,b=3,b=4,AIC,39.56,39.43,39.14,38.95,SC,40.1,40.31,40.42,40.63,2,、建模。,在选择滞后项时,应用信息准则,根据金融理论,货币效应时滞在一年左右,所以我们选择最大,4,阶。,根据,AIC,信息准则,我们应选择滞后项为,4,,根据,SC,信息准则,我们应选择滞后项为,2,或,3,,考虑到,3,阶后,AIC,值下降较缓,以及结合模型的,R,2,和,Determinant Residual Covariance,的值,最后选择滞后项为,3,。或者由,Eviews5.1,可得到(在,VAR,模型估计结果窗口中点,view,再选取,lag structure,lag length Criteria),:,在五个评价指标中有,4,个认为滞后期应为,3,(见系统自动标出的结果,即*号处)。,本例选择结果如下:,设置滞后期,必须配对出现,例如,,1 2 5 8,则每个方程所包含的变量的滞后期均为:,y,t-1,y,t-2,y,t-5,y,t-6,y,t-7,y,t-8,是否需要常数项。不需要去掉,c,。,变量下面第,1,和,2,括号值分别标准差和,T,统计量,在同一变量不同的滞后项,有的是显著的,有的是不显著的,有的符号是相反的,验证了我们所说的,VAR,模型是缺乏理论依据的。,首先,对于物价,CPI,上一季度的货币供应量对其的影响是显著的,并且系数为正,与理论相符,说明货币供应量的增加将使物价水平上升,而上第二个季度,M1,的对,CPI,的影响是负的,而且更显著,正负交叉影响表现出,M1,和,CPI,相互关系的特征。,其次,对于货币供应量来说,上一季度的,GDP,对其影响不显著,说明货币供应量不受上期的产出但受物价水平的影响显著。但上第,2,季度的,GDP,对,M1,产生显著负影响。,再次,对于,GDP,上期的货币供应量对其是显著正影响。这从一个侧面验证了前几年我国实施的稳健的货币政策效果是有效的,而上期物价水平则对产出是不显著负影响。,注:,为了保证序列的平稳性,也可先对所有的数据进行处理再建立,VAR,模型,如取它们的自然对数。用,genr,功能。,Lgdp=log(gdp),Lcpi=log(cpi),Lm1=log(m1),。,然后分别对,Lgdp,Lcpi,Lm1,三变量建立,VAR,模型。或者直接用,log(gdp),log(cpi),log(m1),建立,VAR,模型。,2,、预测,这是,Eviews3.1,的弹出形式,点这里就可求出拟合值。,Eviews5.1,形式为,点,make model,后得到:,点,Solve,得到如下对话框,基本选择有,5,项:,在模拟种类中有,2,项,第,1,为确定性,第,2,为随机性。,在动态方法中有动态求解等项。在静态条件下,滞后期是用实际值,而在动态情况下,滞后期用拟合值,在,Solution scenarios&output(,输出结果保存的序列名),求解得到的序列名是采用原序列加上后缀的方式命名,例如如果选择,baseline,,则,cpah,的预测值放在,Cpah_0,。,在备份序列名,以免在用不同模型进行预测时,冲掉了上一次的预测值。例如如果选择了,scenarios 1,,则预测值放在,Cpah_1,中。,注意:上述两对话框都不能选择,Actual(,实际值),否则计算不出预测值。,此时必须勾上下面的选择才有效。,在工作文件窗口中,cpi,和,cpi_0,分别为原始数据及拟合值,其它同理。,可以用,Genr,命令求出每个变量的残差。,Baseline,为预测值(拟合值),3,、脉冲响应,脉冲响应函数是度量来自于每个方程的随机误差项的一个标准差新息冲击时被解释变量的响应程度和持续时间。,通过测量脉冲响应,我们能够清楚地看到随机误差项的一个标准差新息在某一时期的冲击对未来各期被解释变量的传导作用。,在方程的输出窗口中点,viewimpulse Response,得到:,这是,Eviews3.1,弹出结果。在弹出对话框中:左边:从上到下:一是变量所在方程随机扰动项的一个标准差的变动的变量(也即方程内生变量名)。二是欲要计算脉冲响应的变量名。三是输入,VAR,模型出现的变量顺序,变量的顺序会对结果产生影响。四是计算的期数。右边:上面部分是选择结果的显示方式,表、每个脉冲响应函数图、合成图(来自于同一变量冲击的脉冲响应函数图合并显示)。中间部分是选择计算脉冲响应或还方差分解。下面部分是关于计算脉冲响应函数标准差的方法:一是不计算,二是渐近解析法、三是蒙特卡洛法。,这是,Eviews5.1,结果。在弹出对话框中本例选择结果如下:,基本上和,3.1,是类似的。注意:虽然乔利期基,(cholesky),分解被广泛应用,但是方程的顺序将会强烈地影响脉冲响应。因为如果新信息是相关的话,它们将包含一个不与某特定变量相联系的共同成分。通常将共同成分的效应归属于,VAR,系统中第一个出现的变量(依照方程顺序),即,Cpi,、,m1,、,gdp,的方程对应的,1t,2t,3t,的共同成分都归到,1t,,因此方程的顺序(即变量顺序)会影响脉冲响应的结果。但如果两个变量之间的相关性不大时,结果与排序无关。,积累反应,一般不选取,M1,对,M1,的一个标准差冲击,一开始反应敏感,在第一期达到最高值,随后迅速下降到最低点,然后缓慢上升保持不变在,10,期内都是正的,。,M1,对,gdp,的一个标准差冲击的反应比较弱,几乎在所,0,左右波。说明货币流通量对经济的冲击较弱。,M1,对,Cpi,的一个标准差冲击的反应敏感,在第一期达到最低值,然后趋于平稳,同时表明,M1,对,CPI,的传导作用始终为负。,GDP,对,Cpi,、,GDP,、,m1,的一个标准差冲击的反应的脉冲响应函数图。分析略。,根据上面的脉冲响应函数图,可以详细分析各个变量对另一些变量冲击的持续效应和持续时间。,Cpi,分别对,cpi,、,GDP,、,m1,的一个标准差冲击的反应的脉冲响应函数图。自己作分析。,对于单个脉冲响应图,,Eviews,给出一个,2S.E,的置信区间,这是选择顺序为,m1,gdp,cpi,,其结果和前面的结果有一定的差异,见右图。,广义脉冲响应,广义脉冲响应函数,(Generalized Impulse),是,Pesaran,和,shin,在,1998,年提出的。,Pesaran,和,Shin,证明:,1,、广义脉冲响应是唯一的,即消除了变量的顺序会影响脉冲响应结果的问题。并且考虑了观测到的不同形式冲击和它们之间的相关性。,2,、,Pesaran,和,Shin,还进一步证明了正交分解的脉冲响应是广义脉冲分解的特殊形式。当协方差矩阵是对角阵时,二者是一致的。,3,、它可应用于非线性多变量模型中,因为它不考虑冲击的范围、符号和历史。,因此,利用广义脉冲响应函数得到的结果更具稳定性和说服力。,广义脉冲响应的计算如下:,选择此项,则右边就不会存在变量顺序选择问题。,广义脉冲响应,4,、方差分解,通过方差分解可以了解到各个变量的冲击能解释某个变量的份额以及各个变量有没有预测作用,因为方差,S.E,的变动代表着该变量的变动规律。在模型的输出窗口中选取,Viewvarance decomposition,到方差分解。注意方差也与变量的顺序有关。,这图是显示,M1,的方差分解,显示,cpi,的冲击从弱到强,长期来看能解释,m1,的,40%-48%,,而,gdp,能解释约,6%,左右。,CPI,对,M1,的冲击是明显的。同时表明,CPI,对,M1,变动的预测作用约,41.3%.,这图是显示,cpi,的方差分解,显示,gdp,的冲击从长期来看能解释,cpi,的,4%,左右,而,m1,也是能解释,4%,左右。两者相差不大。,这图是,GDP,的方差分解,显示,cpi,的冲击基本上能解释,gdp,的,22%,左右。而,M1,冲击从弱到强,平均能解释,25%,左右。,案例,5,:面板数据,(Panel data),及其应用,面板数据是同时具有时间和截面性质的数据。是近,20,年来计量经济学最重要的发展领域之一。下面从实例来介绍面板数据应用。,一、面板数据模型的类型,在很多经典的计量经济学模型中所利用的数据不是只利用了时间序列数据就是只利用了截面数据,而实际上,仅利用了时间序列数据或者截面数据对很多经济问题进行分析是远远不够的。我们经常碰到在同一时间包含不同截面的数据信息。例如各个国家的(或者省份)若干系列的年度,GDP,数据,或者是一段时间不同地区的失业数据。这类数据既有时间序列特性又包含一定的横截面特点。因此以前的计量经济学方法就需要调整。,单方程面板数据的一般形式为:,Y,it,=,i,+,i,X,it,+,it,,,(i=1,2,N,t=1,2,T),其中,N,表示面板数据中含有,N,个个体,,T,表示时间序列的最大长度,如果固定,t,不变,则,Y,it,(,i=1,2,N),是横截面上的,N,个随机变量,;,如果固定,i,不变,则,Y,it,(,t=1,2,T),是纵向面上的一个时间序列(个体),;k,为解释变量个数,,常用的模型有如下三种:,(,1,)、,i,=,j,i,=,j,(,2,)、,i,j,i,=,j,(,3,)、,i,j,i,j,Y,it,=,i,+X,it,i,+,it,,,(i=1,2,N,t=1,2,T),(,1,)、,i,=,j,i,=,j,(,2,)、,i,j,i,=,j,(,3,)、,i,j,i,j,对于(,1,),在横截面上无个体差异,没有结构的变化(例如可认为所有省份是完全一样的),则普通的最小二乘法估计给出了,、,一致有效估计。此时把相当于把多个时期的截面数据放在一起作为样本数据。,方程(,2,)为变截距模型,在横截面上的个体影响不同,个体的影响表现为模型中被遗漏或者难以观测的其它影响变量,一般分为固定影响(进一步分为个体固定和时间固定)和随机影响两种模型。,方程(,3,)变系数模型,除了存在个体影响使在横截面上表现不同外。个体影响还会使解释变量的系数发生变化,表现为随个体不同(或者时间不同,或者随机影响不同)而,j,不同。,用面板数据建立模型通常有三种:混合模型、固定效应模型和随机效应模型。固定效应模型又分为三种:个体固定效应模型、时间固定效应模型和个体时间固定效应模型。,(一)、混合模型,如果从时间上看,不同时间之间不存在显著性差异,从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(,OLS,)估计参数。如果一个面板数据定义为:,Y,it,=+X,it,+,it,,,(i=1,2,N,t=1,2,T),则称为混合模型,其特点是无论对任何个体和截面,回归系数,和,都相同。,(二),.,固定效应模型,固定效应模型又分为三种:个体固定效应模型、时间固定效应模型和个体时间固定效应模型,.,1.,个体固定效应模型,如果面板数据模型定义为:,Y,it,=,i,+X,it,+,it,,,(i=1,2,N,t=1,2,T),其中,i,为随机变量,是随不同的个体是不同的,表示对于,i,个体有,i,个不同截距项,并且其变化与,X,it,有关系,,Y,it,为被解释变量,,X,it,为解释变量向量,,为回归系数向量,对于不同个体回归系数相同,则称为个体固定效应模型。,个体固定效应模型也可表示为如下形式:,Y,it,=,0,+,1,X,it,+,1,Z,i,+,it,以本例为例,考察不同省份和不同时间的消费与收入之间的关系。,设,Y,和,X,分别表示消费和收入,,Z,为遗漏或者难以观测的其它影响变量,此变量体现了省市之间(个体)的差异,但又不随时间变化而变化,例如第,i,个省的消费特征、消费习惯和消费文化等因素是不同的。然而假定这些因素又不随时间变化而发生变化。这样可以用个体固定效应模型描述,其线性模型为:,Y,it,=,0,+,1,X,it,+,1,Z,i,+,it,i=1,N,表示,N,个省市(个体),,t=1,2,T,,,t,表示时间。,Z,i,仅与个体有关,与时间无关,,Z,i,的取值为二元变量:,为了区别不同的个体,需引入,N-1,个,Z,i,.(,引入,N,个会出现多重共线性问题)。,Y,it,=,0,+,1,X,it,+,1,Z,1,+,2,Z,2,+,N-1,Z,N-1,+,it,上式就是一个线性形式的个体固定效应模型。其个体差异的不同体现在截距不同上。第,i,个个体的截距项为:,i,=,0,+,i,如果有,k,个解释变量,则个体固定效应模型为:,Y,it,=,0,+,1,X,1,it,+,k,X,k,it,+,1,Z,1,+,2,Z,2,+,N-1,Z,N-1,+,it,可以很容易地把上述模型写成如下矩阵形式:,Y,it,=,i,+X,it,+,it,2.,时间固定效应模型,如果面板数据模型定义为:,Y,it,=,i,+X,it,+,it,其中,i,为随机变量,是随不同的时间是不同的截面,表示对于,T,时间截面有,T,个不同截距项,并且其变化与,X,it,有关系,,Y,it,为被解释变量,,X,it,为解释变量,,为回归系数,对于不同时间回归系数相同。,假设遗漏或者难以观测的影响变量随时间变化而发生变化,但在省市之间(个体截面)不发生变化。如消费税、存款利率的变化等因素的影响。则引入时间二元变量,D,来体现。即时间固定效应模型也可表示为:,Y,it,=,0,+,1,X,1,it,+,k,X,k,it,+,2,D2,t,+,T,DT,t,+,it,其中,i,=,0,+,i,其中,Di,只能有,T-1,个,否则就会出现多重共线性。,3.,个体时间固定效应模型,.,模型形式为:,Y,it,=,i,+,i,+X,it,+,it,(i=1,2,N,t=1,2,T),其中,i,为随机变量,是随不同的个体是不同的,表示对于,i,个体有,i,个不同截距项,其中,i,为随机变量,是随不同的时间是不同的,表示对于,T,时间截面有,T,个不同截距项。,即如果模型要体现遗漏或者难以观测的两种类型变量:一类是随个体不同而变化,但又不随时间变化而变化;另一类是不随个体不同而发生变化,但随时间变化而变化。则需要建立个体时间固定效应模型:,Y,it,=,0,+,1,X,1,it,+,k,X,k,it,+,1,Z,1,+,2,Z,2,+,N-1,Z,N-1,+,2,D2,t,+,T,DT,t,+,it,(,三,),、随机效应模型。如果面板数据模型为:,Y,it,=,i,+X,it,+,it,,,(i=1,2,N,t=1,2,T),其中,Y,it,为被解释变量,,X,it,为解释变量向量,,为回归系数向量,,i,为随机变量,并且其分布与,X,it,无关,即模型的随机干扰项与解释变量无关。,随机效应模型是指,随机干扰项是真正的随机干扰项和未观测效应(个体效应或者时间效应)的组成部分。,故可以这样来理解:固定效应模型是截距项的差异体现在截面上(,i,上),而随机效应模型的截距项差异是体现在随机干扰项上,即随机干扰项含有个体效应(分个体和时间差异两种)。,如果随机干扰项包含的是不同个体效应,则这种模型称为个体随机效应模型。,如果随机干扰项包含的是不同时间效应,则这种模型称为时间随机效应模型。,另外还要注意,一方面固定效应模型会耗费很大的自由度,所以对于截面数目很大的面板数据,随机效应模型似乎更合适。但另一方面,固定效应模型有一个独特的优势,无须做个体效应与其他解释变量不相关的假设,而在随机效应模型,这个假设是必须的,在模型的设定中如果遗漏了重要的变量,就会导致参数估计的非一致性。,因此在选择模型之前最好作模型类型的检验,看是固定效应模型还是随机效应模型。,二,.,工作文件的建立和数据输入处理,考察不同省份和不同时间的消费与收入之间的关系。,利用,1996-2002,年中国东北、华北和华东等,15,个省的居民家庭人均消费(,cp,不变价格)和人均收入(,ip,不变价格)数据来建立面板数据模型。年人均消费(,consume,)、人均收入(,income,)和消费者价格指数(,p),分别见下表,其中省标识为:,ah(,安徽),,bj(,北京,),fj(,福建,),hb(,河北,),hlj(,黑龙江,),jl(,吉林,),js(,江苏,),jx(,江西,),ln(,辽宁,),nmg(,内蒙古,),sd(,山东,),sh(,上海,),sx(,山西,),tj(,天津,),zj(,浙江,).,数据文件为,al4.wf1,。,年人均消费,(元),1996,1997,1998,1999,2000,2001,2002,CONSUMEAH,3607.43,3693.55,3777.41,3901.81,4232.98,4517.65,4736.52,CONSUMEBJ,5729.52,6531.81,6970.83,7498.48,8493.49,8922.72,10284.6,CONSUMEFJ,4248.47,4935.95,5181.45,5266.69,5638.74,6015.11,6631.68,CONSUMEHB,3424.35,4003.71,3834.43,4026.3,4348.47,4479.75,5069.28,CONSUMEHLJ,3110.92,3213.42,3303.15,3481.74,3824.44,4192.36,4462.08,CONSUMEJL,3037.32,3408.03,3449.74,3661.68,4020.87,4337.22,4973.88,CONSUMEJS,4057.5,4533.57,4889.43,5010.91,5323.18,5532.74,6042.6,CONSUMEJX,2942.11,3199.61,3266.81,3482.33,3623.56,3894.51,4549.32,CONSUMELN,3493.02,3719.91,3890.74,3989.93,4356.06,4654.42,5342.64,CONSUMENMG,2767.84,3032.3,3105.74,3468.99,3927.75,4195.62,4859.88,CONSUMESD,3770.99,4040.63,4143.96,4515.05,5022,5252.41,5596.32,CONSUMESH,6763.12,6819.94,6866.41,8247.69,8868.19,9336.1,10464,CONSUMESX,3035.59,3228.71,3267.7,3492.98,3941.87,4123.01,4710.96,CONSUMETJ,4679.61,5204.14,5471.01,5851.53,6121.04,6987.22,7191.96,CONSUMEZJ,5764.27,6170.14,6217.93,6521.54,7020.22,7952.39,8713.08,年人均收入(元),1996,1997,1998,1999,2000,2001,2002,INCOMEAH,4512.77,4599.27,4770.47,5064.6,5293.55,5668.8,6032.4,INCOMEBJ,7332.01,7813.16,8471.98,9182.76,10349.6,11577.78,12463.92,INCOMEFJ,5172.93,6143.64,6485.63,6859.81,7432.26,8313.08,9189.36,INCOMEHB,4442.81,4958.67,5084.64,5365.03,5661.16,5984.82,6679.68,INCOMEHLJ,3768.31,4090.72,4268.5,4595.14,4912.88,5425.87,6100.56,INCOMEJL,3805.53,4190.58,4206.64,4480.01,4810,5340.46,6260.16,INCOMEJS,5185.79,5765.2,6017.85,6538.2,6800.23,7375.1,8177.64,INCOMEJX,3780.2,4071.32,4251.42,4720.58,5103.58,5506.02,6335.64,INCOMELN,4207.23,4518.1,4617.24,4898.61,5357.79,5795.01,6524.52,INCOMENMG,3431.81,3944.67,4353.02,4770.53,5129.05,5535.89,6051,INCOMESD,4890.28,5190.79,5380.08,5808.96,6489.97,7101.08,7614.36,INCOMESH,8178.48,8438.89,8773.1,10931.64,11718.0,12883.46,13249.8,INCOMESX,3702.69,3989.92,4098.73,4342.61,4724.11,5391.05,6234.36,INCOMETJ,5967.71,6608.39,7110.54,7649.83,8140.5,8958.7,9337.56,INCOMEZJ,6955.79,7358.72,7836.76,8427.95,9279.16,10464.67,11715.6,消费物价指数,P,1996,1997,1998,1999,2000,2001,2002,PAH,109.90,101.30,100.0,97.800,100.70,100.50,99.00,PBJ,111.6,105.3,102.4,100.6,103.5,103.1,98.2,PFJ,105.9,101.7,99.7,99.1,102.1,98.7,99.5,PHB,107.1,103.5,98.4,98.1,99.7,100.5,99.0,PHLJ,107.1,104.4,100.4,96.8,98.3,100.8,99.3,PJL,107.2,103.7,99.2,98.0,98.6,101.3,99.5,PJS,109.3,101.7,99.4,98.7,100.1,100.8,99.2,PJX,108.4,102.0,101.0,98.6,100.3,99.5,100.1,PLN,107.9,103.1,99.3,98.6,99.9,100.,98.9,PNMG,107.6,104.5,99.3,99.8,101.3,100.6,100.2,PSD,109.6,102.8,99.4,99.3,100.2,101.8,99.3,PSH,109.2,102.8,100.,101.5,102.5,100.0,100.5,PSX,107.9,103.1,98.6,99.6,103.9,99.8,98.4,PTJ,109.,103.1,99.5,98.9,99.60,101.2,99.6,PZJ,107.9,102.8,99.7,98.8,101,99.8,99.1,数据文件为,al4.wf1,:,1996-2002,年中国东北、华北、华东,15,个省级地区的居民家庭固定价格的人均消费(,CP,)和人均收入(,IP,)。数据是,7,年的,每一年都有,15,个数据,共,105,组观测值。,15,个省级地区的人均消费序列,15,个省级地区的人均收入序列(个体),变量的定义和数据的输入,输入截面的层数,本例为。如果不仅考虑省份的差异又考察每个省的若干行业间差异性,则输入,2,,即双层截面。,选取面板数据类型。,年和时间,工作文件名和页码。,1.,首先建立面板数据工作文件:定义序列名及输入数据,点,object,New object,然后选,ool,(合并数据库),.,3,个变量名的后缀分别为截面变量,aH,BJ,ZJ,。,3.,点,sheet,输入时间序列变量,变量之间用空格隔开。,pool,的名称,2.,然后输入变量名及数据。在打开的合并数据库窗口,pool,中输入,15,个省的标识(截面变量,)aH,BJ,ZJ,。,用,SHOW,打开就可输入数据了。,数据的不变价处理方法,在原来的,Pool,窗口中(原来关闭可重新打开并输入变量名,ah,,,zj,然后点生成新数据键,poolgenr,得到下图。,这样就可生成消除价格因素的消费序列,CP,?所有变量数据,对,IP,?也同样道理,见右图。?代表了所有省份。例如对,CP,?取对数:,log(cp?),,取滞后期:,cp?(-1),等等,三、模型的选择与检验,一般是用豪斯曼(,Hausman,)检验或者协方差分析检验。下面介绍协方差分析检验。协方差分析检验:设:,Y,it,=,i,+,i,X,it,+,it,,,(i=1,2,N,t=1,2,T),(,1,)、,i,=,j,i,=,j,(,2,)、,i,j,i,=,j,(,3,)、,i,j,i,j,下面分别检验模型是否是三种形式的一种:,主要检验两个假设:,假设,1,:变量系数(斜率)在不同横截面样本点上和时间上都相同,但截距不相同。,H,1,:,Y,it,=,i,+,i,X,it,+,it,,,i,j,i,=,j,假设,2,:变量系数和截距在不同横截面样本点上和时间上都相同。,H,2,:,Y,it,=,i,+,i,X,it,+,it,,,i,=,j,i,=,j,检验过程如下:,(,1,)、,i,=,j,i,=,j,(,2,)、,i,j,i,=,j,(,3,)、,i,j,i,j,设,S,1,,,S,2,,,S,3,分别是方程(,1,),(,2,),(,3,)的模型的残差平方和。计算如下两个,F,统计量并进行检验。,上述统计量服从,F,(N-1)(K+1),N(T-K-1),分布,,其中,N,为个体数,,T,为时间个数,,K,为解释变量个数。,给出显著性水平,查,F,分布表,如果,F,2,F,则拒绝,H,2,,则模型不是,(2),就是,(3),,反之就接受,H,2,,则模型为,(1),,检验结束。,如果拒绝,H,2,则需进一步检验是,(2),模型或者是,(3),,即再计算:,上述统计量服从,F,(N-1)K,N(T-K-1),分布,给出显著性水平,查,F,分布表,如果,F,1,F,则拒绝,H,1,,则模型为,(3),,反之就接受,H,1,,则模型为(,2,),检验结束。,在具体检验时,对于,H,1,:,Y,it,=,i,+,i,X,it,+,it,,,i,j,i,=,j,又分为个体不同导致,i,不同(个体固定效应模型),时间不同导致,i,不同(时间固定效应模型),以及两者均有的模型(个体时间固定效应模型)。还有个体和时间随机效应导致的,i,不同等多种情形。即计算,S,2,有多种不同情形,,而对于计算,S,3,时也有不同的情形,如个体导致系数不同,时间导致系数不同等等。,下面就本例进行检验:,由,Y,it,=,i,+,i,X,it,+,it,,,(i=1,2,N,t=1,2,T),(,1,)、,i,=,j,i,=,j,计算,S,1,。,第一步,先作混合效应模型计算,S,1,:在,cross-section,一栏选择,None(,不含截距项,),,,Period,也是,None,;,Weights,是,no Weights(,非加权),见下图。则回归结果的,Sum squared resid,值就是,S,1,S,1,=4824973.(,不加常数项可去掉,c,),第二步:计算固定效应模型,Y,it,=,i,+,i,X,it,+,it,,,(,2,)、,i,j,i,=,j,,求出,S,2,,在这里选取个体和时间固定效应,选择见下图:得,S,2,=2045804,。,表示只要某时期任意截面单元数据存在缺失值,则将不利用该观测值进行计算,(,保证数据的平衡,),,故此项一般要打上勾。,第二步:计算变系数效应模型,Y,it,=,i,+,i,X,i
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服