资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。,第三章 经典单方程计量经济学模型:多元线性回归模型,多元线性回归模型,多元线性回归模型参数预计,多元线性回归模型统计检验,多元线性回归模型预测,回归模型其它形式,回归模型参数约束,1/131,3.1 多元线性回归模型,一、,多元线性回归模型,二、,多元线性回归模型基本假定,2/131,一、多元线性回归模型,多元线性回归模型,:,表现在线性回归模型中解释变量有多个。,普通表现形式,:,i,=1,2,n,其中:,k,为解释变量数目,,j,称为,回归参数,(,regression coefficient,)。,3/131,也被称为,总体回归函数,随机表示形式,。它,非随机表示式,为:,表示:,各变量X值固定时Y平均响应,。,习惯上,:把,常数项,看成为一,虚变量,系数,该虚变量样本观察值一直取1。于是:,模型中解释变量数目为(,k,+1),4/131,总体回归模型n,个随机方程,矩阵表示式,为:,其中,j,也被称为,偏回归系数,,,表示在其它解释变量保持不变情况下,,X,j,每改变1个单位时,,Y,均值,E(Y),改变;,或者说,j,给出了,X,j,单位改变对,Y,均值“直接”或“净”(不含其它变量)影响。,5/131,用来预计总体回归函数,样本回归函数,为,:,6/131,其,随机表示式,:,e,i,称为,残差,或,剩下项,(residuals),,可看成是总体回归函数中随机扰动项,i,近似替换。,样本回归函数,矩阵表示,:,或,其中,:,7/131,二、多元线性回归模型基本假定,假设,1,,解释变量是非随机或固定,且各,X,之间互不相关(无多重共线性)。,假设,2,,随机误差项含有零均值、同方差及不序列相关性。,8/131,假设3,解释变量与随机项不相关,假设,4,,随机项满足正态分布,9/131,上述假设,矩阵符号表示,式:,假设1,,,n,(,k,+1)矩阵,X,是非随机,且,X,秩,=,k,+1,即,X,满秩。,假设2,,10/131,假设,4,,向量,有一多维正态分布,即,同一元回归一样,多元回偿还含有以下两个主要假设:,假设5,,,样本容量趋于无穷时,各解释变量方差趋于有界常数,即,n,时,,假设,3,,E(,X,)=0,即,11/131,其中:,Q,为一非奇异固定矩阵,矩阵,x,是由各解释变量离差为元素组成,n,k,阶矩阵,假设,6,,回归模型设定是正确,。,或,12/131,3.2 多元线性回归模型预计,一、,普通最小二乘预计,*二、,最大或然预计,*三、,矩预计,四、,参数预计量性质,五、,样本容量问题,六、,预计实例,13/131,说 明,预计方法:,3大类方法:,OLS,、,ML,或者,MM,在经典模型中多应用OLS,在非经典模型中多应用ML,或者,MM,在本节中,ML,与,MM为选学内容,14/131,一、普通最小二乘预计,对于随机抽取n组观察值,假如,样本函数,参数预计值已经得到,则有,:,i=1,2,n,依据,最小二乘原理,,参数预计值应该是右列方程组解,其中,15/131,于是得到关于待估参数预计值,正规方程组,:,解该(,k+1),个方程组成线性代数方程组,即,可得到(k+1),个待估参数预计值,$,b,j,j,=,0,1,2,L,。,k,16/131,正规方程组,矩阵形式,即,因为,XX,满秩,故有,17/131,将上述过程用,矩阵表示,以下,:,即求解方程组,:,18/131,得到,:,于是,:,例3.2.1:,在,例2.1.1,家庭收入-消费支出,例中,,,19/131,可求得:,于是,:,20/131,正规方程组,另一个写法,对于,正规方程组,于是,或,(*)或(*)是多元线性回归模型,正规方程组,另一个写法。,(*),(*),21/131,样本回归函数离差形式,i=1,2,n,其,矩阵形式,为,:,其中,:,在离差形式下,参数最小二乘预计结果为,22/131,随机误差项,方差,无偏预计,能够证实,随机误差项,方差无偏预计量为:,23/131,*二、最大或然预计,对于多元线性回归模型,易知,Y,随机抽取,n,组样本观察值联合概率,24/131,对数或然函数为,对对数或然函数求极大值,也就是对,求极小值。,即为变量,Y,或然函数,25/131,所以,参数,最大或然预计,为,结果与参数普通最小二乘预计相同,26/131,*三、矩预计,(,Moment Method,MM,),OLS,预计是经过得到一个关于参数预计值,正规方程组,并对它进行求解而完成。,该,正规方程组,能够从另外一个思绪来导:,求期望,:,27/131,称为原总体回归方程一组,矩条件,,表明了原总体回归方程所含有内在特征。,28/131,由此得到,正规方程组,解此正规方程组即得参数,MM,预计量。,易知MM预计量与OLS、ML预计量等价。,矩方法,是,工具变量方法,(Instrumental Variables,IV),和,广义矩预计方法,(Generalized Moment Method,GMM),基础,29/131,在,矩方法,中利用了关键是,E(,X,)=,0,假如某个解释变量与随机项相关,只要能找到1个工具变量,依然能够组成一组矩条件。这就是,IV,。,假如存在,k+,1个变量与随机项不相关,能够组成一组包含,k+,1方程矩条件。这就是,GMM,。,30/131,四、参数预计量性质,在满足基本假设情况下,其结构参数,普通最小二乘预计,、,最大或然预计,及,矩预计,仍含有:,线性性,、,无偏性,、,有效性,。,同时,伴随样本容量增加,参数预计量含有:,渐近无偏性、渐近有效性、一致性,。,31/131,1、线性性,其中,C,=,(XX),-1,X,为一仅与固定,X,相关行向量,2、无偏性,32/131,3、,有效性(最小方差性),这里利用了假设,:,E(,X,)=,0,33/131,其中利用了,和,34/131,五、样本容量问题,所谓“,最小样本容量,”,即从最小二乘原理和最大或然原理出发,欲得到参数预计量,不论其质量怎样,所要求样本容量下限。,最小样本容量,样本最小容量必须不少于模型中解释变量数目(包含常数项),即,n,k,+1,因为,,无多重共线性要求:秩(,X,)=,k,+1,35/131,2、满足基本要求样本容量,从统计检验角度,:,n,30 时,Z,检验才能应用;,n-,k,8时,t,分布较为稳定,普通经验认为,:,当,n,30,或者最少,n,3(,k,+1),时,才能说满足模型预计基本要求。,模型良好性质只有在大样本下才能得到理论上证实,36/131,六、多元线性回归模型参数预计实例,例3.2.2,在例2.5.1中,已建立了,中国居民人均消费,一元线性模型。这里我们再考虑建立多元线性模型。,解释变量:,人均GDP:GDPP,前期消费:CONSP(-1),预计区间:1979,37/131,Eviews软件预计结果,38/131,3.3 多元线性回归模型统计检验,一、,拟合优度检验,二、,方程显著性检验(F检验),三、,变量显著性检验(t检验),四、,参数置信区间,39/131,一、拟合优度检验,1、可决系数与调整可决系数,则,总离差平方和分解,40/131,因为:,=0,所以有:,注意:,一个有趣现象,41/131,可决系数,该统计量越靠近于,1,,模型拟合优度越高。,问题:,在应用过程中发觉,假如在模型中增加一个解释变量,,R,2,往往增大(,Why?,),这就给人,一个错觉,:,要使得模型拟合得好,只要增加解释变量即可,。,不过,现实情况往往是,由增加解释变量个数引发R,2,增大与拟合好坏无关,,,R,2,需调整,。,42/131,调整可决系数,(,adjusted coefficient of determination,),在样本容量一定情况下,增加解释变量必定使得自由度降低,所以,调整思绪是:,将残差平方和与总离差平方和分别除以各自自由度,以剔除变量个数对拟合优度影响,:,其中:,n-k,-1为残差平方和自由度,,n,-1为总体平方和自由度。,43/131,44/131,*2、赤池信息准则和施瓦茨准则,为了比较所含解释变量个数不一样多元回归模型拟合优度,惯用标准还有:,赤池信息准则,(,Akaike information criterion,AIC,),施瓦茨准则,(,Schwarz criterion,,,SC,),这两准则均要求,仅当所增加解释变量能够降低AIC值或AC值时才在原模型中增加该解释变量,。,45/131,Eviews预计结果显示:,中国居民消费一元例中:,AIC=6.68 AC=6.83,中国居民消费二元例中:,AIC=7.09 AC=7.19,从这点看,能够说前期人均居民消费CONSP(-1)应包含在模型中。,46/131,二、方程显著性检验(F检验),方程显著性检验,意在对模型中被解释变量与解释变量之间线性关系,在总体上,是否显著成立作出推断。,1、方程显著性F检验,即检验模型,Y,i,=,0,+,1,X,1i,+,2,X,2i,+,+,k,X,ki,+,i,i=1,2,n,中参数,j,是否显著不为0。,47/131,可提出以下原假设与备择假设:,H,0,:,0,=,1,=,2,=,=,k,=0,H,1,:,j,不全为0,F检验思想,来自于总离差平方和分解式:,TSS=ESS+RSS,48/131,假如这个比值较大,则,X,联合体对,Y,解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。,所以,可经过该比值大小对总体线性关系进行推断,。,依据数理统计学中知识,在原假设,H,0,成立条件下,统计量,49/131,服从自由度为(,k,n,-,k,-,1),F,分布。,给定显著性水平,,可得到临界值,F,(,k,n-k-,1,),,由样本求出统计量,F,数值,经过,F,F,(,k,n-k-,1,)或 F,F,(,k,n-k-,1,),来拒绝或接收原假设,H,0,,以判定原方程,总体上,线性关系是否显著成立。,50/131,对于中国居民人均消费支出例子:,一元模型:F=285.92,二元模型:F=2057.3,给定显著性水平,=0.05,查分布表,得到临界值:,一元例:,F,(1,21,)=,4.32,二元例,:,F,(2,19,)=,3.52,显然有,F,F,(,k,n-k-,1,),,,即二个模型线性关系在95%水平下显著成立。,51/131,2,、,关于拟合优度检验与方程显著性检验关系讨论,由,可推出:,与,或,52/131,53/131,在,中国居民人均收入消费,一元模型,中,,在,中国居民人均收入消费,二元模型,中,,,54/131,三、变量显著性检验(t检验),方程,总体线性,关系显著,每个解释变量,对被解释变量影响都是显著。,所以,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。,这一检验是由对变量 t 检验完成。,55/131,1,、,t统计量,因为,以,c,ii,表示矩阵,(XX),-1,主对角线上第,i,个元素,于是参数预计量方差为:,其中,2,为随机误差项方差,在实际计算时,用它预计量代替:,56/131,所以,可结构以下,t,统计量,57/131,2、t检验,设计原假设与备择假设:,H,1,:,i,0,给定显著性水平,,可得到临界值,t,/2,(,n-k-,1,),,由样本求出统计量,t,数值,经过,|t|,t,/2,(,n-k-,1,)或|t|,t,/2,(,n-k-,1,),来拒绝或接收原假设,H,0,,从而,判定对应解释变量是否应包含在模型中。,H,0,:,i,=0,(,i=1,2k,),58/131,注意:,一元线性回归中,t检验与F检验一致,一方面,t检验与F检验都是对相同原假设H0:1=0 进行检验;,其次,两个统计量之间有如下关系:,59/131,在,中国居民人均收入-消费支出,二元模型,例中,由应用软件计算出参数t值:,给定显著性水平,=0.05,查得对应临界值:,t,0.025,(,19,),=2.093。,可见,,计算全部t值都大于该临界值,,所以拒绝原假设。即:,包含常数项在内3个解释变量都在95%水平下显著,都经过了变量显著性检验。,60/131,四、参数置信区间,参数置信区间,用来考查:,在一次抽样中所预计参数值离参数真实值有多“近”,。,在变量显著性检验中已经知道:,61/131,轻易推出,:在(1-,)置信水平下,i,置信区间是,其中,,t,/2,为显著性水平为,、自由度为,n,-,k,-1,临界值。,在,中国居民人均收入消费支出,二元模型,例中,给定,=0.05,查表得临界值:,t,0.025,(,19,),=2.093,62/131,计算得参数置信区间:,0,:(44.284,197.116),1,:(0.0937,0.3489),2,:(0.0951,0.8080),从回归计算中已得到:,63/131,怎样才能缩小置信区间?,增大样本容量n,,,因为在一样样本容量下,n越大,t分布表中临界值越小,同时,增大样本容量,还可使样本参数预计量标准差减小,;,提升模型拟合优度,,,因为样本参数预计量标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。,64/131,提升样本观察值分散度,普通情况下,样本观察值越分散,(XX)-1分母|XX|值越大,致使区间缩小。,65/131,3.4 多元线性回归模型预测,一、,E(Y,0,),置信区间,二、,Y,0,置信区间,66/131,对于模型,给定样本以外解释变量观察值,X,0,=(1,X,10,X,20,X,k0,),,能够得到被解释变量预测值:,它能够是总体均值,E(Y,0,),或个值,Y,0,预测。,但严格地说,,这只是被解释变量预测值预计值,而不是预测值。,为了进行科学预测,还需求出预测值置信区间,包含,E(Y,0,),和,Y,0,置信区间,。,67/131,一、,E(Y,0,),置信区间,易知,68/131,轻易证实,于是,得到,(1-,),置信水平下,E(,Y,0,),置信区间,:,其中,,t,/2,为,(1-,),置信水平下,临界值,。,69/131,二、,Y,0,置信区间,假如已经知道实际预测值,Y,0,,那么预测误差为:,轻易证实,70/131,e,0,服从正态分布,即,结构,t,统,计量,可得给定,(1-,),置信水平下,Y,0,置信区间,:,71/131,中国居民人均收入-消费支出二元模型例中:人均GDP:4033.1元,,于是,人均居民消费预测值,为,=120.7+0.22134033.1+0.45151690.8=1776.8,(元),实测值,(,90,年价)=,1782.2,元,,相对误差:,-0.31%,预测置信区间,:,72/131,于是,E(,),95%,置信区间为:,或,(,1741.8,,,1811.7,),73/131,或,(,1711.1,1842.4,),一样,易得,95%,置信区间为,74/131,3.5 回归模型其它函数形式,一、,模型类型与变换,二、,非线性回归实例,75/131,说 明,在实际经济活动中,经济变量关系是复杂,直接表现为线性关系情况并不多见。,如著名,恩格尔曲线,(Engle curves)表现为,幂函数曲线,形式、宏观经济学中,菲利普斯曲线,(Pillips cuves)表现为,双曲线,形式等。,不过,大部分非线性关系又能够经过一些简单数学处理,使之化为数学上线性关系,从而能够利用线性回归模型理论方法。,76/131,一、模型类型与变换,1、倒数模型、多项式模型与变量直接置换法,比如,,描述税收与税率关系,拉弗曲线,:,抛物线,s=a+b r+c r,2,c0,s:税收;r:税率,设X,1,=r,X,2,=r,2,,则原方程变换为,s=a+b X,1,+c X,2,c,k,。,假如出现,n,2,F(,n,2,n,1,-k-,1),,,则拒绝原假设,认为预测期发生了结构改变。,115/131,例3.6.2,中国城镇居民食品人均消费需求邹氏检验。,1、参数稳定性检验,19811994:,RSS,1,=0.003240,1995:,(9.96)(7.14)(-5.13)(1.81),116/131,1981:,(14.83)(27.26)(-3.24)(-11.17),给定,=5%,,查表得临界值,F0.05(4,13)=3.18,117/131,结论,:,F值临界值,拒绝参数稳定原假设,表明中国城镇居民食品人均消费需求在1994年前后发生了显著改变。,2、,邹氏预测,检验,给定,=5%,,查表得临界值,F,0.05,(7,10)=3.18,结论,:,F值临界值,拒绝参数稳定原假设,118/131,*四、非线性约束,也可对模型参数施加,非线性约束,如对模型,施加非线性约束,1,2,=1,得到,受约束回归模型,:,119/131,该模型必须采取,非线性最小二乘法,(,nonlinear least squares,)进行预计。,非线性约束检验,是建立在,最大似然原理,基础上,有,最大似然比检验,、,沃尔德检验,与,拉格朗日乘数检验.,120/131,1、最大似然比检验,(,likelihood ratio test,LR,),预计:,无约束回归模型与受约束回归模型,,方法:,最大似然法,,检验:,两个似然函数值差异是否“足够”大。,记,L,(,2,)为一似然函数:,无约束回归,:Max,:,受约束回归,:Max,:,约束,:g(,),=,0,121/131,或,求极值:,g(,):,以各约束条件为元素列向量,:以对应拉格朗日乘数为元素行向量,受约束,函数值不会超出,无约束,函数值,,但假如,约束条件为真,,则两个函数值就非常“,靠近,”。,由此,定义,似然比,(,likelihood ratio,),:,122/131,假如,比值很小,,说明,两似然函数值差距较大,则应,拒绝,约束条件为真假设;,假如,比值靠近于,,说明,两似然函数值很靠近,应,接收,约束条件为真假设。,详细检验,时,因为大样本下:,h,是约束条件个数。所以:,经过,LR,统计量,2,分布特征来进行判断。,123/131,在,中国城镇居民人均食品消费需求例,中,对,零阶齐次性,检验:,LR,=-2(38.57-38.73)=0.32,给出,=,5%,、查得,临界值,2,0.05,(1),3.84,,,LR,2,0.05,(1),不拒绝原约束假设,,,结论:,中国城镇居民对食品人均消费需求函数满足零阶齐次性条件,。,124/131,、沃尔德检验,(,Wald test,W,),沃尔德检验中,只须预计无约束模型。如对,在全部古典假设都成立条件下,轻易证实,125/131,所以,在,1,+,2,=1,约束条件下:,记,可建立,沃尔德统计量:,126/131,假如有,h,个约束条件,可得到,h,个统计量,z,1,z,2,z,h,约束条件为真时,可建立,大样本,下服从自由度为,h,渐近,2,分布统计量:,其中,,Z,为以,z,i,为元素列向量,,C,是,Z,方差,-,协方差矩阵。所以,,W,从总体上测量了无约束回归不满足约束条件程度。,对,非线性约束,,沃尔德统计量,W,算法描述要复杂得多。,127/131,3、拉格朗日乘数检验,拉格朗日乘数检验则只需预计,受约束,模型.,受约束回归是求最大似然法极值问题:,是拉格朗日乘数行向量,衡量各约束条件对最大似然函数值影响程度。,128/131,假如某一约束为真,则该约束条件对最大似然函数值影响很小,于是,对应拉格朗日乘数值应靠近于零。,所以,拉格朗日乘数检验就是检验一些拉格朗日乘数值是否“足够大”,假如“足够大”,则拒绝约束条件为真假设。,129/131,拉格朗日统计量,LM,本身是一个关于拉格朗日乘数复杂函数,在各约束条件为真情况下,服从一自由度恰为约束条件个数渐近,2,分布。,一样地,假如为线性约束,,LM,服从一准确,2,分布:,(*),130/131,n,为样本容量,,R,2,为以下被称为,辅助回归,(,auxiliary regression,)可决系数:,假如约束是非线性,辅助回归方程预计比较复杂,但仍可按(,*,)式计算,LM,统计量值。,最终,普通地有,:,LM,LR,W,131/131,
展开阅读全文