资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,计量经济学,第,4,章,一元线性回归模型的统计检验,1,回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。,样本是一次抽样取得的,很难能够收集到总体。,尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。,那么,在一次抽样中参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。,统计检验的方法主要有,拟合优度检验,置信区间检验,t,检验,F,检验(下一章),2,4.1,拟合优度检验,拟合优度检验,:,对样本回归直线与样本观测值之间拟合程度的检验。,度量拟合优度的指标,:,判定系数,(,可决系数,),R,2,问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?,普通最小二乘法所保证的最好拟合,是同一个问题内部的比较,拟合优度检验结果所表示的优劣是不同问题之间的比较。两个同样满足最小二乘原则的模型,对样本观测值的拟合程度不一定相同。,3,关于,R,2,的说明,4,4.1.1,总离差平方和的分解,已知由一组样本观测值(,X,i,Y,i,),,i,=1,2,n,得到如下样本回归直线,5,如果,Y,i,=,i,即实际观测值落在样本回归“线”上,则,拟合最好,。,这时,,“离差”,全部来自回归线,而与“残差”无关。,6,对于所有样本点,则需考虑这些点与样本均值离差的平方和,,可以证明,:,记,总体平方和,(,Total Sum of Squares,),回归平方和,(,Explained Sum of Squares,),残差平方和,(,Residual Sum of Squares,),7,要证明,只要证明,由于,所以,8,TSS=ESS+RSS,Y,的观测值围绕其均值的,总离差,(total variation),可分解为两部分:,一部分来自回归线,(ESS),,,另一部分则来自残差平方和,(RSS),。,在给定样本中,,TSS,不变,如果实际观测点离样本回归线越近,则,ESS,在,TSS,中占的比重越大,因此,拟合优度,:回归平方和(,ESS,),/Y,的总离差(,TSS,),9,4.1.2,可决系数,R,2,统计量,称,R,2,为,(样本)可决系数,/,判定系数,(,coefficient of determination),。,可决系数,的,取值范围,:,0,,,1,R,2,越接近,1,,说明实际观测点离样本线越近,拟合优度越高,。,10,在,收入,-,消费支出,例中,,注:可决系数,是一个非负的统计量。它也是随着抽样的不同而不同,通过可决系数可以决定哪次抽样在同样采用最小二乘估计的条件下,更能说明问题。,证明:可决系数是,Y,与,X,相关系数的平方!,11,4.2,变量的显著性检验,回归分析,是要判断,解释变量,X,是否是,被解释变量,Y,的一个显著性的影响因素。,回归的参数是否是可靠的,如果有多个变量,那个自变量应该进入,而哪个变量应该剥离,变量的显著性检验所应用的方法是数理统计学中的假设检验。,计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,12,4.2.1,假设检验,假设检验,,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。,假设检验采用的逻辑推理方法是反证法,!,先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。,判断结果合理与否,是基于,“,小概率事件不易发生,”,的原理,一次抽样中,尽然不能支持原假设,也就是举反例否决。,13,4.2.2,变量的显著性检验,14,检验步骤:,(,1,)对总体参数提出假设,H,0,:,1,=0,,,H,1,:,1,0,(,2,)以原假设,H,0,构造,t,统计量,并由样本计算其值,(,3,)给定显著性水平,,查,t,分布表,得临界值,t,/2,(n-2),(4),比较,判断,若,|t|,t,/2,(n-2),,,则拒绝,H,0,,,接受,H,1,;,若,|t|,t,/2,(n-2),,,则拒绝,H,1,,,接受,H,0,;,15,确定,拒绝域,16,对于一元线性回归方程中的,0,,可构造如下,t,统计量进行显著性检验:,在,上述收入,-,消费支出例中,首先计算,2,的估计值,17,t,统计量的计算结果分别为:,给定显著性水平,=0.05,,查,t,分布表得临界值,t,0.05/2,(8)=2.306,|t,1,|2.306,,,说明,家庭可支配收入在,95%,的置信度下显著,即是消费支出的主要解释变量;,|t,0,|,2.306,表明在,95%,的置信度下,无法拒绝截距项为零的假设。,18,假设检验,可以通过一次抽样的结果检验总体参数假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多,“,近,”,。,要判断样本参数的估计值在多大程度上可以,“,近似,”,地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的,“,区间,”,,,来考察它以多大的可能性(概率)包含着真实的参数值。,这种方法就是参数检验的,置信区间估计,。,4.3,参数的置信区间检验法,19,如果存在这样一个区间,,称之为,置信区间,(,confidence interval,);,1-,称为,置信系数,(,置信度,),(,confidence coefficient,),,称为,显著性水平,(,level of significance,);,置信区间的端点称为,置信限,(,confidence limit,),或,临界值,(,critical values,)。,20,一元线性模型中,,,i,(,i,=1,,,2,),的置信区间,:,在变量的显著性检验中已经知道:,意味着,如果给定置信度(,1-,),,从分布表中查得自由度为,(n-2),的临界值,那么,t,值处在,(-t,/2,t,/2,),的概率是,(1-,),。表示为:,即,21,于是得到,:(1-,),的置信度下,i,的置信区间是,在上述,收入,-,消费支出,例中,如果给定,=0.01,,查表得:,由于,于是,,1,、,0,的置信区间分别为:(,0.6345,0.9195),,(,-433.32,226.98,)。,这样,我们就可以拒绝,H,0,:,1,=0,,而接受,H,1,:,1,0,,也就是说我们可以以,99%,的概率接受,1,0,。,22,4.3,参数的置信区间检验法,如果,我们能够以,5%,以及以上,的,显著性,水平拒绝某个检验的零假设,则称这个检验在统计上是,显著的,。,意思是:,回归参数明显不是“零假设”,T,检验和置信区间检验的结论是一致的。,23,4.3,参数的置信区间检验法,这2,种方法可以得到相同的结论。,在,显著性检验中,我们在下面的情况下不拒绝零假设,H,0,:,=,*,,,即统计量落在非拒绝域内,,整理,,得,这样,就回到了置信区间方法。,24,由于置信区间一定程度地给出了样本参数估计值与总体参数真值的,“,接近,”,程度,因此,,在给定置信水平下,,置信区间越小越好。,要缩小置信区间,则需要:,(,1,)增大样本容量,n,,,因为在同样的置信水平下,,n,越大,,t,分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;,(,2,)提高模型的拟合优度,,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。,25,课后练习,下面数据是依据,10,组,X,和,Y,的观察值得到的:,,,,,,,,,假定满足所有的古典线性回归模型的假设,且总体回归方程的形式为,根据上述给出的条件,进行假设检验和参数估计,并求得,R,2,26,上机练习:汽车零售额,从课件系统下载“汽车零售额”数据,对数据进行描述性统计,建立,GWY,(收入总水平)来解释(,GCDAN,)汽车零售额的回归方程,对回归结果进行检验,显著性检验,置信区间检验,拟合优度检验:原假设参数为,0,若将截距项的原假设设置为,10,,斜率系数设置为,0.05,,请在,99%,置信水平下对其进行参数检验。,进行无截距项的回归并进行参数检验,将该回归结果与带截距项的回归结果进行比较,请说明你最终愿意用哪个方程进行回归。,27,
展开阅读全文