1、第九讲 多元回归模型(三)
多元回归模型的统计检验是要对已得模型是否可用于经济分析、政策评价、结构分析、预测等问题在统计性质方面作出分析与评价,以决定已得模型的应用价值。就其内容来看,它包括总体参数的置信区间的探求,显著性检验和一般线性假设检验,拟合优度与方差分析,相关分析等。
一 置信区间
1 总体回归系数的置信区间
对于多元线性回归模型,设其中为矩阵中第i行,第j列的元素。由于,所以回归系数的最小二乘估计的方差为
因此随机变量的标准化随机变量服从标准正态分布。同简单线性回归分析一样,我们引入样本回归系数的标准误。则因为随机变量
的分子服从标
2、准正态分布,分母为一个自由度为的分布除以其自由度后的算术平方根。根据t分布的定义,服从自由度为的t分布。故,的置信度为的置信区间为
其中为置信度为时t分布的双侧临界值。
2 总体方差的置信区间
多元线性回归模型中方差的置信区间与简单线性回归模型中的情形类似。由于在的正态性假设下,变量
服从自由度为的分布。故可利用分布来建立的置信区间:
和是得自数值表中自由度为的两个值(临界值),使得它们各切去分布的100尾部面积。的置信区间可由下式给出。
二 假设检验
(一) 回归系数的显著性检验(t检验)。所谓回归方程的显著性检验是指对总体线性回归模型
而言,
3、假设是否在统计上被拒绝,如果不被拒绝,则称回归系数对被解释变量的影响是不显著的,或称解释变量对应变量的影响是不显著的;如果假设在统计上被拒绝,则称回归系数对被解释变量的影响是显著的,或称解释变量对应变量的影响是显著的。
如前所述,服从自由度为的t分布,所以在假设的前提下,服从自由度为的t分布。故可构造t检验程序如下:
(1)设置原假设与对立假设:原假设和对立假设;
(2)作统计量
(3)根据样本数据和原假设计算统计量t的值;
(4)根据统计量t的值进行显著性判断:
如果统计量t的值落入了以为中心的其概率度为(称为显著性水平,一般为值较小的正数,通常小于0.1)的区间内,
4、即t的绝对值小于某个临界值,则我们认为没有理由拒绝假设,从而不显著异于零,表明根据观测样本来看,解释变量对应变量的影响是不显著的;如果统计量t的值落在以为中心且概率度为的区间之外,即t的绝对值大于某个临界值则说明小概率事件发生了,这说明我们的假设可能有误,所以要拒绝假设,这就是说显著异于零,表明根据观测样本来看,解释变量对应变量的影响是显著的。
(二) 回归方程的显著性检验(F检验)。所谓回归方程的显著性检验是指对总体线性回归模型
而言,假设是否在统计上被拒绝,如果不被拒绝,则称回归方程对被解释变量的影响是不显著的;如果被拒绝,则称回归方程对解释变量的影响是显著的。表现在样本上就
5、是由回归所产生的变异在解释应变量的变异方面是否明显。
由于在零假设前提下,可证统计量
服从第一个自由度为,第二个自由度为的F分布
。故可设计显著性检验程序。
(1) 设置原假设与对立假设:原假设: (即回归方程不显著)和对立假设:不全为零 (即回归方程显著);
(2) 作统计量
(3) 根据样本数据和原假设计算统计量F的值;
(4) 根据统计量F的值进行显著性判断:
如果统计量F的值小于某个临界值(是使得的F分布的值)。不拒绝回归方程不显著的假设。
如果统计量F的值大于某个临界值,则拒绝回归方程不显著的假设,即回归方程显著。在这里表示显著性水平。
值
6、得注意的是,能否逐一地用t检验对偏回归系数进行显著性检验来代替对回归方程所作的总显著性检验呢?回答是否定的。事实上,在我们检验偏回归系数的显著性时,我们并没有考虑不同解释变量之间的在应用同一个样本时的联系,或者说,我们没有考虑样本回归系数之间的相关性。而在对回归方程进行总显著性检验和联合显著性检验时,则我们不能不考虑样本回归系数之间的相关性,所以在多元回归分析中,t检验和F检验是不能相互替代的。
(三) 线性约束检验(F检验)。线性约束检验是指对回归系数之间的线性约束关系所进行的检验:将约束条件代入到原回归模型中,得两个回归模型:
不受约束的回归模型
其中,分别代表在没有约束条
7、件下的回归系数和扰动项。
受约束的回归模型
其中,分别代表约束条件下的回归系数和扰动项。
用最小二乘法求得不受约束的(3.43)和受约束的(3.44)样本回归模型分别为
和
其中,分别代表在没有约束条件下的回归系数的最小二乘估计和残差;分别代表约束条件下回归系数的最小二乘估计和残差。
则显而易见受约束的残差平方和大于不受约束的残差平方和,并且
服从第一个自由度为m,第二个自由度为n-k的F分布。其中,m是线性约束条件的个数,k为未受约束模型中解释变量的个数(包括常数项),n为样本容量。
根据以上讨论,可设计线性约束检验如下:
1. 利用样本数据对不受约束的多元线性回归(3.43)做回归求出残差平方和。
2. 将m个线性约束条件代入原不受约束的多元线性回归模型中,得出约束条件下的多元线性回归模型。
3. 利用样本数据对受约束的多元线性回归做回归求出残差平方和。构造F统计量,并计算其值。
4. 查自由度为的F分布表得显著性水平为的F分布的临界值。
5. 根据统计量F的值进行显著性判断:
如果统计量F的值小于,则不拒绝线性约束。
如果统计量F的值大于,则拒绝线性约束。