资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,3,章 双变量模型:假设检验,对于样本回归函数,3.1,经典线性回归模型的基本假定,假定,3.1,回归模型是参数线性的,但不一定是变量线性的。,假定,3.2,解释变量与随机误差项不相关。,但是,如果,X,是非随机的,则该假定自动满足。,条件回归分析,假定,X,的取值在重复抽样中是固定的。,这一假定的目的是?,斜率系数的含义是它衡量了在其它因素不变的情况下,解释变量,X,的变动对,Y,的变动的影响。,如果解释变量,X,与随机误差项相关,就无法区分它们各自对应变量,Y,的影响。,假定,3.3,随机误差项的期望值为,0,,即,Y,X,X1,X2,X3,对于确定性的总体回归函数,实际上就隐含了这一假定,假定,3.4,同方差假定,Y,X,X1,X2,X3,假定同方差的目的是从不同的子总体中抽取的,Y,值都是同样可靠的。因为它们各自的方差是相等的,其分散程度相同。,相反,如果存在异方差,不同的子总体的方差不同,那么一般说来,从方差较大的子总体中抽取的,Y,值代表性较,_,。,异方差,Y,X,X1,X2,X3,假定,3.5,无自相关假定,,3.2,OLS,估计量的方差与标准误,OLS,估计量是随机变量,这样,就会产生抽样误差,即不同样本的估计值的差异。,称为残差平方和,称为自由度,称为回归标准误,n-2,对于残差平方和自由度的理解,要计算残差平方和,需要先计算出,而要计算,需先计算出,的计算是根据以下两个方程得到的,,这实际上相当于对,Y,值施加了两个约束条件,从而其独立的观测值只有,n-2,个。故残差平方和的自由度只有,n-2,3.3,OLS,估计量的,统计,性质,高斯,马尔柯夫定理:如果满足经典线性回归模型的基本假定,,OLS,估计量是最优线性无偏估计量。,何为最优线性无偏估计量?,线性,是随机变量,Y,的线性函数。,无偏性:,最小方差性,在所有的线性无偏估计量中,的方差最小,其它线性无偏估计量,OLS,估计量,3.4,OLS,估计量的抽样分布,假定,3.7,:随机误差项服从正态分布,中心极限定理:独立同分布的随机变量,随着变量个数的无限增加,其和的分布趋向于服从正态分布。,为什么要做这样一个假定,目的何在?,应变量,Y,也服从正态分布,正态分布随机变量的线性函数也服从正态分布,OLS,估计量是线性估计量,是应变量,Y,的线性函数,正态分布随机变量的线性函数也服从正态分布,OLS,估计量也服从正态分布,根据中心极限定理,随机误差项服从正态分布,应变量,Y,是随机误差项的线性函数,根据,为什么要推导,OLS,估计量的抽样分布?,3.5,假设检验,经济意义是由经济理论决定的,主要是,参数的符号和大小是否符合经济理论对这些参数的符号和大小的约束,。如果不符,则要查找原因并采取必要的修正措施,否则,参数估计值视为不可靠。,(1),经济意义上的检验,统计检验是由统计理论决定的,其目的在于评定模型参数估计值的可靠性。应该指出、统计检验准则相对经济意义准则来说是第二位的。,需要用到估计量的抽样分布或概率分布,(2),统计上的检验,常用的统计检验有,拟合优度检验、,t,检验、,F,检验等。,计量经济检验是由计量经济学理论确定的、主要是用来检验所采用的计量经济方法是否令人满意、计量经济方法的假设条件是否得到满足、从而确定统计检验的可靠性。,(3),计量经济检验,常用的检验方法主要包括随机误差项的,序列相关检验,、,异方差检验,、解释变量的,多重共线检验,以及随机误差项的,正态分布检验,等。,为什么原假设是回归系数值为,0,?,对回归系数的检验分两种:,置信区间法,显著性检验法,建立原假设和备择假设,变量的显著性检验,在,一元线性模型,中,就是要判断,X,是否对,Y,具有显著的线性影响。这就需要进行,变量的显著性检验。,计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,回归分析,是要判断,解释变量,X,是否是,被解释变量,Y,的一个显著的影响因素。,由于,所以可构造,Z,统计量,但是由于,未知,用其估计量,代替,则我们可以构造,t,统计量,3.5.1,置信区间法,给定显著性水平,置信区间,检验的思想是先不去管原假设是怎样假定的,根据给定的显著性水平、自由度和样本统计量的具体值构造一个具体的置信区间。,对于回归模型,提出零假设和备择假设,通过观察原假设所设定的参数值是否落在这个置信区间之内来做出,接受,或,拒绝,原假设的判断,.,置信区间法的检验步骤为,:,1.,由于构造的是,t,统计量,根据给定的显著性水平,5%,和自由度,n-2,首先可求出,t,统计量的,95%,的置信区间,.,2.,将,代入上式得,3.,整理得,这是一个随机区间,意思是抽取,100,个样本,按这种方法计算置信区间,将有,95,个区间包含真实的总体参数,.,4.,根据手中的样本,可计算出具体的区间为,这是一个具体的区间,它包含真实的总体参数的概率,?,5.,结论:由于该置信区间没有包含原假设所设定的参数值,所以,拒绝原假设。,3.5.2,显著性检验法,显著性,检验的思想是先姑且认为原假设是真的,然后根据该假设值,给定的显著性水平、自由度和具体的样本统计量的值,计算出,t,统计量的数值。,根据获得这样一个,t,统计量数值的概率大小来决定是接受还是拒绝原假设,.,如果这个概率小于给定的显著性水平,就认为小概率事件发生了,拒绝原假设,认为该统计量在统计上是显著的,即显著地异于,0,(只针对“零”零假设而言),显著性检验的步骤:,对于回归模型,提出零假设和备择假设:,给定显著性水平:,1.,根据原假设和抽取样本的统计量的值,计算,t,统计量的值,根据,得,代入,2.,查,t,分布表,得知获此,t,值的概率有多大,即,P,值,在该例中,通过查表得知,在原假设成立的条件下,获得这样一个,t,值的概率只有,0.0006,3.,通过将获取,t,值的概率与给定的显著性水平相比较,决定是否拒绝原假设,在该例中,给定的显著性水平为,5%,,而获取此,t,值的概率小于,0.0006,,因而,也小于,5%,,所以结论是拒绝原假设。,3.6,拟合优度的检验,:,判定系数,当我们从总体中抽取了某个样本,根据样本拟合了回归直线后,可以发现,并不是所有的样本点都落在了样本回归直线上。,问题:样本回归直线对样本点的拟合优度怎么样?如何衡量?,x,Y,样本回归直线,拟合优度检验,:,对样本回归直线与样本观测值之间拟合程度的检验。,问题:,采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?,在满足经典线性回归模型的基本假定下,应用,OLS,方法可以获得,BLUE,估计量,即,b1,b2,是最优线性无偏估计量,估计量的精度用其标准误衡量。,1.,总离差平方和的分解,已知由一组样本观测值(,X,i,Y,i,),,i=1,2,n,得到如下样本回归直线,x,Y,对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明,:,因为,所以,又由于,所以,各种符号,总离差平方和,(,Total Sum of Squares,),回归平方和,(,Explained Sum of Squares,),残差平方和,(,Residual Sum of Squares,),2,判定系数,判定系数越接近于,1,,说明样本回归直线拟合得越好,样本回归直线解释,Y,的变异的比例越高。反之,拟合得越差。,区分,:,离差:变量与其均值的(偏)差,变异:一个变量对其均值的离差平方和,方差:指离差平方和除以适当的自由度。,3.7,回归分析结果的报告,3.9,正态性检验,3.9.1,残差直方图,其原假设和备择假设如下:,构造检验统计量:,其中,,S,代表偏度,,K,代表峰度。,3.9.3,Jarque-Bera,检验(雅克,贝拉统计量),在正态性假定下,,JB,服从自由度为,2,的 分布,根据给定的显著性水平,查 分布表,决定拒绝还是接受原假设。,3.11,预测,对于回归方程:,若已知某一家庭收入水平,比如,X=78000,美元,,将其直接代入回归方程,得,这种预测叫做,点预测,。,
展开阅读全文