资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,LOGO,*,单击此处编辑母版标题样式,第三章 多元线性回归模型,3.1,多元线性回归模型,一、多元线性回归模型,总体回归函数,总体回归模型,LOGO,总体回归模型矩阵形式:,LOGO,样本回归函数,样本回归模型,LOGO,二、多元线性回归模型的,基本假定,假设,1,:模型是正确设定的。,假设,2,:解释变量,X,1,X,2,,,X,k,是确定性变量,不是随,机变量,且,相互之间,不存在线性相关,。,假设,3,:解释变量在样本中具有变异性,但样本方差趋于收敛。,假设,4,:随机干扰项具有零均值,同方差及不序列相,关性。,假设,5,:随机干扰项与解释变量间不相关。,假设,6,:随机干扰项服从零均值、同方差、零协方差,的正态分布。,LOGO,3.2,多元线性回归模型的参数估计,一、普通最小二乘估计,LOGO,通过引入,X,Y,的离差,x,y,,可以得到参数的,离差形式:,LOGO,二、参数估计量的性质,1,、线性性,LOGO,2,、无偏性,LOGO,3,、有效性,LOGO,三、样本容量问题,1,、最小样本容量,nk+1,样本容量不能小于模型中解释变量的个数(包括,常数项),2,、满足基本要求的样本容量,最小样本容量仅能保证得到参数估计量,为了提,高估计的精度,还需进一步扩大样本容量。,一般经验认为,当,n30,或,n3,(,k+1,),时,才能,满足参数估计的基本要求。,LOGO,【,实例,】,中国居民人均消费模型,在上例的基础上引入前一年的人均居民消费支,出,CONSP,(,1,),将其作为一个解释变量,建,立如下多元线性回归模型进行估计,估计区间为,1979,2000,年:,LOGO,LOGO,LOGO,LOGO,LOGO,LOGO,多元线性回归模型的统计检验包括:,拟合优度,检验,方程总体线性,的显著性检验,变量,显著性检验,参数检验的,置信区间估计,3.3,多元线性回归模型的统计检验,LOGO,一、拟合优度检验,含义,:检验模型对样本观察值的拟合程度。,“,总离差平方和,”,TSS,可以分解为两部分,:,来自样本回归线的,“,回归平方和,”,ESS,来自随机势力的,“,残差平方和,”,RSS,LOGO,LOGO,LOGO,二、方程总体线性的显著性检验(,F,检验),目的,:检验模型中被解释变量和解释变量的线性关系在总体上是否成立。,即,检验模型中参数 是否显著不为,0,。,如果 都等于,0,,则变量间的线性关系,不存在;如果 不全为,0,,则变量间的线,性关系存在。,LOGO,方法,:假设检验,步骤,:,(,1,)提出原假设,H,0,:,(,2,)假定原假设,H,0,正确;,(,3,)构造小概率事件,a.,构造统计量,LOGO,b.,构造小概率事件,如果小概率事件 发生了,不正,常,则原假设,H,0,错误,,拒绝,原假设,H,0,,变量间线,性关系在总体上是成立的,模型,通过检验,;,如果小概率事件没有发生,即 ,,正常,则原假设,H,0,正确,,接受,原假设,H,0,,变量间,线性关系不成立,模型,没有通过检验,。,LOGO,LOGO,拟合优度,与,方程总体线性显著性,检验的关系,区别,:,拟合优度检验,:从估计出来的,模型,出发,检验模,型对,样本观察值,的拟合程度;,方程总体线性显著性,:从,样本观察值,出发,检验,模型,总体线性关系的显著性。,联系,:,LOGO,三、变量显著性检验,目的,:对模型中每个解释变量进行显著性检验,以此,来决定该解释变量是否被保留下来。,如果某个解释变量对被解释变量的影响不显著,,则应予以提出,以此来保证方程的正确性和简洁性。,方法,:对于每一个解释变量,X,,都构造一个,t,统计量进行假设检验,LOGO,具体步骤,:,(1),针对某个解释变量,X,j,(,j=1,2,k),提出,原假设:,;,(2),构造小概率事件:给定一个显著性水平,a,,查,t,分,布表,得到一个临界值 ,则 为,原假设,H,0,下的一个小概率事件;,(3),如果发生 ,则在,1,a,的置信度水平下,拒绝原假设,H,0,,即该变量是显著的,通过了变量显,著性检验;如果发生 ,则在,1,a,的置信,水平下接受原假设,即该变量是不显著的,未通过变,量显著性检验,应考虑予以剔除。,LOGO,LOGO,四、参数的置信区间,目的,:为了判断样本参数的估计值 在多大程度,上接近总体参数的真实值 ,需要构造一个以样,本参数的估计值 为中心的,“,区间,”,,来考察该,区间以多大的可能性(概率)包含真实的参数值。,LOGO,LOGO,如何缩小置信区间,:,(,1,),扩大样本容量,n,:,n,增加会使标准差和,t,分布表里的临界值减小,从而缩小置信区间;,(,2,),提高模型的拟合优度,:拟合优度越高,残差平方和应越小,标准差也就越小,置信区间也就越小。,(,3,),提高样本观测值的分散度,:,C,jj,会变小,从而使标准差变小。,注,:置信度与置信区间存在此消彼涨的关系,要注意平衡。,LOGO,3.4,多元线性回归中的预测问题,实例,3,:将,2001,年的,gdpp,数值,4033.1,元,,2000,年,consp,数值,1690.8,元带入多元线性回归方程进行点预,测:,LOGO,3.5,可线性化的多元非线性回归模型,一、,直接置换,关于解释变量的非线性问题,LOGO,LOGO,二、,函数变换,关于参数的非线性问题,LOGO,LOGO,1,根据我国某省,22,年的数据估计出下列回归方程,其中,,Yt,第,t,年的小麦产量(吨,/,亩);,HFt,第,t,年的化肥施用量(公斤,/,亩);,JRt,第,t,年的降雨量(寸)。,请分析变量,HF,和,JR,能否通过拟合优度、,F,检验和,t,检验,显著性水平为,5,。,第三章练习,LOGO,2,、考虑以下方程(括号内为估计标准差),其中,,Wt,第,t,年员工工资;,Pt,第,t,年物价水平;,Ut,第,t,年失业率。,LOGO,(,1,)该模型是否能通过经济意义的检验?,(2),试评价可决系数的值,并在给定显著性水平,为,5,的情况下,对解释变量进行显著性检验;,(,3,)讨论,Pt-1,在理论上的正确性,讨论,Pt-1,在,本模型中是否应该删除?为什么?,LOGO,3,、假定以校园内食堂每天,卖出的盒饭数量,作为被解释变量,,盒饭价格,、,气温,、,附近餐厅的盒饭价格,、,学校当日的学生数量,(单位:,千人)作为解释变量,进行回归分析;假设不管是否,有假期,食堂都营业。,不幸的是,食堂内的计算机被一次病毒侵犯,所,有的存储丢失,无法恢复,你不能说出独立变量分别,代表着哪一项!下面是回归结果(括号内为,t,检验,值):,LOGO,被解释变量:每天卖出的盒饭数量,解释变量:盒饭价格、气温、附近餐厅的盒饭价格、,学校当日的学生数量,试判断每项结果对应哪个解释变量?并说明理由。,LOGO,4,、,假设要求你建立一个计量经济模型来说明,在学校跑道上慢跑一英里或一英里以上的人数,,以便决定是否修建第二条跑道以满足所有的,锻炼者。你通过整个学年收集数据,得到两个可能,的解释性方程:,其中:,y,某天慢跑者的人数,X1,该天降雨的英寸数,X2,该天日照的小时数,,X3,该天的最高温度,方程,A,:,LOGO,y,某天慢跑者的人数,X1,该天降雨的英寸数,X2,该天日照的小时数,,x4,第二天,需课程作业的班级数,问题:,(,1,)你认为哪个模型更合理?为什么?,(,2,)两个模型都选择日照数为解释变量,为什么得到的系数符号不一样呢?,5,、课本,90,页,第,4,题,方程,B,:,LOGO,6,、下面的方程式考察工作与休息之间的替代关系,模型设定如下,其中,,sleep,、,work,是每周休息和工作时间(单位分钟),,edu,表示受教育的年数,,age,为年龄。利用,706,个样本回归上述模型,估计结果如下(括号里的数字为参数估计量的标准差),LOGO,(,1,)年龄越大,休息时间越多吗?以,5%,和,10%,的检验水平,分别进行检验,可以得到什么结论?,(,2,)工作时间和休息时间存在替代关系,那么是否多工作,1,分钟就意味着少休息,1,分钟呢?(检验水平,5%,),(,3,)如果工作时间和休息时间改为以小时计,重新估计方程,估计结果会变成怎样?,LOGO,建模练习,1,、,A,同学欲建立我国服装类商品价格指数的计量经济模型,,B,同学欲建立我国货币发行量的计量经济模型,请问两位同学可以选择哪些解释变量来解释其被解释变量,请说明理由,并拟定关于每个解释变量的待估计参数的正负号。,(,1,)服装类商品价格指数,(,2,)货币发行量,LOGO,2,、,甲同学欲建立我国猪肉价格的计量经济模型,乙同学欲建立我国出口总额的计量经济模型,请问两位同学可以选择哪些解释变量来解释其被解释变量,简单说明理由,并拟定关于每个解释变量的待估计参数的正负号。,(,1,)猪肉价格,(,2,)出口总额,LOGO,3,、甲同学欲建立国际原油价格的计量经济模型,乙同学欲建立我国货币需求的计量经济模型,请问两位同学可以选择哪些解释变量来解释其被解释变量,请说明理由,并拟定关于每个解释变量的待估计参数的正负号。,(,1,)国际原油价格,(,2,)货币需求,LOGO,
展开阅读全文