资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,上海市教委重点建设课程,上海对外经贸大学,一元线性回归模型建模步骤与重要知识点对应,1)提出问题,经济理论与实践,2)收集数据,年度货币单位时间序列,数据的可比价处理,3)理论的数学模型,线性含义,4)理论的经济计量模型,随机误差项的产生,5)参数估计,OLS,,残差与离差,6)模型的检验,经济与统计意义检验,R,2,&T-Test,7)模型的分析和预测,点预测与区间预测,上海市教委重点建设课程,两变量线性回归,实例:美国进口支出,我们将通过一个建立在具体经济数据之上的实例,来对双变量模型建立和实现做一概括。,1、,确立被解释变量与解释变量,凯恩斯著名的消费函数理论表明:个人的消费支出与个人可支配收入(税后收入)正相关。因为对进口物品的消费是总消费支出的一部分,因此,可以认为进口支出与个人可支配收入成正比。,下表给出了19,8,8-,200,7年间美国进口支出及个人可支配收入的数据,。(表中数据以198,8,年美元价换算为可比价格),表1,U.S,进口商品支出(,Y),与个人可支配收入(,X)1988-1997,YEAR Y X,1988 135.7 1551.3,1989 144.6 1599.8,1990 150.9 1668.1,1991 166.2 1728.4,1992 190.7 1797.4,1993 218.2 1916.3,1994 211.8 1896.9,1995 187.9 1931.7,1996 229.9 2001.0,1997 259.4 2066.6,续表1,U.S,进口商品支出(,Y),与个人可支配收入(,X)1998-2007,YEAR Y X,1998 274.1 2167.4,1999 277.9 2212.6,2000 253.6 2214.3,2001 258.7 2248.6,2002 249.5 2261.5,2003 282.2 2331.9,2004 351.1 2469.8,2005 367.9 2542.8,2006 412.3 2640.9,2007 439.0 2686.3,数据散点图,2、,建立模型,散点图表明,两变量的关系近似为线性关系,因此建立两变量线性模型如下:,Y=,B,1,+,B,2,X+u,其中,,Y,表示进口的消费支出,,X,表示个人可支配收入。这里,我们假定模型符合经典线性回归假设。从经济意义讲,B,2,表示进口商品的边际消费倾向,即个人可支配收入每增加,1,美元所引起进口商品平均支出的变化量。,3、,参数估计,我们用,EVIEWS,统计软件对表中的数据进行计算,采用最小二乘法。回归结果如下:,l,Y,=-261.09+0.24523,X,l,se=(,31.327,)(,0.0148,),l,t=(,-8.334,)(,16.5996,),l,p,值,=,(,0.000,)(,0.000,),l,R,2,=0.9388,l,d.f.=18,4、,对回归结果的解释,回归得到的估计式及回归直线表明:与预期相同,进口支出与个人可支配收入正相关。,X,的系数为,0.2452,表示个人可支配收入每增加,1,美元,平均而言,对进口商品的消费支出将增加,24,美分。,决定系数为,0.9388,,意味着模型能够以,94%,的比例解释进口产品支出的变动。,5、,回归结果的显著性检验,估计的回归系数是统计显著的吗?即回归系数显著不为0吗?,因为对于某一给定的置信水平,如果计算得到的,t,值超过,t,的临界值,那么就拒绝零假设,有,t,0.05,18,=1.743,那么,得到的,t,值,16.62远,超过,t,的临界值,则拒绝零假设。,置信区间检验法,已知:,b,2,-t,/2,,d.f.,se(b,2,)B,2,b,2,+,t,/2,,,d.f.,se(b,2,),若=0.05,则,t,/2,,18,=2.101,所以:,0.2412B,2,0.2762,即,得到,B,2,95%,的,置信区间。,显然,95%,的,置信区间不包括零假设值,拒绝了,B,2,为,零的假设。,6、,预测,根据19,8,8-,200,7年的历史数据,我们得到了进口需求函数的估计式,并且通过了经济意义和统计检验,因此可以用于预测:将已知的个人可支配收入的值代入估计式中,就得到预测年的对进口产品的平均支出的估计值。,点预测,假定,200,8年个人可支配收入,X,为2800美元,现估计,200,8年的,E(Y/X,2008,),,即相应进口产品的消费支出。,由,Y,2008,=-261.09+0.24523*2800=425.556,可知:,200,8年对进口产品的平均支出为426万美元。(,1988,年可比价格),区间预测,对,200,8,年总体的平均消费支出建立一个,95%,的置信区间,:,425.556-2.101*11.4684,E,(Y/X,2008,),425.556+2.101*11.4684,401.4609,Y,2008,449.651,即,200,8年平均消费支出以95%的置信度落在401.46万美元到449.65万美元之间.,实例计量经济分析步骤,1)理论的陈述,凯恩斯消费函数理论,2)收集数据,年度时间序列数据,3)理论的数学模型,Y=B1+B2X,4)理论的经济计量模型,Y=B1+B2X+u,5)参数估计,Y=,-261.09+0.24523,X,6)模型的检验,B,2,是否显著为零等,7)模型的分析和预测,给定,X,,预测,Y,值,第四章 多元线性回归,第一部分:模型的思维方法,第二部分:多元线性回归模型,第三部分:实例研究,一、主题的引入,1、,为什么要引入多元线性回归?,2、学习的方法:比较学习。,建立计量经济模型思路,(1)提出问题,(2)确立被解释变量和解释变量,(3)收集数据,(4)建立模型,(5)参数估计,(6)模型的检验,(7)运用模型分析问题,(8)进行预测,有待讨论的问题,:,(1)多元线性回归模型的表达形式有何扩展?,(2)多元线性回归模型的是否仍然要符合经典假设?与一元模型有何不同?,(3)如何估计多元线性回归模型?估计量有没有一些在一元模型中未曾遇到的独特性质?,(4)多元线性回归模型的检验有何不同?模型选择的一般标准如何,?,(5)在多元回归模型的运用中经济意义解释有何变化?如何预测?,(6)既然一个多元回归模型能够包括任意多个解释变量,那么对于具体的情况,我们如何决定解释变量的个数?,二、多元线性回归模型,1、,多元线性回归模型的基本形式:,Y,i,=c,0,+c,1,x,1i,+c,2,x,2i,+c,n,x,ni,+u,i,2、,模型的假设条件,第一:,Y,与,Xi,是存在多元线性随机函数关系,,Xi,是非随机变量,第二:误差项均值为零,第三:误差项方差为常数,即同方差,第四:误差项序列不相关,第五:,X,各变量间不存在线性关系,3、,两个新名词,偏回归系数:,c,1、,c,2,为偏回归系数,如,c,1,表示当,X,2,为不变时,,X,1,每变化一个单位引起,Y,的均值的变化。,多重共线性:,解释变量之间存在线性关系。通常我们认为不存在完全的多重共线性。,4、,参数估计,用空间中的一条最佳拟合直线逼近真值。,通过最小二乘法根据求极值原理将最佳拟合直线问题转换为求最小残差平方和问题,进而得到参数的估计值。,得到的估计量具有的性质:线性性、无偏性、有效性、一致性,。,5、,模型的检验,经济意义检验,统计意义检验,拟合度检验,显著性检验(单个变量和整体解释变量),计量经济检验,拟合度检验,目的:与一元线性回归一样,为了考察模型整体的真实性。既是检验选择的模型函数形式是否合理。,方法:因为,R,2,是解释变量数目的增函数,所以采用调整的,R,2,,,即:,Adjusted R,2,=1-(1-R,2,)(n-1)/(n-K-1),其中,n,为样本数目,,K,为解释变量数目,当,k,1,时,,Adjusted R,2,R,2,显著性检验,包括单个变量的显著性检验和整体变量的显著性检验。,单个变量的显著性检验:,T-,检验(同一元),整体显著性检验:,F-,检验,F-,检验(回归显著性检验),目的:检验全体解释变量共同作用时,对被解释变量的影响是否显著。,方法:(1)做原假设:,H,0,:,1,=,2,=.,K,=0 (2),做,F,统计量,F,=(R,2,/K)/(1-R,2,)/(n-K-1),该,F,统计量服从分子自由度为,K,,分母自由度为,n-K-1,的,F,分布,记为,F,(K,n-K-1),(3),给定显著性水平,将,当,F,统计量与,F,临界值作,F,(K,n-K-1),比较:当,F,F,(K,n-K-1),则拒绝原假设,变量整体显著。,F,统计量与,R,2,关系,F,统计量是判定系数,R,2,的单调增函数,当,R,2,趋于1时,,F,趋于正无穷。对于每一个显著性水平下的,F,临界值,F,,,都可以找到一个,R,2,与之对应,当,R,2,R,2,时,便有,F,F,举例,某实例中:,n=17,k=3,n-k-1=13,,取显著性水平,=0.01,时,查得,F,分布临界值为5.74;因此只要,F,统计量的值大于5.74,就能够以99%的置信度认为模型整体显著。由,F,统计量与,R,2,的关系式可以计算得到,R,2,=0.5698,,,也就是说,只要,R,2,0.5698,,,则模型线性关系显著的概率就达到99%。,F,统计量与,R,2,关系说明的问题,(1),F,检验实际上也是判定系数的显著性检验。,(2)如果模型对于样本有较好的拟合优度,则,F,检验一般都能通过。,(3)实际应用中不用过分苛求,R,2,的大小。,6、,分析和预测,同两变量模型一样,当通过了经济意义和统计意义的检验后,就可以用于分析实际问题,并进行预测。,点预测和区间预测,7、,解释变量的取舍,为了解释某一现象,我们往往会面临如何取舍若干解释变量的问题,通常做法如下:,只要校正的决定系数值增加,就可以增加解释变量。,一般如果增加变量的系数的/,t/,大于,1,校正的决定系数值就会增加,。但实际操作中我们要求/,t/,大于,2,为什么?,8,、,模型选择的一般标准,R,2,与调整的,R,2,几个准则:,AIC,和,SCHWARZ,一般判断方法:统计值越小越好。,三、实例研究,某公司市场战略部研究销售额,SALES,与价格,PRICE、,广告费,ADS,之间的关系。,(1)确立解释变量和被解释变量,要研究的问题是产品价格、投入的广告费用对产品销售额的影响。我们主观认为随着价格的降低,销售额一般会有所提高;广告费用的增加会带来销售额的提高。,以销售额,SALES,为被解释变量,Y,,广告费,ADS,和价格,PRICE,为解释变量,X1,和,X2。,(2),收集、观察数据,建立模型,我们可以得到一组关于,SALES、ADS、PRICE,的月度数据,从1999年1月到1999年12月。,分别观察,SALES,与,PRICE,和,ADS,的散点图。发现较为明显的线性关系。,建立三变量线性回归模型:,Y,i,=c,0,+c,1,x,1i,+c,2,x,2i,+u,i,(3)参数估计,可以采用最小二乘方法,使用估计方程:,SALES=C(1)+C(2)*PRICE+C(2)*ADS,得到,SALES=-40.31-1.31*PRICE+1.61*ADS,se=(0.451)(0.1398),t=(-2.897)(11.509),p=0.0177 0.0000,R-squared=0.983,Adjusted R-squared=0.979,F-statistic=255.4816 p=0.0000,(4)模型的检验,经济意义检验通过,拟合度检验通过,显著性检验(单个变量和整体解释变量)通过,假设通过计量经济检验,(5)分析和预测,当通过了检验后,就可以用于分析实际问题,该产品价格每上升一个单位,销售额将下降1.31个单位;广告费每上升一个单位,销售额将提升1.61个单位。可以此为依据制定相应的销售策略。,进行预测。,小结,多元线性回归模型是两变量模型的扩展,也介绍了一些新的概念,如偏回归系数、校正的判定系数、多重共线性。,多元线性回归的,OLS,估计量也具有很好的统计性质最优线性无偏估计。,F,检验通过,,T,检验才有意义。,
展开阅读全文