资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,计 量 经 济 学,Economerics,2,讲课计划(,Syllabus,),任课教师:岳昌君,3,I,、课程概述及要求,:,本课程的主要内容为多元线性回归模型、,VAR,模型、,ARIMA,模型和联立方程模型;统计软件,Eviews,应用方法。本课程重点在于对计量经济学基本概念的深刻理解、对基本原理的熟悉掌握;能够根据经济理论知识,建立计量回归模型,利用统计软件,Eviews,对横截面数据、时间序列数据以及面板(,panel,)数据进行实证分析,并能够对计算机回归结果理解和应用;特别的,时间序列数据的处理方法将是本课程的难点和重点。对计量经济学理论的证明和推导不做过高的要求。,4,II,、主要教学参考书,:,计量经济学导论:现代观点,,伍德里奇著,费剑平等译,中国人民大学出版社,,2003,年,3,月。,数据分析与,Eviews,应用,,易丹辉主编,中国统计出版社,,2002,年,10,月。,5,其他教学参考书:,计量经济学,(第三版),古扎拉蒂著,林少宫译,中国人民大学出版社,,2000,年,3,月。,Econometric Analysis,Greene,William H.,1996.,6,IV,、课程安排,第一章 绪论,第一部分:单一方程回归模型,第二章 双变量线性回归模型,第三章 多元线性回归模型,第四章 非线性回归模型,7,IV,、课程安排,第二部分:放宽经典模型的假定,第五章 多重共线性,第六章 异方差,第七章 自相关,第八章 随机解释变量,第九章 虚拟因变量,8,IV,、课程安排,第三部分:联立方程模型,第十章 联立方程模型,第四部分:时间序列分析,第十一章 时间序列分析,(注:授课,8,次;上机,2,次。),9,第一章:绪论,10,从一个实际例子开始:凯恩斯消费理论,思考:在一个总需求不足的经济中,政府为了刺激消费,可以采取什么样的手段?,财政政策与货币政策,11,财政政策效应,财政政策的直接政策效应是政府购买商品和服务(,G,)的变化、转移支付(,F,)的变化或税收(,T,)的变化。,这些变化都分别影响总需求,政府购买直接增加需求,转移支付和税收则使收入发生变化。,12,不同的政策效应,扩张性(或较松的)财政政策的直接政策效应是:政府购买的增加、转移支付的增加或是税收的减少,而紧缩性(或较紧的)财政政策正好与此相反。,13,货币政策涵义,我们还知道,货币政策是货币供给(,M,)的变化。,扩张性或较松的货币政策是货币供给的增加;,而紧缩性或较紧的货币政策是货币供给的减少。,14,乘数效应,当政府向,A,公司购买,200,亿元的物品时,这种购买会有反应。政府更高需求的直接影响是增加了,A,公司的就业和利润。但是随着工人看到收入更多,企业所有者看到利润更多,他们对这种收入增加的反应是增加他们自己对消费品的支出。结果,政府对,A,公司的购买还增加了经济中许多其他企业产品的需求。由于政府支出的每一元可以增加的物品与劳务的总需求大于一元,所以说政府购买对总需求有一种乘数效应。,乘数,=1+MPC+MPC,2,+MPC,3,+,1/,(,1-MPC,),MPC,越接近于,1,,乘数效应越大;,MPC,等于,0,则没有乘数效应。,问:,MPC,到底,多大,?,15,(,1,)理论或假说的陈述,凯恩斯消费理论:,基本的心理定律是,一般而言,人们倾向于随着他们收入的增加而增加其消费,但比不上收入增加的那么多。,简言之,凯恩斯设想,边际消费倾向(,MPC,),即收入每变化一个单位的消费变化率,大于零而小于,1,。,0 MPC 1,16,(,2,)消费的数学模型的设定,凯恩斯公设了消费与收入之间有正的关系,但没有明确指出两者之间的准确的函数关系。,数学模型:,Y=,1,+,2,X 0,2,1,其中,Y,消费支出,为因变量;,X,收入,是自变量;,而被称为模型参数的,1,和,2,分别代表截距和斜率系数。就,2,是,MPC,的度量。,17,几何意义,Y,X,1,1,2,MPC,消费支出,收入,18,(,3,)消费的计量模型的设定,纯数学模型是一种确定性关系,一般不是计量经济学家研究的对象。,给定收入,支出还受其他因素的影响,例如家庭大小,家庭成员的年龄等。,19,(,3,)消费的计量模型的设定,u,20,(,3,)消费的计量模型的设定,计量经济模型:,Y=,1,+,2,X+u,u,是随机扰动项或随机误差项,是一个随机变量,有良好定义的概率性质。,u,可用来代表所有未经指明的对消费有所影响的那些因素。,21,(,4,)获得数据,为了估计计量模型,得到参数,1,和,2,的数值,学要有数据。,右表是中国经济数据,,Y,是整个经济的对个人加总的消费支出,,X,是国内生产总值(,GDP,),代表加总收入的一个度量,均以亿元为单位计算。,年,Y,X,1985,4589,8964,1986,5175,10202,1987,5961,11963,1988,7633,14928,1989,8524,16909,1990,9113,18548,1991,10316,21618,1992,12460,26638,1993,15682,34634,1994,20810,46759,1995,26945,58478,1996,32152,67885,1997,34855,74463,1998,36921,78345,1999,39334,82067,2000,42896,89468,2001,45898,97315,2002,48882,105172,2003,52679,117252,22,(,5,)计量经济模型的估计,估计方法:回归分析,“,回归(,Regression),”,一词的来历:,Francis Galton,发现,虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮。但是,给定父母的身高,儿女辈的平均身高却趋向于或者,“,回归,”,到全体人口的平均身高。,回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,去估计和(或)预测前者的(总体)均值,23,(,5,)计量经济模型的估计,估计方法:回归分析,利用回归分析方法和数据,我们得到参数,1,和,2,的估计值分别为,430.15,和,0.4611,Y,顶上的帽子(,hat,)符号表示一种估计值。,意义:在,1985-2003,年期间,斜率系数(即,MPC,)约为,0.46,,表明在此样本期间,收入每增加一元,平均而言,消费支出将增加,0.46,元。,“,平均而言,”,的意思是说,消费和收入之间并没有准确的关系。,24,(,5,)计量模型的估计,25,(,6,)假设检验,假定所拟合的模型是现实的一个较好的近似,还必须指定适当的准则,借以判断如同方程中的估计值是否与待检验的理论预期相一致。,凯恩斯预期,MPC,是正的,但小于,1,。在我们的结果中,MPC,等于,0.46,。这个数是不是在统计上小于,1,?,以样本证据为依据去确认或否定经济理论,是以,统计推断(假设检验),为名的一个统计理论分支作为其理论基础的。,26,(,7,)预测,用回归模型预测,2005,年中国的消费支出。假定,2005,年,GDP,增长率为,8,,则,2005,年,GDP,总量将达到,147436,亿元。预期消费支出是多少?,27,收入乘数(,M,),假定政策改变,投资有所下降,其对经济的影响将如何?宏观经济理论告诉我们,投资支出每改变,1,元,收入的改变由收入乘数(,M,)决定:,M=1/(1-MPC,),1/,(,1-0.46,),1.85,投资减少(增加),1,元,最终导致收入减少(增加),1.85,元(注意,乘数的实现需要时间)。,28,(,8,)利用模型进行控制或制定政策,假定政府认为,7,万亿元的消费支出水平可以维持当前约,4.5,的失业率,问什么收入水平将保证消费支出的这一目标值?,70000,430.15+0.4611X,则,X,150878,(元),GDP,增长率要达到:,(,150878/136515-1,)*,100,10.5,29,小结:,计量经济学,“,四大过程,”,模型设计:,理论假说,理论模型,计量模型,模型估计:,数据,估计方法,模型检验:,经济,统计,计量,模型应用:,预测,制定政策,30,1,简史,一、含义:,计量经济学是经济科学领域内的一门应用科学,它以一定的经济理论和实际统计资料为基础,运用数学、统计学方法与计算机技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特征的经济变量关系。,31,二、发展,1926,年,挪威经济学家费里希(,R.F,ris,c,h,)仿照生物计量学(,Biometrics,)一词提出了计量经济学(,Econometrics,)。,1930,年,12,月,费里希、丁伯根(荷兰,,J.Tinbergen,)等在美国发起了国际计量经济学会。,1933,年,创刊学会杂志,Econometria,。,1969,年,首届诺贝尔经济学奖授予费里希和丁伯根,表彰他们,“,发展了经济分析过程的动态模型,并使之实用化。,32,二、发展,(,续,),2030,H.,舒尔兹:消费理论与市场行为,P.,道格拉斯:边际生产力,J.,丁伯根:景气循环,R.,费里希,:,需求弹性、边际生产力、总体经济的稳定性,4070,(宏观经济),H.,泰尔:二阶段最小二乘法,80,D.,亨德利:协整理论,33,三、评价,萨缪尔森(,Samuelson,)称,“,二战以后的经济学是计量经济学的时代,”,。,Klein:,“,在经济学中占最重要的地位,”,19691989,,在,27,位诺贝尔经济学奖中,15,位是计量经济学家,,10,位是计量经济学会会长,例如,建立在一般均衡模型基础之上的全球贸易分析系统(,GTAP,)就是计量经济学的一个大型应用软件包。,34,四、计量经济学为什么是一门单独的学科,经济理论:侧重定性分析;例如,产品需求随着产品价格的下降而上升,问上升多少?,数量经济学:用数学形式(如方程式)表述经济理论;,经济统计学:收集、加工并通过图、表等形式展现经济数据;是进行计量分析的前提。,数理统计:提供工具和方法。,35,经济学,数学,统计学,经济统计学,数理经济学,数理统计学,计量经济学,各学科之间关系的图示,36,五、计量经济学的类型,计量经济学,理论,应用,经典,贝叶斯,经典,贝叶斯,37,六、应用,范围:,经济学:如微观经济学(,D P,),;,宏观经济学(经济预测),其他学科:教育学,社会学,地理,历史。,如教育对收入的影响,38,2,例子,39,一、单一方程,一、单一方程:商品市场需求量,(一)模型设计,1.,经济理论模型:公式化,提供变量关系,需求量,D,价格,P,收入,Y,相关产品价格(如汽车与汽油),替代产品价格(如柴油与汽油),消费者偏好等,40,一、单一方程举例(续),D=f(P,Y,),D/,P0,;,2.,计量模型,假定:,(,1,)省略次要变量,选择主要变量,(,2,),f,的数学形式,线性:,D=,1,+,2,P+,3,Y+,其中,1,,,2,和,3,为参数,未知,2,0,(,3,)随机扰动项,u,41,N=100,D,P,Y,100,5,1000,75,7,600,60,9,300,一、单一方程举例(续),(,二,),模型估计,1.,统计资料:用历史资料估计参数,2.,估计方法,OLS:D=112.7-719P+0.0014Y+,(,残差,),42,一、单一方程举例(续),(三)模型检验,1.,经济合理性,定性(符号和大小),2.,数学上检验(统计检验和计量检验),(四)模型应用,政策模拟,例如:,P=9,Y=1400,根据回归方程式得到,D=66.59,P=2,给定,Y,不变,问,D=?,43,二、联立方程组,宏观经济模型,(一)模型设计,1.,经济理论模型:,C,t,=C(Y,t,r,t,),I,t,=I(,Y,t-1,r,t-1,),Y,t,=C,t,+I,t,+G,t,0,C/,Y1,C/,r0,I/,r,t-1,0,44,2.,计量模型,C,t,=,1,+,2,Y,t,+,3,r,t,+u,t1,(,1,),I,t,=,1,+,2,Y,t-1,+,3,r,t-1,+u,t2,(,2,),Y,t,=C,t,+I,t,+G,t,(,3,),45,(,1,)变量,被解释变量,(当期内生变量),解释变量,(其他当期内生变量,内滞,外生),C,t,Y,t,,,r,t,I,t,Y,t-1,,,r,t-1,Y,t,C,t,,,I,t,G,t,46,前定变量,当期内生变量,内生滞后,外生变量,C,t,r,t,I,t,Y,t-1,r,t-1,Y,t,G,t,(,1,)变量(续),47,(,2,)参数,0,2,1,3,0,3,0,未知,需要估计,行为方程式:,1,和,2,定义方程式:,3,技术方程式:如,用总产值作为净产值的解释变量,制度方程式:如,用进口总额作为关税收入的解释变量,随机方程式:随机项,u,,参数未知,确定方程式:不含随机项,u,,参数已知,48,(二)模型估计,经济统计资料,识别,方法:,OLS;2SLS,(三)模型检验,(四)模型应用,已知前定变量,由模型确定当期内生变量,49,3,经济计量模型,50,经济计量模型,经济计量模型是理论假定下描述定量关系的一个或一组关系式,一、分类,范围:微观经济学,宏观经济学,时点:静态与动态,期限:短、中、长,规模:单一,联立,体系:组合,非组合,51,二、构成,1.,经济变量:含有特定的经济定义,影响经济系统的因素,可观测、可定量化的变量,(,1,)解释变量,自变量;被解释变量,因变量,(,2,)随机变量:抽样取值随机;固定变量:抽样取值固定,(,3,)当期(现期):,Y,t,;滞后变量:,Y,t-1,;超前变量:,Y,t+1,(,4,)定性变量:可观测,无数据,可定量化,定量变量:可观测,有定量数据,(,5,)可控变量;不可控变量,(,6,)当期内生变量:内部因素,外生变量:外部因素,前定变量:求解前已知;包括内生滞后和外生变量,52,2.,参数:,稳定特征;,存在未知;,经济理论:范围;,计量模型:估计值,53,3.,方程式:,(,1,)经济性质,行为方程式:经济行为,C,I,定义方程式:,均衡方程式:如,D=S,(2),数理性质,随机性:含,u,,参数未知,需估计(如行为),确定性:无,u,,参数已知,不需估计(如定义方程式和均衡方程式),54,3.,方程式,(续),(,3,)数学形式,线性模型,非线性模型:内蕴线性,内蕴非线性,(,4,)方程个数,单一方程:一个,联立方程:多个,55,4.,随机扰动项,u,(,1,)来源,省略误差:变量(次要;不可观测;无统计数据;不可定量化;未认识);偶然因素,统计误差:观测;归类,(,2,)特性:随机;不可观测,(,3,)影响:实证性;参数未知,不能严格计算,估计,56,小结:,计量模型,“,四个要素,”,Y=,1,+,2,X+u,3,、方程式,4,、随机扰动项,2,、参数,1,、变量,57,术语与符号,因变量,(,dependent variable,),自变量,(,independent variable,),被解释变量,(,explained variable,),解释变量,(,explanatory variable,),预测子(,predictand,),预测元(,predictor,),回归子(,regressand,),回归元(,regressor,),内生(,endogenour,),外生(,exogenous,),58,术语与符号,双变量回归分析,一个变量对仅仅一个解释变量,复回归分析(多元或多变量回归分析),一个变量对多个解释变量,字母,Y,表示因变量,X,(,X,1,X,2,X,k,),表示解释变量,X,k,第,k,个解释变量,X,ki,指第,k,个解释变量的第,i,个观测值,i,用于横截面数据,t,用于时间序列数据,59,4,:研究步骤,60,一、模型设定,一、模型设定,(一)选择变量,1.,根据研究目的选择变量,2.,由经济理论确定解释变量,3.,变量应该是可观测、可定量化的,4.,变量之间的关系原则是,被解释变量与解释变量之间高度相关,而解释变量与解释变量之间无关。,61,区别概念,相关关系,vs,回归关系,vs,因果关系,相关关系:是两个变量之间的关系,是对称的;,回归关系:解释变量与被解释变量的统计关系,是非对称。在回归分析中,变量之间的线性无关有两种情况:一是一般意义下的线性无关,二是非线性关系;,因果关系:统计关系本身不可能意味着任何因果关系,统计关系,vs,确定性关系,统计关系:如农作物受气温、降雨、阳光、施肥的影响,确定性关系:如牛顿引力定律,62,(二)确定方程个数,单一方程:一个解释变量,联立方程:多个解释变量,当期内生解释变量的个数,=,方程个数,63,(三)确定数学形式,与经济理论一致,如平均成本是形式为二次函数:,散点图:观测变量之间的关系,实验法,64,(三)确定数学形式,65,二、模型估计,(一)统计资料数据,时间序列(,time series data,):年、季度、月、日。如:每日价格、每周货币供给、每月价格指数、每季,GDP,、每年政府财政预算。时间序列容易出现的问题:自相关,横截面数据(,cross-sectional data,):一个或多个变量在同一时点上收集的数据。例如:工业普查、上年各省,GDP,。容易出现的问题:异方差(,heterrogeneity,),66,3.,混合数据,混合数据:兼有时间序列和横截面数据的成分,定点时序或面板数据(,panel data,):对相同的横截面单元在时间轴上进行跟踪调查的数据。如:,GDP,China,Japan,USA,1952,1953,2001,2002,67,数据的准确性,问卷中的选择性偏误,抽样问题,加总数据,近似计算的数据,切记:,研究结果不能比数据的质量更好,68,(,二,),识别,单一方程:不需要,联立方程:必须。可识别才可估计,(三)估计方法,单一方程:,OLS,GLS,IV,ML,联立方程:,OLS:ILS(Indirect Least Squares);2SLS(Two-stage Least Squares);3SLS(Three-stage Least Squares);,ML:LIML(Limited Information Maximum Likelihood);FIML(Full Information Maximum Likelihood),69,三、模型检验,经济合理性检验,古典统计检验:,R,2,,,t,,,F,经济计量检验:,异方差,自相关,多重共线性,模型精度检验,稳定性检验,预测能力检验,70,四、模型应用,预测,20,世纪,50,年代和,60,年代西方国家经济预测的实例,70,年代,,1973,年和,1979,年两次石油危机未能预报,原因:对非稳定发展的经济过程,对缺乏规范行为理论的经济活动,计量模型无能为力,经济结构分析,此处经济结构分析是对经济现象中变量之间相互关系的研究。不同于通常所说的诸如产业结构和产品结构等。主要方法包括:,弹性:变量的变化率之比,乘数:变量的变化量之比(倍数),比较静力分析:经济系统从一个平衡点向另一个平衡点变量的变化,71,3.,政策评价,主要方法:,工具,-,目标法。预测目标,通过解模型,确定政策变量,政策模拟:不同政策代入模型,比较各自目标值,最优控制法:与最优化方法结合,检验与发展经济理论,用数据拟合已有经济理论模型(检验);,用数据拟合不同经济理论模型(选择最佳模型,从而发现和发展经济理论),72,五、实际操作,选择被解释变量和解释变量,散点图,设定数学形式:线性?双,ln,?,上机计算:估计系数、检验指标,判断,73,六、经济经济学应用软件介绍,EVIEWS,:时间序列分析,SAS,:统计分析系统,STATA,:经济统计软件,TSP,:时间序列分析软件包,SPSS,:统计分析软件包,GAUSS,:原意是一种程序语言,GIVE,:计量经济分析软件,74,第二章:双变量线性回归分析,75,本章主要内容,1,双变量线性回归模型及其基本假定,2,参数估计,3,参数最小二乘估计量的统计性质,4,随机扰动项的方差的估计,5,拟合优度检验,(经典正态线性回归模型),6,置信区间,7 t,假设检验,8 F,检验,9,预测,(小结),76,复习:,计量经济学,“,四大过程,”,模型设计:,理论假说,理论模型,计量模型,模型估计:,数据,估计方法,模型检验:,经济,统计,计量,模型应用:,预测,制定政策,77,复习:,计量模型,“,四个要素,”,Y=,1,+,2,X+u,3,、方程式,4,、随机扰动项,2,、参数,1,、变量,78,1,双变量线性回归模型及其基本假定,一、一些基本概念,一个例子:假想一个国家的人口总体由,60,户组成,要研究每周家庭消费支出,Y,与可支配家庭收入,X,之间的关系。,即,知道了家庭的每周收入,要预测每周消费支出的(总体)平均水平。,79,数据,Y,每周家庭支出,X,总计,80,几个概念:条件分布,条件分布:以,X,取定值为条件的,Y,的条件分布,注:给定收入,X,,支出,Y,并不确定,而是取不同的值。,问:给定收入,X,,支出,Y,取什么值?,例:给定,X=80,,,Y,取,5,个不同的值:,55,、,60,、,65,、,70,、,75,81,几个概念:条件概率,条件概率:给定,X,的,Y,的概率,记为,P(Y|X),。,已知给定,X=80,,,Y,取,5,个不同的值:,55,、,60,、,65,、,70,、,75,。问:,Y,取每个值的概率有多大?,古典概率模型:取每个值的概率相等。因此有:,P(Y=55|X=80)=1/5,;,P(Y=60|X=80)=1/5,;,P(Y=65|X=80)=1/5,;,P(Y=70|X=80)=1/5,;,P(Y=75|X=80)=1/5,;,82,几个概念:条件期望,问:给定,X,,,Y,可以取不同的值,那么,这些值平均起来是多少?,条件期望(,conditional Expectation,):给定,X,的,Y,的期望值,记为,E(Y|X,i,),。,例如,,E(Y|X=80)=55,1/5,60,1/5,65,1/5,70,1/5,75,1/5,65,注:条件均值条件期望,称条件期望是为了表示它是总体的平均值。习惯上,看到,“,期望,”,一般指的是总体的平均值;看到,“,均值,”,一般指的是样本的平均值。应该注意区分二者的含义。,83,几个概念:总体回归曲线,思考:给定一个,X,,就对应一个(唯一的),E(Y|X),。因此,(,X,,,E(Y|X),)可以表示成平面上的一个点。,总体回归曲线(,Popular Regression Curve,):,Y,的条件均值的轨迹。即,Y,对,X,的回归。,总体回归曲线的几何意义:当解释变量给定值时因变量的条件期望值的轨迹。,84,总体回归曲线,85,条件均值,条件均值,80 140 220 X,E(Y|X,i,),Y,149,101,65,86,2.,总体回归函数(,PRF,),因为每个,X,i,对应唯一的一个,E(Y|X,i,),,所以,E(Y|X,i,),是,X,i,的函数。将此函数称为:,总体回归函数(,PRF:Population Regression Function,),E(Y|X,i,)=f(X,i,)(1),问:,PRF,的函数形式是什么?,当,PRF,的函数形式为线性函数,则有,,E(Y|X,i,)=,1,+,2,X,i,(2),其中,1,和,2,为未知而固定的参数,称为回归系数。,1,和,2,也分别称为截距和斜率系数。,上述方程也称为线性总体回归函数。,87,3,“,线性,”,的含义,“,线性,”,可作为两种解释:对变量的线性和对参数的线性。本课,“,线性,”,回归一词总是指对参数,为线性的一种回归(即参数只以它的,1,次方出现)。,模型对参数为线性?,模型对变量为线性?,是,不是,是,LRM,LRM,不是,NLRM,NLRM,LRM=,线性回归模型;,NLRM,=,非线性回归模型,88,3,“,线性,”,的含义,Y=,1,+,2,X+u,是线性的!,lnY=,1,+,2,lnX+u,也是线性的!,Y=,1,ln(,2,X+u,)不是线性的!,89,4 PRF,的随机设定,随着家庭收入的增加,家庭消费支出平均地说也增加。但是,对某一个别的家庭来说,消费支出却不一定随着收入水平的增加而增加。例如,一个收入,100,美元的家庭,支出为,65,美元,而一个收入只有,80,美元的家庭,支出却为,75,美元。,问:个别家庭的消费支出与给定收入水平之间能有什么关系呢?,90,4 PRF,的随机设定,事实:给定收入,X,i,,个别家庭的支出,Y,i,围绕在条件均值,E(Y|X,i,),附近。,将个别的,Y,i,围绕其期望值的离差,(Deviation),表述如下:,u,i,=Y,i,-E(Y|X,i,),或,Y,i,=E(Y|X,i,)+u,i,E(Y|X,i,),是系统性成分或确定性成分;,u,i,随机或非确定性成分,随机扰动项:离差,u,i,是一个不可观测的可正可负的随机变量。,91,4 PRF,的随机设定,Y,i,=E(Y|X,i,)+u,i,当,E(Y|X,i,),是,X,i,的线性函数时:,Y,i,=,1,+,2,X,i,+u,i,=,E(Y|X,i,),+,u,i,问:在给定,X,i,下,上述等式中什么是变量,什么是常量?,92,例子,一个家庭的消费支出,线性地依赖于家庭的收入另加干扰项,Y,1,=55=,1,+,2,(80)+u,1,Y,2,=60=,1,+,2,(80)+u,2,Y,3,=65=,1,+,2,(80)+u,3,Y,4,=70=,1,+,2,(80)+u,4,Y,5,=75=,1,+,2,(80)+u,5,93,5,随机干扰项的意义,随机扰动项是从模型中省略下来的而又集体地影响着,Y,的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来?换句话说,为什么不构造一个含有尽可能多个变量的复回归模型呢?理由是多方面的:,理论的含糊性(未知因素的影响),数据的欠缺(财富与收入),核心变量与周边变量,内在随机性,替代变量(永久消费与当前消费),省略原则,错误的函数形式,94,总体与样本,总体是我们研究的目的,但是不能知道总体的全部数据,用总体中的一部分(样本)来推断总体的性质。,总体,样本,样本,样本,95,6,样本回归函数(,SRF,),两个随机样本,对应给定的每个,X,i,只有一个,Y,值,问:能从样本数据中估计出,PRF,吗?,样本数据一 样本数据二,X,Y,80,70,100,65,120,90,220,150,X,Y,80,55,100,88,120,90,220,175,96,样本回归线与总体回归线,比较两条样本回归线,SRF1,和,SRF2,(假定,PRF,是直线),问哪条样本线代表,“,真实,”,的总体回归线?,SRF1,PRF,SRF2,Y,X,97,(,1,)样本回归函数,估计量(,Estimator,):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。,98,比较,PRF,和,SRF,99,(,2,)样本回归线的几何意义,X,i,X,i,u,i,Y,E(Y|X,i,),E(Y|X,i,),i,Y,i,100,样本回归线的几何意义,101,二、古典假定,经典线性回归模型(,CLRM,)的基本假定:,Y,i,=,1,+,2,X,i,+u,i,(i=1,2,3,n),假定,1,:干扰项的均值为零。即,,E(u,i,|X,i,)=0,假定,2,:同方差性或,u,i,的方差相等。即,,Var(u,i,|X,i,)=,2,假定,3,:各个干扰项无自相关。即,,Cov(u,i,u,j,|X,i,X,j,)=0,假定,4,:,u,i,和,X,i,的协方差为零。即,,Cov(u,i,X,i,)=E(u,i,X,i,)=0,假定,5,:在重复抽样中,X,的值是固定的(非随机),假定,6,:随机干扰项服从,0,均值、同方差的正态分布。,即:,u,i,N,(,0,,,2,),注:在实际建模时,除了假定,6,以外,对模型是否满足假定都要进行检验。对于假定,6,,由中心极限定理,当样本趋于无穷大时,对于任何实际模型都是满足的。,102,2,参数估计(,和,2,),双变量线性回归模型的一般形式是,满足:,E(u,i,|X,i,)=0,Var(u,i,|X,i,)=,2,Cov(u,i,u,j,|X,i,X,j,)=0,Cov(u,i,X,i,)=0,如果,X,是确定的,则上述条件自然成立。,其中,i,j=1,2,3,n;ij,103,一、普通最小二乘法(,OLS,),104,样本点的图示,105,2,正规方程(,Normal equation,),106,二、,的估计,107,2,对,OLS,估计量的说明,OLS,估计量可由观测值计算;,OLS,估计量是点估计量;,一旦从样本数据得到,OLS,估计值,就可画出样本回归线。,108,注意,“,帽子,”,的含义,109,3,、样本回归线的性质,1,110,样本回归线的性质,2,111,样本回归线的性质,3,112,样本回归线的性质,4,113,样本回归线的性质,5,114,3,参数最小二乘估计量的统计性质,115,一、线性性(续),116,二、无偏性,117,无偏性(续),118,三、最小方差性,高斯,-,马尔可夫定理:在给定古典线性回归模型的假定之下,,OLS,估计量在无偏线性估计量一类中,有最小方差。称之为最优线性无偏估计量(,BLUE,)。,BLUE-Best Linear Unbiasedness Estimator,有最小方差的无偏估计量叫做有效估计量(,efficient estimator,),119,最小二乘估计量的方差,120,最小二乘估计量的方差(续),121,最小二乘估计量的方差(续),(最小方差性的证明略),122,最小二乘估计量的标准差,123,全部估计量,BLUE,估计量的图形表示,线性无偏估计量,BLUE,估计量,124,4,随机扰动项的方差的估计,125,5,拟合优度检验(统计检验之一),问:样本回归线对数据拟合得有多好?,如果全部观测点都落在样本回归线上,则得到的是一个,“,完美,”,的拟合。,一般情形:总有一些正的残差或负的残差。我们希望这些围绕着回归线的残差尽可能小。,判定系数,R,2,就是用来做拟合优度检验的。,126,文图,Y,x,Y,x,Y,x,Y,x,Y,的变异完全由,X,的变异所解释,127,拟合优度检验的几何含义,128,一、平方和公式,129,平方和公式中各项的解释,总平方和(,TSS,),是实测的,Y,值围绕其均值的总变异。,解释平方和(,ESS,),是估计的,Y,值围绕其均值的变异。,残差平方和(,RSS,),是未被解释的围绕回归线的,Y,的变异。,130,平方和公式的几何表示,来自残差,来自回归,总离差,SRF,131,二、,R,2,公式,性质:,0R,2,1,问:,R,2,=0,意味着什么?,R,2,=1,意味着什么?,132,R,2,=1,133,R,2,=0,134,R,2,=0.86,R,2,=0.86,表示约有,86,的因变量,Y,的变异能由解释变量,X,来说明。,或者说,解释变量解释了因变量,Y,变异中的,86,。,注意:不表示有,86,的样本观测点落在了样本回归线上!(此处容易不错。),135,三、,R,2,与相关系数,r,的区别,136,相关系数,r,的一些性质,可正可负,区间为,-1,,,+1,是对称的,与原点和尺度无关:,若,X,i,*,=a X,i,+b,Y,i,*,=c Y,i,+d,,则,r(X,i,*,Y,i,*,)=r(X,i,Y,i,),若,X,与,Y,独立,则相关系数为,0,;反之不然,是线性关联,不能用于描述非线性关系,未必有因果关系,只是线性关联,137,四、相关样式的图形表示,Y,X,r=+1,Y,X,r=-1,138,四、相关样式的图形表示,(,续,1),Y,X,r=,接近于,+1,Y,X,r=,接近于,-1,139,四、相关样式的图形表示,(,续,2),Y,X,r=,接近于,+1,Y,X,r=,接近于,-1,140,四、相关样式的图形表示,(,续,3),Y,X,r=0,141,一个数值例子:支出与收入,1,0.51,24.5,142,一个数值例子:支出与收入,1,0.51,24.5,143,一个数值例子,斜率项,0.51,:在,80,到,260,美元的,X,的样本极差(最大值减最小值)范围内,,X,每增加,1,美元,平均每周消费估计增加,51,美分。,截距项,24.5,:,X,样本中不含,X=0,的点,所以截距项没有什么意义,通常不用解释它。若要解释,需借助经济学常识。,R,2,=0.9621,表示约有,96,的每周消费支出的变异,能由收入来说明。,144,咖啡的例子,斜率项,0.4795,:咖啡价格每上涨,1,美元,每日平均咖啡消费可望减少约半杯。,截距项,2.6911,:即使咖啡价格降到,0,,则平均每人咖啡消费可望达到每日,2.6911,杯。而人们不会毫无节制饮用咖啡。,R,2,=0.6628,表示约有,66,的咖啡消费的变异,能由价格来说明。,145,经典正态线性回归模型,CNLRM,没有正态性的假定,前面,OLS,估计量也满足,BLUE,性质,得到的估计量是点估计量,点估计只是统计推断的一个方面。,当我们用估计的,去推断真值时,或者说由样本回归函数(,SRF,)来推测总体回归函数(,PRF,)时,需要用到已知的分布。,因为估计的是随机扰动项,u,的线性函数,因此,u,的概率分布是什么性质至关重要。,146,正态独立分布:记号,147,正态性假定下,OLS,估计量的性质,148,最大似然估计法(,ML,),取代最小二乘法的另一方法似最大似然法(,ML,)。,为了使用,ML,法,必须对随机扰动项,u,的概率分布作一假定。在回归分析中,最常作的假定就是,u,服从正态分布。,在正态性假定下,自变量参数的,ML,估计量和,OLS,估计量是完全相同的。但是,,u,的方差的,OLS,和,ML,估计量却有差别。然而,在大样本中,这两个估计量趋于一致。,因此,通常称,ML,法为大样本方法。,ML,法有更为广泛的应用。意思是,它可以用于对参数为非线性的回归模型。对于非线性情形,一般都不用,OLS,。,149,本课程选用,OLS,的理由,相当于,ML,来说,,OLS,易于应用,对多元线性回归模型,参数,的,ML,估计量和,OLS,估计量是相同的。,即使样本不很大,,2,的,ML,估计量和,OLS,估计量也相差无几。,150,6,置信区间,151,6,置信区间,152,置信区间的图形表示,真实值存在、未知,样本估计值,置信上限,置信下限,置信区间,153,基本概念,置信区间,(Confidence interval):,这样的一个区间如果存在的话,就称为置信区间。,置信系数,(Confidence coefficient):1-,称为置信系数。,显著性水平,(Level of significance),:,(05.86,的概率,0.012,;即,,t,取此值的概率为,1.2%,;此概率如此小,因为拒绝原假设。,180,对,2,显著性的,2,检验,181,2,显著性的,2,检验:图示,1-,/2,/2,在接受域吗?,Yes,,接受,H,0,;,no,,则拒绝,H,0,。,182,8 F,检验(总体显著性水平),183,F,公式,184,方差分析
展开阅读全文