计量经济学课件全套教学教程整套课件全书电子教案.ppt

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,计量经济学,ECONOMETRICS,第一章,概述,1.1,什么是计量经济学？,1930,年,12,月,29,日，在耶鲁大学经济学家欧文,费雪（,Irving Fisher,）和挪威经济学家弗里希（,Ragnar,Frisch,）的倡议下，计量经济学会（,Econometric Society,）在美国俄亥俄州克里夫兰成立，由弗里希担任主编的计量经济学会的刊物,计量经济学学刊,（,Econometrica,）于,1933,年创刊。,1,一般认为，计量经济学会的成立，标志着计量经济学作为经济学的一门独立学科被正式确定。,1,,www.econometricsociety.org,/.,在,计量经济学学刊,创刊号上，弗里希进一步指出：“但经济学中的数量方法有几个方面，不应该将其中任何一个单方面与计量经济学相混淆。计量经济学与经济统计学绝非一码事；它也不同于我们所说的一般经济理论，尽管经济理论具有明显的数量特征；计量经济学也不应被看成是数学在经济学中的应用。经验表明，统计学、经济理论和数学这三方面对于要真正理解现代经济生活的数量关系来说，都是必要的，但没有哪一个方面是足够的，这三者结合起来才是力量，这种结合便构成了计量经济学。”,1,1,,www.econometricsociety.org,/.,1.2,计量经济学是一门独立的经济学科,一、计量经济学与其他学科的不同,经济理论,主要是根据逻辑推理得出结论，说明研究经济现象的本质和规律，大多数是,定性,的。经济理论所涉及到的数量关系也都是确定的，并,不能给出具体的数值度量,。,计量经济学,所要研究的就是如何,估计这个具体的数值,，并且计量经济学所研究的数量关系不是确定的变量关系而是,随机变量关系。,数理经济学,是要用,数学形式,来表述经济理论。,计量经济学家,就是把数理经济学家提出来的数学方程式（公式）,改造成适合于经验验证的形式。,这种从数学公式到计量经济学方程式（公式）的转换需要许多的创造性和实际技巧。,经济统计学,主要是收集、加工并用图表的形式来体现经济数据。,计量经济学,根据需要的原始资料进行参数估计，验证经济理论。,二、计量经济学在经济学中的地位,克莱因,(,Lawrence,R.Klein),认为：“计量经济已经在经济学科中居于重要的地位”，“大多数大学的学院中，计量经济学的讲授已经成为经济学课程表中最有权威的一部分”。萨缪尔森甚至认为：“第二次世纪大战后的经济学是计量经济学的时代”。从,1969,年诺贝尔经济学设立到,2012,年，共有,71,位经济学家获奖，覆盖了经济学各分支学科分支学科，直接因对计量经济学的创立和发展作出贡献而获奖的经济学家达,12,人，居经济学个分支学科之首（详见附录,1.1,）。,三、计量经济学有自己独特的研究经济问题的方法,首先，计量经济学要根据观测（,observational,）数据而不是实验（,experimental,）数据来建立模型。,其次，从建立与应用计量经济学模型的全过程来看，理论模型的设定和样本数据的收集，都必须对经济理论和所要研究的经济现象有深刻的认识。所购建的计量经济学模型必须与实际经济现象和经济理论相符合，否则，模型将毫无意义。这一点正是为什么说计量经济学不是数学或数学在经济学上的应用，而是经济学的理由。,最后，计量经济学在某种角度是一门,综合方法论学科,，其核心内容是模型,参数估计方法,，但是，在整个计量经济学的分析中，涉及到各种方法与思想。这也恰恰是让学习者感觉到这门学科难以掌握、不是很系统的原因所在。,1.3,计量经济学方法论,什么是计量经济学方法论呢？实际上，就是计量经济学家们对一个经济问题到底是怎么分析的呢？使用什么样的方法呢？计量经济学的思想方法有若干派别，我们这里讲的主要是至今仍在经济学及其他社会和行为科学领域研究中占主导地位的,传统或经典方法论。,一、在理论和假说的基础上建立计量经济学模型,凯恩斯（,John Maynard Keynes,）在,就业、利息和货币通论,中说，存在一条基本的心理规律：通常或平均而言，人们倾向于随着他们收入的增加而增加其消费，但是消费的增加不如收入增加那么多。消费与收入的这种关系被称作,消费函数或消费倾向,。那么，增加的消费与增加的收入之比率，也就是说增加的,1,单位收入中用于增加消费部分的比率，称为,边际消费倾向,（,marginal propensity to consume,MPC,）。,边际消费倾向的公式是：,表示增加的消费，表示增加的收入；,代表消费，代表收入。,如果我们把消费和收入之间的关系看成函数关系，那么就可以建立一个函数方程来：,（,1.3.1,）,根据微积分的知识，我们知道,MPC,实际上就是函数的导数，即可以写成：,凯恩斯设想，边际消费倾向,MPC,是大于零小于,1,的。进一步，我们可以看到凯恩斯假设的消费与收入之间的关系是正向关系，但他并没有明确指出二者之间准确的函数关系。,为了简单起见，数理经济学家建立了一个如下的凯恩斯,消费函数,（,consumption function,）：,（,1.3.2,）,其中，代表消费，代表收入，而和分别表示,截距,（,intercept,）和,斜率,（,slope,）,方程（,1.3.2,）的几何意义是一条直线，见图,1.1,。这种函数关系，我们称为线性关系，即消费与收入之间的关系是线性关系。,图,1.1,凯恩斯消费函数,1,现在来定义一些概念和说明一下计量经济学模型建立的思想。,1,解释变量与被解释变量。,2.,截距,和,斜率,、,模型,（,model,）、模型,参数,（,parameter,）,3.“,线性”的含义。,4,在线性函数方程（,1.3.2,）中具有非常重要的意义。,5,计量经济学模型建立的思想,。,计量经济学模型,方程（,1.3.1,）和方程（,1.3.2,）修改成如下的形式：,（,1.3.3,）,（,1.3.4,）,变量是一个,随机变量,（,random variable,stochastic variable,），被称为,随机干扰项,（,stochastic disturbance term,）或,随机误差项,（,stochastic error term,）。,二、统计数据的获得与参数估计,1.,数据类型。,时间序列数据,（,time series data,）。,截面数据,（,cross-section data,）。,面板数据,（,panel data,）。,2.,参数估计。,利用,回归分析,（,regression analysis,）方法，得到参数和的,估计值,。,表,1.1 1978-2011,年间中国人均国内生产总值与居民消费水平数据,(,单位：元,),年份,人均国内生产总值（,X,）,居民消费水平（,Y,）,年份,人均国内生产总值（,X,）,居民消费水平（,Y,）,1978,381,184,1995,5046,2355,1979,419,208,1996,5846,2789,1980,463,238,1997,6420,3002,1981,492,264,1998,6796,3159,1982,528,288,1999,7159,3346,1983,583,316,2000,7858,3632,1984,695,361,2001,8622,3887,1985,858,446,2002,9398,4144,1986,963,497,2003,10542,4475,1987,1112,565,2004,12336,5032,1988,1366,714,2005,14185,5596,1989,1519,788,2006,16500,6299,1990,1644,833,2007,20169,7310,1991,1893,932,2008,23708,8430,1992,2311,1116,2009,25608,9283,1993,2998,1393,2010,30015,10522,1994,4044,1833,2011,35181,12272,图,1.2 1978-2011,年间中国人均国内生产总值与居民消费水平的关系,和的估计值分别为,374.6882,和,0.350334,。从而所估计的消费函数是，,（,1.3.5,）,什么是“回归”？什么是“回归分析方法”？,为什么估计出来的消费函数变量,Y,顶上有帽（或尖）符号，并且和变量,X,一样都有下标符号,t,？,首先，计量经济模型（,1.3.4,）是一个随机模型，因为有随机变量的存在，但是，这个模型也是纯随机数学模型，因此，不可能写成带有具体数值的模型来；,其次，要写成带有具体数值，或者讲，带有具体的参数数值的模型来，也就是说，把抽象的参数符号赋予具体的数值，就必须利用具体的数据来估计。因此，我们得到的和的数值是通过具体一组数据估计获得的,-,样本。,方程（,1.3.5,）叫做样本回归函数（,sample regression function,SRF,）或样本回归方程（,sample regression equation,）；图,1-2,中所显示出的直线称为样本回归线（,sample regression lines,）。,样本估计值用帽表示：,-,样本回归函数,下标表示不同样本观测值。,N,个不同样本，确定与随机的关系。,样本函数一旦确定，对于某个样本来讲，这个样本函数就是一个确定的、具体的函数关系。但是同时因为样本本身的随机性，参数又是随机变量。,三、假设检验,首先，通过,统计推断,（,statistical inference,）即,假设检验,（,hypothesis testing,）来肯定或否定经济理论，这是本书最重要的内容。,其次，需要考虑的问题是：数据的选择是不是有问题？建立的模型一定存在因果关系吗？经济理论一定能够得到模型验证吗？建立的经济模型一定能够发现新的经济理论呢？例如，在,19,世纪晚期，英国经济学家,威廉姆,斯坦利,杰文斯（,William,Stanley Jevons,）曾经假设太阳黑子导致经济活动增加。,四、模型应用,如果所选择的模型经过验证肯定了所考虑的经济理论或假说，那么就可以根据模型来预测与预报。比如根据样本回归方程（,1.3.5,）来预测,2012,年的居民消费水平。假设,2012,年人均国内生产总值为,X=36000,元，代入方程（,1.3.5,）得到：,图,1.3,计量经济学的研究过程,1.4,计量经济学的类型,理论计量经济学,（,theoretical econometrics,）和,应用计量经济学,(applied econometrics),。,经典计量经济学,（,classical econometrics,）一般指,20,世纪,70,年代以前的计量经济学，,非经典计量经济学,（,non-classical econometrics,）或,现代计量经济学,（,modern econometrics,），主要包括微观计量经济学、非参数计量经济学、时间序列计量经济学和平行数据计量经济学。即经典方法和,贝叶斯方法,（,Bayesian,）。,宏观计量经济学,（,Macroeconometrics,）和,微观计量经济学,（,Microeconometrics,）,1.5,预备知识和计量经济学软件,1.,宏观经济学方面的基本知识。,2.,数学方面。需要基本的微积分和线性代数方面的知识。,3.,统计学和数理统计方面。个体、总体、样本、随机变量、条件概率、数学期望、常见随机变量分布、平均值、方差、标准差、协方差、相关系数、统计估计量、点估计、区间估计、参数估计、中心极限定理、小概率事件、两类错误、假设检验等。,常用的计量经济学软件很多。诸如,EViews(Econometric,Views),、,TSP(Time,Series Processor),、,PcGIVE(Personal,Computer,General Instrumental Variable Estimation),、,FcFiml(Personal,Computer,Full Instrument Maximum Likelihood Estimation),、,RATS,、,Microfit,、,Mathematica,、,S-plus,、,Ox,、,ET,、,LIMDEP,、,SHAZAM,、,MINITAB,、,BMD,、,GUASS,、,STATA,、,SPSS,、,SAS,等。,EViews,是目前世界上最流行的计量经济学软件之一。,1.6,进一步学习建议,古拉扎蒂,.,计量经济学基础,.5,版,.,费剑平译,.,北京：中国人民大学出版社，,2011.,威廉,格林,.,计量经济学分析,.6,版,.,张成思译,.,北京：中国人民大学出版社，,2011.,本章结束了！,准备好了吗？,下节课我们开始学习新课程！,第二章简单线性回归模型,2.1,什么是“回归”？,“回归”这个词是由英国维多利亚时期博学科学家,法兰西斯,高尔顿（,Francis Galton,）首先提出来的。,法兰西斯,高尔顿,在利用统计方法研究人类遗传学中发现，父母高，儿女也高；父母矮，儿女也矮，但是给定父母的身高，儿女辈的平均身高却趋于或者“回归”到全体人口的平均身高，即“回归于平均值”（,regression toward the mean,）。,另一位英国数理统计学家,卡尔,皮尔逊（,Karl Pearson),发现，对于父亲高的群体，儿子辈的平均身高低于父辈的身高，而对于父亲矮的群体，儿子辈的平均身高则高于父辈的身高。,儿子辈的身高“回归”到男子的平均身高,。,表,2.1,模仿,70,对父子身高的调查结果,（纯假设构造数据，单位：厘米）,父亲,儿子,父亲,儿子,父亲,儿子,父亲,儿子,父亲,儿子,父亲,儿子,父亲,儿子,153,150,153,166,165,160,165,173,178,166,178,180,190,171,153,152,153,168,165,162,165,175,178,167,178,181,190,172,153,154,153,171,165,163,165,177,178,168,178,183,190,173,153,156,153,172,165,165,165,180,178,170,190,160,190,175,153,158,153,173,165,166,178,156,178,172,190,162,190,177,153,159,153,175,165,167,178,158,178,173,190,164,190,178,153,160,165,155,165,168,178,160,178,174,190,165,190,180,153,162,165,156,165,170,178,161,178,175,190,167,190,182,153,163,165,157,165,171,178,163,178,176,190,169,190,184,153,165,165,158,165,172,178,165,178,178,190,170,190,186,图,2.1,给定父亲身高后儿子辈身高的假设分布,（,Y,代表儿子辈身高，,X,代表给定的父亲身高，单位：厘米）,表,2.2,按照给定父亲身高对儿子辈身高重新编排,（单位：厘米）,项目,给定父亲身高,153,165,178,190,儿子辈身高,150,163,155,167,156,172,160,172,152,165,156,168,158,173,162,173,154,166,157,170,160,174,164,175,156,168,158,171,161,175,165,177,158,171,160,172,163,176,167,178,159,172,162,173,165,178,169,180,160,173,163,175,166,180,170,182,162,175,165,177,167,181,171,184,166,180,168,183,186,170,平均值,162.7,166.4,169.8,172.6,图,2.2,儿子辈身高的平均值连接成一条直线，这条直线就叫做回归线,对回归的现代理解已经有了很大的不同，在计量经济学上所讲的回归，实际上，与所说的,回归分析,（,regression analysis,）是一个意思。从狭义上讲，回归分析是指：,一个变量对另一个变量的依赖关系，在计量经济学上，就是指,被解释变量,对,解释变量,（一个或多个）的依赖关系（也可以说成统计依赖关系）。其用意在于通过后者的已知或设定值，去,估计,或,预测,前者的（总体）均值；或者，利用回归分析得到的样本模型中的（总体）参数的估计值来解释被解释变量的经济意义，即,经济结构分析,。,例如第,1,章我们谈到的凯恩斯消费函数的计量经济模型，,人均国内生产总和居民消费水平数据作为样本得到的样本回归模型,实际上是一个,随机变量,，而也是随机变量，但是在经典计量经济学中，我们假定,不是随机变量,，也就是说，在不同的多个样本抽取中取同样一组数值。,所谓的被解释变量与解释变量的依赖关系，往往含有,因果关系,的意思，也就是说，在经济理论假设（因果关系）的前提下，作为检验经济理论的计量经济模型自然就存在着,因果关系,，这种因果方向是从到，而不存在从到的因果关系。但是，这并不能说明被解释变量与解释变量本来就存在因果关系。,依赖关系的另一层含义：,用样本模型中得到的对总体参数的估计值来解释被解释变量的经济意义，即,经济结构分析,。,广义的回归分析包括：根据样本数据对计量经济模型参数进行估计，得到样本回归方程；对回归方程、参数估计值进行显著性假设检验；利用回归方程进行分析、评价及预测。,2.2,总体回归函数与样本回归函数,一、随机变量与统计学中一些基本概念,回归分析中，我们所谈的统计依赖关系，是不确定的关系，即变量是随机变量（,random variable,stochastic variable,）。,农作物收成对气温、降雨量、阳光、土壤质量以及施肥量的关系。,影响农作物收成的因素是复杂的、多样的（不可辨认的）。,确定的关系,-,万有引力定律,其中，为两个物体的质量，,F,为引力，,G,为比例常数，,r,为距离。,如何处理随机变量问题？建立与随机变量相关的模型呢？,经济学家建立纯数学模型：,Q,代表商品需求量,P,代表商品价格，,Ps,代表替代品价格，,Y,代表可支配收入。,数理经济学家建立线性模型：,计量经济学家随机模型：,通过样本估计得到具体的方程：,在概率论与数理统计中，随机变量的含义是指定义,在样本空间上具有一定概率分布的变量,。也就是说，随机变量是具有一定概率的不确定的变量。,统计学中一些基本概念：,总体,（,population,）是指包含所研究的全部个体（数据）的集合；,样本或样本空间,（,sample space,）是指从总体中抽取的一部分元素的集合，构成样本的元素的个数叫做,样本量,（,sample size,）或,样本容量,（,sample capacity,）,平均数,也称为,均值,（,mean,）,是指变量值相加后除以变量个数得到的结果，记作，,离差,（,deviation,），是指变量值与均值之差，记作，,方差,（,variance,），是指各变量值与均值之差（离差）的平方的平均数，记作，,，,标准差,（,standard error,），是指方差的平方根，记作，,数学期望,（,mathematical expectation,）或,期望,（,expectation,），是指随机变量平均取值大小，记作，,协方差,（,covariance,），是指两个变量的离差乘积的数学期望，记作；,相关系数,（,correlation coefficient,），是指两个变量之间线性关系的一个度量，定义为：,(2.2.1),样本相关系数可以写成如下形式,:,(2.2.2),二、总体回归函数（重新回到回归的概念）,例,2.1,假想一个社区是由,60,户家庭组成的,总体,（,population,），现在来研究该社区整体家庭每月家庭消费与每月可支配收入之间的关系。,把,60,个家庭按照可支配收入水平不同分成,10,组（子总体），每组有不同个数的家庭组成，这样，就有了,10,个固定的值以及每个值对应着不同个数的值。,项目,每月家庭可支配收入,X,3200,4000,4800,5600,6400,7200,8000,8800,9600,10400,每月家庭消费支出,Y,2200,2600,3160,3200,4080,4400,4800,5400,5480,6000,2400,2800,3360,3720,4280,4600,5440,5480,5800,6080,2600,2960,3600,3800,4400,4800,5600,5600,6200,7000,2800,3200,3760,4120,4640,5200,5760,6080,6600,7120,3000,3400,3920,4320,4720,5400,5800,6280,7000,7200,3520,4520,5000,5600,6400,7560,7400,4600,6480,7640,共计,13000,18480,17800,28280,27120,30000,27400,41720,38640,48440,E(Y,X),2600,3080,3560,4040,4520,5000,5480,5960,6440,6920,表,2.3,每月家庭可支配收入与消费支出,（单位：元）,平均值或均值，也称为,条件均值,或,条件期望值,（,conditional expected values,），用符号表示为，,读作“给定值条件下的期望值”。,根据表,2.4,中的数据可以计算出，,其中,=1,，,2,，,10,，表示给定的第组家庭月可支配收入。,项目,每月家庭可支配收入,X,3200,4000,4800,5600,6400,7200,8000,8800,9600,10400,条件概率,P(,Y,Xi,),1/5,1/6,1/5,1/7,1/6,1/6,1/5,1/7,1/6,1/7,1/5,1/6,1/5,1/7,1/6,1/6,1/5,1/7,1/6,1/7,1/5,1/6,1/5,1/7,1/6,1/6,1/5,1/7,1/6,1/7,1/5,1/6,1/5,1/7,1/6,1/6,1/5,1/7,1/6,1/7,1/5,1/6,1/5,1/7,1/6,1/6,1/5,1/7,1/6,1/7,1/6,1/7,1/6,1/6,1/7,1/6,1/7,1/7,1/7,1/7,E(Y,X),2600,3080,3560,4040,4520,5000,5480,5960,6440,6920,表,2.4,与表,2.3,数据对应的条件概率分布,比如，,=8000,元，的概率分布为,Y 4800 5440 5600 5760 5800,P(Y|Xi)1/5,1/5,1/5,1/5,1/5,需要指出的是：条件期望值与无条件期望值（,unconditional expected value,）是不同的。,现在把表,2.3,中的数据，以为横轴，以和为纵轴，做出散点图来，并将条件期望值各点连接起来，就形成了一条直线，见图,2.3,。,我们把这条直线称为总体回归线（,population regression line,，,PRL,）或一般地称为总体回归曲线（,population regression curve,）。或者说，对的回归（,regression of on,）。,图,2.3,家庭可支配收入与家庭消费支出的散点图,（,E,代表条件期望值）,图,2.3,中的总体回归线是一条直线，这不说明所有的总体回归线都是直线，也可能是抛物线、指数曲线等其他曲线。,另外，我们假设对于每个，都有值在其条件期望值左右的一定分布，而总体回归线恰好是穿过这些条件期望或均值的直线或曲线。,对于每一个条件期望都是的函数，其中是的某个给定值，可以写成：,（,2.2.3,）,方程（,2.2.3,）称为,条件期望函数,（,conditional expectation function,，,CEF,）或,总体回归函数,（,population regression function,，,PRF,）或简称,总体回归,（,population regression,，,PR,）。,一般情况下，我们把总体回归函数设为线性形式，即,（,2.2.4,）,方程（,2.2.4,）称为,线性总体回归函数,（,linear population regression function,）或简称,线性总体回归,（,linear population regression,）。,和是未知但却固定的参数。,需要测算或估计出具体的数值。,在实际经济现象中，要全部掌握总体数据往往是比较困难的或者是不可能的。,被看成常数。,回归系数,（,regression coefficients,）,模型参数,三、随机误差项与总体回归函数随机设定形式,离差（个别值）,（,2.2.5,）,是一个不可观测的可正可负的随机变量。,称为随机误差项（,stochastic error term,）或,随机扰动项,或,随即干扰项,（,stochastic disturbance term,）。,也可以写成,（,2.2.6,）,（,2.2.8,）,等价表示（一般的）：,等价表示（线性的）：,四个函数,（,2.2.3,）,（,2.2.5,）,（,2.2.4,）,（,2.2.6,）,（,2.2.5,）和（,2.2.6,）称为,总体回归函数随机设定形式,。（,2.2.4,）和（,2.2.6,）被称为,线性回归模型,（,linear regression model,，,LRM,）。,确定函数形式,随机设定形式,对于只有一个解释变量的线性回归模型也叫做,一元线性回归模型,或,简单线性回归模型,（,Simple linear regression model,）。,简单线性回归模型,图,2.4,给定后的分布以及随机误差项的几何表示,0,随机误差项产生的原因,：,1,由于经济理论的不完备，作为未知因素的代表,。比如，每月家庭可支配收入对消费支出的影响，还可以能存在众多未知因素对消费支出产生影响。,2,由于数据欠缺，作为无法取得数据的代表,。比如，在收入对消费的影响中，我们很清楚家庭财富对消费支出有很大的影响，但不幸的是，一般很难得到家庭财富的信息。,3,由于忽略了一些影响微小的因素，作为众多微小影响因素的代表,。比如，在家庭收入与消费的例子中，除了收入之外，还有家庭的子女数、性别、宗教、教育和地区也是影响因素，但是这些影响因素很微小，如果一一收集数据并引入模型是划不来的，因此，只能把这些众多微小影响因素当作随机变量处理。,4,作为数据观测误差的代表。,一是由于主客观的原因，在取得观测数据时往往存在测量误差和登记误差；二是有些数据难以直接观测，必须采取替代变量而产生误差。,5,作为模型设定错误的代表,。比如在研究家庭收入与消费之间的关系时，我们设定了简单线性模型，但是，实际上收入与消费的关系也许并非是线性的，并且影响消费的解释变量也不仅有收入，所以模型的正确性还有待进一步研究。,6,人类行为以及经济现象内在的随机性,。即使把所有的因素全部纳入模型中，人的行为以及所从事的经济活动还是可能存在不可重复性和随机性，即所谓变量的“内在”随机性。,四、样本回归函数,表,2.5,表,2.3,中的两组样本数据,第一组样本数据,第二组样本数据,Y,X,Y,X,2800,3200,2200,3200,2600,4000,3520,4000,3600,4800,3600,4800,3800,5600,3200,5600,4400,6400,4720,6400,4600,7200,4800,7200,4800,8000,5800,8000,5600,8800,5400,8800,6200,9600,5800,9600,6000,10400,7000,10400,样本回归线,Y1,Y2,图,2.5,从表,2.3,中获取的两组样本数据（表,2.5,）的散点图,图,2.6,表,2.3,中数据的总体回归线与样本回归线,一般地，,（,2.2.10,）,称为,样本回归函数,（,sample regression function,，,SRF,）。,是的估计量；,是的估计量；,是的估计量。,是回归线上与相对应的的条件均值的估计，与的个别值离差为,（,2.2.11,）,或,（,2.2.12,）,方程（,2.2.12,）称为,样本回归函数的随机设定形式,，其中，称为,剩余项,或,残差,（,residual,），是随机误差项的估计量。,因此，也可以说，回归分析就是用样本回归函数,SRF,的方程来估计总体回归函数,PRF,的方,程。,注意，,估计量,（,estimator,）,又称,样本统计量,（,statistic,）与,估计值,的区别。由估计量算出的具体数值，称为,估计值,（,estimate,，,estimated value,）。估计量是一个随机变量，估计值是一个具体的数值。,和即可看作估计值，也可看作估计量，当看作估计量时，是随机变量，样本函数也变成了随机关系。,为什么？,估计量即可看作估计值，也可看成随机变量。,为什么？,五、总体回归函数与样本回归函数的关系,设定总体回归函数，再用样本回归函数来估计总体回归函数，这是计量经济学基本的思想方法。,第一，怎么样建立样本回归函数呢？,第二，由于样本的不同，得到的样本回归函数也不一样，那么，哪一个样本回归函数更好呢？也就是说，哪一个样本回归函数更“接近”真实的总体回归函数呢？,4,个方程,（,2.2.4,）,（,2.2.9,）,（,2.2.10,）,（,2.2.12,）,前,两个方程是关于总体回归函数的，方程（,2.2.9,）是随机设定形式。,后两个方程是关于样本回归函数的，方程（,2.2.12,）是随机设定形式。,方程（,2.2.4,）与方程（,2.2.10,）对应；方程（,2.2.9,）与方程（,2.2.12,）对应。,方程（,2.2.10,）是用来估计在给定后的条件均值，即所谓总体回归线；而方程（,2.2.12,）是用来估算的个别值。,方程（,2.2.12,）的真正意义是：用来估计，即用样本估计总体所产生的误差，这是被称为残差的真实意义所在。,方程（,2.2.4,）是总体回归函数的确定表示形式，方程（,2.2.9,）是总体回归函数的随机表示形式，也就是说，前者是确定的函数关系，后者是随机的函数关系。那么，显然是随机变量，从而也是随机变量。,方程（,2.2.10,）是样本回归函数的确定表示形式，方程（,2.2.12,）是样本回归函数的随机设定形式。,如何正确理解？,某个样本条件下，确定关系；,大量样本条件下，统计关系,-,随机关系。,图,2.7,总体回归函数与样本回归函数的关系,SRF:,0,A,从图,2.7,中，我们看到：,SRF,在,PRF,上方时，是高估；,SRF,在,PRF,下方时，是低估。,2.3,模型参数估计：普通最小二乘法,一般常用的方法有两种：,普通最小二乘法,（,ordinary least squares,，,OLS,）,极大似然法,（,maximum likelihood,，,ML,）。,普通最小二乘法应用最为广泛，因此，本书只介绍该方法以及其演变形式,加权最小二乘法,（,weighted least squares,，,WLS,）。,一、普通最小二乘法,OLS,普通最小二乘法是由德国数学家高斯（,Carl Friedrich Gauss,）提出,由于,可以取正负值，最后会抵消，因此，选择最小二乘法：,让残差平方和最小,，即,进一步写成,：,（,2.3.1,）,把上式的残差平方和看成为自变量为和的二元函数，根据微积分知识，在偏导数都等于零的条件下，函数取极大值。,对参数和分别求偏导数，并令方程为零。,（,2.3.2,）,（,2.3.3,）,整理得正规方程（,normal equations,）为,：,（,2.3.4,）,（,2.3.5,）,解正规方程得到参数估计值为：,（,2.3.6,）,（,2.3.7,）,进一步简化为离差形式：,（,2.3.8,）,（,2.3.9,）,离差形式简单、方便运算和推导,。,下面给出一些方便使用的等价公式来。,1,）（,2.3.10,）,2,）（,2.3.11,）,3,）（,2.3.12,）,4,）（,2.3.13,）,5,）（,2.3.14,）,用离差形式（,deviation form,）表达样本回归函数和总体回归函数：,（,2.3.15,）,（,2.3.16,）,注意：没有截距项。,或者,二、,OLS,回归线的纯数值性质,（,numerical properties,）,1,回归线穿过和的样本均值点,（，）,。,SRF:,2,估计值的均值等于实际值的均值。,3.,残差的均值为零。,（,2.3.19,）,4,残差与估计值不相关，即,所谓两个变量不相关，即协方差为零。,证明残差与估计值不相关，即协方差为零。,继续，,由残差和样本函数的离差表达式以及最小二乘法的结果得，,（,2.3.20,）,所以，,即残差与估计值不相关。,5,残差与解释变量不相关，即,证明残差与解释变量不相关：,所以，,例,2.2,利用例,2.1,的表,2.5,中的第一组样本数据来求回归线。见表,2.6,。,序号,可支配收入,消费支出,1,3200,2800,-3600,-1640,5904000,12960000,2,4000,2600,-2800,-1840,5152000,7840000,3,4800,3600,-2000,-840,1680000,4000000,4,5600,3800,-1200,-640,768000,1440000,5,6400,4400,-400,-40,16000,160000,6,7200,4600,400,160,64000,160000,7,8000,4800,1200,360,432000,1440000,8,8800,5600,2000,1160,2320000,4000000,9,9600,6200,2800,1760,4928000,7840000,10,10400,6000,3600,1560,5616000,12960000,合计,68000,44400,26880000,52800000,平均,6800,4440,表,2.6,表,2.5,中第一组样本数据及相关数据,（单位：元）,将有关数据代入方程（,2.3.8,）和（,2.3.9,）得,介绍大家使用,EViews,6.0,软件,。,第一步，,文件创建,。,将鼠标放置窗口最上端的工具栏的第一项,File,并点击，选择,New,项的,Workfile,并点击，弹出下列窗口,在,Workfile,structure type,对话框中选择,Unstructured/Undated,（因数据不是时间序列数据，如果是时间序列数据，请选择,Dated-regular frequency,），在右边,data range,的,observations,键入,10,。下面,Names(optional,),是给文件起名字。我给文件起名字为“家庭收入与消费样本回归”。点击,OK,，文件就建成了。,第二步，,数据输入,。在最上面的工具栏中选择,Quick,一项并点击，选择其中,Empty Group(Edit Series),并点

展开阅读全文