1、Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,1-,*,计 量 经 济 学 基 础 与 应 用,Two-Variable Regression Analysis:Some Basic Ideas,chapter two,第二章 双变量回归分析,:,基本概念,第一节 关于,“,回归,”,“回归”最早由统计学家,Francis,Galton,提出,父母身高、子女身高,儿女的身高趋向人口总体平均,普遍回归定律,(la
2、w of universal regression),。,Karl Pearson,发现:父亲高的的群体,儿辈平均身高低于父辈;而父亲身高矮的群体,儿辈平均身高高于父辈。,回归是计量经济学的主要工具,回归分析是研究一个因变量对一个或多个自变量的依赖关系的过程,其用意在于通过后者的设定去估计或预测前者的均值(总体均值)。,几个例子,第一节 关于,“,回归,”,变量,表示符号,用,Y,代表因变量,,X,代表自变量或解释变量。如果有多个解释变量,将使用适当的下标表示各个不同的,X,。,(,例如,,X,1,,,X,2,,,X,3,等等,),。,第二节 一个假想的例子,家庭收入与家庭消费支出的关系,假设
3、一个国家人口总体,由,60,户,家庭组成,分析每周家庭消费,支出,Y,和可家庭支配收入,X,的,关系,将,60,户家庭划分为收入水平差不多的,10,组,表,2-1,第二节 一个假想的例子,家庭可支配收入,X,给定情况下家庭消费支出,Y,的条件分布,由于为总体,所以可以计算条件概率,再计算,Y,的条件期望,条件均值,表,2-2,第二节 一个假想的例子,Y,条件均值落在一条直线上,该直线为总体回归线,(,population regression line,PRL),,,现实中可能为曲线,PRL,是,Y,对,X,的回归,(,regression of,Y,on,X,),图,2-1,PRL,都是直线
4、NO,!巧合!,第二节 一个假想的例子,图,2-2,第三节 总回归函数,(PRF),根据图,2-1,和图,2-2,,条件均值,均为,X,i,函数,表示为:,(,2.3.1,),PRF,的形式是一个经验问题,线性方程是常用的形式:,(,2.3.2,),其中 和,为未知但却固定的参数,称为回归系数,(regression coefficient),。,和,分别称为截距和斜率系数。方程,(2.3.2,)本身则称为线性总体回归函数或简称线性总体回归。,第四节 线性的含义,线性,(,linear,),,线性回归模型,(,LRM,),对变量线性,对参数线性(,本课程主要关注,),对变量非线性,对参数非
5、线性,第五节,PRF,的随机设定,随着家庭收入的增加,家庭消费支出平均地说也增加。但对单个家庭而言,消费支出 与收入 之间的关系呢?,答案:消费不一定随收入的增加而增加。而是围绕在其条件均值周围,表示为:,或者 (,2.5.1,),其中离差,u,i,是一个不可观测的可正可负的随机变量,在专业术语中,把它称为随机扰动项,(,stochastic disturbance term,),或随机误差项,(,stochastic error term,),。,第五节,PRF,的随机设定,怎样解释方程式,(2.5.1),呢,?,支出可表示为两个成分之和:一部分系统性或确定性成分 ;另一部分为随机或非系统性
6、成分 。,假定 与 为线性关系,即如式,(2.3.2),那么,式,(2.5.1),可变换为:,(2.5.2),(2.5.2),为,PFR,的随机设定形式,与(,2.3.2,)等价。,第六节,随机扰动项的意义,为什么要引入随机扰动项?,理论的含糊性,数据的缺失,变量的解释力(核心变量与周边变量),人类行为的内在随机性,糟糕的替代变量(永久消费与当前消费等),节省原则,错误的函数形式,第七节 样本回归函数(,SRF,),总体是观测不到的,大多数情况下,对应于一个解释变量,X,,,只能观测到被解释变量,Y,的一个值。,我们只能得到对应于某些固定,X,值的,Y,值的一个(有限个)样本。,第七节 样本回
7、归函数(,SRF,),样本回归函数,(sample regression function,SRF),第七节 样本回归函数(,SRF,),对应,(2.3.2),的,SRF,其中 读为,Y-,帽,是 的估计量。,注意,一个估计量,(,estimator,),,又称,(,样本,),统计量,(,statistic,),,是指一个规则或公式或方法。在一项应用中,由估计量算出的一个具体的数值,称为估计值,(,estimate,),。,对应,(2.5.2),的,SRF,表示样本残差项,(residual term),第七节 样本回归函数(,SRF,),回归分析的主要目的,根据,SRF,去估计,PRF,从图中,可以看出,疑问,?,现在,重要的问题是:既然认识到,SRF,只不过是,PRF,的一个近似,能不能设计一种规则或方法,使得这种近似是一种尽可能“接近”的近似,?,换一种说法,怎样构造,SRF,能使 的估计值尽可能“接近”真实的,?,从而估计得到,PRF,。,尽管真实的 永远不得而知,!,