1、计量经济学复习要点参考教材:伍德里奇 计量经济学导论第1章 绪论数据类型:截面、时间序列、面板用数据度量因果效应,其他条件不变的概念习题:C1、C2第2章 简单线性回归 回归分析的基本概念,常用术语现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。简单线性回归模型是只有一个解释变量的线性回归模型。 回归中的四个重要概念1. 总体回归模型(Population Regression Model,PRM)-代表了总体变量间的真实关系。2. 总体回归函数(Population Regression Function,PRF)-代表了总
2、体变量间的依存规律。3. 样本回归函数(Sample Regression Function,SRF)-代表了样本显示的变量关系。4. 样本回归模型(Sample Regression Model,SRM)-代表了样本显示的变量依存规律。 总体回归模型与样本回归模型的主要区别是:描述的对象不同。总体回归模型描述总体中变量y与x的相互关系,而样本回归模型描述所关的样本中变量y与x的相互关系。建立模型的依据不同。总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。模型性质不同。总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。 总体回归模型与
3、样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。线性回归的含义线性:被解释变量是关于参数的线性函数(可以不是解释变量的线性函数)线性回归模型的基本假设简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)普通最小二乘法(原理、推导)最小二乘法估计参数的原则是以“残差平方和最小”。Min : , OLS的代数性质拟合优度R2离差平方和的分解:TSS=ESS+RSS“拟合优度”是模型对样本数据的拟合程度。检验方法是构造一个可以表征拟合程度的指
4、标判定系数又称决定系数。 (1),表示回归平方和与总离差平方和之比;反映了样本回归线对样本观测值拟合优劣程度的一种描述; (2) ; (3) 回归模型中所包含的解释变量越多,越大!改变度量单位对OLS统计量的影响函数形式(对数、半对数模型系数的解释)(1):X变化一个单位Y的变化(2): X变化1%,Y变化%,表示弹性。(3):X变化一个单位,Y变化百分之100(4):X变化1%,Y变化%。OLS无偏性,无偏性的证明OLS估计量的抽样方差误差方差的估计OLS估计量的性质(1)线性:是指参数估计值和分别为观测值的线性组合。(2)无偏性:是指和的期望值分别是总体参数和。(3)最优性(最小方差性):
5、是指最小二乘估计量和在在各种线性无偏估计中,具有最小方差。高斯-马尔可夫定理OLS参数估计量的概率分布OLS随机误差项的方差2的估计简单回归的高斯马尔科夫假定对零条件均值的理解习题:4、5、6;C2、C3、C4第3章 多元回归分析:估计1、变量系数的解释(剔除、控制其他因素的影响) 对斜率系数的解释:在控制其他解释变量(X2)不变的条件下,X1变化一个单位对Y的影响;或者,在剔除了其他解释变量的影响之后,X1的变化对Y的单独影响!2、多元线性回归模型中对随机扰动项u的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定。3、多
6、元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式。最小二乘法 (OLS) 公式: 估计的回归模型:的方差协方差矩阵: 残差的方差 : 估计的方差协方差矩阵是: 拟合优度遗漏变量偏误多重共线性多重共线性的概念多重共线性的后果多重共线性的检验多重共线性的处理习题:1、2、6、7、8、10;C2、C5、C6第4章 多元回归分析:推断经典线性模型假定正态抽样分布变量显著性检验,t检验 检验值的其他假设P值实际显著性与统计显著性检验参数的一个线性组合假设多个线性约束的检验:F检验理解排除性约束报告回
7、归结果习题:1、2、3、4、6、7、10、11;C3、C5、C8第6章 多元回归分析:专题测度单位对OLS统计量的影响进一步理解对数模型二次式的模型交互项的模型拟合优度修正可决系数的作用和方法。习题:1、3、4、7;C2、C3、C5、C9、C12第7章 虚拟变量虚拟变量的定义如何引入虚拟变量:如果一个变量分成N组,引入该变量的虚拟变量形式是只能放入N-1个虚拟变量虚拟变量系数的解释虚拟变量系数的解释:不同组均值的差(基准组或对照组与处理组)以下几种模型形式表达的不同含义; 1):截距项不同;2):斜率不同;3):截距项与斜率都不同;其中D是二值虚拟变量,X是连续的变量。虚拟变量陷阱虚拟变量的交
8、互作用习题:2、4、9;C2、C3、C6、C7、C11第8章 异方差异方差的后果异方差稳健标准误BP检验异方差的检验(White检验)加权最小二乘法习题:1、2、3、4;C1、C2、C8、C9Eviews回归结果界面解释表英文名称中文名称常用计算公式常用相互关系和判断准则Variable变量Coefficient系数Sta.Error标准差一般是绝对值越小越好t-statisticT检验统计量绝对值大于2时可粗略判断系数通过t检验ProbT统计量的P值P值小于给定显著水平时系数通过t检验RsquaredAjusted RsquaredS.E. of regression扰动项标准差Sum sq
9、uared resid残差平方和Log likelihood似然函数对数值Durbin-Watson statDW统计量Mean dependent var应变量样本均值S.D. dependent var应变量样本标准差Akaike info criterionAIC准则一般是越小越好Schwarz criterionSC准则一般是越小越好F-statisticF统计量Prob(F-statistic)F统计量的P值P值小于给定显著水平时模型通过F检验19计量经济学复习题第1章习题:C1、C2第2章习题:4、5、6;C2、C3、C4第3章习题:1、2、6、7、8、10;C2、C5、C6第4章
10、习题:1、2、3、4、6、7、10、11;C3、C5、C8第6章习题:1、3、4、7;C2、C3、C5、C9、C12第7章习题:2、4、9;C2、C3、C6、C7、C11第8章习题:1、2、3、4;C1、C2、C8、C91、判断下列表达式是否正确2、给定一元线性回归模型: (1)叙述模型的基本假定;(2)写出参数和的最小二乘估计公式; (3)说明满足基本假定的最小二乘估计量的统计性质;(4)写出随机扰动项方差的无偏估计公式。3、对于多元线性计量经济学模型: (1)该模型的矩阵形式及各矩阵的含义;(2)对应的样本线性回归模型的矩阵形式;(3)模型的最小二乘参数估计量。4、根据美国1961年第一季
11、度至1977年第二季度的数据,我们得到了如下的咖啡需求函数的回归方程: (-2.14) (1.23) (0.55) (-3.36) (-3.74) (-6.03) (-0.37)其中,Q=人均咖啡消费量(单位:磅);P=咖啡的价格(以1967年价格为不变价格);I=人均可支配收入(单位:千元,以1967年价格为不变价格);=茶的价格(1/4磅,以1967年价格为不变价格);T=时间趋势变量(1961年第一季度为1,1977年第二季度为66);D1=1:第一季度;D2=1:第二季度;D3=1:第三季度。请回答以下问题: 模型中P、I和的系数的经济含义是什么? 咖啡的需求是否很有弹性? 咖啡和茶是
12、互补品还是替代品? 你如何解释时间变量T的系数? 你如何解释模型中虚拟变量的作用? 哪一个虚拟变量在统计上是显著的? 咖啡的需求是否存在季节效应?5、为研究体重与身高的关系,我们随机抽样调查了51名学生(其中36名男生,15名女生),并得到如下两种回归模型: (5.1)t=(-5.2066) (8.6246) (5.2)t=(-2.5884) (4.0149) (5.1613)其中,W(weight)=体重 (单位:磅);h(height)=身高 (单位:英寸)请回答以下问题: 你将选择哪一个模型?为什么? 如果模型(5.2)确实更好,而你选择了(5.1),你犯了什么错误? D的系数说明了什么
13、?6、 简述异方差对下列各项有何影响:(1)OLS估计量及其方差;(2)置信区间;(3)显著性t检验和F检验的使用。(4)预测。7、假设某研究者基于100组三年级的班级规模(CS)和平均测试成绩(TestScore)数据估计的OLS回归为: (1) 若某班级有22个学生,则班级平均测试成绩的回归预测值是多少?(2) 某班去年有19个学生,而今年有23个学生,则班级平均测试成绩变化的回归预测值是多少?(3) 100个班级的样本平均班级规模为21.4,则这100个班级的样本平均测试成绩是多少?(4) 100个班级的测试成绩样本标准差是多少?(提示:利用R2和SER的公式)(5) 求关于CS的回归斜
14、率系数的95%置信区间。(6) 计算t统计量,根据经验法则(t=2)来判断显著性检验的结果。8、设从总体中抽取一容量为200的20岁男性随机样本,记录他们的身高和体重。得体重对身高的回归为:其中体重的单位是英镑,身高的单位是英寸。(1) 身高为70英寸的人,其体重的回归预测值是多少?65英寸的呢?74英寸的呢?(2) 某人发育较晚,一年里蹿高了1.5英寸。则根据回归预测体重增加多少?(3) 解释系数值-99.41和3.94的含义。(4) 假定不用英镑和英寸度量体重和身高而分别用厘米和千克,则这个新的厘米-千克回归估计是什么?给出所有结果,包括回归系数估计值,R2和SER。(5) 基于回归方程,
15、能对一个3岁小孩的体重(假设身高1米)作出可靠预测吗?9、假设某研究使用250名男性和280名女性工人的工资(Wage)数据估计出如下OLS回归: (标准误)(0.23)(0.36)其中WAGE的单位是美元/小时,Male为男性=1,女性=0的虚拟变量。用男性和女性的平均收入之差定义工资的性别差距。(1)性别差距的估计值是多少?(2)计算截距项和Male系数的t统计量,估计出的性别差距统计显著不为0吗?(5%显著水平的t统计量临界值为1.96)(3)样本中女性的平均工资是多少?男性的呢?(4)对本回归的R2你有什么评论,它告诉了你什么,没有告诉你什么?这个很小的R2可否说明这个回归模型没有什么
16、价值?(5)另一个研究者利用相同的数据,但建立了WAGE对Female的回归,其中Female为女性=1,男性=0的变量。由此计算出的回归估计是什么?10、基于美国CPS人口调查1998年的数据得到平均小时收入对性别、教育和其他特征的回归结果,见下表。该数据集是由4000名全年工作的全职工人数据组成的。其中:AHE=平均小时收入;College=二元变量(大学取1,高中取0);Female女性取1,男性取0;Age=年龄(年);Northeast居于东北取1,否则为0;Midwest居于中西取1,否则为0;South居于南部取1,否则为0;West居于西部取1,否则取0。表1:基于2004年C
17、PS数据得到的平均小时收入对年龄、性别、教育、地区的回归结果因变量:AHE(1)(2)(3)回归变量College(X1)5.465.485.44(0.21)(0.21)(0.21)Female(X2)-2.64-2.62-2.62(0.20)(0.20)(0.20)Age(X3)0.290.29(0.04)(0.04)Northeast(X4)0.69(0.30)Midwest(X5)0.60(0.28)South(X6)-0.27(0.26)截距12.694.403.75(0.14)(1.05)(1.06)概括统计量和联合检验地区效应=0的F统计量6.10注:F(3,)分布,1%显著水平的
18、临界值为:3.78SER6.276.226.21R20.1760.1900.194N400040004000注:括号中是标准误。(1) 计算每个回归的调整R2。(2) 利用表1中列(1)的回归结果回答:大学毕业的工人平均比高中毕业的工人挣得多吗?多多少?这个差距在5%显著性水平下统计显著吗?男性平均比女性挣的多吗?多多少?这个差距在5%显著性水平下统计显著吗?(3) 年龄是收入的重要决定因素吗?请解释。使用适当的统计检验来回答。(4) Sally是29岁女性大学毕业生,Betsy是34岁女性大学毕业生,预测她们的收入。(5) 用列(3)的回归结果回答:地区间平均收入存在显著差距吗?利用适当的假
19、设检验解释你的答案。(6) 为什么在回归中省略了回归变量West?如果加上会怎样。解释3个地区回归变量的系数的经济含义。(7)Juantia是南部28岁女性大学毕业生,Jennifer是中西部28岁女性大学毕业生,计算她们收入的期望差距计量经济学补充复习题一、填空题1、 计量经济学常用的三类样本数据是_、_和_。2、虚拟解释变量不同的引入方式产生不同的作用。若要描述各种类型的模型在截距水平的差异,则以 引入虚拟解释变量;若要反映各种类型的模型的不同相对变化率时,则以 引入虚拟解释变量。二、选择题1、参数b的估计量具备有效性是指【 】A Var()=0 B Var()为最小C (b)0 D (b
20、)为最小2、产量(x,台)与单位产品成本(y, 元/台)之间的回归方程为3561.5x,这说明【 】A 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少1.5元C产量每增加一台,单位产品成本平均增加356元D产量每增加一台,单位产品成本平均减少1.5元3、在总体回归直线E中,表示【 】A 当x增加一个单位时,y增加个单位B当x增加一个单位时,y平均增加个单位C当y增加一个单位时,x增加个单位D当y增加一个单位时,x平均增加个单位4、以y表示实际观测值,表示回归估计值,则普通最小二乘法估计参数的准则是使【 】A 0 B 0C 为最小 D 为最小5、设y表示实际观测值,
21、表示OLS回归估计值,则下列哪项成立【 】A =y B =C =y D =6、用普通最小二乘法估计经典线性模型,则样本回归线通过点【 】A (x,y) B (x,) C (,) D (,)7、判定系数的取值范围是【 】A 1 B 1 C 01 D 118、对于总体平方和TSS、回归平方和RSS和残差平方和ESS的相互关系,正确的是【 】A TSSRSS+ESS B TSS=RSS+ESSC TSSRSS+ESS D TSS=RSS+ESS9、决定系数是指【 】A 剩余平方和占总离差平方和的比重B 总离差平方和占回归平方和的比重C 回归平方和占总离差平方和的比重D 回归平方和占剩余平方和的比重1
22、0、如果两个经济变量x与y间的关系近似地表现为当x发生一个绝对量变动(Dx)时,y有一个固定地相对量(Dy/y)变动,则适宜配合地回归模型是【 】A B lnC D ln11、下列哪个模型为常数弹性模型【 】A ln B lnC D 12、模型中,y关于x的弹性为【 】A B C D 13、模型ln中,的实际含义是【 】A x关于y的弹性 B y关于x的弹性C x关于y的边际倾向 D y关于x的边际倾向14、当存在异方差现象时,估计模型参数的适当方法是【 】A 加权最小二乘法 B 工具变量法C 广义差分法 D 使用非样本先验信息15、加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同
23、的权数,从而提高估计精度,即【 】A 重视大误差的作用,轻视小误差的作用B 重视小误差的作用,轻视大误差的作用C重视小误差和大误差的作用D轻视小误差和大误差的作用16、容易产生异方差的数据是【 】A 时间序列数据 B 修匀数据C 横截面数据 D 年度数据17、设回归模型为,其中var()=,则b的最小二乘估计量为【 】A. 无偏且有效 B 无偏但非有效 C 有偏但有效 D 有偏且非有效18、如果模型存在序列相关,则【 】A cov(,)=0 B cov(,)=0(ts)C cov(,)0 D cov(,)0(ts)19、下列哪种形式的序列相关可用DW统计量来检验(为具有零均值,常数方差,且不存
24、在序列相关的随机变量)【 】A B C D 20、DW的取值范围是【 】A 1DW0 B 1DW1C 2DW2 D 0 DW421、当DW4是时,说明【 】A 不存在序列相关 B 不能判断是否存在一阶自相关C 存在完全的正的一阶自相关 D存在完全的负的一阶自相关22、模型中引入一个无关的解释变量【 】A 对模型参数估计量的性质不产生任何影响B 导致普通最小二乘估计量有偏C导致普通最小二乘估计量精度下降D导致普通最小二乘估计量有偏,同时精度下降23、如果方差膨胀因子VIF10,则认为什么问题是严重的【 】A 异方差问题 B 序列相关问题C 多重共线性问题 D 解释变量与随机项的相关性24、某商品
25、需求函数为,其中y为需求量,x为价格。为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为【 】A 2 B 4 C 5 D 625、根据样本资料建立某消费函数如下:=100.50+55.35+0.45,其中C为消费,x为收入,虚拟变量D,所有参数均检验显著,则城镇家庭的消费函数为【 】A =155.85+0.45 B =100.50+0.45C =100.50+55.35 D =100.95+55.3526、假设某需求函数为,为了考虑“季节”因素(春、夏、秋、冬四个不同的状态),引入4个虚拟变量形式形成截距变动模型,则模型的【 】A
26、 参数估计量将达到最大精度 B 参数估计量是有偏估计量C 参数估计量是非一致估计量 D 参数将无法估计27、对于模型,为了考虑“地区”因素(北方、南方),引入2个虚拟变量形式形成截距变动模型,则会产生【 】A 序列的完全相关 B 序列不完全相关C完全多重共线性 D 不完全多重共线性28、如果一个回归模型中不包含截距项,对一个具有m个特征的质的因素要引入虚拟变量的数目为【 】A m B m-1 C m-2 D m+129、某一时间序列经一次差分变换成平稳时间序列,此时间序列称为()。A1阶单整 B2阶单整 CK阶单整 D以上答案均不正确30、当随机误差项存在自相关时,进行单位根检验是由()来实现
27、。A . DF检验 BADF检验CEG检验 DDW检验三、多项选择题:1、一元线性回归模型的经典假设包括【 】A B (常数)C D N(0,1)E x为非随机变量,且2、以带“”表示估计值,u表示随机误差项,如果y与x为线性相关关系,则下列哪些是正确的【 】A B C D E 3、用普通最小二乘法估计模型的参数,要使参数估计量具备最佳线性无偏估计性质,则要求:【 】A B (常数)C D 服从正态分布E x为非随机变量,且4、假设线性回归模型满足全部基本假设,则其参数估计量具备【 】A 可靠性 B 合理性C 线性 D 无偏性E 有效性5、下列哪些非线性模型可以通过变量替换转化为线性模型【 】
28、A B C ln D E 6、异方差性将导致【 】A 普通最小二乘估计量有偏和非一致B 普通最小二乘估计量非有效C 普通最小二乘估计量的方差的估计量有偏D 建立在普通最小二乘估计基础上的假设检验失效E 建立在普通最小二乘估计基础上的预测区间变宽7、当模型中解释变量间存在高度的多重共线性时【 】A 各个解释变量对被解释变量的影响将难于精确鉴别B 部分解释变量与随机误差项之间将高度相关C 估计量的精度将大幅下降D 估计量对于样本容量的变动将十分敏感E 模型的随机误差项也将序列相关8、下述统计量可以用来检验多重共线性的严重性【 】A 相关系数 B DW值 C 方差膨胀因子D 特征值 E 自相关系数三
29、、判断题1、随机误差项ui与残差项ei是一回事。( )2、当异方差出现时,常用的t检验和F检验失效。 ( )3、在异方差情况下,通常预测失效。 ( )四、计算分析题1、指出下列模型中的错误,并说明理由。(1) 其中,C、Y分别为城镇居民的消费支出和可支配收入。(2) 其中,Y、K、L分别为工业总产值、工业生产资金和职工人数。2、对下列模型进行适当变换化为标准线性模型:(1) y=+u;(2) Q=A;(3) Y=exp(+x+u);3、一个由容量为209的样本估计的解释CEO薪水的方程为:(15.3) (8.03) (2.75) (1.775) (2.13) (-2.895)其中,Y表示年薪水平(单位:万元), 表示年收入(单位:万元), 表示公司股票收益(单位:万元); 均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设对比产业为交通运输业。(1) 解释三个虚拟变量参数的经济含义。(2) 保持和不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。这个差异在1%的显著性水平上是统计显著吗?消费品工业和金融业之间估计薪水的近似百分比差异是多少?