1、第一章计量经济学含义:以经济理论为基石,以经济数据为基础,运用从概率论与数理统计学中产生的计量经济学方法量化经济变量间的关系,来检验经济理论,提出政策建议或进行政策评价与结构分析,以减少未来经济活动中的不确定性的的一门经济学的分支学科。数据类型:横截面数据:给定时点,随机抽样得到时间序列数据:不同时间的观测值混合横截面数据:随机+不同时间综列(或纵剖面)数据:若干单位、不同时间、重复跟踪调查变量类型:应变量;解释变量;随机变量计量经济学模型范式(即建模过程)P5(1) 经济理论(2) 数学模型(3) 计量经济模型(4) 获取数据(5) 参数估计(6) 假设检验(7) 预测(8) 检验经济理论,
2、政策评价和结构分析计量经济学与其他学科的关系:计量经济学是经济学、统计学和数学三科结合而成的交叉型学科。经济学为其提供理论基础,统计学和数学为其提供研究方法。但计量经济学又是一门独立的学科。经济学主要做定性研究,而计量经济学又添加了定量研究;统计学主要收集加工数据,而计量经济学又在数据的基础上检验经济理论和政策结构分析;数学往往用实验数据,计量经济学往往用非实验数据。第二章第三章线性指什么(对于参数或变量)P102对于变量来说,Y的条件期望是解释变量Xi的线性函数,此时回归曲线是一条直线。对于参数来说,Y的条件期望是各参数的线性函数,可以是或不是解释变量X的线性函数。因此只要模型中的回归系数是
3、线性的,就可以认为是线性模型。回归的本质:通过一定变量或一些变量的变化解释另一变量的变化 回归分析与相关分析的联系与区别:两者的联系:相关分析是回归分析的前提和基础;回归分析是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间的数量关系,而回归分析需要靠相关分析来表现变量之间数量变化的相关程度只有当变量之间存在显著相关时,进行回归分析寻求其相关的具体形式才有意义。两者的区别:在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的相关分析可以不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可
4、以都是随机变量。而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量,通常被解释变量y是随机变量,解释变量x是非随机变量。简单回归系数与偏回归系数的联系与区别:联系:都是线性回归模型中的回归系数,表示解释变量的单位变动对被解释变量平均值的影响。区别:简单回归系数存在于简单线性回归模型中,表示模型中唯一解释变量的单位变动对被解释变量平均值的影响。偏回归系数存在于多元线性回归模型中,偏回归系数i(i1,2,k)表示的是当控制其它解释变量不变的条件下,第i个解释变量的单位变动对被解释变量平均值的影响。 简单线性回归模型把许多未观测到的因素放入到扰动项中,从而使研究者无法通最小二
5、乘法控制这些变量,因而回归系数所反映的并不是模型中的解释变量对应变量的净影响。所以一般简单回归系数的最小二乘是有偏和不一致的。多元回归方程解决了实验科学中保持其他情况不变的问题,使对经济学的研究更具有“实验性”,这是简单线性回归不能做到的。最小二乘法思想和公式思想:估计的回归系数能使原有数列的实际数值与趋势线的估计数值的残差平方和最小公式:P23估计系数:使残差平方和最小的回归系数的估计经典线性回归的基本假设:1、随机扰动项的数学期望(均值)为02、随机扰动项方差相等3、随机扰动项之间不存在相关关系4、随机扰动性与解释变量不相关5、随机扰动项为服从正态分布的随机变量6、解释变量必须有足够的变异
6、(为了使样本回归系数的值能够被计算出来)总体回归模型与样本回归模型:定义:总体回归模型:在总体回归函数基础上,考虑进随机扰动项的影响。(总体回归函数:指在给定Xi下Y分布的总体均值与Xi所形成的函数关系,或者说总体被解释变量的条件期望表示为解释变量的某种函数)。样本回归模型:在样本回归函数基础上,考虑进残差的影响。(样本回归函数:指从总体中抽出的关于Y,X的若干组值形成的样本所建立的回归函数。)范式:P20.21联系与区别:联系:样本回归模型是总体回归模型的一个估计式。区别:描述的对象不同。总体回归模型描述总体中变量y与x的相互关系,而样本回归模型描述所观测的样本中变量y与x的相互关系。建立模
7、型的不同。总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。模型性质不同。总体回归模型不是随机模型,样本回归模型是随机模型,它随着样本的改变而改变。OLS评判标准P68 无偏性:估计值的均值为真实值 有效性:在所有线性无偏估计量中,最小二乘估计量具有最小方差 一致性:在大样本情况下,即便X是随机的,只要X满足一些条件,最小二乘估计量将依概率收敛于真实值F检验与t检验t检验是单个系数显著性的检验F检验是整个方程显著性的检验F统计量:在假设斜率系数为0的条件下,F统计量服从自由度为(1,n-2)的F分布 P52公式+服从什么分布F统计量与R方(判定系数或决定系数)的关
8、系:R方是反映回归方程对样本的拟合程度,受样本的影响较大;F统计量是反映整体的显著性的。如果R方小,F检验通过表明模型解释变量只能解释一部分原因,遗漏了一些重要解释变量。+公式P54简单+P83多元对于多元线性回归模型,为什么在进行了总体显著性F检验之后,还要对每个回归系数进行是否为0的t检验?答:多元线性回归模型的总体显著性F检验是检验模型中全部解释变量对被解释变量的共同影响是否显著。通过F检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显著的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显著的。因此还需要就每个解释变量对被解释变量的影响是否显著进行检验,即进行t检
9、验。第四章虚拟变量定义:用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。作用:1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。2、检验定性变量的影响,例如工资模型中的文化程度、季节对销售额的影响。3、提高模型的精度,相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)设置原则:如果回归模型有截距项,定性变量有m种分类,只在模型中引入个虚拟变量型中设置m-1个虚拟变量;如果回归模型无截距项,则要设置m个虚拟变量。若要描述各种类型的模型在截距水平的差异,则以加法方式引入虚拟
10、解释变量;若要反映各种类型的模型的不同相对变化率时,则以乘法方式引入虚拟解释变量。并且要注意避免“虚拟变量陷阱”。对数单位模型(Logit模型):P123 逻辑斯蒂函数的图像+系数含义第五章异方差性,自相关性和多重共线性联系与区别联系:都是违背经典假设的线性模型区别:违背的经典假设不同。异方差性违背了经典线性模型的同方差假设(随机扰动项方差相等);自相关性违背了不同观测点的随机扰动项之间不相关的假设;多重共线性违背了解释变量之间不相关的假设。原因:异方差性:边错边改学习模型随着解释变量的变化,方差可能会发生变化 常值数据采集技术的改进,方差可能变小回归模型设定错误 P135自相关性:时间序列中
11、经济变量本身的惯性经济变量的滞后性蛛网现象(特殊的滞后性,滞后一个时期)原始数据经过编造回归模型设定错误 P150多重共线性:数据采集范围过小,解释变量没有足够变异过度决定的模型,模型中解释变量的个数多于样本容量的个数。回归模型设定错误 P170检验方法:异方差性:图示法检验;帕克检验( P142 );格莱泽检验(适用于大样本);哥德费尔德-匡特检验( P143 适用于异方差性方差同回归模型中的某一解释变量有正向关系的情形) 计算F统计量;布劳殊-培干-戈弗雷检验;怀特检验:R方、自由度自相关性:DW检验 P155;h检验;沃尔利斯四阶自回归检验多重共线性:判定系数的值较大而回归系数的t值较小
12、解释变量之间有高度的两两相关辅助回归 P172后果:异方差性:仍然是线性、无偏的,但不是有效或最优的。普通OLS对所有观测点同等对待,方差偏大,OLS估计非有效 P136自相关性:OLS无偏一致,但无效+置信区间过宽+假设检验失效(后面两个由错误的方差导致) P155多重共线性: (1) 估计问题:对于完全多重共线性,无法得到个别回归系数的唯一OLS估计,但能得到这些系数的某线性组合的唯一OLS估计,且标准误为无穷大对于不完全多重共线性,能得到个别回归系数的OLS估计,但回归系数的估计量对样本十分敏感,且估计的标准误极大。(2) 检验问题:虽然OLS是BLUE,但由于方差很大,估计不精确由于方
13、差很大置信区间过宽,t统计量的值倾向于不显著虽然t不显著,但拟合优度很高修正方法:异方差性:广义最小二乘法-加权最小二乘法 P137 检验方法、步骤、蒙特卡洛实验自相关性:广义差分法,普莱斯-温斯腾变换(弥补差分造成的自由度减少)广义最小二乘法多重共线性:根据先验信息横截面数据与时间序列数据并用剔除共线性的变量(导致设定偏误,从而OLS估计量有偏)一阶差分法(导致自相关性,并且自由度减少)补充样本数据(成本太高) P173DW检验的适用范围:原回归模型中含有截距项解释变量是非随机的干扰项是按一阶自回归模式AR(1)产生的回归模型不把滞后应变量作为解释变量没有缺落数据如果滞后应变量作为解释变量,
14、则要加入h统计量局限性:如果滞后应变量成为解释变量,则d统计量就会偏向2,得出零相关广义最小二乘法(不考操作题)第六章自回归模型与分布滞后模型产生原因:1.心理、习惯惰性 2.技术变更需要时间 3.制度惯性 4.经济变量自身原因 P186分类:分布滞后模型;自回归模型。自回归模型:模型的解释变量中包含滞后应变量;包含了内生变量滞后项的模型分布滞后模型:模型中不仅包含解释变量的当期值,还包括解释变量的滞后值的模型。两个乘数:(分布滞后模型中,除此,还有中期乘数、长期乘数P185)估计方法:1、非受限有限分布滞后模型:t、F序贯检验;赤池信息准则AIC; 施瓦兹准则SC2、有限分布滞后模型:阿尔蒙
15、方法(了解)目的是为了减轻有限分布滞后模型中的多重共线性问题,思想是对有限分布滞后模型中的滞后项回归系数用关于滞后期的同类多项式表示。3、无限分布滞后模型:考伊克模型 (将无限分布滞后模型转化为自回归模型 ) ;适应性期望模型(根据现在和过去预测未来,错误中学习假设。价格粘性、投资品、耐用消费品例如房地产的需求量和价格的关系可以用此模型。房地产需求不只取决于当期价格,更取决于预期价格);部分调整模型(当期决定未来。由于行为惯性或技术、制度原因使调整不可能一次性到位。实际调整只是意愿调整的一部分)无限分布滞后模型:三个模型的联系与区别联系:适应性期望模型和局部调整模型是考伊克模型的行为化,且三者
16、的范式相同目的都是为了估计无限分布滞后模型中的回归系数,方法都是对模型中的回归系数加以限制区别:考伊克模型和适应性期望模型有自相关性可化为一阶自相关模型,必须用工具变量法估计回归系数。而局部调整模型没有这样的局限性,可直接用最小二乘法估计回归系数。第七章1、不可识别、恰好识别、过度识别的含义:P2232、识别方法的阶条件、秩条件:P229、231恰可识别:排除变量=M 1 ; 过度识别:排除变量 M-1 要求除了要识别的那个方程,余下的方程的系数矩阵是线性无关的,即秩为M -1因为若是线性相关的,则有方程是可以用其他方程表示的,该方程就没有存在意义3、识别的一般规则和实践中的识别方法:P233(记结论)