资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第,1-4,章 计量经济学复习题,(2015.5),第一部分 简单线性回归的基本思想,2.1,解释概念,1,、总体回归函数,(PRF),答:总体回归函数反映了被解释变量的均值同一个或多个解释变量之间的关系。即,2,、样本回归函数,(SRF),样本回归函数是总体回归函数的近似。即,3,、随机总体回归函数,从总体上表明了单个,y,同解释变量和随机干扰项之间的关系。即,4,、随机样本回归函数,从所抽取样本的角度说明了被解释变量与被解释变量以及残差之间的关系。即,5,、线性回归模型,回归参数为线性的回归模型。,6,、随机误差项,(),它代表了与被解释变量,y,有关但未被纳入模型变量的影响。每一个随机误差项对于,y,的影响都是非常小的,且是随机的。随机误差项的均值为零。即,7,、残差项,(),它是随机误差项的近似。即,8,、回归系数或回归参数,若,则称,为回归系数或回归参数。,9,、回归系数的估计量,回归系数的估计量,(),说明了如何通过样,本数据来计算回归系数,(),的估计值。也称为样本回归估计值。,1.2,随机总体回归函数与随机样本回归函数有什么区别?,随机总体回归函数是从总体上表明了单个,y,同解释变量和随机干扰项之间的关系。即,随机样本回归函数是从所抽取样本的角度说明了被解释变量 与被解释变量 以及残差 之间的关系。即,1.3,讨论;“既然不能观察到总体回归函数,为什么还要研究它呢?”,答:就像经济理论中的完全竞争模型一样,总体回归函数也是一个理论化的、理想化的模型,在现实中很难得到。但是这样一个理想化的模型有助于我们把握所研究问题的本质。,1.4,判断正误并说明理由。,1,、随机误差项与残差项是一回事。,答:错误。残差项 是随机误差项 的一个近似,(,估计值,),。,2,、总体回归函数给出了与自变量每个取值相对应的因变量的值。,答:错误。总体回归函数给出了在解释变量给定条件下被解释变量的条件均值。,3,、线性回归模型意味着模型变量是线性的。,答:错误。线性回归模型是指所建立的模型中回归系数为线性。而其中的解释变量和被解释变量不一定是线性的。,4,、在线性回归模型中,解释变量是因,因变量是果。,答:错误。通常情况下,解释变量与被解释变量之间的因果关系是由经济理论决定的,而不是由回归模型决定的。,5,、随机变量的条件均值与非条件均值是一回事。,答:错误。只有,x,和,y,独立时,才相等。,1.5,下面两者之间有什么关系?,(1),;,(2),;,(3),。,上述哪些量可以观察得到?如何观察得到?,答:,(1),的回归估计量;,(2),的回归估计量;,(3),的估计量。,在现实中,我们无法观测到 ,但是只要得到一组观测数据,就可以通过,得到它们的估计量。,1.6,下表列出了若干对自变量与因变量。对每一对变量,它们之间的关系如何?是正的?负的?还是无法确定?也就是说,其斜率是正还是负,或都不是?说明理由。,序号,因变量,自变量,序号,因变量,自变量,1,GDP,利率,5,总统声誉,任职时间,2,个人储蓄,利率,6,学生第一年,GPA,分数,SAT,分数,3,小麦产出,降雨量,7,学生经济计量学成绩,统计学成绩,4,美国国防开支,俄罗斯国防开支,8,日本汽车的进口量,美国人均国民收入,答:,(1),这取决于高利率水平对构成,GDP,的各部分,(,居民消费、投资、政府消费和进出口,),的影响。无法确定。,(2),斜率为正。在其他条件不变的情况下,利率水平越高,人们储蓄的欲望越大。,(3),一般情况下,斜率为正。,(4),国际形势不发生重大改变的情况下,斜率为正。,(5),斜率可能为正。,(6),斜率可能为负。民众对总统越熟悉,对总统产生厌恶的可能性越大。,(7),斜率可能为正。,(8),斜率为正。统计学是计量经济学的基础。,(9),斜率为正。当收入增加时,可自由支配的收入也增加,从而导致对较为昂贵汽车的需求上升,而大部分日本汽车都较为昂贵,因此人们对日本汽车的需求会上升。,1.7,判别下列模型是否为线性回归模型:,(1,;,(2),;,(3),;,(4),;,(5),;,(6),答:,(1)-(4),题是,,(5)-(6),题不是。,1.8,下表给出了每周家庭的消费支出,y(,元,),与每周家庭收入,x(,元,),的数据。,每周消费支出与每周收入的假想数据,每周收入,(,元,)x,每周消费支出,(,元,)y,每周收入,(,元,)x,每周消费支出,(,元,)y,80,55,60,65,70,75,180,110,115,120,130,135,140,100,65,70,74,80,85,88,200,120,136,140,144,145,120,79,84,90,94,98,220,135,137,140,152,157,160,162,140,80,93,95,103,108,113,115,240,137,145,155,165,175,189,160,102,107,110,116,118,125,260,150,152,175,178,180,185,191,(1),对每一收入水平,计算平均的消费支出,即条件期望值。,(2),以收入为横轴,消费支出为纵轴作散点图。,(3),在该散点图上,做出,(1),中的条件均值点。,(4),你认为,x,与,y,之间,,x,与,y,的均值之间的关系如何?,(5),写出总体回归函数及样本回归函数。,(6),总体回归函数是线性的函数还是非线性的?,解答:,(1),对每一收入水平,平均的消费支出,即条件期望值为,80,65,180,125,100,77,200,137,120,89,220,149,140,101,240,161,160,113,260,173,(2),以收入为横轴,消费支出为纵轴作散点图。,(3),在该散点图上,做出,(1),中的条件均值点。,(4),你认为,x,与,y,之间,,x,与,y,的均值之间的关系如何?,Y,的均值随,x,的增加而增加,但,y,的个别观测值不一定随,x,的增加而增加。,解答:,(6),从散点图可知总体回归函数是线性的。,1.9,根据上题中给出的数据,对每个,x,随机抽取一个,y,,结果如下:,y,70,65,90,95,110,115,120,140,155,150,x,80,100,120,140,160,180,200,220,240,260,(1),以,y,为纵轴,,x,为横轴作图。,(2)y,与,x,之间是怎样的关系?,(3),求样本回归函数?写出计算步骤。,(4),在同一个图中,做出,SRF,和,PRF,。,(5)SRF,和,PRF,相同吗?为什么?,解答:,(1),以,y,为纵轴,,x,为横轴作图。,(2)y,与,x,之间呈正相关关系。,(3),从原始数据可知,,,,所以,(4),在同一个图中,做出,SRF,和,PRF,。,(5)SRF,和,PRF,相同吗?为什么?,两者非常接近,但很明显两者并不相同。,第二部分 简单线性回归模型:假设检验,2.1,解释概念,(1),最小二乘法;,(2)OLS,估计量;,(3),估计量的方差;,(4),估计量的标准误;,(5),同方差性;,(6),异方差性;,(7),自相关;,(8),总平方和,(SST),;,(9),解释平方和,(SSE);(10),残差平方和,(SSR),;,(11),判定系数,;(12),估计值的标准误;,(13)BLUE,;,(14),显著性检验;,(15)t,检验;,(16)F,检验;,(17),单边检验;,(15),双边检验;,(19),统计显著。,解答:,(1),最小二乘法:就是以残差,(,被解释变量的观测值与拟合值之间的差,),平方和最小的原则对回归模型中的系数进行估计的方法。,(2)OLS,估计量:运用最小二乘法计算出的总体回归参数的估计量。,(3),估计量的方差:回归参数估计量是一个随机变量,其方差衡量了估计量与估计量均值的偏离程度。,(4),估计量的标准误:估计量方差的算术平方根。,(5),同方差性:,(6),异方差性:,(7),总离差平方和,(SST),:,在回归模型中,,SST,为总离差平方和是指被解释变量同其均值之间差的平方和,即,(8),解释平方和,(SSE),:,在回归模型中,,SSE,为总离差平方和,(SST),中解释变量所解释的那部分离差平方和,即,(9),残差平方和,(SSR),:,在回归模型中,,SSR,为总离差平方和,(SST),中解释变量未解释的那部分离差平方和,即,(10),判定系数:,它衡量了解释变量解释的那部分离差平方和占被解释变量总离差平方和的比例。即,,(11)BLUE,:,称为最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中其方差最小。,(12)t,检验:,基于,t,分布的条件假设检验过程。,(13),单边检验:,当对立假设是单边假设时,称该检验为单边检验。例如:虚拟假设为,(14),双边检验:当对立假设是双边假设时,称该检验为双边检验。例如:虚拟假设为,(15),统计显著:,当虚拟假设 被拒绝时,就称,是统计显著的。,2.2,判断正误并说明理由。,(1)OLS,就是使误差平方和最小化的估计过程。,答:错误。,其最小化的是残差平方和,即最小化,(2),高斯,马尔可夫定理是,OLS,的理论依据。,答:正确。,(3),在双变量回归模型中,若扰动项 服,从正态分布,则 更准确的估计值。,答:错误。,在估计回归系数时,,OLS,对干扰项的概率分布没有任何要求。,(4),只有当 服从正态分布时,,OLS,估计量,才服从正态分布。,答:正确。,OLS,的估计量是的线性函数,且当服从正态分布时,,OLS,估计量也服从正态分布,(,任何服从正态分布的随机变量的线性组合仍服从正态分布,),。,(5),等于,SST/SSE,。,答:错误。,应该是,SSE/SST,。,(6),给定显著性水平及自由度,若计算得到的,|t|,值超过临界值,则接受虚拟假设。,答:错误。,应该拒绝虚拟假设。,(7),相关系数,r,与斜率 同号。,答:正确。因为,,2.3,考虑下面的回归模型:,完成空缺。如果 能否接受假设:,?,你是用单边检验还是双边检验,为什么?,答:,自由度为,18,,显著性水平为,5%,的,t,分布临界值为,2.101(,双边,),和,1.734(,单边,),。,因为估计量的,t,统计量值为,18.73,,远远超过,t,分布的临界值,所以拒绝虚拟假设。,此处用双边检验较为合适,因为先验的理论假设通常不会考虑系数的符号。,2.4,戴尔和拉里根据美国,1962-1977,年的数据,得到如下汽车需要函数:,其中,,y,表示私家车零售数量,(,千辆,),,,x,表示实际可支配收入,(1972,年美元价,,10,亿美元,),(1),对 建立一个,95%,的置信区间。,(2),假设检验:该置信区间包括 。如果不包括,那么接受零假设吗?,(3),在 下,计算,t,值,在,5%,的显著性水平下,它是统计显著的吗?选择双边,t,检验还是单边,t,检验?为什么?,解答:,(1),自由度为,16-1-1=14,,显著性水平为,5%,的双边,t,分布临界值为,2.145,,因此的置信水平为,95%,的置信区间为,(2),上述置信区间包含 ,因此不能拒绝零假设。,(3),因为私家车零售量应该与实际可支配收入成正相关,因此选择单边,t,检验较为合适,即。,自由度为,16-1-1=14,,显著性水平为,5%,的单边,t,分布临界值为,1.761,,,即实际可支配收入是统计显著的。,2.5,根据,x,和,y,的,10,组观测值得到如下数据:,假定满足,CLRM,的所有假定,求,(1),;,(2),;,(3),(4),对 分别建立,95%,的置信区间。,(5),根据,(4),建立的置信区间,能否接受虚拟假设:?,解答:,(1),(2),(3),(4),对 分别建立,95%,的置信区间。,自由度为,10-1-1=8,,显著性水平为,5%,的双边,t,分布临界值为,2.306,,因此,的置信水平为,95%,的置信区间为,的置信水平为,95%,的置信区间为,(5),根据,(4),建立的置信区间,能否接受虚拟假设?,解答:拒绝,因为上述置信区间中不包括 。,第三部分 多元回归分析:估计与推断 复习题,3.1,解释概念,(1),偏回归系数;,(2),多元判断系数;,(3),完全共线性;,(4),完全多重共线性;,(5),单个假设检验;,(6),联合假设检验,解答:,(1),偏回归系数:,在其他解释变量保持不变的条件下,某一个解释变量,x,每变动一个单位,被解释变量,y,均值的变动量。代数上,其为被解释变量,y,对解释变量,x,的偏导数。,(2),多元判断系数:它衡量了解释变量能解释的离差占被解释变量总离差的比例。,(3),完全共线性:解释变量之间存在精确的线性关系。,(4),完全多重共线性:解释变量之间存在着多个精确的线性关系。,(5),单个假设检验:只涉及单独的回归系数的统计性检验。,(6),联合假设检验:同时涉及多个回归系数的统计性检验。,3.2,按步骤解释下列过程:,(1),单个多元回归系数的显著性检验:,解答,:,1),提出虚拟假设和对立假设。,2),选择适当的显著性水平。,3),在虚拟假设为真的条件下,计算,t,统计量。,4),将,t,统计量的绝对值,|t|,与相应自由度和显著性水平下的临界值相比较。,5),如果,t,统计量大于临界值,则拒绝虚拟假设。该步骤中务必使用合适的单边或双边检验。,(2),所有偏斜率系数的显著性检验:,解答,:,虚拟假设为:,即所有的偏回归系数均为零。对立假设为至少一个偏回归系数不为零。,在虚拟假设为真的情况下,如果,F,统计量的值大于相应显著性水平下的临界值,则拒绝虚拟假设,否则接受虚拟假设。,3.3,判断正误并说明理由,(1),判定所有解释变量是否对应变量有显著影响的方法是,看看是否每个解释变量都有选择,t,统计量;如果不是,则解释变量整体是统计部显著的。,解答:,错误。应该运用,F,检验。,(2),解答,:错误。,因为,,所以,(3),当自由度大于,120,时,在,5%,显著性水平下,,(,双边检验的,)t,临界值与在,5%,显著性水平下的,(,标准正态变量,)z,临界值相同,均为,1.96,。,解答:,正确。这可以从,t,分布与正态分布的分布表中看出。,(4),估计的回归系数是统计显著的,意思是说它显著不为,1,。,解答:,错误。是在统计是显著不为,0,,而不是显著不为,1.,(5),要计算,t,临界值,仅需知道自由度。,解答:,错误。还需要知道显著性水平。,(6),多元回归模型的总体显著性意味着模型中任何一个变量都是统计显著的。,解答:,错误。整个多元回归模型在统计上显著,意味着偏回归系数不全为零或,(7),就估计和假设检验而言,单方程回归与多元回归没有什么区别。,解答:,错误。如果我们只关注某一个回归系数,那么在两种情况下都运用,t,是可行的。但是如果我们关注的是两个或两个以上变量的回归系数整体的显著性,,t,检验就不可行了,需要进行,F,检验。,(8),无论模型中包括多少个解释变量,总平方和的自由度总为,(n-1),。,解答:正确。因为,,所以总平方和的自由度总为,(n-1),。,3.4,求下列情形下的,(1),n=30,回归参数的个数为,5,个,(,包含截距,),解答:,(2),n=16,回归参数的个数为,5,个,(,不包含截距,),解答:,3.5,求下列情形下的临界值,t,值,自由度,df,显著性水平,(%),15,22,38,201,5,1,10,5,双边,左边,右边,双边,解答:,2.13,;,-2.51,;,1.30,;,1.96,。,3.6,求下列情形下的临界,F,值:,分子自由度,分母自由度,显著性水平,(%),5,4,20,5,19,200,5,1,5,解答:,5.05,;,4.50,;,1.62,。,3.7,根据,15,个观测值得到了下列估计方程:,估计,95%,的置信区间。,(1),估计 置信水平为,95%,的置信区间。,解答:自由度为,12,,显著性水平为,5%,的双边,t,检验为,2.18,,因此,的置信区间为;,的置信区间为。,(2),在 显著性水平下,检验估计的每个回归系数的统计显著性,(,双边检验,),。,解答:,即 在统计上是显著的。,即在统计上是显著的。,或者因为上述置信区间都没有包含零,所以每个解释变量的回归系数但是显著的。,(3),检验在 显著性水平下所有的偏斜率系数都为零。,即整体回归方程在统计上是显著的。,3.8,下表给出了三变量模型的回归结果:,变异来源,平方和,(SS),自由度,平方和均值,(MSS),来自回归,(SSE),65965,来自残差,(SSR),总平方和,(SST),66042,14,(1),样本容量是多少?,解答:样本容量,n=14+1=15,(2),求,SSR,。,解答:,SSR=SST-SSE=66042-65965=77,。,(3)SSE,与,SSR,的自由度各是多少?,解答:,SSR,的自由度为,n-k-1=15-2-1=12,SSE,的自由度为,2,。,(4),求,解答:,(5),检验假设:。使用什么假设检验?为什么?,解答:,即整体回归方程在统计上是显著的。,(6),根据以上信息,能否确定,各自对,y,的贡献?,解答:不能,还需要两变量模型的回归结果。,3.9,为了确定影响空调价格的因素,拉奇福德根据,19,个样本数据得到如下回归结果:,其中,,y,表示空调价格,(,美元,),;表示空调的,BTU,比率;表示能量效率;表示设定数。,(1),解释,BLU,比率的回归结果。,解答:在其他条件不变的情况下,,BLU,比率每上升一个单位,空调的平均价格上升,2.3,美分。,(2),在 显著性水平下,检验虚拟假设:,BTU,比率对空调的价格误影响;对立假设:,BTU,比率对价格有正向影响。,解答:,自由度为,19-3-1=15,,显著性水平为,5%,的单边,t,分布的临界值为,1.75,,,即 在统计上是显著的。,(3),你会接受虚拟假设:三个解释变量在很大程度上解释了空调价格的变动吗?详细写出计算过程。,解答:,显著性水平为,1%,时,,F(3,15)=5.42;,显著性水平为,5%,时,,F(3,15)=3.29,。,即整体回归方程在,1%,与,5%,显著性水平是都是统计显著的。,3.10,根据美国,1965,年第,1,季度至,1983,年第,4,季度的数据,(n=76),,詹姆斯和艾斯马尔得到下面的回归方程,用以解释美国的个人消费支出,(PCE):,其中,表示个人消费支出,(10,亿美元,),;,表示,(,税后,),可支配收入,(10,亿美元,),;,表示银行支付利率,(%),。,(1),求边际消费倾向,(PMC),每额外增加,1,美元个人可支配收入所增加的消费支出。,解答:,PMC=0.93,。,(2)MPC,显著不为,1,吗?给出检验过程。,解答:,自由度为,76-2-1=73,,显著性水平为,5%,的双边,t,分布的临界值为,1.99,,,即 在统计上是显著不为,1,的。,(3),模型中包括主要利率变量的理论基础是什么?先验地预期这个变量的符号为负吗?,解答:一般来讲,购买汽车、洗衣机和烘干机等都是分期付款的,因此贷款的成本也应该是影响这方面消费支出的因素之一。通常用利息率来衡量贷款的成本,这里利息率应该与消费支出成负相关的关系。,(4),显著不为零吗?,解答:,自由度为,76-2-1=73,,显著性水平为,5%,双边,t,分布的临界值为,1.99,,,即 在统计上是显著的。,(5),检验假设 。,解答:,显著性水平为,1%,时,,F(3,73)=4.15;,显著性水平为,5%,时,,F(3,73)=2.74,。,即整体回归方程在,1%,与,5%,显著性水平是都是统计显著的。,(6),计算每个系数的标准误。,解答:,
展开阅读全文