资源描述
第三章 多元线性回归模型
一、名词解释
1、多元线性回归模型
2、调整的决定系数
3、偏回归系数
4、正规方程组
5、方程显著性检验
二、单项选择题
1、在模型的回归分析结果中,有,
,则表明 ( )
A、解释变量对的影响不显著
B、解释变量对的影响显著
C、模型所描述的变量之间的线性关系总体上显著
D、解释变量和对的影响显著
2、设为回归模型中的实解释变量的个数,为样本容量。则对回归模型进行总体显著性
检验(检验)时构造的统计量为 ( )
A、 B、
C、 D、
3、已知二元线性回归模型估计的残差平方和为,估计用样本容量为,
则随机误差项的方差的OLS估计值为 ( )
A、33.33 B、 40 C、 38.09 D 、36.36
4、在多元回归中,调整后的决定系数与决定系数的关系为 ( )
A、 B、
C、 D、与的关系不能确定
5、下面说法正确的有 ( )
A、时间序列数据和横截面数据没有差异
B、对回归模型的总体显著性检验没有必要
C、总体回归方程与样本回归方程是有区别的
D、决定系数不可以用于衡量拟合优度
6、根据调整的可决系数与F统计量的关系可知,当时,有 ( )
A、F=0 B、F=-1 C、F→+∞ D、F=-∞
7、线性回归模型的参数估计量是随机向量的函数,即。是 ( )
A、随机向量 B、非随机向量
C、确定性向量 D、常量
8、下面哪一表述是正确的 ( )
A、线性回归模型的零均值假设是指
B、对模型进行方程显著性检验(即检验),检验的零假
设是
C、相关系数较大意味着两个变量存在较强的因果关系
D、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系
9、对于,如果原模型满足线性模型的基本假设则
在零假设下,统计量(其中是的标准误差)服从 ( )
A、 B、 C、 D、
10、下列说法中正确的是 ( )
A、如果模型的R2很高,我们可以认为此模型的质量较好
B、如果模型的R2很低,我们可以认为此模型的质量较差
C、如果某一参数不能通过显著性检验,我们应该剔除该解释变量
D、如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量
三、多项选择题
1、残差平方和是指 ( )
A、随机因素影响所引起的被解释变量的变差
B、解释变量变动所引起的被解释变量的变差
C、被解释变量的变差中,回归方程不能作出解释的部分
D、被解释变量的总离差平方和回归平方之差
E、被解释变量的实际值与拟合值的离差平方和
2、回归平方和是指 ( )
A、被解释变量的观测值与其均值的离差平方和
B、被解释变量的回归值与其均值的离差平方和
C、被解释变量的总体平方和与残差平方和之差
D、解释变量变动所引起的被解释变量的离差的大小
E、随机因素影响所引起的被解释变量的离差大小
3、对模型满足所有假定条件的模型进行总体显著性检验,如果
检验结果总体线性关系显著,则很可能出现 ( )
A、 B、
C、 D、
E、
4、设k为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所
用的F统计量可以表示为 ( )
A、 B、
C、 D、
E、
5、在多元回归分析中,调整的可决系数与可决系数之间 ( )
A、 B、
C、只可能大于零 D、可能为负值
E、不可能为负值
四、判断题
1、满足基本假设条件下,样本容量略大于解释变量个数时,可以得到各参数的唯一确定的
估计值,但参数估计结果的可靠性得不到保证 ( )
2、在多元线性回归中,t检验和F检验缺一不可。 ( )
3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零 ( )
4、多元线性回归中,可决系数是评价模型拟合优度好坏的最佳标准。 ( )
5、多元线性回归模型中的偏回归系数,表示在其他解释变量保持不变的情况下,对应解释
变量每变化一个单位时,被解释变量的变动。 ( )
五、简答题
1、多元线性回归模型与一元线性回归模型有哪些区别?
2、为什么说最小二乘估计量是最优线性无偏估计量?对于多元线性回归最小二乘估计的正
规方程组,能解出唯一的参数估计量的条件是什么?
六、计算分析题
1、某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为
R2=0.214
式中,为劳动力受教育年数,为劳动力家庭中兄弟姐妹的个数,与分别为母亲与父亲受到教育的年数。问
(1)sibs是否具有预期的影响?为什么?若与保持不变,为了使预测的受教育水平减少一年,需要增加多少?
(2)请对的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另一个的父母受教育的年数均为16年,则两人受教育的年数预期相差多少年?
2、考虑以下方程(括号内为标准差):
(0.080) (0.072) (0.658)
其中:——年的每位雇员的工资
——年的物价水平
——年的失业率
要求:(1)进行变量显著性检验;
(2)对本模型的正确性进行讨论,是否应从方程中删除?为什么?
3、以企业研发支出(R&D)占销售额的比重(单位:%)为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个容量为32的样本企业的估计结果如下:
其中,括号中的数据为参数估计值的标准差。
(1)解释ln(X1)的参数。如果X1增长10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)检验R&D强度不随销售额的变化而变化的假设。分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?
4、假设你以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。假设你看到如下的回归结果(括号内为标准差),但你不知道各解释变量分别代表什么。
(2.6) (6.3) (0.61) (5.9)
试判定各解释变量分别代表什么,说明理由。
5、下表给出一二元模型的回归结果。
方差来源
平方和(SS)
自由度(d.f.)
来自回归(ESS)
65965
—
来自残差(RSS)
_—
—
总离差(TSS)
66042
14
求:(1)样本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?
(2)和?
(3)检验假设:解释变量总体上对无影响。你用什么假设检验?为什么?
(4)根据以上信息,你能确定解释变量各自对的贡献吗?
6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型:
你想检验的虚拟假设是:。
(1)用的方差及其协方差求出。
(2)写出检验H0:的t统计量。
(3)如果定义,写出一个涉及b0、q、b2和b3的回归方程,以便能直接得到q估计值及其样本标准差。
7、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:
方程A:
方程B:
其中:——第i天慢跑者的人数
——第i天降雨的英寸数
——第i天日照的小时数
——第i天的最高温度(按华氏温度)
——第i天的后一天需交学期论文的班级数
请回答下列问题:
(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
8、考虑以下预测的回归方程:
其中:为第t年的玉米产量(吨/亩);为第t年的施肥强度(千克/亩);为第t年的降雨量(毫米)。要求回答下列问题:
(1)从和对的影响方面,说出本方程中系数和的含义;
(2)常数项是否意味着玉米的负产量可能存在?
(3)假定的真实值为,则的估计量是否有偏?为什么?
(4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计,则是否意味着的真实值绝对不等于?为什么?
9、已知描述某经济问题的线性回归模型为 ,并已根据样本容量为32的观察数据计算得
,,,
查表得,。
(1)求模型中三个参数的最小二乘估计值
(2)进行模型的置信度为95%的方程显著性检验
(3)求模型参数b2的置信度为99%的置信区间。
10、下表为有关经批准的私人住房单位及其决定因素的4个模型的估计和相关统计值(括号内为p值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:
式中:housing——实际颁发的建筑许可证数量;density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元);income——平均家庭的收入(单位:千美元);popchang——1980~1992年的人口增长百分比;unemp——失业率;localtax——人均交纳的地方税;statetax——人均缴纳的州税。
变量
模型A
模型B
模型C
模型D
C
813 (0.74)
-392 (0.81)
-1279 (0.34)
-973 (0.44)
Density
0.075 (0.43)
0.062 (0.32)
0.042 (0.47)
Value
-0.855 (0.13)
-0.873 (0.11)
-0.994 (0.06)
-0.778 (0.07)
Income
110.41 (0.14)
133.03 (0.04)
125.71 (0.05)
116.60 (0.06)
Popchang
26.77 (0.11)
29.19 (0.06)
29.41 (0.001)
24.86 (0.08)
Unemp
-76.55 (0.48)
Localtax
-0.061 (0.95)
Statetax
-1.006 (0.40)
-1.004 (0.37)
RSS
4.763e+7
4.843e+7
4.962e+7
5.038e+7
R2
0.349
0.338
0.322
0.312
1.488e+6
1.424e+6
1.418e+6
1.399e+6
AIC
1.776e+6
1.634e+6
1.593e+6
1.538e+6
(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?
(2)在模型A中,在5%水平下检验联合假设H0:bi =0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。
(3)哪个模型是“最优的”?解释你的选择标准。
(4)说明你对最优模型中参数符号的预期并解释原因,确认其是否为正确符号。
展开阅读全文