资源描述
第一章 导论
一、选择题
4、横截面数据是指__________。
A 同一时点上不同统计单位相同统计指标组成的数据
B 同一时点上相同统计单位相同统计指标组成的数据
C 同一时点上相同统计单位不同统计指标组成的数据
D 同一时点上不同统计单位不同统计指标组成的数据
5、同一统计指标,同一统计单位按时间顺序记录形成的数据列是__________。
A时期数据
B混合数据
C时间序列数据
D横截面数据
8、经济计量模型的被解释变量一定是__________。
A 控制变量
B 政策变量
C 内生变量
D 外生变量
9、下面属于横截面数据的是__________。
A 1991-2003年各年某地区20个乡镇企业的平均工业产值
B 1991-2003年各年某地区20个乡镇企业各镇的工业产值
C 某年某地区20个乡镇工业产值的合计数
D 某年某地区20个乡镇各镇的工业产值
10、经济计量分析工作的基本步骤是__________。A
A 建立模型、收集样本数据、估计参数、检验模型、应用模型
B 设定模型、估计参数、检验模型、应用模型、模型评价
C 个体设计、总体设计、估计模型、应用模型、检验模型
D 确定模型导向、确定变量及方程式、估计模型、检验模型、应用模型
11、将内生变量的前期值作解释变量,这样的变量称为__________。
A.虚拟变量 B.控制变量 C.政策变量 D.滞后变量
12、__________是具有一定概率分布的随机变量,它的数值由模型本身决定。
A.外生变量 B.内生变量 C.前定变量 D.滞后变量
15、同一统计指标按时间顺序记录的数据列称为__________。
A.横截面数据 B.时间序列数据 C.修匀数据 D.原始数据
E.线性特性
2、计量经济模型有哪些应用。
答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。②经济预测,即是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算。③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程。④检验和发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律。
6、简述建立与应用计量经济模型的主要步骤。
答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集;③估计参数;④模型的检验;⑤计量经济模型的应用。
7、对计量经济模型的检验应从几个方面入手。
答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检验。
第2章 一元线性回归模型
一、单项选择题
4、表示x和y之间真实线性关系的是__________。
A B
C D
5、参数的估计量具备有效性是指__________。
A B
C D
8、对于,以表示估计标准误差,r表示相关系数,则有__________。D
A
B
C
D
9、产量(X,台)与单位产品成本(Y,元/台)之间的回归方程为,这说明__________。
A 产量每增加一台,单位产品成本增加356元
B 产量每增加一台,单位产品成本减少1.5元
C 产量每增加一台,单位产品成本平均增加356元
D 产量每增加一台,单位产品成本平均减少1.5元
10、在总体回归直线中,表示__________。
A 当X增加一个单位时,Y增加个单位
B 当X增加一个单位时,Y平均增加个单位
C 当Y增加一个单位时,X增加个单位
D 当Y增加一个单位时,X平均增加个单位
11、对回归模型进行检验时,通常假定 服从__________。
A B
C D
12、以Y表示实际观测值,表示回归估计值,则普通最小二乘法估计参数的准则是使__________。
14、用OLS估计经典线性模型,则样本回归直线通过点_________。D
15、以Y表示实际观测值,表示OLS估计回归值,则用OLS得到的样本回归直线满足__________。
16、用一组有30个观测值的样本估计模型,在0.05的显著性水平下对的显著性作t检验,则显著地不等于零的条件是其统计量t大于__________。
A t0.05(30) B t0.025(30) C t0.05(28) D t0.025(28)
19、判定系数R2的取值范围是__________。
A R2≤-1 B R2≥1 C 0≤R2≤1 D -1≤R2≤1
24、在C—D生产函数中,__________。
A.和是弹性 B.A和是弹性
C.A和是弹性 D.A是弹性
25、回归模型中,关于检验所用的统计量,下列说法正确的是__________。
A 服从 B 服从
C 服从 D 服从
26、在二元线性回归模型中,表示__________。
A 当X2不变时,X1每变动一个单位Y的平均变动。
B 当X1不变时,X2每变动一个单位Y的平均变动。
C 当X1和X2都保持不变时,Y的平均变动。
D 当X1和X2都变动一个单位时,Y的平均变动。
27、在双对数模型中,的含义是__________。
A Y关于X的增长量 B Y关于X的增长速度
C Y关于X的边际倾向 D Y关于X的弹性
26、根据样本资料已估计得出人均消费支出Y对人均收入X的回归模型为,这表明人均收入每增加1%,人均消费支出将增加__________。
A 2% B 0.2% C 0.75% D 7.5%
28、按经典假设,线性回归模型中的解释变量应是非随机变量,且__________。
A 与随机误差项不相关 B 与残差项不相关
C 与被解释变量不相关 D 与回归值不相关
二、多项选择题
4、表示OLS估计回归值,u表示随机误差项,e表示残差。如果Y与X为线性相关关系,则下列哪些是正确的__________。
5、表示OLS估计回归值,u表示随机误差项。如果Y与X为线性相关关系,则下列哪些是正确的__________。
7、用OLS法估计模型的参数,要使参数估计量为最佳线性无偏估计量,则要求__________。ABCDE
A B
C D 服从正态分布
E X为非随机变量,与随机误差项不相关。
8、假设线性回归模型满足全部基本假设,则其参数的估计量具备__________。
A 可靠性 B 合理性
C 线性 D 无偏性
E 有效性
9、普通最小二乘估计的直线具有以下特性__________。B同D
A 通过样本均值点
B
C
D
E
10、由回归直线估计出来的值__________。ADE
A 是一组估计值 B 是一组平均值
C 是一个几何级数 D 可能等于实际值Y
E 与实际值Y的离差之和等于零
15、判定系数R2可表示为__________。
A
B
C
D
E
16、线性回归模型的变通最小二乘估计的残差满足__________。ACDE
A
B
C
D
E
四、简答
1、在计量经济模型中,为什么会存在随机误差项?
答:①模型中被忽略掉的影响因素造成的误差;②模型关系认定不准确造成的误差;③变量的测量误差;④随机因素。这些因素都被归并在随机误差项中考虑。因此,随机误差项是计量经济模型中不可缺少的一部分。
2、古典线性回归模型的基本假定是什么?
答:①零均值假定。即在给定xt的条件下,随机误差项的数学期望(均值)为0,即。②同方差假定。误差项的方差与t无关,为一个常数。③无自相关假定。即不同的误差项相互独立。④解释变量与随机误差项不相关假定。⑤正态性假定,即假定误差项服从均值为0,方差为的正态分布。
5、在满足古典假定条件下,一元线性回归模型的普通最小二乘估计量有哪些统计性质?
答:①线性,是指参数估计量和分别为观测值和随机误差项的线性函数或线性组合。②无偏性,指参数估计量和的均值(期望值)分别等于总体参数和。③有效性(最小方差性或最优性),指在所有的线性无偏估计量中,最小二乘估计量和的方差最小。
6、简述BLUE的含义。
答:在古典假定条件下,OLS估计量和是参数和的最佳线性无偏估计量,即BLUE,这一结论就是著名的高斯-马尔可夫定理。
7、对于多元线性回归模型,为什么在进行了总体显著性F检验之后,还要对每个回归系数进行是否为0的t检验?
答:多元线性回归模型的总体显著性F检验是检验模型中全部解释变量对被解释变量的共同影响是否显著。通过了此F检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显著的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显著的。因此还需要就每个解释变量对被解释变量的影响是否显著进行检验,即进行t检验。
五、综合题
1、下表为日本的汇率与汽车出口数量数据,
年度
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
X
Y
168
661
145
631
128
610
138
588
145
583
135
575
127
567
111
502
102
446
94
379
X:年均汇率(日元/美元)
Y:汽车出口数量(万辆)
问题:
(1)画出X与Y关系的散点图。
(2)计算X与Y的相关系数。
其中,,,,
(3)若采用直线回归方程拟和出的模型为
t值 1.2427 7.2797 R2=0.8688 F=52.99
解释参数的经济意义。
解答:(1)散点图如下:
(2)=0.9321
(3)截距项81.72表示当美元兑日元的汇率为0时日本的汽车出口量,这个数据没有实际意义;斜率项3.65表示汽车出口量与美元兑换日元的汇率正相关,当美元兑换日元的汇率每上升1元,会引起日本汽车出口量上升3.65万辆。
2、已知一模型的最小二乘的回归结果如下:
标准差 (45.2) (1.53) n=30 R2=0.31
其中,Y:政府债券价格(百美元),X:利率(%)。
回答以下问题:
(1)系数的符号是否正确,并说明理由;
(2)为什么左边是而不是Yi;
(3)在此模型中是否漏了误差项ui;
(4)该模型参数的经济意义是什么。
答:(1)系数的符号是正确的,政府债券的价格与利率是负相关关系,利率的上升会引起政府债券价格的下降。
(2)
(3)
(4)常数项101.4表示在X取0时Y的水平,本例中它没有实际意义;系数(-4.78)表明利率X每上升一个百分点,引起政府债券价格Y降低478美元。
3、估计消费函数模型得
t值 (13.1)(18.7) n=19 R2=0.81
其中,C:消费(元) Y:收入(元)
已知,,,。
问:(1)利用t值检验参数的显著性(α=0.05);
(2)确定参数的标准差;
(3)判断一下该模型的拟合情况。
答:(1)提出原假设H0:,H1:
统计量t=18.7,临界值,由于18.7>2.1098,故拒绝原假设H0:,即认为参数是显著的。
(2)由于,故。
(3)回归模型R2=0.81,表明拟合优度较高,解释变量对被解释变量的解释能力为81%,即收入对消费的解释能力为81%,回归直线拟合观测点较为理想。
5、、有如下表数据
日本物价上涨率与失业率的关系
年份
物价上涨率(%)
失业率(%)U
1986
0.6
2.8
1987
0.1
2.8
1988
0.7
2.5
1989
2.3
2.3
1990
3.1
2.1
1991
3.3
2.1
1992
1.6
2.2
1993
1.3
2.5
1994
0.7
2.9
1995
-0.1
3.2
(1)设横轴是U,纵轴是,画出散点图。
(2)对下面的菲力普斯曲线进行OLS估计。
已知
(3)计算决定系数。
答:(1)散点图如下:
(2)
8、表2-4中的数据是从某个行业5个不同的工厂收集的,请回答以下问题:
表2-4 总成本Y与产量X的数据
Y
80
44
51
70
61
X
12
4
6
11
8
(1)估计这个行业的线性总成本函数:
(2)的经济含义是什么?
(3)估计产量为10时的总成本。
9、有10户家庭的收入(X,元)和消费(Y,百元)数据如表2-5。
表2-5 10户家庭的收入(X)与消费(Y)的资料
X
20
30
33
40
15
13
26
38
35
43
Y
7
9
8
11
5
4
8
10
9
10
(1)建立消费Y对收入X的回归直线。
(2)说明回归直线的代表性及解释能力。
(3)在95%的置信度下检验参数的显著性。
(4)在95%的置信度下,预测当X=45(百元)时,消费(Y)的置信区间。
14、假设某国的货币供给量Y与国民收入X的历史如表2-6。
表2-6 某国的货币供给量X与国民收入Y的历史数据
年份
X
Y
年份
X
Y
年份
X
Y
1985
2.0
5.0
1989
3.3
7.2
1993
4.8
9.7
1986
2.5
5.5
1990
4.0
7.7
1994
5.0
10.0
1987
3.2
6
1991
4.2
8.4
1995
5.2
11.2
1988
3.6
7
1992
4.6
9
1996
5.8
12.4
(1)作出散点图,然后估计货币供给量Y对国民收入X的回归方程,并把回归直线画在散点图上。
(2)如何解释回归系数的含义。
(3)如果希望1997年国民收入达到15,那么应该把货币供给量定在什么水平?
15、假定有如下的回归结果
其中,Y表示美国的咖啡消费量(每天每人消费的杯数),X表示咖啡的零售价格(单位:美元/杯),t表示时间。问:
(1)这是一个时间序列回归还是横截面回归?做出回归线。
(2)如何解释斜率?
(3)能否救出真实的总体回归函数?
(4)根据需求的价格弹性定义: ,依据上述回归结果,你能救出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?
解答:(1)这是一个时间序列回归。(图略)
(2)截距2.6911表示咖啡零售价在每磅0美元时,美国平均咖啡消费量为每天每人2.6911杯,这个没有明显的经济意义;斜率-0.4795表示咖啡零售价格与消费量负相关,表明咖啡价格每上升1美元,平均每天每人消费量减少0.4795杯。
(3)不能。原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的。
(4)不能。在同一条需求曲线上不同点的价格弹性不同,若要求价格弹性,须给出具体的X值及与之对应的Y值。
16、下面数据是依据10组X和Y的观察值得到的:(李子奈书P18)
,,,,
假定满足所有经典线性回归模型的假设,求
(1),的估计值及其标准差;
(2)决定系数;
(3)对,分别建立95%的置信区间。利用置信区间法,你可以接受零假设:吗?
59
第3章 多元线性回归模型
一、单项选择题
1.在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为( D )
A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327
2.下列样本模型中,哪一个模型通常是无效的(B)
A. (消费)=500+0.8(收入)
B. (商品需求)=10+0.8(收入)+0.9(价格)
C. (商品供给)=20+0.75(价格)
D. (产出量)=0.65(劳动)(资本)
3.用一组有30个观测值的样本估计模型后,在0.05的显著性水平上对的显著性作检验,则显著地不等于零的条件是其统计量大于等于( C )
A. B. C. D.
4.模型中,的实际含义是( B )
A.关于的弹性 B. 关于的弹性
C. 关于的边际倾向 D. 关于的边际倾向
5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( C )
A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度
6.线性回归模型 中,检验时,所用的统计量 服从( C )
A.t(n-k+1) B.t(n-k-2)
C.t(n-k-1) D.t(n-k+2)
7. 调整的判定系数 与多重判定系数 之间有如下关系( D )
A. B.
C. D.
9.在多元线性回归模型中对样本容量的基本要求是(k为解释变量个数):( C )
A n≥k+1 B n<k+1
C n≥30 或n≥3(k+1) D n≥30
11.半对数模型中,参数的含义是( C )。
A.X的绝对量变化,引起Y的绝对量变化
B.Y关于X的边际变化
C.X的相对变化,引起Y的期望值绝对量变化
D.Y关于X的弹性
12.半对数模型中,参数的含义是( A )。
A.X的绝对量发生一定变动时,引起因变量Y的相对变化率
B.Y关于X的弹性
C.X的相对变化,引起Y的期望值绝对量变化
D.Y关于X的边际变化
13.双对数模型中,参数的含义是( D )。
A.X的相对变化,引起Y的期望值绝对量变化
B.Y关于X的边际变化
C.X的绝对量发生一定变动时,引起因变量Y的相对变化率
D.Y关于X的弹性
四、简答
1.给定二元回归模型:,请叙述模型的古典假定。
解答:(1)随机误差项的期望为零,即。(2)不同的随机误差项之间相互独立,即。(3)随机误差项的方差与t无关,为一个常数,即。即同方差假设。(4)随机误差项与解释变量不相关,即。通常假定为非随机变量,这个假设自动成立。(5)随机误差项为服从正态分布的随机变量,即。(6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。
2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度?
解答:因为人们发现随着模型中解释变量的增多,多重决定系数的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。
3.修正的决定系数及其作用。
解答:,其作用有:(1)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。
4.常见的非线性回归模型有几种情况?
解答:常见的非线性回归模型主要有:
(1) 对数模型
(2) 半对数模型或
(3) 倒数模型
(4) 多项式模型
(5) 成长曲线模型包括逻辑成长曲线模型和Gompertz成长曲线模型
2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程:
式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。
解答:该消费模型的判定系数,F统计量的值,均很高,表明模型的整体拟合程度很高。
计算各回归系数估计量的t统计量值得:,
,。除外,其余T值均很小。工资收入W的系数t检验值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。
5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:
方程A:
方程B:
其中:——某天慢跑者的人数
——该天降雨的英寸数
——该天日照的小时数
——该天的最高温度(按华氏温度)
——第二天需交学期论文的班级数
请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。
(2)出现不同符号的原因很可能是由于与高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。
6.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):
(2.6) (6.3) (0.61) (5.9)
要求:(1)试判定每项结果对应着哪一个变量?
(2)对你的判定结论做出说
解答:(1)是盒饭价格,是气温,是学校当日的学生数量,是附近餐厅的盒饭价格。
(2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为;至于其余两个变量,从一般经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以是盒饭价格,是气温。
第4章 异方差性
一、单项选择
1.Goldfeld-Quandt方法用于检验( )
A.异方差性 B.自相关性
C.随机解释变量 D.多重共线性
2.在异方差性情况下,常用的估计方法是( )
A.一阶差分法 B.广义差分法
C.工具变量法 D.加权最小二乘法
3.White检验方法主要用于检验( )
A.异方差性 B.自相关性
C.随机解释变量 D.多重共线性
4.Glejser检验方法主要用于检验( )
A.异方差性 B.自相关性
C.随机解释变量 D.多重共线性
5.下列哪种方法不是检验异方差的方法 ( )
A.戈德菲尔特——匡特检验 B.怀特检验
C.戈里瑟检验 D.方差膨胀因子检验
6.当存在异方差现象时,估计模型参数的适当方法是 ( )
A.加权最小二乘法 B.工具变量法
C.广义差分法 D.使用非样本先验信息
7.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 ( )
A.重视大误差的作用,轻视小误差的作用
B.重视小误差的作用,轻视大误差的作用
C.重视小误差和大误差的作用
D.轻视小误差和大误差的作用
8.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为 ( )
A. B. C. D.
9.如果戈德菲尔特——匡特检验显著,则认为什么问题是严重的 ( )
A.异方差问题 B.序列相关问题
C.多重共线性问题 D.设定误差问题
10.设回归模型为,其中,则的最有效估计量为( )
A. B.
C. D.
二、多项选择
1.下列计量经济分析中那些很可能存在异方差问题( )
A.用横截面数据建立家庭消费支出对家庭收入水平的回归模型
B.用横截面数据建立产出对劳动和资本的回归模型
C.以凯恩斯的有效需求理论为基础构造宏观计量经济模型
D.以国民经济核算帐户为基础构造宏观计量经济模型
E.以30年的时序数据建立某种商品的市场供需模型
2.在异方差条件下普通最小二乘法具有如下性质()
A、线性 B、无偏性 C、最小方差性
D、精确性 E、有效性
3.异方差性将导致
A、普通最小二乘法估计量有偏和非一致
B、普通最小二乘法估计量非有效
C、普通最小二乘法估计量的方差的估计量有偏
D、建立在普通最小二乘法估计基础上的假设检验失效
E、建立在普通最小二乘法估计基础上的预测区间变宽
4.下列哪些方法可用于异方差性的检验()
A、DW检验 B、方差膨胀因子检验法 C、判定系数增量贡献法 D、样本分段比较法 E、残差回归检验法
5.当模型存在异方差现象进,加权最小二乘估计量具备( )
A、线性 B、无偏性 C、有效性 D、一致性 E、精确性
6.下列说法正确的有()
A、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性
B、当异方差出现时,常用的t和F检验失效
C、异方差情况下,通常的OLS估计一定高估了估计量的标准差
D、如果OLS回归的残差表现出系统性,则说明数据中不存在异方差性
E、如果回归模型中遗漏一个重要变量,则OLS残差必定表现出明显的趋势
三、名词解释
1.异方差性 2.格德菲尔特-匡特检验 3.怀特检验
4.戈里瑟检验和帕克检验
四、简答题
1.什么是异方差性?试举例说明经济现象中的异方差性。
2.产生异方差性的原因及异方差性对模型的OLS估计有何影响。
3.检验异方差性的方法有哪些?
4.异方差性的解决方法有哪些?
5.什么是加权最小二乘法?它的基本思想是什么?
6.样本分段法(即戈德菲尔特——匡特检验)检验异方差性的基本原理及其使用条件。
五、计算题
1.设消费函数为,其中为消费支出,为个人可支配收入, 为随机误差项,并且(其中为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
2.检验下列模型是否存在异方差性,列出检验步骤,给出结论。
样本共40个,本题假设去掉c=12个样本,假设异方差由引起,数值小的一组残差平方和为,数值大的一组平方和为。
3.假设回归模型为:,其中:;并且是非随机变量,求模型参数的最佳线性无偏估计量及其方差。
4.现有x和Y的样本观测值如下表:
x
2
5
10
4
10
y
4
7
4
5
9
假设y对x的回归模型为,且,试用适当的方法估计此回归模型。
5.某人根据某区的有关资料作如下的回归模型,结果为:
其中,Y表示人口密度,X表示离中心商业区的距离(英里)
(1)如果存在异方差,异方差的结构是什么?(2)从变换后的(WLS)回归函数中,你如何知道异方差已被消除或减弱了?(3)你如何解释回归结果?它是否有经济意义?
答案
一、单选
A D A A D A B C A C
二、多选
1.ABCDE 2.AB 3.BCDE 4.DE 5.ABCDE 6.BE
三、名词解释
1.异方差性:在线性回归模型中,如果随机误差项的方差不是常数,即对不同的解释变量观测值彼此不同,则称随机项具有异方差性。
2.戈德菲尔特-匡特检验:该方法由S.M.Goldfeld和R.E.Quandt于1965年提出,用对样本进行分段比较的方法来判断异方差性。
3.怀特检验:该检验由White在1980年提出,通过建立辅助回归模型的方式来判断异方差性。
4.戈里瑟检验和帕克检验:该检验法由戈里瑟和帕克于1969年提出,其基本原理都是通过建立残差序列对解释变量的(辅助)回归模型,判断随机误差项的方差与解释变量之间是否存在着较强的相关关系,进而判断是否存在异方差性。
四、简答题
1. 异方差性是指模型违反了古典假定中的同方差假定,它是计量经济分析中的一个专门问题。在线性回归模型中,如果随机误差项的方差不是常数,即对不同的解释变量观测值彼此不同,则称随机项具有异方差性,即 (t=1,2,……,n)。例如,利用横截面数据研究消费和收入之间的关系时,对收入较少的家庭在满足基本消费支出之后的剩余收入已经不多,用在购买生活必需品上的比例较大,消费的分散幅度不大。收入较多的家庭有更多可自由支配的收入,使得这些家庭的消费有更大的选择范围。由于个性、爱好、储蓄心理、消费习惯和家庭成员构成等那个的差异,使消费的分散幅度增大,或者说低收入家庭消费的分散度和高收入家庭消费得分散度相比较,可以认为牵着小于后者。这种被解释变量的分散幅度的变化,反映到模型中,可以理解为误差项方差的变化。
2.产生原因:(1)模型中遗漏了某些解释变量;(2)模型函数形式的设定误差;(3)样本数据的测量误差;(4)随机因素的影响。
产生的影响:如果线性回归模型的随机误差项存在异方差性,会对模型参数估计、模型检验及模型应用带来重大影响,主要有:(1)不影响模型参数最小二乘估计值的无偏性;(2)参数的最小二乘估计量不是一个有效的估计量;(3)对模型参数估计值的显著性检验失效;(4)模型估计式的代表性降低,预测精度精度降低。
3.检验方法:(1)图示检验法;(2)戈德菲尔德—匡特检验;(3)怀特检验;(4)戈里瑟检验和帕克检验(残差回归检验法);(5)ARCH检验(自回归条件异方差检验)
4.解决方法:(1)模型变换法;(2)加权最小二乘法;(3)模型的对数变换等
5.加权最小二乘法的基本原理:最小二乘法的基本原理是使残差平方和为最小,在异方差情况下,总体回归直线对于不同的的波动幅度相差很大。随机误差项方差越小,样本点对总体回归直线的偏离程度越低,残差的可信度越高(或者说样本点的代表性越强);而较大的样本点可能会偏离总体回归直线很远,的可信度较低(或者说样本点的代表性较弱)。因此,在考虑异方差模型的拟合总误差时,对于不同的应该区别对待。具体做法:对较小的给于充分的重视,即给于较大的权数;对较大的给于充分的重视,即给于较小的权数。更好的使反映对残差平方和的影响程度,从而改善参数估计的统计性质。
6. 样本分段法(即戈德菲尔特—匡特检验)的基本原理:将样本分为容量相等的两部分,然后分别对样本1和样本2进行回归,并计算两个子样本的残差平方和,如果随机误差项是同方差的,则这两个子样本的残差平方和应该大致相等;如果是异方差的,则两者差别较大,以此来判断是否存在异方差。使用条件:(1)样本容量要尽可能大,一般而言应该在参数个数两倍以上;(2)服从正态分布,且除了异方差条件外,其它假定均满足。
六、计算题
1. 解:(一)原模型: (1)等号两边同除以,
新模型:(2)
令
则:(2)变为
此时新模型不存在异方差性。
(二)对进行普通最小二乘估计
其中
(进一步带入计算也可)
2.解:(1)
(2)
(3)
(4),接受原假设,认为随机误差项为同方差性。
3.解:原模型: 根据
为消除异方差性,模型等号两边同除以
模型变为:
令
则得到新模型:
此时新模型不存在异方差性。
利用普通最小二乘法,估计参数得:
4.解:原模型: , 模型存在异方差性
为消除异方差性,模型两边同除以,
得:
令
则:(2)变为
此时新模型不存在异方差性
由已知数据,得
2
5
10
4
10
0.5
0.2
0.1
0.25
0.1
4
7
4
5
9
2
1.4
0.4
1.25
0.9
根据以上数据,对进行普通最小二乘估计得:
解得
第5章 自相关性
一、 名词解释
1 序列相关性 2 虚假序列相关 3 差分法
4 广义差分法 5 自回归模型 6 广义最小二乘法
7 DW检验 8 科克伦-奥克特跌代法 9 Durbin两步法
10 相关系数
二、 单项选择题
1、如果模型yt=b0+b1xt+ut存在序列相关,则()
A.cov(xt, ut)=0 B.cov(ut, us)=0(t≠s) C. cov(xt, ut)≠0 D. cov(ut, us) ≠0(t≠s)
2、DW检验的零假设是(ρ为随机误差项的一阶相关系数)
A、DW=0 B、ρ=0 C、DW=1 D、ρ=1
3、下列哪个序列相关可用DW检验(vt为具有零均值,常数方差且不存在序列相关的随机变量)
A.ut=ρut-1+vt B.ut=ρut-1+ρ2ut-2+…+vt
C.ut=ρvt D.ut=ρvt+ρ2 vt-1 +…
4、DW的取值范围是()
A、-1≤DW≤0 B、-1≤DW≤1 C、-2≤DW≤
展开阅读全文