资源描述
计量经济学作业
姓名:万超
班级:08级数学一班
学号:118
简单线性回归模型
一、建立模型
为了研究四川省城镇具名消费支出以及可支配收入之间的关系,又经济理论分析可知,收入是影响居民消费支出的主要因素,居民消费支出Y与可支配收入X之间存在密切的关系,消费支出随着收入的增加而增加,但变动的幅度相比较低,即边际消费倾向MPC有0<MPC<1。因此可设定居民消费支出Yi与Xi的关系为:
Yi=ß1+ß2Xi+ui,
其中ß1表示四川省城镇居民家庭平均每人年生活性消费支出(元);Xi为城镇居民家丁平均没人年可支配收入(元)。变量采用年度数据,样本期为1978-1998年。这里的ß1为居民没有收入来源时的最低消费。
二、估计模型中的位置参数
假设模型中的随机误差项ui满足古典假定,运用OLS方法估计模型的参数,利用计量经济学计算机软件EViews计算过程如下:
简历文档,输入数据
首先点击EViews图标,进入EViews主页。点击File后,在File菜单的New选项中点击Workfile,这时屏幕上出现Workfile Range对话框,在Srart Date里键入1978,在End Date里键入1998,点击OK后屏幕出现Workfile工作框。
在Object菜单栏,点击New Object对话框里选Group并在Name for Object上定义文件名,点击OK,屏幕出现数据编辑框。也可在光标出直接输入Data Y X,回车后即可出现数据编辑框。此时可录入数据,首先按上行键,这时对应“obs”字样的空格会自动上跳,在对应第二个“obs”字样,有边框的空格里键入变量名,再按下行键,这时对应变量名下的这一列出现“NA”字样,便可依时间顺序键入相应的数据。其他变量的数据类似输入。可以几个变量同时录入数据。
obs
Y
X
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
314.0000
340.0000
364.0000
396.0000
407.0000
457.0000
517.0000
680.0000
787.0000
899.0000
1086.000
1184.000
1281.000
1488.000
1651.000
2034.000
2806.000
3429.000
3733.000
4093.000
4383.000
338.0000
369.0000
391.0000
412.0000
445.0000
493.0000
581.0000
695.0000
849.0000
948.0000
1130.000
1349.000
1490.000
1691.000
1989.000
2408.000
3297.000
4003.000
4406.000
4763.000
5127.000
用OLS估计未知参数
在主页上选Quick菜单,点击Eatimate Equation项,屏幕上出现估计对话框(Equation Spacification),在Easmation Setting中选OLS估计,即Least Squares,键入Y C X或Y X C(C为EViews固定的截距系数)。然后OK,得输入结果。
三、检验模型
从估计的结果可以看出,模型拟合较好。因为可以决系数R²=0.9993,表明模型在整体上拟合的非常好。系数显著性检验:对于ß2,t的统计量为169.6548.给定α=0.05,查t分布表,在自由度n-2=19下,得临界值t(19)=2.093,因为t(19)<t,所以拒绝Hß2=0,表明城镇居民年人均可支配收入对年人均生活费支出有着显著性影响。并且从经济意义上看,ß=0.8423,符合经济理论中绝对可收入假说边际消费倾向在0与1之间,表明四川省城镇居民年人均可支配收入每增加1元居民年人均生活费支出平均增加0.84元。
四、预测
我们还可以在估计出的Eaquation框里选Forecast项,EViews自动计算出样本估计期内的被解释变量的拟合值,拟合变量记为YF。
运用趋势分析预测1999与2000年的人均可支配收入分辨是4365.662元和4601.614元。下面预测1999年、2000年两年居民人均生活费支出。再输入数据之前将Range从1978——19981扩展为1978——2000。将X(1999)=4365.662和X(2000)=4601.614分别输入变量X中,在前面Eguation对话框里选Forecast,将时间Sanple定义在1999——2000,这时EViews自动计算Y(1999)=3725.199和Y(2000)=3923.944.
下面计算Y(1999)和Y(2000)的预测拒签,在X、Y的数据框里点击View,选Dcscriptive State里的Common Sample Eviews使计算出有关X和Y的描述统计结果。
据此可计算如下结果Y(1999)的95%预测区间为(3644.6925,3805.7028),Y(2000)的95%预测区间为(3867.9374,3979.9506)。
中国旅游市场发展分析
一、 模型的背景
近年来,中国旅游业一直保持高速的发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游业迅速增长。改革开放20多年来,特别市进入20实际90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。
二、 模型设定及其估计
经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数,城镇居民人均旅游支出,农村居民人均旅游支出,并以公路里程和铁路里程作为相关基础设施的代表。为此设定了以下形式的计量经济模型:
其中,为第年全国旅游收入(亿元);
为国内旅游人数(万人/次);
为城镇居民人均旅游支出(元);
为农村居民人均旅游支出(元);
为公路里程(万Km);
为铁路里程(万Km);
为了估计模型参数,收集旅游事业发展最快的1994~2003年的统计数据,如下表所示。
年份
全国旅游收入(亿元)
国内旅游人数(万人/次)
城镇居民人均旅游支出(元)
农村居民人均旅游支出(元)
公路里程(万Km)
铁路里程(万Km)
1994
1023.5
52400
414.7
54.9
111.78
5.90
1995
1375.7
62900
464.0
61.5
115.70
5.97
1996
1638.4
63900
534.1
70.5
118.58
6.49
1997
2112.7
64400
599.8
145.7
122.64
6.60
1998
2391.2
69450
607.0
197.0
127.85
6.64
1999
2831.9
71900
614.8
249.5
135.17
6.74
2000
3175.5
74400
678.6
226.6
140.27
6.87
2001
3522.4
78400
708.3
212.7
169.80
7.01
2002
3878.4
87800
739.7
209.1
176.52
7.19
2003
3442.3
87000
684.9
200.0
180.98
7.30
通过Eviews软件对模型进行OLS回归的结果如下图所示:
由此可见,该模型,可决系数很高,检验值,明显显著。但是当时,回归结果显示、系数的检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。
为了得到进一步显示,我们求出数据的相关系数矩阵:
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
三、 模型的修正
1) 逐步回归法
分别做对、、、、的一元回归,得到的结果如下表所示:
变量
参数估计值
0.0842
9.0523
11.6673
34.3324
2014.146
统计量
8.6659
13.1598
5.1967
6.4675
8.7487
0.9037
0.9558
0.7715
0.8394
0.9054
0.8917
0.9504
0.7427
0.8195
0.8936
可以看出,加入的效果最好,以为基础,顺次添加其它内容:
、
0.0298(2.1530)
6.1940(4.2872)
0.9659
、
8.0206(5.7513)
1.7106(0.8550)
0.9486
、
6.7356(6.6523)
10.9117(2.6628)
0.9718
、
7.8512(2.9101)
285.0119(0.4621)
0.9450
明显加入的效果比较好,继续加:
、、
0.0091(0.4229)
6.3553(4.5277)
8.5739(1.2176)
0.9681
、、
4.2196(3.9502)
3.2160(3.0633)
13.6279(4.6945)
0.9872
、、
8.0988(4.0852)
12.9241(2.6445)
-424.9056(-0.807)
0.9703
可见加入、都使得结果变坏,因此只加入、、三个变量。
修正之后的回归结果为:
经济学解释为在其它因素不变的情况下,当城镇居民人均旅游支出和农村居民人均旅游支出分别增长1元,公路里程每增加1万Km时,国内旅游收入将分别增长4.21亿元、3.22亿元和13.63亿元。
2) 差分法
效果不好 = =|||
医疗机构模型
一、问题的提出与模型设定
根据本章引子提出的问题,为了给制定医疗机构的规划提供数据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为
其中, Y表示医疗机构数,X表示人口数。由2001年《四川统计年鉴》得到以下数据
编号
地区
人口数X/万人
医疗机构数 Y
1
成都
1013.3
6304
2
自贡
315
911
3
攀枝花
103
934
4
泸州
463.7
1297
5
德阳
379.3
1085
6
绵阳
518.4
1616
7
广元
302.6
1021
8
遂宁
371
1375
9
内江
419.9
1212
10
乐山
345.9
1132
11
南充
709.2
4064
12
眉山
339.9
827
13
宜宾
508.5
1530
14
广安
438.6
1589
15
达州
620.1
2403
16
雅安
149.8
866
17
巴中
346.7
1223
18
资阳
488.4
1361
19
阿坝
82.9
536
20
甘孜
88.9
594
21
凉山
402.4
1471
二、参数估计
进入EViews软件包,确定样本范围,编辑输入数据,选择估计方程菜单,估计以下样本回归函数(下图)
估计样本回归函数
Dependent Variable: Y
Method: Least Squares
Date: 11/14/11 Time: 17:17
Sample: 1901 1921
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-562.9074
291.5642
-1.930646
0.0686
X
5.372828
0.644239
8.339811
0.0000
R-squared
0.785438
Mean dependent var
1588.143
Adjusted R-squared
0.774145
S.D. dependent var
1310.975
S.E. of regression
623.0301
Akaike info criterion
15.79746
Sum squared resid
7375164.
Schwarz criterion
15.89694
Log likelihood
-163.8733
F-statistic
69.55245
Durbin-Watson stat
1.947198
Prob(F-statistic)
0.000000
估计结果为
括号内t为统计量。
三、检验模型异方差
本例用的是四川省2000年各地市州的医疗机构数何人口数,由于地区之间存在不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差。从而影响模型的估计和作用。为此,必须对该模型是否存在异方差进行检验。
(一) 图形法
生成残差平方序列。在得到上述结果后,立即用生成命令建立序列ei^2,记为e2,生成过程如下
绘制散点图。选择变量名X与e2,进入数据列表可得散点图如下
2、判断
由上散点图可以看出,残差平方对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方随Xi的变动呈增大趋势,因此模型很可能存在异方差。但是否确实存在异方差还应通过进一步的检验。
(二)Goldfeld-Quanadt检验
1、EViews软件操作
对变量取值排序(按递增或者递减)。在Procs菜单里选Sort Series 命令,出现排序对话框,如果以递增型排序。选择Ascending,如果以递减排序选择Decending,输入X,点击OK。本例选择递增排序,这时变量Y与X将以X按递增排序。
构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值。即大约5个观测值,余下部分平分得两个样本区间:1-8和14-21,他们的样本个数均是8,即n1=n2=8.在sample菜单里,将区间定义为1-8,然后用OLS方法得到以下结果
在sample菜单里,将区间定义为14-21,再用OLS方法求得以下结果,见下表
求F统计量值。基于表5.3和表5.4中残差平方和(sum/squared/residual)的值,由表5.3可以得到残差平方和为=144958.9,由表5.4中可以得到残差平方和为=734355.8,根据Goldfeld-Quanadt检验,F统计量为
判断。在a=0.05下(5.33)式中分子、分母的自由度均为6,查F分布表,得临界值F=5.0762>F(6.6)=4.28,所以拒绝原假设,表明模型确实存在异方差。
(三)White检验
由表5.2估计结果,按路径view/residul tests/white heteroskedasticity
(no cross terms or cross terms),进入White 检验。根据White检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选no cross terms,则辅助函数为
经检验出现White检验结果,见表5.5.
从表5.5可以看出,nR^2=18.07481,由White检验知,在a=0.05下,查分布表得临界值=5.9915,同时X与的t检验也很显著。比较计算的统计量与临界值,因为=18.07481>5.9915,所以拒绝原假设,不拒绝备择假设,表明存在异方差。
表5.5
四、异方差的修正
运用加权最下二乘法(WLS)估计过程中,我们分别选用了权数=。权数的生成过程如下,在途5.4对话框中的Enter equation处分别输入w1=1/X,w2=1/x^2,w3=1/sqr
(X),经估计检验发现用权数w3t效果最好。下面给出用权数的结果
1) w1=1/X:
2) w2=1/x^2,
3) w3=1/sqr
因此估计结果如下:
括号中数据为t统计量。
可以看出运用加权最小二乘法消除了异方差性后,参数的t检验均显著,可决系数大幅提高,F检验也显著,并说明人口数量每增加1万人,平均说来将增加3.5545个卫生医疗机构,而不是增加5.3735个卫生医疗机构。可能这个模型还存在其他需要进一步解决的问题,但这一估计结果或许比本章引子的结论更为接近真实情况。
展开阅读全文