资源描述
2006-2007第2学期
计量经济学课程大作业
大作业名称:关于我国粮食生产的单方程计量经济学模型
组长:
学号: 姓名: 专业:
成员:
学号: 姓名: 专业:
学号: 姓名: 专业:
选课班级: A02 任课教师: 徐晔 成绩:
评语: 本文以我国改革开放以来1978-2002年的相关数据为依托,运用计量经济学方法对影响我国粮食生产的主要因素进行了回归分析,并通过统计检验、计量经济学检验、经济意义检验和模型预测检验,最终得出结论:粮食播种面积对我国粮食生产的正面影响最大。同时,利用模型对提高我国的粮食产量进行了数量化分析,并就如何增加我国粮食产量提出一些可供参考的意见。
教师签名: 批阅日期:
计 量 经 济 学 模 型
---------------------关于我国粮食生产的单方程计量经济学模型
粮食生产是关系国计民生的战略物资。本文以我国改革开放以来1978-2002年的相关数据为依托,运用计量经济学方法对影响我国粮食生产的主要因素进行了回归分析,并通过统计检验、计量经济学检验、经济意义检验和模型预测检验,最终得出结论:粮食播种面积对我国粮食生产的正面影响最大。同时,利用模型对提高我国的粮食产量进行了数量化分析,并就如何增加我国粮食产量提出一些可供参考的意见。
近年来,中国的经济一直处在高速增长时期,被誉为东亚乃至世界经济发展的一个新引擎。经济的持续增长当然值得庆贺,然而,对于经济增长中所出现的一些问题,如果不能及时地发现和正视,那么它所引起的后果也可能是严重的。现阶段的农业就是最需要重视的一个问题。
农业是封建社会最重要的物质生产部门,而粮食更是国民经济的基础。粮食生产对一个农业国家的经济,特别是对于一个封建国家的经济,真有极为重要的意义。粮食总产量代表封建国家的经济实力,粮食单位面积产量,反映土地利用的效果,是农业生产力发展水平的重要指标。清代的粮食生产获得了很大的发展,它的发展同任何社会经济的发展一样,都是由时间上的上升运动和空间上的扩散运行交织而成。清代各地的粮食亩产,与前代相比,均有所提高。只是农业比较发达地区提高的幅度小一些,其他发展中地区提高的幅度大一些。清代粮食生产最突出的成就是地区扩散,即粮食亩产量在全国广大地区普遍提高,从而导致了粮食总产量和全国平均亩产量的提高。
长期以来,我国的粮食消费具有明显的城乡和地域差异,粮食消费市场主要集中在农村,城乡差别主要体现在人均口粮和粮食总量的消费上,农村居民的粮食消费远远大于城镇居民的粮食消费。粮食消费的地域差异除了在粮食消费量上有所体现外,更主要的是体现在粮食消费品种的差异上,这两种差异目前均处于缩小的趋势。从总体上看,我国南方地区居民的粮食消费主要以稻谷为主,而北方地区居民则以小麦为主要消费对象,这是我国居民长期以来的生活习惯使然随着我国粮食流通体制的进一步改革、城镇化速度的加快、人口流动规模的扩大,以及农产品物流市场的不断发展,“南米北面”的粮食消费地域差异也将会逐步缩小。
粮食产量下降直接与传统农业模式不足以支撑农民升高了的生活需求、农民种粮积极性低落相关。在今天的中国农村,一边是越来越多的“农民进城”、在城市中寻找就业机会,一边是相伴的田地被大量抛荒或者挪作他用。有地无人种导致许多传统上能够实现粮食自给并且还有盈余可供售卖的农户,现在也加入到了在市场上买粮的非耕大军中,这种现象在有些地方已经到了极其严重的程度。而农田被挪作他用,比如改作鱼塘、种树甚至用作屋场等等,在农村中也越来越常见。
粮食产量下降与农民种粮积极性的低落,正在给未来中国的粮食安全敲响警钟。如果任时下的中国粮食生产状况持续下去,那么可能引发的后果将不堪设想。与其他人口小国或人均资源丰富的国家不同,未来的中国一旦遭遇重大的天灾、发生大规模的粮食减产,并因此而出现粮荒的话,那么一个有着十几亿生灵的人口大国,不仅其内部无法互相接济,就是花巨额外汇储备从国外购买,也可能买不到足够的粮食来渡过危机。
因此,对我国粮食生产的影响因素进行定量分析,研究粮食生产涨落的原因以及提供某些政策性的建议是十分必要的。著名经济学家李子奈教授在文献[1]中曾对我国1983—1995年粮食生产数据进行过研究分析,他选取的影响因素数据是:农用化肥施用量,粮食播种面积,成灾面积,农业机械动力和农业劳力,并拟合出了关于我国粮食生产的线性回归模型。在本文中,我们将运用计量经济学的方法对上述模型问题进行研究。对于粮食产量的影响,除了选取上述影响因素外,还把农村用电量、国家财政用于农业的支出和灌溉面积的影响因素数据也加到了模型中去。
被解释变量与解释变量的确定与C-D生产函数模型
我们把粮食总产量确定为被解释变量,把影响粮食产量的因素确定为解释变量。依据国家政策对粮食生产的积极扶持作用,影响粮食生产的主要因素是投入要素,即资本和劳动力。而农业生产的特点决定了其资本主要是土地和化肥;至于农业劳动力,过去我国一直是人工种植,但近年来由于呈现农业经济多种化经营的趋势,所以许多人都从事副业生产;同时由于科技进步的影响,农业机械化水平的提高也对粮食生产有一定的影响。综合以上考虑,我们最终确定影响粮食生产的因素为:播种面积、成灾面积、化肥施用量、农业机械动力、农村用电量、国家财政用于农业的支出、灌溉面积和农业劳动力。另外影响粮食生产的因素还有农民的积极性,但这是一个不太好量化的因素,因此可把它作为随机的因素引入到模型中。
因此,我们最终确定的模型的被解释变量为:粮食总产量;解释变量为:播种面积、成灾面积、化肥施用量、农业机械动力、农村用电量、国家财政用于农业的支出、灌溉面积和农业劳动力。
由初步的分析知,粮食产量与成灾面积是负相关的,而与其它变量则是正相关的
我们选择在经济领域应用最广泛的一种生产函数模型—C-D生产函数模型来进行研究。
生产函数是描述生产过程中投入的生产要素的某种组合同它可能的最大产出量之间的依存关系的数学表达式。即
其中Y为产出量,A,K,L分别为技术、资本、劳动的投入要素。生产要素对生产函数的作用与影响,主要是由一定的技术条件决定的,从本质上讲,生产函数反映了生产过程中投入要素与产出量之间的技术关系。
1928年,美国数学家Charles Cobb和经济学家Paul Dauglas提出的生产函数的数学形式为
(2.1)
根据要素的产出弹性的定义,很容易推出
即:参数、分别是资本与劳动的产出弹性。那么由产出弹性的经济意义,应该有
在最初提出的C-D生产函数中,假定了参数满足,即生产函数的一阶齐次性,也就是假定研究对象满足规模报酬不变。这是因为
即:当资本与劳动的数量同时增长倍时,产出量也增长倍。1937年,Durand提出了C-D生产函数的改进型,即取消了的假定,允许要素的产出弹性之和大于1或小于1,即承认研究对象可以是规模报酬递增的,也可以是规模报酬递减的,取决于对参数的估计结果。
模型(2.1)中的待估参数A称为效率系数,是广义技术进步水平的反映,显然应有。
由上可见,C-D生产函数的参数具有明确的经济意义,这一显著特点是它被广泛应用的重要原因。
我们现在看模型(2.1)对要素替代弹性的假设。根据要素替代弹性的定义,可以得到.由此可知,C-D生产函数模型的要素替代弹性为1,这样就更加逼近于生产活动的实际
样本数据收集
3.1 数据收集
根据上面的所确定的模型的变量,我们收集到了1978年-2003年主要粮食生产数据(表1)。
年份
粮食总产量(万吨)
播种面积
(千公顷)
成灾面积
(千公顷)
化肥施用量(万吨)
灌溉面积
(千公顷)
国家财政
用于农业的支出(亿元)
农村用电量(亿千瓦小时)
农机动力
(万千瓦)
农村劳动力(万人)
1978
30477
120587
24457
884
44965
150.66
253.1
11750
28318
1979
33212
119263
15120
1086
45003
174.33
282.7
13379
28634
1980
32056
117234
29777
1269
44888
149.55
320.8
14746
29122
1981
32502
114958
18743
1335
44574
110.21
369.8
15680
29777
1982
35450
113463
15985
1513
44177
120.49
396.9
16614
30859
1983
38728
114047
16209
1660
44644
132.87
435.2
18022
31151
1984
40731
112884
15607
1740
44453
141.29
464
19497
30868
1985
37911
108845
22705
1776
44036
153.62
508.9
20913
31130
1986
39151
110933
23656
1931
44226
184.2
586.7
22950
31254
1987
40298
111268
20393
2000
44403
195.72
658.8
24836
31663
1988
39408
110123
23945
2142
44376
214.07
712
26575
32249
1989
40755
112205
22449
2357
44917
265.94
790.5
28067
33225
1990
44624
113466
17819
2590
47403
307.84
844.5
28708
38914
1991
43529
112314
27814
2805
47822
347.57
963.2
29389
39098
1992
44266
110560
25859
2930
48590
376.02
1106.9
30308
38699
1993
45649
110209
23133
3152
48728
440.45
1244.8
31817
37680
1994
44510
109544
31383
3318
48759
532.98
1473.9
33803
36628
1995
46662
110060
22267
3594
49281
574.93
1655.7
36118
35530
1996
50454
112548
21233
3828
50381
700.43
1812.7
38547
34820
1997
49417
112912
30309
3980
51239
766.39
1980.1
42016
34840
1998
51230
113787
25181
4084
52296
1154.76
2042.1
45208
35177
1999
50839
113161
26731
4124
53158
1085.76
2173.4
48996
35768
2000
46219
108463
34374
4146
53820
766.9
2421.3
52574
36043
2001
45264
106080
31734
4254
54249
917.96
2610.8
55172
36513
2002
45706
103891
27319
4339
54355
1102.7
2993.4
57930
36870
2003
43065
99410
32516
4412
54014
1125.8
3432.9
60387
36546
数据来源:《中国统计摘要2004》,《中国统计年鉴2003》。
4 模型的估计
由C-D生产函数模型,得模型形式如下:
(4.1)
两边取对数并进行变换,得:
(4.2)
其中。
运用Eviews软件对模型(4.2)进行估计,我们得到估计结果(见表2):
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/12/07 Time: 10:36
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
0.692593
0.485506
1.426538
0.1729
LOG(X2)
-0.100634
0.034068
-2.953970
0.0093
LOG(X3)
0.534914
0.147015
3.638506
0.0022
LOG(X4)
-0.440859
0.343773
-1.282411
0.2180
LOG(X5)
0.066512
0.053046
1.253838
0.2279
LOG(X6)
-0.161679
0.139093
-1.162374
0.2621
LOG(X7)
0.049568
0.108774
0.455696
0.6547
LOG(X8)
-0.034488
0.134234
-0.256927
0.8005
C
4.740039
6.315919
0.750491
0.4639
R-squared
0.975463
Mean dependent var
10.63403
Adjusted R-squared
0.963194
S.D. dependent var
0.149839
S.E. of regression
0.028746
Akaike info criterion
-3.986891
Sum squared resid
0.013222
Schwarz criterion
-3.548096
Log likelihood
58.83614
F-statistic
79.50844
Durbin-Watson stat
1.089272
Prob(F-statistic)
0.000000
从表2可以看出,回归估计的判决系数很高,方程很显著,但是8个参数的检验值却只有两个略微显著。显然,出现了严重的多重共线性统计学检验。
相关系数法
从各解释变量之间的相关系数(表3)也能初步看出各变量之间存在着多重共线性:
1.00000
-0.41564
-0.64554
-0.50681
-0.46408
-0.64567
-0.69218
-0.59207
-0.41564
1.00000
0.60685
0.64292
0.56823
0.63443
0.63526
0.44898
-0.64554
0.60685
1.00000
0.93906
0.92524
0.96184
0.96829
0.78427
-0.50681
0.64292
0.93906
1.00000
0.95370
0.97189
0.95145
0.68740
-0.46408
0.56823
0.92524
0.95370
1.00000
0.95229
0.93533
0.59376
-0.64567
0.63443
0.96184
0.97189
0.95229
1.00000
0.98659
0.66234
-0.69218
0.63526
0.96829
0.95145
0.93533
0.98659
1.00000
0.70817
-0.59207
0.44898
0.78427
0.68740
0.59376
0.66234
0.70817
1.00000
从表3可以看出与、、、之间存在较高的相关系数,这说明它们之间可能存在着多重共线性。
5.1.2 判定系数检验法
由表3的初步判断,我们进行如下形式的回归:
(5.1)
得到回归结果(见表4):
Dependent Variable: LOG(X3)
Method: Least Squares
Date: 06/12/07 Time: 10:40
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X4)
0.190812
0.154200
1.237435
0.2296
LOG(X5)
-0.157583
0.081909
-1.923875
0.0680
LOG(X6)
0.607818
0.196791
3.088651
0.0056
LOG(X7)
0.246155
0.259323
0.949223
0.3533
R-squared
0.976902
Mean dependent var
7.790785
Adjusted R-squared
0.973603
S.D. dependent var
0.476553
S.E. of regression
0.077427
Akaike info criterion
-2.133325
Sum squared resid
0.125893
Schwarz criterion
-1.938305
Log likelihood
30.66656
Durbin-Watson stat
0.604755
从表4中可以看出其判定系数0.976902很大,这说明在该形式中作为被解释变量的可以用、、、的线性组合代替,即与、、、之间存在共线性。
5.1.3 修正的Frish方法[3]
下面我们用修正的Frish方法来消除该模型的多重共线性。
首先,做出被解释变量关于解释变量的每一个回归方程,得各判决系数依次为:0.325219;0.156088;0.912886;0.602399;0.754473;0.838016;0.832231;0.686358。
从上面我们知道判决系数最大的为0.912886;从而可选取作为模型的出发点进行估计,得表5:
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/13/07 Time: 18:35
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X3)
0.300415
0.019351
15.52485
0.0000
C
8.293559
0.151027
54.91442
0.0000
R-squared
0.912886
Mean dependent var
10.63403
Adjusted R-squared
0.909098
S.D. dependent var
0.149839
S.E. of regression
0.045176
Akaike info criterion
-3.279866
Sum squared resid
0.046941
Schwarz criterion
-3.182356
Log likelihood
42.99832
F-statistic
241.0209
Durbin-Watson stat
1.007996
Prob(F-statistic)
0.000000
在Y、中加入解释变量进行估计, 常数项不显著,在去掉常数项后再一次估计得表6:
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/14/ 07 Time: 09:10
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
0.691293
0.011098
62.29127
0.0000
LOG(X3)
0.333285
0.016532
20.15955
0.0000
R-squared
0.932183
Mean dependent var
10.63403
Adjusted R-squared
0.929234
S.D. dependent var
0.149839
S.E. of regression
0.039860
Akaike info criterion
-3.530268
Sum squared resid
0.036543
Schwarz criterion
-3.432758
Log likelihood
46.12835
Durbin-Watson stat
0.931751
从结果可以看出在加入解释变量之后,其判决系数的值有了明显的变化,并且对的系数值和检验值没有多大影响,因此可以加入变量。
同理,在Y、、中加入解释变量进行估计得常数项不显著,在去掉常数项后, 得到
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/14/07 Time: 09:20
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
0.777863
0.022542
34.50745
0.0000
LOG(X2)
-0.132174
0.031875
-4.146602
0.0004
LOG(X3)
0.374595
0.016113
23.24759
0.0000
R-squared
0.961934
Mean dependent var
10.63403
Adjusted R-squared
0.958473
S.D. dependent var
0.149839
S.E. of regression
0.030534
Akaike info criterion
-4.027757
Sum squared resid
0.020512
Schwarz criterion
-3.881492
Log likelihood
53.34697
Durbin-Watson stat
0.721462
从结果可以看出:在加入变量之后,其判决系数的值有了明显变化,并且对、的系数值和检验值没有多大影响,并且的估计系数是负值,符合经济意义,加入变量。
在Y、、、中加入变量进行估计得常数项不显著,在去掉常数项后,再一次估计得到:
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/14/07 Time: 10:10
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
1.123050
0.124372
9.029739
0.0000
LOG(X2)
-0.100049
0.030067
-3.327497
0.0032
LOG(X3)
0.444313
0.028511
15.58406
0.0000
LOG(X4)
-0.452980
0.161157
-2.810797
0.0105
R-squared
0.972340
Mean dependent var
10.63403
Adjusted R-squared
0.968388
S.D. dependent var
0.149839
S.E. of regression
0.026641
Akaike info criterion
-4.267096
Sum squared resid
0.014904
Schwarz criterion
-4.072076
Log likelihood
57.33871
Durbin-Watson stat
0.909275
从结果可以看出加入解释变量之后,其判决系数的值虽然有变化,但对的系数值和检验值有较大影响,且的估计系数是负值,不符合经济意义.它的检验值也不太显著,因此暂时不考虑加入变量。
运用同样的方法逐个加入变量、和进行估计知,加入的变量对表8的判决系数没有多大影响,但对表9的检验值有较大影响,因此暂时不考虑加入上述变量。
在Y、、、中加入解释变量进行估计得表9:
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/14/07 Time: 10:32
Sample: 1978 2002
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
0.877783
0.281540
3.117789
0.0054
LOG(X2)
-0.130209
0.033567
-3.879047
0.0009
LOG(X3)
0.372419
0.031188
11.94115
0.0000
LOG(X8)
0.036335
0.125249
0.290099
0.7747
C
-1.543268
3.602112
-0.428434
0.6729
R-squared
0.962327
Mean dependent var
10.63403
Adjusted R-squared
0.954792
S.D. dependent var
0.149839
S.E. of regression
0.031859
Akaike info criterion
-3.878139
Sum squared resid
0.020300
Schwarz criterion
-3.634364
Log likelihood
53.47673
F-statistic
127.7204
Durbin-Watson stat
0.690001
Prob(F-statistic)
0.000000
从结果可以看出,在加入解释变量之后,其判决系数的值有较大变化,况且它对其余解释变量的检验值和系数没有多大影响,因此可以加入该变量。
最终,我们确定模型的形式为:
(5.2)
从而我们有如下的回归模型:
LOG(Y) = 0.877783LOG(X1) - 0.130209LOG(X2) + 0.372419LOG(X3)
(0.281540) (0.033567) (0.031188)
(3.117789) (-3.879047) (11.94115)
+ 0.0363345LOG(X8) - 1.543268
(0.125249) (3.602112)
(0.290099) (-0.428434)
0.962327 SE=0.031859 DW=0.690001 F=127.7204
从上述回归报告可以看出,、和常数项的检验值并不太显著,模型拟合得并不是太好,且常数项为负值,这也不符合经济含义。从DW表中可以看到,对于n=25,k=4,在5%的显著水平下,有,而表中的DW值仅为0.690001,明显比值要小,这说明模型存在严重的序列自相关性,这有可能是导致上述检验值并不显著的重要原因.因此,为了使模型更具有价值,我们首先必须消除模型的自相关。
广义差分法[1]
下面我们用广义差分方程来考虑消除序列的自相关:
将回归方程中的变量滞后一期,得
(5.4)
将方程两边同时乘以,得到:
(5.5)
现用方程(5.2)减去上式(5.5),得到:
(5.6)
令:
得到方程:
(5.7)
其中由的估计值来代替。
由得:=0.655,代入方程得回归结果如下:
Dependent Variable: YTL
Method: Least Squares
Date: 06/15/07 Time: 10:33
Sample(adjusted): 1979 2002
Included observations: 24 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X1TL
1.272493
0.303645
4.190724
0.0005
X2TL
-0.094229
0.021084
-4.469289
0.0003
X3TL
0.357326
0.046508
7.683193
0.0000
X8TL
0.081845
0.141032
0.580327
0.5685
C
-2.362777
1.337787
-1.766184
0.0934
R-squared
0.860145
Mean dependent var
3.684247
Adjusted R-squared
0.830702
S.D. dependent var
0.055384
S.E. of regression
0.022788
Akaike info criterion
-4.542076
Sum squared resid
0.009867
Schwarz criterion
-4.296648
Log likelihood
59.50491
F-statistic
29.21370
Durbin-Watson stat
1.041152
Prob(F-statistic)
0.000000
其中YTL=;=
但是由表10知1.041152,落入了无法决策区,因此无法判断模型是否还存在自相关,下面再用迭代法来试着消除自相关。
5.2.2 迭代法[1]
下面用迭代法来消除自相关,经过多次反复拟合,得较理想的回归结果(见表11):
要小,
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 06/15/07 Time: 11:06
Sample(adjusted): 1980 2002
Included observations: 23 after adjusting endpoints
Convergence achieved after 10 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
LOG(X1)
0.763860
0.019009
40.18465
0.0000
LOG(X2)
-0.103879
0.015134
-6.864072
0.0000
LOG(X3)
0.359327
0.023457
15.31855
0.0000
AR(1)
1.020992
0.200102
5.102369
0.0001
AR(2)
-0.498956
0.216003
-2.309949
0.0330
R-squared
0.978767
Mean dependent var
10.65719
Adjusted R-squared
0.974049
S.D. dependent var
0.131589
S.E. of regression
0.021198
Akaike info criterion
-4.680145
Sum squared resid
0.008089
Schwarz criterion
-4.433298
Log likelihood
58.82166
Durbin-Watson stat
2.268207
Inverted AR Roots
.51 -.49i
.51+.49i
从表11可以看出,添入AR(1)和AR(2)项后,DW值由0.694540提高到了2.364586,自相关得到了消除
展开阅读全文