资源描述
影响粮食产量的因素spss
目录
摘要: II
一.前言 1
二.理论背景 1
2.1多元线性回归模型的基本理论 1
2.1.1多元线性回归模型一般形式 1
2.1.2多元线性回归模型的基本假定: 1
三.模型的建立及求解 2
3.1 一些基本的符号说明 2
3.2 多元回归模型的初步建立与初步检验 2
3.2.1 多元回归模型的初步建立 2
3.2.2 模型的初步检验 3
3.3 模型的优化 4
3.3.1多重共线性的诊断与模型的建立 4
3.3.1.1 多重共线性的诊断——方差扩大因子法 4
3.3.1.2 多重共线性的处理与检验 4
3.3.2 异方性差检验及处理 6
3.3.2.1 异方差检验 6
3.3.3 自相关性检验及处理 7
3.3.3.1 自相关检验 7
3.4 最终模型的确定 8
四.模型评价 8
参考文献 8
附录 10
影响我国粮食产量因素的分析
摘要:
本文主要对我国粮食产量的变动进行多因素分析,选取1990年-2007年18年的数据,利用SPSS软件,建立以粮食产量为被解释变量,以有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资为解释变量的多元线性回归模型,通过对模型进行异方差检验,自相关检验,自变量的选择以及多重共线性诊断,最后建立了合乎经济意义的粮食生产函数,从而通过对我国粮食生产的影响因素分析粮食产量的决定因素。
关键词:最小二乘估计 多元线性回归分析 异方差 自相关 多重共线性 残差图 怀特检验 迭代法,差分法 逐步回归 方差扩大因子。
一.前言
粮食是人类最基本的生活消费品,一个国家的粮食问题是关系到本国的国计民生的头等大事。人们都知道,农业是国民经济发展的基础,粮食是基础的基础,因此粮食生产是关系到一个国家生产与发展的一个永恒的主题。
根据理论和经验分析,影响粮食生产的主要因素有有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资。为此,本文收集了我国自1990年至2007年有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资的相关数据。数据资料均来源于《中国统计年鉴》,见附录一。
粮食的产量随着投入生产要素的变化而变化,反映出一种投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。多元线性函数就是用于表示农业生产投入产出的一种生产函数。
本文首先用最小二乘估计,建立多元线性回归模型,对参数进行估计,然后进行参数检验,方程显著性检验,经济意义的检验。通过建立数学模型来研究我国粮食投入与产出的生产函数,找出影响粮食产量的关键指标加以改善,确保粮食产量稳步增长,建立粮食生产模型,且对此模型进行评估。
二.理论背景
2.1多元线性回归模型的基本理论
2.1.1多元线性回归模型一般形式
设随机变量与一般变量的理论线性回归模型为:...(1),其中是个未知参数,称为回归常数,称为回归系数。y称为被解释变量(因变量),是个可以精确测量并可控制的一般变量,称为解释变量(自变量),是随机误差。
对一个实际问题,如果我们获得n组观测数据(),则线性回归模型(1)式可表示为:
写成矩阵的形式为:,是一个阶矩阵,称为回归设计矩阵或资料矩阵。
2.1.2多元线性回归模型的基本假定:
为了方便地进行模型的参数估计,对回归方程(2)式有如下一些基本的假定:
(1)解释变量是确定性变量,不是随机变量,且要求
,这里的,表明设计矩阵中的自变量列之间不相关,样本量的个数应大于解释变量的个数,是以个满秩矩阵。
(2)高斯-马尔科夫条件:随机误差项具有零均值和同方差性,即:
;
;
;
即假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本之间是不相关的,不存在序列相关,并且有相同的精度。
(3)正态分布的假定条件为:
对于多元线性回归的矩阵模型(3)式,这个条件还可以表示为:~,由上述假定和多元正态分布的性质可知,随机向量服从维正态分布,回归模型(3)式的期望向量,因此~
三.模型的建立及求解
3.1 一些基本的符号说明
用表示粮食产量(万吨);表示有效灌溉面积(千公顷);表示播种面积(千公顷);表示化肥施用量(万吨);表示是受灾面积(千公顷);表示农用机械总动力(万千瓦时);表示农业基本建设投资(亿元)。
3.2 多元回归模型的初步建立与初步检验
3.2.1 多元回归模型的初步建立
(1)建立粮食产量与有效灌溉面积、播种面积化肥施用量,受灾面积,农业机械总动力,农业基本建设投资的一个6元线性回归模型:
其中:是待定参数.
(2)利用SPSS软件,通过最小二乘估计得到系数的估计值,结果如表5-1所示:
表5-1
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-47279.746
11670.296
-4.051
.002
有效灌溉面积
.885
.411
.976
2.151
.055
播种面积
.464
.056
.760
8.260
.000
化肥施用量
7.395
.690
2.029
10.724
.000
受灾面积
-.144
.024
-.318
-6.004
.000
农业机械总动力
-.576
.159
-3.342
-3.629
.004
农业基本建设投资
3.582
.999
1.342
3.587
.004
a. 因变量: 粮食产量
表5-2
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.992a
.985
.976
417.705661814464900
a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。
表5-3
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.223E8
6
20386377.595
116.842
.000a
残差
1919258.219
11
174478.020
总计
1.242E8
17
a. 预测变量: (常量), x6, x4, x2, x3, x1, x5。
b. 因变量: y
3.2.2 模型的初步检验
(1)由输出结果我们可以清楚的看到此多元回归的经验方程为:
(2) 从coefficient系数表(表5-1)中可以看到,回归系数检验的t值分别为-4.051、2.151、8.260、10.724、-6.004、-3.629、3.587,自变量t检验的临界值均大于,且从收尾率也可以看出回归系数通过检验,即自变量对被解释变量有显著影响;我们再从模型汇总表(model summary)表5-2来做分析。
(3)从模型汇总(model summary)表中可以看到,决定系数,从相对水平上看,回归方程能够减少因变量y的99.8%的方差波动,回归标准差,从绝对水平上看,y的标准差从回归前的2703.347856减少到回归后的417.70566181;从以下的方差分析(ANOVA)表5-3进行分析。
(4)从方差分析(ANOVA)表中看到,,Sig=0,说明y对自变量有显著的线性关系,回归方程是显著的;
从上的分析中可以回归系数的显著性检验及方程的显著性检验均通过,但是回归系数x5的正负号不符合经济意义,x5代表农用机械总动力,它的参数负,意味着投入农用机械总动力越高,粮食产量越低,从经济行为上无法解释。我们首先考虑它是否存在多重共线性,因为农业投入资金与化肥的施用量,灌溉面积,农业机械总动力有很强的相关性。
3.3 模型的优化
3.3.1多重共线性的诊断与模型的建立
3.3.1.1 多重共线性的诊断——方差扩大因子法
下表5-4、5-5是对其进行多重共线性诊断。
表5-4
系数a
模型
共线性统计量
容差
VIF
1
灌溉面积
.007
146.601
播种面积
.166
6.023
化肥使用量
.039
25.497
受灾面积
.501
1.996
农业机械总动力
.002
603.981
农业基本建设投资
.010
99.767
a. 因变量: 粮食产量
表5-5
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
灌溉面积
播种面积
化肥使用量
受灾面积
农业机械总动力
农业基本建设投资
1
1
6.520
1.000
.00
.00
.00
.00
.00
.00
.00
2
.461
3.759
.00
.00
.00
.00
.00
.00
.01
3
.009
26.444
.00
.00
.00
.01
.53
.00
.03
4
.008
29.419
.00
.00
.01
.04
.07
.00
.06
5
.001
78.204
.00
.00
.02
.53
.00
.04
.06
6
.000
175.787
.14
.00
.50
.36
.02
.08
.07
7
1.489E-5
661.662
.86
1.00
.47
.05
.38
.87
.77
a. 因变量: 粮食产量
从表5-4中可以看出的方差扩大因子均大于10,说明自变量间存在严重的多重共线性,从表5-5中最大的条件数也可以说明自变量间存在严重的共线性。再者第七行中的方差比例同时较大,说明间存在多重共线性。
从表5-4的输出结果中看到,的方差扩大因子为最大,远大于10,并且的回归系数为负值。所以考虑模型是否存在多重共线性。
3.3.1.2 多重共线性的处理与检验
(一)多重共线性的处理
首先 剔除建立y对五个自变量的回归方程,计算结果如表5-6所示。
表5-6
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
-14899.383
10674.563
-1.396
.188
灌溉面积
-.500
.217
-.552
-2.300
.040
.049
20.349
播种面积
.629
.047
1.029
13.346
.000
.476
2.101
化肥使用量
6.089
.835
1.671
7.294
.000
.054
18.553
受灾面积
-.091
.027
-.202
-3.370
.006
.791
1.265
农业基本建设投资
.075
.358
.028
.210
.837
.157
6.360
a. 因变量: 粮食产量
再次 从表5-4的输出结果中看到,x1的方差扩大因子为最大,远大于10,并且x1的回归系数仍为负值,因此首先剔除x1建立y对四个自变量x2,x3,x4,x6的回归方程,计算结果如表5-7所示。
表5-7
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
-35825.060
6440.979
-5.562
.000
播种面积
.650
.053
1.064
12.195
.000
.495
2.022
化肥使用量
4.438
.492
1.218
9.023
.000
.206
4.843
受灾面积
-.105
.030
-.232
-3.443
.004
.831
1.204
农业基本建设投资
-.127
.400
-.048
-.318
.755
.167
5.975
a. 因变量: 粮食产量
最后 从表5-7的输出结果中看到,自变量的方差扩大因子均小于10,但回归系数x6的符号仍然不符合经济意义的解释,这是由于农业基本建设投资与化肥的使用量、灌溉面积有着很强的相关性,因此将x6剔除后再做回归,结果如表5-8所示:
表5-8
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
-36263.297
6087.009
-5.957
.000
播种面积
.656
.048
1.073
13.579
.000
.564
1.774
化肥使用量
4.314
.288
1.184
14.966
.000
.563
1.777
受灾面积
-.102
.028
-.225
-3.658
.003
.934
1.070
a. 因变量: 粮食产量
表5-9
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.975a
.951
.940
661.367554285573500
1.426
a. 预测变量: (常量), 受灾面积, 播种面积, 化肥使用量。
b. 因变量: 粮食产量
(二).多重共线性的检验
从表5-8的输出结果中看到,自变量的方差扩大因子均小于10,回归系数的符号也符合经济意义的解释,,拒绝零假设,回归方程显著,各回归系数的t统计量均大于,各自变量对y有显著线性关系。
由表5-9知:此回归方程的样本决定系数,调整样本决定系数,而y对3个自变量的全模型样本决定系数,与全模型(1)式相比较,(2)式的拟合度仍然很高。
所以最后的回归方程为,即粮食生产函数。
现在我们来看以上的回归模型是否满足了回归的基本假设。
3.3.2 异方性差检验及处理
3.3.2.1 异方差检验
第一 残差图分析法
图3-1
从残差图以及等级相关系数表(见附录)中我们大致可以判断该模型不存在异方差问题,为了更加精确的判定该模型的确不存在异方差问题,下面通过怀特检验来加以验证。
第二 white检验法
表5-10
Heteroskedasticity Test: White
F-statistic
0.768046
Prob. F(9,8)
0.6506
Obs*R-squared
8.343615
Prob. Chi-Square(9)
0.4999
Scaled explained SS
4.027407
Prob. Chi-Square(9)
0.9096
从怀特检验的显示的结果可以看出:,且收尾率远大于显著性水平,所以接受原假设,残差不存在异方差性,与残差图的检验结果是一致的。
3.3.3 自相关性检验及处理
3.3.3.1 自相关检验
第一 残差图分析法
图3-2
从图5-2我们大致判断该系列不存在自相关,从表5-9中的可以知道,不能判断序列是否存在自相关性,下面通过LM检验来加以验证。
第二 LM检验法
表5-11
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
1.146164
Prob. F(2,12)
0.3503
Obs*R-squared
2.886997
Prob. Chi-Square(2)
0.2361
从LM=知:回归模型不存在序列自相关性。
所以由上述检验知道上面建立的生产函数拟合效果很好,符合多元回归模型的一些基本的假定。
3.4 最终模型的确定
所以最后的回归方程为,即粮食生产函数。通过以上的分析,我们得出结论:粮食产量与粮食作物播种面积、化肥使用量、受灾面积有着密切的关系。
四.模型评价
以上模型采用依次剔除方差因子大于10的自变量后,克服了多重共线性的影响,异方差的检验以及自相关的检验后,该模型不存在异方差及自相关,且该方程的经济意义已经合理,已经满足回归模型的三条基本假设,粮食产量与粮食作物播种面积、化肥使用量、受灾面积有着密切的关系。由于其他各种因素可能存在很严重的多重共线性,导致系数符号与经济事实不相符所以不予采用,但其对粮食产量的影响是不可忽视的。各个因素单个拿出来与粮食产量的回归都取得可很高的可决系数,t检验与F检验也都很显著。
参考文献
【1】何晓群 刘文卿.运用回归分析【M】.中国人民大学出版社.2011.
【2】易丹辉.数据分析与EViews运用【M】.中国人民大学出版社.2011.
附录
附录一
表1-1
年份
粮食产量(万吨)
有效灌溉面积(千公顷)
粮食作物播种面积(千公顷)
化肥使用量(万吨)
受灾面积(千公顷)
农用机械总动力(万千瓦时)
农业基本建设投资(亿元)
1990
44624.3
47403.1
113466
2590.3
38474
28707.7
67.2
1991
43529.3
47822.1
112314
2805.1
55472
29388.6
85
1992
44265.8
48590.1
110560
2930.2
51333
30308.4
111
1993
45648.8
48727.9
110509
3151.9
48829
31816.6
127.8
1994
44510.1
48759.1
109544
3317.9
55043
33802.5
154.9
1995
46661.8
49281.2
110060
3593.7
45821
36118.1
219.1
1996
50453.5
50381.4
112548
3827.9
46989
38546.9
317.9
1997
49417.1
51238.5
112912
3980.7
53429
42015.6
412.7
1998
51229.5
52295.6
113787
4083.7
50145
45207.7
637.1
1999
50838.6
53158.4
113161
4124.3
49981
48996.1
835.5
2000
46217.5
53820.3
108463
4146.4
54688
52573.6
940
2001
45263.7
54249.4
106080
4253.8
52215
55172.1
993.4
2002
45705.8
54354.9
103891
4339.4
47119
57929.9
1291.6
2003
43069.5
54014.2
99410
4411.6
54506
60386.5
1652.3
2004
46946.9
54478.4
101606
4636.6
37106
64027.9
1890.7
2005
48402.2
55029.3
104278
4766.2
38818
68397.8
2323.7
2006
49804.2
55750.5
104958
4927.7
41091
72522.1
2749.9
2007
50160.3
56518.3
105638
5107.8
48992
76589.6
3403.5
附录二
表2-1 全回归模型的结果表
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.992a
.985
.976
417.705661814464900
2.458
a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。
b. 因变量: 粮食产量
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.223E8
6
20386377.595
116.842
.000a
残差
1919258.219
11
174478.020
总计
1.242E8
17
a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。
b. 因变量: 粮食产量
系数a
模型
非标准化系数
标准系数
t
Sig.
B 的 95.0% 置信区间
相关性
共线性统计量
B
标准 误差
试用版
下限
上限
零阶
偏
部分
容差
VIF
1
(常量)
-47279.746
11670.296
-4.051
.002
-72965.894
-21593.598
有效灌溉面积
.885
.411
.976
2.151
.055
-.020
1.790
.431
.544
.081
.007
146.601
播种面积
.464
.056
.760
8.260
.000
.341
.588
.245
.928
.310
.166
6.023
化肥施用量
7.395
.690
2.029
10.724
.000
5.877
8.913
.533
.955
.402
.039
25.497
受灾面积
-.144
.024
-.318
-6.004
.000
-.196
-.091
-.254
-.875
-.225
.501
1.996
农业机械总动力
-.576
.159
-3.342
-3.629
.004
-.925
-.227
.380
-.738
-.136
.002
603.981
农业基本建设投资
3.582
.999
1.342
3.587
.004
1.384
5.781
.362
.734
.134
.010
99.767
a. 因变量: 粮食产量
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
有效灌溉面积
播种面积
化肥施用量
受灾面积
农业机械总动力
农业基本建设投资
1
1
6.520
1.000
.00
.00
.00
.00
.00
.00
.00
2
.461
3.759
.00
.00
.00
.00
.00
.00
.01
3
.009
26.444
.00
.00
.00
.01
.53
.00
.03
4
.008
29.419
.00
.00
.01
.04
.07
.00
.06
5
.001
78.204
.00
.00
.02
.53
.00
.04
.06
6
.000
175.787
.14
.00
.50
.36
.02
.08
.07
7
1.489E-5
661.662
.86
1.00
.47
.05
.38
.87
.77
a. 因变量: 粮食产量
相关性
粮食产量
有效灌溉面积
播种面积
化肥施用量
受灾面积
农用机械总动力
农业基本建设投资
粮食产量
Pearson 相关性
1
.431*
.245
.533*
-.254
.380
.362
显著性(单侧)
.037
.164
.011
.154
.060
.070
N
18
18
18
18
18
18
18
有效灌溉面积
Pearson 相关性
.431*
1
-.686**
.971**
-.203
.973**
.888**
显著性(单侧)
.037
.001
.000
.210
.000
.000
N
18
18
18
18
18
18
18
播种面积
Pearson 相关性
.245
-.686**
1
-.656**
.232
-.751**
-.708**
显著性(单侧)
.164
.001
.002
.178
.000
.001
N
18
18
18
18
18
18
18
化肥施用量
Pearson 相关性
.533*
.971**
-.656**
1
-.235
.960**
.885**
显著性(单侧)
.011
.000
.002
.174
.000
.000
N
18
18
18
18
18
18
18
受灾面积
Pearson 相关性
-.254
-.203
.232
-.235
1
-.315
-.365
显著性(单侧)
.154
.210
.178
.174
.101
.068
N
18
18
18
18
18
18
18
农用机械总动力
Pearson 相关性
.380
.973**
-.751**
.960**
-.315
1
.964**
显著性(单侧)
.060
.000
.000
.000
.101
.000
N
18
18
18
18
18
18
18
农业基本建设投资
Pearson 相关性
.362
.888**
-.708**
.885**
-.365
.964**
1
显著性(单侧)
.070
.000
.001
.000
.068
.000
N
18
18
18
18
18
18
18
Unstandardized Residual
Pearson 相关性
.124
.000
.000
.000
.000
.000
.000
显著性(单侧)
.312
.500
.500
.500
.500
.500
.500
N
18
18
18
18
18
18
18
*. 在 0.05 水平(单侧)上显著相关。
**. 在 .01 水平(单侧)上显著相关。
描述性统计量
均值
标准 偏差
N
粮食产量
47041.60555555555000
2703.347856764497000
18
有效灌溉面积
51992.92777777779000
2982.498723594335000
18
播种面积
108510.28
4421.581
18
化肥施用量
3944.178
741.8620
18
受灾面积
48336.17
5975.525
18
农用机械总动力
48472.64999999999000
15684.781784649058000
18
农业基本建设投资
1011.850
1013.0752
18
附录三
表3-1 White检验的部分结果
Heteroskedasticity Test: White
F-statistic
0.768046
Prob. F(9,8)
0.6506
Obs*R-squared
8.343615
Prob. Chi-Square(9)
0.4999
Scaled explained SS
4.027407
Prob. Chi-Square(9)
0.9096
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/17/12 Time: 13:10
Sample: 1990 2007
Included observations: 18
Coefficient
Std. Error
t-Statistic
Prob.
C
-4.91E+08
2.91E+08
-1.688866
0.1297
X2
6694.356
3729.917
1.794774
0.1104
X2^2
-0.021595
0.011885
-1.817051
0.1067
X2*X3
-0.402303
0.318636
-1.262579
0.2423
X2*X4
-0.007487
0.010348
-0.723498
0.4900
X3
54182.56
41278.53
1.312609
0.2257
X3^2
-1.357037
0.843810
-1.608227
0.1465
X3*X4
0.007303
0.053199
0.137270
0.8942
X4
725.8455
1191.145
0.609368
0.5592
X4^2
0.000784
0.006003
0.130677
0.8993
R-squared
0.463534
Mean dependent var
340205.5
Adjusted R-squared
-0.139990
S.D. dependent var
展开阅读全文