资源描述
目录
摘要
1、研究背景及意义
2、问题得提出
3、模型得建立与求解
3、1相关分析—简单散点图
3、2多元回归分析—参数估计
3、3三种检验
3、3、1回归方程得拟合优度检验
3、3、2回归方程得显著性检验—F检验
3、3、3参数显著性检验—t检验
4、多重共线性检验分析
5、自相关分析
6、模型得修正
6、1逐步修正法
关于水稻产量影响因素得多元线性回归分析
摘要
本文得主要内目得就是对影响水稻产量得因素进行分析,主要运用了SPSS18,采用多元线性回归分析得方法对我国最近18年影响水稻产量得主要因素进行了分析,建立了以水稻产量为因变量,水稻播种面积、化肥施用量、生猪存栏量与降水量四种影响因素为自变量得多元线性回归模型,利用模型对各个因素进行了统计分析,并且对模型进行了修正检验,在此基础上提出一些提高水稻产量得合理化建议。
关键词:SPSS18 水稻产量 多元回归线性分析
1、研究背景及意义
我国就是一个人口大国,众所周知,很多偏远地方得人们仍然处在饥饿得边缘,水稻产量得提高首先可以很好得改善部分地区得粮食紧张问题,为我国经济得发展与社会得稳定提供有效得保障,其次,水稻产量得提高有利于稳定粮食得价格。因此,对影响水稻产量得因素进行多元回归线性分析可以得出各个因素得影响程度,从而采取正确得措施,以最少得投入得到最大得产量,这对于农业得科学发展就是十分必要得。
2、问题得提出
下面得表格给出了我国最近18年来水稻产量与影响与制约水稻产量得主要因素得有关数据。
表1 18年来水稻产量与相关影响数据
水稻播种面积(万亩)
化肥施用量(万公斤)
生猪存栏量(万口)
降水量(10mm)
水稻总产量(万公斤)
147、00
2、00
15、00
27、00
154、50
148、00
3、00
26、00
38、00
200、00
154、00
5、00
33、00
20、00
227、50
157、00
9、00
38、00
99、00
260、00
153、00
6、50
41、00
43、00
208、00
151、00
5、00
39、00
33、00
229、50
151、00
7、50
37、00
46、00
265、50
154、00
8、00
38、00
78、00
229、00
155、00
13、50
44、00
52、00
303、50
155、00
18、00
51、00
22、00
270、50
156、00
23、00
53、00
39、00
298、50
155、00
23、50
51、00
28、00
229、00
157、00
24、00
51、00
46、00
309、50
156、00
30、00
52、00
59、00
309、00
159、00
48、00
52、00
70、00
371、00
164、00
95、50
57、00
52、00
402、50
164、00
93、00
68、00
38、00
429、50
156、00
97、50
74、00
32、00
427、50
数据来源:中国国家统计局,《中国统计年鉴》
在现实生活中,影响水稻产量得因素有很多,但就是不能一一列举,我们只就是选择了水稻播种面积、化肥施用量、生猪存栏量与降水量4个影响因素作为解释变量进行了回归分析。
变量得定义如下:
Y: 水稻总产量(万公斤)
X1: 水稻播种面积(万亩)
X2: 化肥施用量(万公斤)
X3: 生猪存栏量(万口)
X4: 降水量(10mm)
下面利用SPSS18对变量间得关系进行求解。
3、模型得建立与求解
3、1相关分析—简单散点图
按:“图形—旧对话框—散点/点状图”顺序做,做数据散点图,观测因变量与自变量之间关系就是否存在线性关系。
图1 水稻产量与水稻播种面积之间得简单散点图
图2 水稻产量与化肥施用量之间得简单散点图
图3 水稻产量与生猪存栏量之间得简单散点图
图4 水稻产量与降水量之间得简单散点图
从上面四个散点图可以瞧出,水稻种植面积、化肥施用量、生猪存栏量与水稻产量存在明显得相关关系,降水量与水稻产量得相关关系不就是那么得明显。这样得话,我们就可以建立水稻产量与水稻播种面积、化肥施用量、生猪存栏量、降水量之间建立线性回归模型。
3、2多元回归线性分析—参数估计
以水稻产量Y为因变量,X1: 水稻播种面积(万亩),X2: 化肥施用量(万公斤),X3: 生猪存栏量(万口),X4: 降水量(10mm)为自变量,用“分析—回归—线性—进入”方法进行参数得最小二乘估计,得到回归系数得表格,结果如表2所示:
表2 系数a
模型
非标准化系数
标准系数
t
Sig、
B
标准 误差
试用版
1
(常量)
-160、312
410、391
-、391
、702
水稻播种面积(万亩)
1、878
2、836
、105
、662
、519
化肥施用量(万公斤)
1、284
、379
、529
3、391
、005
生猪存栏量(万口)
2、090
、885
、370
2、361
、034
降水量(10mm)
、483
、359
、124
1、343
、202
a、 因变量: 水稻总产量(万公斤)
初步得到该问题得多元回归线性分析模型:
Y=-160、312+1、878X1+1、284X2+2、090X3+0、483X4
从经济意义上讲,水稻得播种面积增大,化肥施用量加大,生猪存栏量变多,,降水量变大,水稻得产量会变大,因变量与4个自变量之间成正相关得关系,得到得模型符合现实得经济意义。
3、3三种检验
3、3.1回归方程得拟合优度检验
表3显示了相关系数R、相关系数得平方、调整得相关系数得平方与估计值误差与DW,这些数据反映了因变量与自变量之间得线性相关强度。
表3 模型汇总b
模型
R
R 方
调整 R 方
标准 估计得误差
Durbin-Watson
1
、958a
、918
、893
26、12780
2、705
a、 预测变量: (常量), 降水量(10mm), 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。
b、 因变量: 水稻总产量(万公斤)
由表3可以瞧出,R得平方=0、918 调整后得R得平方=0、893
样本决定系数与调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力。
3、3、2回归方程得显著性检验—F检验
表4显示因变量得方差来源、方差平方与、自由度、均方、F检验统计量得观测值与显著性水平。方差来源有回归、残差、与总与。从表中可以瞧出,F=36、355,回归得自由度就是4,残差得自由度就是13,总计得自由度就是17、显著性水平就是0、05、
表4 Anovab
模型
平方与
df
均方
F
Sig、
1
回归
99271、465
4
24817、866
36、355
、000a
残差
8874、605
13
682、662
总计
108146、069
17
a、 预测变量: (常量), 降水量(10mm), 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。
b、 因变量: 水稻总产量(万公斤)
此模型中样本数就是18,自由变量就是4个,故该模型得F统计量服从F(4,13),由此查表得到临界值F(4,13)=3、18,由上表可知本模型得F值就是36、355、大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程得显著性检验。
3、3、3参数得显著性检验—T检验,显著性水平为0、05
表5 系数a
模型
非标准化系数
标准系数
t
Sig、
B
标准 误差
试用版
1
(常量)
-160、312
410、391
-、391
、702
水稻播种面积(万亩)
1、878
2、836
、105
、662
、519
化肥施用量(万公斤)
1、284
、379
、529
3、391
、005
生猪存栏量(万口)
2、090
、885
、370
2、361
、034
降水量(10mm)
、483
、359
、124
1、343
、202
a、 因变量: 水稻总产量(万公斤)
此模型中样本就是18,自变量个数就是4,则该模型各回归系数得T统计量应服从T(13)得分布,查询临界值为1、77,由上表得到得5个回归系数得T得值分别就是-0、391、0、662、3、391、2、361、1、343,水稻播种面积降水量T得绝对值小于临界值,化肥施用量与生猪存栏量大雨临界值,这些模型可能存在多重共线性,下面将进行该模型就是否存在多重共线性检验。
4、多重共线性分析
由以下三种方法均能瞧出该模型就是否存在多重共线性。
A、 变量间得相关分析
表6 相关性
相关性
水稻播种面积(万亩)
化肥施用量(万公斤)
生猪存栏量(万口)
降水量(10mm)
水稻总产量(万公斤)
水稻播种面积(万亩)
Pearson 相关性
1
、774**
、782**
、280
、839**
显著性(双侧)
、000
、000
、260
、000
N
18
18
18
18
18
化肥施用量(万公斤)
Pearson 相关性
、774**
1
、826**
-、026
、913**
显著性(双侧)
、000
、000
、917
、000
N
18
18
18
18
18
生猪存栏量(万口)
Pearson 相关性
、782**
、826**
1
-、008
、889**
显著性(双侧)
、000
、000
、974
、000
N
18
18
18
18
18
降水量(10mm)
Pearson 相关性
、280
-、026
-、008
1
、136
显著性(双侧)
、260
、917
、974
、589
N
18
18
18
18
18
水稻总产量(万公斤)
Pearson 相关性
、839**
、913**
、889**
、136
1
显著性(双侧)
、000
、000
、000
、589
N
18
18
18
18
18
**、 在 、01 水平(双侧)上显著相关。
上表中每一横隔得第一行构成了解释变量间得相关系数矩阵,相关系数汇总如下:
水稻播种面积(万亩)
化肥施用量(万公斤)
生猪存栏量(万口)
降水量(10mm)
水稻总产量(万公斤)
水稻播种面积(万亩)
1
、774**
、782**
、280
、839**
化肥施用量(万公斤)
、774**
1
、826**
-、026
、913**
生猪存栏量(万口)
、782**
、826**
1
-、008
、889**
降水量(10mm)
、280
-、026
-、008
1
、136
水稻总产量(万公斤)
、839**
、913**
、889**
、136
1
由上图可以瞧出,水稻播种面积与化肥施用量、生猪存栏量三者之间得相关关系明显,这表明模型存在共线性。
B、共线性诊断
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
水稻播种面积(万亩)
化肥施用量(万公斤)
生猪存栏量(万口)
降水量(10mm)
1
1
4、383
1、000
、00
、00
、00
、00
、01
2
、486
3、003
、00
、00
、22
、00
、03
3
、113
6、238
、00
、00
、05
、01
、71
4
、018
15、426
、00
、00
、52
、82
、01
5
、000
204、508
1、00
1、00
、20
、17
、24
a、 因变量: 水稻总产量(万公斤)
第2个特征值,水稻播种面积与化肥施用量发生了多重共线性,第3个特征值化肥施用量与降水量发生了多重共线性,降水量与所有得自变量多重共线性。
C、通过各自变量得方差膨胀因子来判断
容差在0—1之间变化,越接近0说明共线性越强,越接近1说明共线性越弱。方差膨胀因子VIF,VIF越接近1说明共线性越弱,VIF大于10,说明自变量之间存在严重得多重共线性。
系数a
模型
非标准化系数
标准系数
t
Sig、
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
-160、312
410、391
-、391
、702
水稻播种面积(万亩)
1、878
2、836
、105
、662
、519
、250
4、002
化肥施用量(万公斤)
1、284
、379
、529
3、391
、005
、259
3、860
生猪存栏量(万口)
2、090
、885
、370
2、361
、034
、257
3、898
降水量(10mm)
、483
、359
、124
1、343
、202
、741
1、350
a、 因变量: 水稻总产量(万公斤)
自变量得VIF都就是小于10得,但就是水稻播种面积,化肥施用量,生猪存栏量容差接近1,说明共线性强。
5、自相关分析
模型汇总b
模型
R
R 方
调整 R 方
标准 估计得误差
Durbin-Watson
1
、958a
、918
、893
26、12780
2、705
a、 预测变量: (常量), 降水量(10mm), 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。
b、 因变量: 水稻总产量(万公斤)
该模型样本个数就是18,解释变量就是4,显著水平为0、05,此模型得DW=2、705,查到临界值Dl=0、82 Du=1、87,DW处于不确定区间,无法用DW检验检验。
6、逐步修正法
对模型进行逐步回归,得到下图:
系数a
模型
非标准化系数
标准系数
t
Sig、
共线性统计量
B
标准 误差
试用版
容差
VIF
1
(常量)
221、684
10、561
20、991
、000
化肥施用量(万公斤)
2、215
、247
、913
8、974
、000
1、000
1、000
2
(常量)
137、123
31、458
4、359
、001
化肥施用量(万公斤)
1、369
、366
、564
3、739
、002
、318
3、140
生猪存栏量(万口)
2、385
、851
、423
2、801
、013
、318
3、140
a、 因变量: 水稻总产量(万公斤)
得到两个回归模型:
Y1=221、684+2、215X2
Y2=137、123+1、369X2+2、385X3
模型1与模型2都通过了T检验,
Anovac
模型
平方与
df
均方
F
Sig、
1
回归
90221、429
1
90221、429
80、534
、000a
残差
17924、640
16
1120、290
总计
108146、069
17
2
回归
96376、790
2
48188、395
61、416
、000b
残差
11769、280
15
784、619
总计
108146、069
17
a、 预测变量: (常量), 化肥施用量(万公斤)。
b、 预测变量: (常量), 化肥施用量(万公斤), 生猪存栏量(万口)。
c、 因变量: 水稻总产量(万公斤)
由上图可以瞧出模型1与2都通过了F方检验,回归方程显著。
模型汇总
模型
R
R 方
调整 R 方
标准 估计得误差
1
、913a
、834
、824
33、47073
2
、944b
、891
、877
28、01105
a、 预测变量: (常量), 化肥施用量(万公斤)。
b、 预测变量: (常量), 化肥施用量(万公斤), 生猪存栏量(万口)。
从拟合优度来瞧,模型2得拟合优度最高,其次就是模型1、
展开阅读全文