1、贵州民族大学 实用回归分析论文 (GuizhouMinzu University) 论文题目:影响谷物的因素分析 年级:2014级 班级:应用统计班 小组成员: 姓名:黄邦秀 学号:201410100318 序号:4 姓名:王远 学号:201410100314 序号:26 姓名:陈江倩 学号:201410100326 序号:11 姓名:吴堂礼 学号: 时间:2016.12.06 目录 摘要: 3 关键词: 3 一、问题的提出 4 二、多元线性回归模型的基假设 4 三、收集整理统计数据
2、5 3.1数据的收集 5 3.2确定理论回归模型的数学形式 6 四、模型参数的估计、模型的检验与修改 6 4.1 SPSS软件运用 6 4.2 用SPSS软件,得到相关系数矩阵表 8 4.3 回归方程的显著性检验 9 4.4利用逐步回归法进行修正 10 4.5 DW检验法 11 五、结果分析 12 六、建议 12 七、参考文献 13 影响谷物的因素分析 摘要:在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数
3、据为样本,对影响中国谷物生产的多种因素进行了分析。分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。 关键词:谷物产量 影响因素 多元线性回归分析 一、问题的提出 我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。粮食生产的不稳定性
4、对国民经济的影响是不可忽略的,主要体现在:粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨,从而影响整个宏观经济。因此,对关系国计民生的这个特殊农产品,我们不得不慎重对待。因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。
二、多元线性回归模型的基假设
(1)解释变量x1,x2,x3,xp是确定性变量,不是随机变量,且要求rank(k)=p+1 5、尔柯夫条件。,即,假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相关的精度。
(3)正态分布的假定条件为:
对于多元线性回归的矩阵模式,这个条件便可表示为:
由上述假定和多元正态分布的性质可知,随机向量y服从n维正态分布,回归模型的期望向量
因此
三、收集整理统计数据
3.1数据的收集
选用了谷物产量y(万吨)、谷物零售价格指数x1、受灾面积x2(万公顷),化肥施用量x3(万吨),乡村农林牧渔业从业人员数x4(万人),谷物作物播种面积x5(千公顷 6、农用机械总动力x6(万千瓦),农村用电量x7(亿千瓦),把这7个指标的1994—2014年21年间的时间序列数据进行回归分析,来分析这些因素与谷物产量的关系。以谷物产量作为因变量,其它7个指标作为解释变量进行回归分析。
表1-1 1994-2014年度谷物产量影响因素表
谷物产量(万吨)y
价格指数x1
受灾面积(万公顷)x2
化肥施用量(万吨)x3
乡村农林牧渔业从业人员数(万人)x4
谷物作物播种面积(千公顷)x5
农用机械总动力(万千瓦)x6
农村用电量(亿千瓦 时)x7
1994
35450
110.2
3313.3
1513.4
31152.7
7、
113462
16614.2
396.9
1995
38727.5
99.9
3471.3
1659.8
31645.1
114047
19497.2
435.2
1996
40730.5
99.8
3188.7
1739.8
31685
112884
20912.5
464
1997
37910.8
110.9
4436.5
1775.8
30351.5
108845
22950
508.9
1998
39151.2
109.3
4713.5
1930.6
30467.9
110933
24836
586.7
1 8、999
40473.3
106.2
4208.6
1999.3
30870
111268
26575
658.8
2000
39408
114.1
5087.4
2141.5
31455.7
110123
28067
712
2001
40754.9
121.3
4699.1
2357.1
32440.5
112205
28707
790.5
2002
44624.3
95.2
3847.4
2590.3
33336.4
113466
29388
884.5
2003
43529.3
108.6
5547.2
28 9、05.1
34186.3
112314
30308.4
963.2
2004
44265.8
124.3
5133.3
2930.2
34037
110560
31816.6
1106.9
2005
45648.8
127.7
4882.9
3151.9
33258.2
110509
33802.5
1244.9
2006
44510.1
148.7
5504.3
3317.9
32690.3
109544
36118.1
1473.9
2007
46661.8
134.4
4582.1
3593.7
32334.5
10、110060
38546.9
1655.7
2008
50453.5
107.5
4698.9
3827.9
32260.4
112548
42015.6
1812.7
2009
49417.1
92.1
5342.9
3980.7
32677.9
112912
45207.7
1980.1
2010
51229.5
96.9
5014.5
4083.7
32626.4
113787
48996.1
2042.2
2011
50838.6
96.4
4998.1
4124.3
32911.8
113161
52573.6 11、
2173.2
2012
46217.5
90.1
5468.8
4146.4
32797.5
108463
55172.1
2421.3
2013
45263.7
101.5
5221.5
4253.8
32451
106080
57929.9
2610.8
2014
45705.8
98.6
4711.9
4339.4
31990.6
103891
60386.5
2993.4
注:数据来源相应年度的《中国统计年鉴》、《中国农村统计年鉴》、《中国农业发展报告》、《中华人民共和国年鉴》、《中国统计摘要》
3.2确定理论回归模型的数学 12、形式
通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为:
其中,y:谷物产量, x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量关系。可能有人会提出质疑,是否遗漏了其它重要的解释变量,的确像农业科技费用等这些因素对谷物 13、产量有重要的影响,但考虑农业科技费用会导致严重的多重共线性(因为它们与谷物单产有极高的正相关性),又考虑到它代表对农业的投入和科技进步,在选用指标中已有灌溉面积、农机总动力等性质相似的指标,再加上分析工具的局限性,因此就舍弃了这几个指标。这也是线性相关分析的局限性之一
四、模型参数的估计、模型的检验与修改
4.1 SPSS软件运用
将收集到的数据运用SPSS软件进行运算,可以得到以上模型设定的参数估计值,结果如下表
表4-1 系数a
模型
非标准化系数
标准系数
B
标准 误差
试用版
t
Sig.
1
(常量)
37259.895
24839.352
14、
1.500
.157
x1
-29.854
24.382
-.099
-1.224
.243
x2
-1.606
.581
-.251
-2.765
.016
x3
12.870
2.025
2.843
6.354
.000
x4
-.433
.291
-.100
-1.490
.160
x5
.043
.188
.025
.228
.823
x6
.136
.147
.400
.926
.371
x7
-12.366
3.115
-2.192
-3.970
.002
a. 因变量: y
表4-2 15、 模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.987a
.974
.960
906.04373
2.031
a. 预测变量: (常量), x7, x1, x4, x2, x5, x6, x3。
b. 因变量: y
由表4-2得 所以回归方程拟合较好
表4-3 Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.953E8
7
5.647E7
68.795
.000a
残差
1.067E7
13
820915.240
总计
4.060E8
20
16、
a. 预测变量: (常量), x7, x1, x4, x2, x5, x6, x3。
b. 因变量: y
由上表4-1和表4-2数据可得所求回归方程,, ,
4.2 用SPSS软件,得到相关系数矩阵表
由相关系数矩阵表得如下矩阵:
相关矩阵
从相关矩阵看出,y与x1,x2,x3,x4,x5,x6,x7的相关系数偏小,P值=0.232;偏小,P值=0.006;,P值=0.000;偏小,P值=0.002;偏小P值=0.481;偏小,P值=0.000;偏小,P值=0.000。x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物 17、作物播种面积,x6农用机械总动力,x7农村用电量,说明x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量对谷物产量无显著影响。自变量之间可能存在多重共线性,SPSS软件同时可以计算出相关系数显著性单侧和双侧检验的P值。
4.3 回归方程的显著性检验
F 检验
表4-4 Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.953E8
7
5.647E7
68.795
.000a
残差
1.067E7
13
820915.240
总计 18、
4.060E8
20
a. 预测变量: (常量), x7, x1, x4, x2, x5, x6, x3。
b. 因变量: y
,拒绝原假设,即作出7个自变量整体对因变量y显著影响
x1对应的t,对应的;x2对应的t,对应的;x3对应的t,对应的;x4对应的t,对应的;x5对应的t,对应的;x6对应的t,对应的;x7对应的t,对应的,所以x1、x4、x5、x6对y没有显著影响,只有x2、x3、x7通过系数的显著性检验。回归系数没有通过显著性检验的,将用逐步回归法重新建立回归方程。
4.4利用逐步回归法进行修正
4-5 模型汇总
模型
R
R 方
调 19、整 R 方
标准 估计的误差
1
.896a
.803
.793
2050.32352
2
.966b
.934
.927
1220.78525
3
.974c
.949
.940
1103.98755
a. 预测变量: (常量), x3。
b. 预测变量: (常量), x3, x5。
c. 预测变量: (常量), x3, x5, x7。
4-6 Anovad
模型
平方和
df
均方
F
Sig.
1
回归
3.261E8
1
3.261E8
77.577
.000a
残差
7.987E7
19
4203826.5 20、32
总计
4.060E8
20
2
回归
3.792E8
2
1.896E8
127.210
.000b
残差
2.683E7
18
1490316.627
总计
4.060E8
20
3
回归
3.853E8
3
1.284E8
105.371
.000c
残差
2.072E7
17
1218788.516
总计
4.060E8
20
a. 预测变量: (常量), x3。
b. 预测变量: (常量), x3, x5。
c. 预测变量: (常量), x3, x5, 21、x7。
d. 因变量: y
4-7 系数a
模型
非标准化系数
标准系数
B
标准 误差
试用版
t
Sig.
1
(常量)
31827.796
1437.037
22.148
.000
x3
4.057
.461
.896
8.808
.000
2
(常量)
-45087.994
12920.482
-3.490
.003
x3
4.738
.297
1.047
15.950
.000
x5
.675
.113
.392
5.966
.000
3
(常量)
-25062.601
14716 22、130
-1.703
.107
x3
7.331
1.189
1.620
6.165
.000
x5
.468
.138
.272
3.401
.003
x7
-3.613
1.614
-.641
-2.238
.039
a. 因变量: y
从表 输出结果看到,逐步回归的最优子集为模型3,回归方程为:
由回归方程可以看出,对谷物产量有显著性影响的是x3化肥施用量、x5谷物作物播种面积、x7农村用电量,回归方程中2个自变量的系数为正、1个系数为负,即化肥施用量和谷物作物播种面积越大,每万吨谷物产量越大;农村用电量越大,每万吨谷物产量越小。具 23、体说,在x5、x7保持不变时,x3每增加一个百分点,每万吨谷物产量平均增加7.331万吨,在x3、x7保持不变时,x5每增加一个百分点,每万吨谷物产量平均增加0.468万吨,在x3、x5保持不变时,x7每增加一个百分点,每万吨谷物产量平均减少3.613万吨。
4.5 DW检验法
4-8 残差统计量a
极小值
极大值
均值
标准 偏差
N
预测值
37091.8359
50786.3945
43855.8095
4389.04304
21
残差
-2284.96460
1848.82971
.00000
1017.82623
21
标准 预测值
-1 24、541
1.579
.000
1.000
21
标准 残差
-2.070
1.675
.000
.922
21
a. 因变量: y
模型汇总d
模型
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
Durbin-Watson
1
.803
77.577
1
19
.000
2
.131
35.594
1
18
.000
3
.015
5.010
1
17
.039
1.995
d. 因变量: y
由上表4-2可得,DW=1.995,,,,,所以误差项之间不存在自相关。
25、
五、结果分析
我们进行了一系列的检验和修正后的结果如下:
,DW=1.995,
从模型中可以看出:
1、 x1、x2、x4、x6不符合经济意义的检验,因为在实际上,谷物产量是随着x1谷物零售价格指数的增长而增加;谷物产量是随着x2受灾面积增广而减少,谷物产量是随着 x4乡村农林牧渔业从业人员数增加而增加, 谷物产量是随着x6农用机械总动力增加而减少,所以最新的模型的剔除了这4个在原模型的解释变量。
2、 新的模型表明:化肥施用量每增加1万吨,谷物产量提高7.331万吨; x5谷物作物播种面积增广一个单位,谷物产量提高0.468万吨;x7农村用电量增加一个单位,谷物产量就会减少3 26、613万吨
3、 可见,化肥使用量是影响谷物产量的显著性因素。但从经济意义上来说,施肥过度反而会导致谷物死亡,从而减产。
4、 所以我们的模型所反映的经济意义不能包括现实中的每一种情况。
六、建议
我们知道农业是一个国民经济的基础,谷物生产是关系到一个国家生存与发展的一个永恒的主题,再加上我国的人口庞大的基本国情,告诉我们。谷物产量对我国具有特别的意义和重要性。因而谷物产量生产关系到我们上至国家,下至人民的一件大事,每个人都应该促进和稳定谷物产量提高上做出努力,而政府在此当中的则是起着关键性的作用。
在此,我们建立的模型的基础上,就谷物产量的提高,提出了一些可供参考的政策。
1、 27、通过模型和上面的分析可以看出,谷物播种面积对产量提高有着重要的作用,所以我们应该在合理的基础上有目的的,有规划的提高耕地面积。
2、化肥使用量虽然对谷物增产有着积极作用,但物极必反,过度使用化肥必然在很大程度上降低土地肥力,抑制谷物的生产。
所以在合理控制化肥量的同时,也要加大对化肥质的提高。
总之,任何措施办法都应该在顺应自然的基础上,我们要保证谷物的稳定增长,就一定要注意走谷物生产的课持续发展之路。
七、参考文献
[1]何晓群,刘文卿.应用回归分析[M].中国人民大学出版社,2015.3
[]茆诗松,程依明.概率论与数理统计教程 [M].高等教育出版社,2011.2
九、 28、附录
y
x1
x2
x3
x4
x5
x6
x7
35450.00
110.20
3313.30
1513.40
31152.70
113462.00
16614.20
396.90
38727.50
99.90
3471.30
1659.80
31645.10
114047.00
19497.20
435.20
40730.50
99.80
3188.70
1739.80
31685.00
112884.00
20912.50
464.00
37910.80
110.90
4436.50
1775.80
30351. 29、50
108845.00
22950.00
508.90
39151.20
109.30
4713.50
1930.60
30467.90
110933.00
24836.00
586.70
40473.30
106.20
4208.60
1999.30
30870.00
111268.00
26575.00
658.80
39408.00
114.10
5087.40
2141.50
31455.70
110123.00
28067.00
712.00
40754.90
121.30
4699.10
2357.10
32440. 30、50
112205.00
28707.00
790.50
44624.30
95.20
3847.40
2590.30
33336.40
113466.00
29388.00
884.50
43529.30
108.60
5547.20
2805.10
34186.30
112314.00
30308.40
963.20
44265.80
124.30
5133.30
2930.20
34037.00
110560.00
31816.60
1106.90
45648.80
127.70
4882.90
3151.90
33258. 31、20
110509.00
33802.50
1244.90
44510.10
148.70
5504.30
3317.90
32690.30
109544.00
36118.10
1473.90
46661.80
134.40
4582.10
3593.70
32334.50
110060.00
38546.90
1655.70
50453.50
107.50
4698.90
3827.90
32260.40
112548.00
42015.60
1812.70
49417.10
92.10
5342.90
3980.70
326 32、77.90
112912.00
45207.70
1980.10
51229.50
96.90
5014.50
4083.70
32626.40
113787.00
48996.10
2042.20
50838.60
96.40
4998.10
4124.30
32911.80
113161.00
52573.60
2173.20
46217.50
90.10
5468.80
4146.40
32797.50
108463.00
55172.10
2421.30
45263.70
101.50
5221.50
4253.80
32 33、451.00
106080.00
57929.90
2610.80
45705.80
98.60
4711.90
4339.40
31990.60
103891.00
60386.50
2993.40
RES_1
ZRE_1
RES_2
ZRE_2
RES_3
ZRE_3
-2284.96469
-2.06974
-2284.96469
-2.06974
-2284.96469
-2.06974
-216.36815
-.19599
-216.36815
-.19599
-216.36815
-.19599
1848.82966 34、
1.67468
1848.82966
1.67468
1848.82966
1.67468
818.96416
.74182
818.96416
.74182
818.96416
.74182
227.71623
.20627
227.71623
.20627
227.71623
.20627
1149.77062
1.04147
1149.77062
1.04147
1149.77062
1.04147
-229.61509
-.20799
-229.61509
-.20799
-229.61509
-.20799
-1154.7 35、7540
-1.04600
-1154.77540
-1.04600
-1154.77540
-1.04600
754.02399
.68300
754.02399
.68300
754.02399
.68300
-1091.90979
-.98906
-1091.90979
-.98906
-1091.90979
-.98906
68.07069
.06166
68.07069
.06166
68.07069
.06166
348.19429
.31540
348.19429
.31540
348.19429
.31540
-728 36、17892
-.65959
-728.17892
-.65959
-728.17892
-.65959
-183.26470
-.16600
-183.26470
-.16600
-183.26470
-.16600
1293.50834
1.17167
1293.50834
1.17167
1293.50834
1.17167
-428.75600
-.38837
-428.75600
-.38837
-428.75600
-.38837
443.10673
.40137
443.10673
.40137
443.10673
.40 37、137
521.04426
.47197
521.04426
.47197
521.04426
.47197
-1165.49385
-1.05571
-1165.49385
-1.05571
-1165.49385
-1.05571
-1105.99133
-1.00182
-1105.99133
-1.00182
-1105.99133
-1.00182
1116.08896
1.01096
1116.08896
1.01096
1116.08896
1.01096
目 录
第一章 总 论 1
一、项目提要 1
二、可行 38、性研究报告编制依据 2
三、综合评价和论证结论 3
四、存在问题与建议 4
第二章 项目背景及必要性 5
一、项目建设背景 5
二、项目区农业产业化经营发展现状 11
三、项目建设的必要性及目的意义 12
第三章 建设条件 15
一、项目区概况 15
二、项目实施的有利条件 17
第四章 建设单位基本情况 19
一、建设单位概况 19
二、研发能力 20
三、财务状况 20
第五章 市场分析与销售方案 21
一、市场分析 21
二、产品生产及销售方案 22
三、销售策略及营销模式 22
四、销售队伍和销售网络建设 23
第六章 项目建设方案 24
39、一、建设任务和规模 24
二、项目规划和布局 24
三、生产技术方案与工艺流程 25
四、项目建设标准和具体建设内容 26
五、项目实施进度安排 27
第七章 投资估算和资金筹措 28
一、投资估算依据 28
二、项目建设投资估算 28
三、资金来源 29
四、年度投资与资金偿还计划 29
第八章 财务评价 30
一、财务评价的原则 30
二、主要参数的选择 30
三、财务估算 31
四、盈利能力分析 32
五、不确定性分析 33
六、财务评价结论 34
第九章 环境影响评价 35
一、环境影响 35
二、环境保护与治理措施 35
三、环保部门意见 36
第十章 农业产业化经营与农民增收效果评价 37
一、产业化经营 37
二、农民增收 38
三、其它社会影响 38
第十一章 项目组织与管理 40
一、组织机构与职能划分 40
二、项目经营管理模式 42
三、技术培训 42
四、劳动保护与安全卫生 43
第十二章 可行性研究结论与建议 46
一、可行性研究结论 46
二、建议 47






