收藏 分销(赏)

影响粮食产量的因素spss教学内容.doc

上传人:人****来 文档编号:4052655 上传时间:2024-07-26 格式:DOC 页数:20 大小:685.04KB 下载积分:10 金币
下载 相关 举报
影响粮食产量的因素spss教学内容.doc_第1页
第1页 / 共20页
影响粮食产量的因素spss教学内容.doc_第2页
第2页 / 共20页


点击查看更多>>
资源描述
影响粮食产量的因素spss 目录 摘要: II 一.前言 1 二.理论背景 1 2.1多元线性回归模型的基本理论 1 2.1.1多元线性回归模型一般形式 1 2.1.2多元线性回归模型的基本假定: 1 三.模型的建立及求解 2 3.1 一些基本的符号说明 2 3.2 多元回归模型的初步建立与初步检验 2 3.2.1 多元回归模型的初步建立 2 3.2.2 模型的初步检验 3 3.3 模型的优化 4 3.3.1多重共线性的诊断与模型的建立 4 3.3.1.1 多重共线性的诊断——方差扩大因子法 4 3.3.1.2 多重共线性的处理与检验 4 3.3.2 异方性差检验及处理 6 3.3.2.1 异方差检验 6 3.3.3 自相关性检验及处理 7 3.3.3.1 自相关检验 7 3.4 最终模型的确定 8 四.模型评价 8 参考文献 8 附录 10 影响我国粮食产量因素的分析 摘要: 本文主要对我国粮食产量的变动进行多因素分析,选取1990年-2007年18年的数据,利用SPSS软件,建立以粮食产量为被解释变量,以有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资为解释变量的多元线性回归模型,通过对模型进行异方差检验,自相关检验,自变量的选择以及多重共线性诊断,最后建立了合乎经济意义的粮食生产函数,从而通过对我国粮食生产的影响因素分析粮食产量的决定因素。 关键词:最小二乘估计 多元线性回归分析 异方差 自相关 多重共线性 残差图 怀特检验 迭代法,差分法 逐步回归 方差扩大因子。 一.前言 粮食是人类最基本的生活消费品,一个国家的粮食问题是关系到本国的国计民生的头等大事。人们都知道,农业是国民经济发展的基础,粮食是基础的基础,因此粮食生产是关系到一个国家生产与发展的一个永恒的主题。 根据理论和经验分析,影响粮食生产的主要因素有有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资。为此,本文收集了我国自1990年至2007年有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资的相关数据。数据资料均来源于《中国统计年鉴》,见附录一。 粮食的产量随着投入生产要素的变化而变化,反映出一种投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。多元线性函数就是用于表示农业生产投入产出的一种生产函数。 本文首先用最小二乘估计,建立多元线性回归模型,对参数进行估计,然后进行参数检验,方程显著性检验,经济意义的检验。通过建立数学模型来研究我国粮食投入与产出的生产函数,找出影响粮食产量的关键指标加以改善,确保粮食产量稳步增长,建立粮食生产模型,且对此模型进行评估。 二.理论背景 2.1多元线性回归模型的基本理论 2.1.1多元线性回归模型一般形式 设随机变量与一般变量的理论线性回归模型为:...(1),其中是个未知参数,称为回归常数,称为回归系数。y称为被解释变量(因变量),是个可以精确测量并可控制的一般变量,称为解释变量(自变量),是随机误差。 对一个实际问题,如果我们获得n组观测数据(),则线性回归模型(1)式可表示为: 写成矩阵的形式为:,是一个阶矩阵,称为回归设计矩阵或资料矩阵。 2.1.2多元线性回归模型的基本假定: 为了方便地进行模型的参数估计,对回归方程(2)式有如下一些基本的假定: (1)解释变量是确定性变量,不是随机变量,且要求 ,这里的,表明设计矩阵中的自变量列之间不相关,样本量的个数应大于解释变量的个数,是以个满秩矩阵。 (2)高斯-马尔科夫条件:随机误差项具有零均值和同方差性,即: ; ; ; 即假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本之间是不相关的,不存在序列相关,并且有相同的精度。 (3)正态分布的假定条件为: 对于多元线性回归的矩阵模型(3)式,这个条件还可以表示为:~,由上述假定和多元正态分布的性质可知,随机向量服从维正态分布,回归模型(3)式的期望向量,因此~ 三.模型的建立及求解 3.1 一些基本的符号说明 用表示粮食产量(万吨);表示有效灌溉面积(千公顷);表示播种面积(千公顷);表示化肥施用量(万吨);表示是受灾面积(千公顷);表示农用机械总动力(万千瓦时);表示农业基本建设投资(亿元)。 3.2 多元回归模型的初步建立与初步检验 3.2.1 多元回归模型的初步建立 (1)建立粮食产量与有效灌溉面积、播种面积化肥施用量,受灾面积,农业机械总动力,农业基本建设投资的一个6元线性回归模型: 其中:是待定参数. (2)利用SPSS软件,通过最小二乘估计得到系数的估计值,结果如表5-1所示: 表5-1 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -47279.746 11670.296 -4.051 .002 有效灌溉面积 .885 .411 .976 2.151 .055 播种面积 .464 .056 .760 8.260 .000 化肥施用量 7.395 .690 2.029 10.724 .000 受灾面积 -.144 .024 -.318 -6.004 .000 农业机械总动力 -.576 .159 -3.342 -3.629 .004 农业基本建设投资 3.582 .999 1.342 3.587 .004 a. 因变量: 粮食产量 表5-2 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .992a .985 .976 417.705661814464900 a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。 表5-3 Anovab 模型 平方和 df 均方 F Sig. 1 回归 1.223E8 6 20386377.595 116.842 .000a 残差 1919258.219 11 174478.020 总计 1.242E8 17 a. 预测变量: (常量), x6, x4, x2, x3, x1, x5。 b. 因变量: y 3.2.2 模型的初步检验 (1)由输出结果我们可以清楚的看到此多元回归的经验方程为: (2) 从coefficient系数表(表5-1)中可以看到,回归系数检验的t值分别为-4.051、2.151、8.260、10.724、-6.004、-3.629、3.587,自变量t检验的临界值均大于,且从收尾率也可以看出回归系数通过检验,即自变量对被解释变量有显著影响;我们再从模型汇总表(model summary)表5-2来做分析。 (3)从模型汇总(model summary)表中可以看到,决定系数,从相对水平上看,回归方程能够减少因变量y的99.8%的方差波动,回归标准差,从绝对水平上看,y的标准差从回归前的2703.347856减少到回归后的417.70566181;从以下的方差分析(ANOVA)表5-3进行分析。 (4)从方差分析(ANOVA)表中看到,,Sig=0,说明y对自变量有显著的线性关系,回归方程是显著的; 从上的分析中可以回归系数的显著性检验及方程的显著性检验均通过,但是回归系数x5的正负号不符合经济意义,x5代表农用机械总动力,它的参数负,意味着投入农用机械总动力越高,粮食产量越低,从经济行为上无法解释。我们首先考虑它是否存在多重共线性,因为农业投入资金与化肥的施用量,灌溉面积,农业机械总动力有很强的相关性。 3.3 模型的优化 3.3.1多重共线性的诊断与模型的建立 3.3.1.1 多重共线性的诊断——方差扩大因子法 下表5-4、5-5是对其进行多重共线性诊断。 表5-4 系数a 模型 共线性统计量 容差 VIF 1 灌溉面积 .007 146.601 播种面积 .166 6.023 化肥使用量 .039 25.497 受灾面积 .501 1.996 农业机械总动力 .002 603.981 农业基本建设投资 .010 99.767 a. 因变量: 粮食产量 表5-5 共线性诊断a 模型 维数 特征值 条件索引 方差比例 (常量) 灌溉面积 播种面积 化肥使用量 受灾面积 农业机械总动力 农业基本建设投资 1 1 6.520 1.000 .00 .00 .00 .00 .00 .00 .00 2 .461 3.759 .00 .00 .00 .00 .00 .00 .01 3 .009 26.444 .00 .00 .00 .01 .53 .00 .03 4 .008 29.419 .00 .00 .01 .04 .07 .00 .06 5 .001 78.204 .00 .00 .02 .53 .00 .04 .06 6 .000 175.787 .14 .00 .50 .36 .02 .08 .07 7 1.489E-5 661.662 .86 1.00 .47 .05 .38 .87 .77 a. 因变量: 粮食产量 从表5-4中可以看出的方差扩大因子均大于10,说明自变量间存在严重的多重共线性,从表5-5中最大的条件数也可以说明自变量间存在严重的共线性。再者第七行中的方差比例同时较大,说明间存在多重共线性。 从表5-4的输出结果中看到,的方差扩大因子为最大,远大于10,并且的回归系数为负值。所以考虑模型是否存在多重共线性。 3.3.1.2 多重共线性的处理与检验 (一)多重共线性的处理 首先 剔除建立y对五个自变量的回归方程,计算结果如表5-6所示。 表5-6 系数a 模型 非标准化系数 标准系数 t Sig. 共线性统计量 B 标准 误差 试用版 容差 VIF 1 (常量) -14899.383 10674.563 -1.396 .188 灌溉面积 -.500 .217 -.552 -2.300 .040 .049 20.349 播种面积 .629 .047 1.029 13.346 .000 .476 2.101 化肥使用量 6.089 .835 1.671 7.294 .000 .054 18.553 受灾面积 -.091 .027 -.202 -3.370 .006 .791 1.265 农业基本建设投资 .075 .358 .028 .210 .837 .157 6.360 a. 因变量: 粮食产量 再次 从表5-4的输出结果中看到,x1的方差扩大因子为最大,远大于10,并且x1的回归系数仍为负值,因此首先剔除x1建立y对四个自变量x2,x3,x4,x6的回归方程,计算结果如表5-7所示。 表5-7 系数a 模型 非标准化系数 标准系数 t Sig. 共线性统计量 B 标准 误差 试用版 容差 VIF 1 (常量) -35825.060 6440.979 -5.562 .000 播种面积 .650 .053 1.064 12.195 .000 .495 2.022 化肥使用量 4.438 .492 1.218 9.023 .000 .206 4.843 受灾面积 -.105 .030 -.232 -3.443 .004 .831 1.204 农业基本建设投资 -.127 .400 -.048 -.318 .755 .167 5.975 a. 因变量: 粮食产量 最后 从表5-7的输出结果中看到,自变量的方差扩大因子均小于10,但回归系数x6的符号仍然不符合经济意义的解释,这是由于农业基本建设投资与化肥的使用量、灌溉面积有着很强的相关性,因此将x6剔除后再做回归,结果如表5-8所示: 表5-8 系数a 模型 非标准化系数 标准系数 t Sig. 共线性统计量 B 标准 误差 试用版 容差 VIF 1 (常量) -36263.297 6087.009 -5.957 .000 播种面积 .656 .048 1.073 13.579 .000 .564 1.774 化肥使用量 4.314 .288 1.184 14.966 .000 .563 1.777 受灾面积 -.102 .028 -.225 -3.658 .003 .934 1.070 a. 因变量: 粮食产量 表5-9 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .975a .951 .940 661.367554285573500 1.426 a. 预测变量: (常量), 受灾面积, 播种面积, 化肥使用量。 b. 因变量: 粮食产量 (二).多重共线性的检验 从表5-8的输出结果中看到,自变量的方差扩大因子均小于10,回归系数的符号也符合经济意义的解释,,拒绝零假设,回归方程显著,各回归系数的t统计量均大于,各自变量对y有显著线性关系。 由表5-9知:此回归方程的样本决定系数,调整样本决定系数,而y对3个自变量的全模型样本决定系数,与全模型(1)式相比较,(2)式的拟合度仍然很高。 所以最后的回归方程为,即粮食生产函数。 现在我们来看以上的回归模型是否满足了回归的基本假设。 3.3.2 异方性差检验及处理 3.3.2.1 异方差检验 第一 残差图分析法 图3-1 从残差图以及等级相关系数表(见附录)中我们大致可以判断该模型不存在异方差问题,为了更加精确的判定该模型的确不存在异方差问题,下面通过怀特检验来加以验证。 第二 white检验法 表5-10 Heteroskedasticity Test: White F-statistic 0.768046     Prob. F(9,8) 0.6506 Obs*R-squared 8.343615     Prob. Chi-Square(9) 0.4999 Scaled explained SS 4.027407     Prob. Chi-Square(9) 0.9096 从怀特检验的显示的结果可以看出:,且收尾率远大于显著性水平,所以接受原假设,残差不存在异方差性,与残差图的检验结果是一致的。 3.3.3 自相关性检验及处理 3.3.3.1 自相关检验 第一 残差图分析法 图3-2 从图5-2我们大致判断该系列不存在自相关,从表5-9中的可以知道,不能判断序列是否存在自相关性,下面通过LM检验来加以验证。 第二 LM检验法 表5-11 Breusch-Godfrey Serial Correlation LM Test: F-statistic 1.146164     Prob. F(2,12) 0.3503 Obs*R-squared 2.886997     Prob. Chi-Square(2) 0.2361 从LM=知:回归模型不存在序列自相关性。 所以由上述检验知道上面建立的生产函数拟合效果很好,符合多元回归模型的一些基本的假定。 3.4 最终模型的确定 所以最后的回归方程为,即粮食生产函数。通过以上的分析,我们得出结论:粮食产量与粮食作物播种面积、化肥使用量、受灾面积有着密切的关系。 四.模型评价 以上模型采用依次剔除方差因子大于10的自变量后,克服了多重共线性的影响,异方差的检验以及自相关的检验后,该模型不存在异方差及自相关,且该方程的经济意义已经合理,已经满足回归模型的三条基本假设,粮食产量与粮食作物播种面积、化肥使用量、受灾面积有着密切的关系。由于其他各种因素可能存在很严重的多重共线性,导致系数符号与经济事实不相符所以不予采用,但其对粮食产量的影响是不可忽视的。各个因素单个拿出来与粮食产量的回归都取得可很高的可决系数,t检验与F检验也都很显著。 参考文献 【1】何晓群 刘文卿.运用回归分析【M】.中国人民大学出版社.2011. 【2】易丹辉.数据分析与EViews运用【M】.中国人民大学出版社.2011. 附录 附录一 表1-1 年份 粮食产量(万吨) 有效灌溉面积(千公顷) 粮食作物播种面积(千公顷) 化肥使用量(万吨) 受灾面积(千公顷) 农用机械总动力(万千瓦时) 农业基本建设投资(亿元) 1990 44624.3 47403.1 113466 2590.3 38474 28707.7 67.2 1991 43529.3 47822.1 112314 2805.1 55472 29388.6 85 1992 44265.8 48590.1 110560 2930.2 51333 30308.4 111 1993 45648.8 48727.9 110509 3151.9 48829 31816.6 127.8 1994 44510.1 48759.1 109544 3317.9 55043 33802.5 154.9 1995 46661.8 49281.2 110060 3593.7 45821 36118.1 219.1 1996 50453.5 50381.4 112548 3827.9 46989 38546.9 317.9 1997 49417.1 51238.5 112912 3980.7 53429 42015.6 412.7 1998 51229.5 52295.6 113787 4083.7 50145 45207.7 637.1 1999 50838.6 53158.4 113161 4124.3 49981 48996.1 835.5 2000 46217.5 53820.3 108463 4146.4 54688 52573.6 940 2001 45263.7 54249.4 106080 4253.8 52215 55172.1 993.4 2002 45705.8 54354.9 103891 4339.4 47119 57929.9 1291.6 2003 43069.5 54014.2 99410 4411.6 54506 60386.5 1652.3 2004 46946.9 54478.4 101606 4636.6 37106 64027.9 1890.7 2005 48402.2 55029.3 104278 4766.2 38818 68397.8 2323.7 2006 49804.2 55750.5 104958 4927.7 41091 72522.1 2749.9 2007 50160.3 56518.3 105638 5107.8 48992 76589.6 3403.5 附录二 表2-1 全回归模型的结果表 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .992a .985 .976 417.705661814464900 2.458 a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。 b. 因变量: 粮食产量 Anovab 模型 平方和 df 均方 F Sig. 1 回归 1.223E8 6 20386377.595 116.842 .000a 残差 1919258.219 11 174478.020 总计 1.242E8 17 a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。 b. 因变量: 粮食产量 系数a 模型 非标准化系数 标准系数 t Sig. B 的 95.0% 置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 VIF 1 (常量) -47279.746 11670.296 -4.051 .002 -72965.894 -21593.598 有效灌溉面积 .885 .411 .976 2.151 .055 -.020 1.790 .431 .544 .081 .007 146.601 播种面积 .464 .056 .760 8.260 .000 .341 .588 .245 .928 .310 .166 6.023 化肥施用量 7.395 .690 2.029 10.724 .000 5.877 8.913 .533 .955 .402 .039 25.497 受灾面积 -.144 .024 -.318 -6.004 .000 -.196 -.091 -.254 -.875 -.225 .501 1.996 农业机械总动力 -.576 .159 -3.342 -3.629 .004 -.925 -.227 .380 -.738 -.136 .002 603.981 农业基本建设投资 3.582 .999 1.342 3.587 .004 1.384 5.781 .362 .734 .134 .010 99.767 a. 因变量: 粮食产量 共线性诊断a 模型 维数 特征值 条件索引 方差比例 (常量) 有效灌溉面积 播种面积 化肥施用量 受灾面积 农业机械总动力 农业基本建设投资 1 1 6.520 1.000 .00 .00 .00 .00 .00 .00 .00 2 .461 3.759 .00 .00 .00 .00 .00 .00 .01 3 .009 26.444 .00 .00 .00 .01 .53 .00 .03 4 .008 29.419 .00 .00 .01 .04 .07 .00 .06 5 .001 78.204 .00 .00 .02 .53 .00 .04 .06 6 .000 175.787 .14 .00 .50 .36 .02 .08 .07 7 1.489E-5 661.662 .86 1.00 .47 .05 .38 .87 .77 a. 因变量: 粮食产量 相关性 粮食产量 有效灌溉面积 播种面积 化肥施用量 受灾面积 农用机械总动力 农业基本建设投资 粮食产量 Pearson 相关性 1 .431* .245 .533* -.254 .380 .362 显著性(单侧) .037 .164 .011 .154 .060 .070 N 18 18 18 18 18 18 18 有效灌溉面积 Pearson 相关性 .431* 1 -.686** .971** -.203 .973** .888** 显著性(单侧) .037 .001 .000 .210 .000 .000 N 18 18 18 18 18 18 18 播种面积 Pearson 相关性 .245 -.686** 1 -.656** .232 -.751** -.708** 显著性(单侧) .164 .001 .002 .178 .000 .001 N 18 18 18 18 18 18 18 化肥施用量 Pearson 相关性 .533* .971** -.656** 1 -.235 .960** .885** 显著性(单侧) .011 .000 .002 .174 .000 .000 N 18 18 18 18 18 18 18 受灾面积 Pearson 相关性 -.254 -.203 .232 -.235 1 -.315 -.365 显著性(单侧) .154 .210 .178 .174 .101 .068 N 18 18 18 18 18 18 18 农用机械总动力 Pearson 相关性 .380 .973** -.751** .960** -.315 1 .964** 显著性(单侧) .060 .000 .000 .000 .101 .000 N 18 18 18 18 18 18 18 农业基本建设投资 Pearson 相关性 .362 .888** -.708** .885** -.365 .964** 1 显著性(单侧) .070 .000 .001 .000 .068 .000 N 18 18 18 18 18 18 18 Unstandardized Residual Pearson 相关性 .124 .000 .000 .000 .000 .000 .000 显著性(单侧) .312 .500 .500 .500 .500 .500 .500 N 18 18 18 18 18 18 18 *. 在 0.05 水平(单侧)上显著相关。 **. 在 .01 水平(单侧)上显著相关。 描述性统计量 均值 标准 偏差 N 粮食产量 47041.60555555555000 2703.347856764497000 18 有效灌溉面积 51992.92777777779000 2982.498723594335000 18 播种面积 108510.28 4421.581 18 化肥施用量 3944.178 741.8620 18 受灾面积 48336.17 5975.525 18 农用机械总动力 48472.64999999999000 15684.781784649058000 18 农业基本建设投资 1011.850 1013.0752 18 附录三 表3-1 White检验的部分结果 Heteroskedasticity Test: White F-statistic 0.768046     Prob. F(9,8) 0.6506 Obs*R-squared 8.343615     Prob. Chi-Square(9) 0.4999 Scaled explained SS 4.027407     Prob. Chi-Square(9) 0.9096 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/17/12 Time: 13:10 Sample: 1990 2007 Included observations: 18 Coefficient Std. Error t-Statistic Prob.   C -4.91E+08 2.91E+08 -1.688866 0.1297 X2 6694.356 3729.917 1.794774 0.1104 X2^2 -0.021595 0.011885 -1.817051 0.1067 X2*X3 -0.402303 0.318636 -1.262579 0.2423 X2*X4 -0.007487 0.010348 -0.723498 0.4900 X3 54182.56 41278.53 1.312609 0.2257 X3^2 -1.357037 0.843810 -1.608227 0.1465 X3*X4 0.007303 0.053199 0.137270 0.8942 X4 725.8455 1191.145 0.609368 0.5592 X4^2 0.000784 0.006003 0.130677 0.8993 R-squared 0.463534     Mean dependent var 340205.5 Adjusted R-squared -0.139990     S.D. dependent var
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服