1、 我国农民收入影响因素的多元线性回归分析 精品资料 我国农民收入影响因素的多元线性回归分析 院系名称: 外国语学院 专 业: 英语(商务) 班 级: 14 级2 班 学 号: 140413217 学生姓名: 王 蒙 蒙 任课教师: 李 世 纪 摘要 : 我国一直以来就是农业大国,但始终存在农村经济落后、农民收入增长缓慢等问题,这势必成为我国经济持续稳定增长的障碍。因此正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。目前,农民收入问题受到了全社会的关注。而影响农民
2、收入的因素却有很多,本文在分析了现阶段我国农业现状的基础上,通过研究农村从业人员占总人数的比重、第二、三产业从业人数占全社会从业人数的比重等内部因素,及农作物总播种面积、农业化肥施用量等外部因素来分析其对农民收入的影响程度。我们通过建立多元线性回归模型进行分析。并采用SPSS对该模型进行检验,在该模型的基础上对影响农民收入的因素进行全面的概括,并提出合理性的建议。 自改革开放以来,虽然中国经济平均增长速度为9.5 % ,但二元经济结构给经济发展带来的问题仍然很突出。农村人口占了中国总人口的70 %多,农业产业结构不合理,经济不发达,以及农民收入增长缓慢等问题势必成为我国经济持续稳定增长的障碍
3、正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。其中,农民收入增长是核心,也是解决“三农”问题的关键。本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,寻找其根源,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。 关键词:多元线性回归模型;模型检验;SPSS;中国农民收入影响因素。 Abstract:The regression analysis is an important part of the statistical analysis model using regression analys
4、is method to study the problem. It is a common and effective method in the study of practical problems. By studying the relationship between the random variables to grasp the main features of the data groups. This article points out the general steps of the regression analysis method and problem-sol
5、ving. A brief introduction of the two types of relationships between variables, which leads to the definition of a basic linear regression analysis method and its solution to the regression analysis of that we can have an initial understanding. Secondly, we elaborated theoretical model of multiple l
6、inear regression, and lists the assumptions of a multiple linear regression model to be followed to explore the unknown parameter estimation method in the multiple linear regression model and its parameters of the test. Finally, through specific case to summarize the extensive application of the mul
7、tiple regression analysis in various fields of science, focusing on description of the multiple linear regression analysis significantly with sexual judgment independent variable on the dependent variable method, the predict the of role and the using of it’s integrated . Keywords: multiple linea
8、r regression model; test of significance; the SPSS; instance of the application; regression analysis on the influencing factors of farmers' income in China. 目 录 摘要.............................................................. 1 Abstract...............................................
9、 2 引言........................ ..................................... 3 一、研究目的要求........................................ ......... 4 二、计量经济模型分析........................................ ..... 5 2.1 数据搜集.............. ....................... ...... .... 5 2.2计量经济学模型建立 ....................
10、 ..............6 2.2.1散点图分析......................... .....................6 三、计量经济模型检验.............. ....................... ....... 7 3.1、经济意义检验...................... ...... ................9 3.2、统计检验....................... ...... ….................10 3.2.1、拟合优度检验........................
11、10 3.2.2、F检验....................... ...... ...... ............10 3.2.3、t检验....................... ..... ....................10 3.2.4、置信区间.... .......................................... 11 3.3、模型的最终结果...................... ..... ................ 13 四、方差分析................. ..
12、 ..... ..... 13 五、模型预测.................... ...... ........ ...................15 六、模型总结.................... ...... ........ ..................16 参考文献.................... ...... .......................... 17 引 言 我国一直以来就是农业大国,但始终存在农村经济落后、农民收入增长缓慢等问题,这势必成为我国经济持
13、续稳定增长的障碍。因此正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。在利用回归分析解决问题时,首先要建立模型,即函数关系式,其自变量称为回归变量,因变量称为应变量或响应变量。如果模型中只含有一个回归变量,称为一元回归模型,否则称为多元回归模型(实际中所见到的大都是线性回归模型,非线性的一般可以化为线性的来处理)。 随之社会经济的发展和时代环境的改变,近几年来虽然我国农民居民的纯收入水平 明显有所改变,居民收入的绝对量在不断增长,但增长的幅度在不断下滑,农民的内部收入出现了严重的失衡。因此,本文通过对农民收入变动的多因素,以农作物总播种面积、农产品生产价格总指数、第一
14、产业就业人数占全社会就业人数的比重、农村用电量、财政支出对农业的投入等影响因素为自变量,建立多元线性回归分析模型并进行研究分析,这对将来农民提高收入水平起着至关重要的意义。 一、研究目的要求 农民收入水平的度量,通常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。目前农业收入仍是中西部地区农民收入的主要来源。二是农业剩余劳动力转移水平。中国的农业目前仍以农户分散经营为主, 农业比较效益低,尽快地把农业剩余劳动力转移出去是有
15、效改善农民收入状况的重要因素。三是城市化、工业化水平。中国多数地区城市化、工业化水平落后于世界平均水平,这种状况极大地影响了农民收入的增长。四是农业产业结构状况。农林牧渔业对农民收入增长贡献率是不同的。随着我国“入世”后农产品市场的开放和人民生活水平的提高、农产品需求市场的改变,农业结构状况直接影响着农民收入的增长。五是农业投入水平。农民收入与财政农业支出、农村集体投入、农户个人投入以及信贷投入都有显著的正相关关系。农业投入是农民收入增长的重要保证。但考虑到农业投入主体的多元性,既有国家、集体和农户的投入,又有银行、企业和外资的投入,考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨
16、论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 二、计量经济模型分析 1、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:x1-财政用于农业的支出的比重,x2 -乡村从业人员占农村人口的比重,x3 -农作物播种面积。 Y X1 X2 X3 年份 78年可比价 比重 比重 千公顷 1993 133.6 13.43 36.01 150104.07 1994 137.63 12.2 38.62 146379.53 1995 147
17、86 7.66 45.9 143625.87 1996 196.76 9.42 49.23 146553.93 1997 220.53 9.98 49.93 148362.27 1998 223.25 10.26 50.92 149585.8 1999 233.19 10.05 51.53 149007.1 2000 265.67 9.49 51.86 147740.7 2001 335.16 9.2 52.12 148240.6 2002 441.29 8.43 52.41 149879.3 2003 460.
18、68 8.82 53.23 152380.6 2004 477.96 8.3 54.93 153969.2 2005 474.02 10.69 55.84 155705.7 2006 466.8 8.23 57.16 156372.81 2007 466.16 7.75 59.33 156299.85 2008 469.8 7.71 60.62 155707.86 2009 468.95 7.17 62.02 154635.51 2010 476.24 7.12 63.72 152414.96 2011 499.3
19、9 9.67 65.64 153552.55 2012 521.20 7.22 67.59 155487.73 资料来源《中国统计年鉴2013》 2.计量经济学模型建立 Yt=β0+β1X1 + β2X2 + β3X3 散点图分析: Y关于X1的散点图: 可以看出Y和X1成线性相关关系 Y关于X2的散点图: 可以看出Y和X2成线性相关关系
20、 Y关于X3的散点图: 可以看出Y和X3成线性相关关系 回归检验 三、模型检验: 1. 经济意义检验 模型估计结果表明: 在假定其他解释变量不变的情况下,当财政用于农业支出的比重增长一个百分点,农民人均纯收入就会增加-14.31772%; 在假定其他解释变量不变的情况下,当乡村从业人员占农村人口的比重增长一个百分点,农民人均纯收入就会增加6.123952%; 在假定其他解释变量不变的情况下,当农作物播种面积增长一千公顷,农民人均纯收入就会增加0.020337元;
21、 2、 统计检验 (1)、拟合优度检验 由于 , 所以 0.885300, =0.863793, 可见模型在整体上拟合得非常好。 (2)、F 检验 由于 所以 =41.16462 , 针对,给定显著性水平,在F分布表中查出自由度为k-1=3和n-k-1=16的临界值。由表3.4中得到F=41.16462 ,由于F=41.16462 >应拒绝原假设,说明回归方程显著,即“财政用于农业支出的比重”、“乡村从业人员占农村人口的比重”、“农作物播种面积”等变量联合起来确实对“农民收入”有显著影响。 (3)、t 检验 由于 =2759
22、559375 且599.852494,11.632384, 0.03196669,0.0047479, 当, 4.868962 在时, (16)=2.120因为t=4.868962>2.120,所以在95%的置信度下拒绝原假设,说明截距项对回归方程影响显著。 当 1.230850 在时,(16)=2.120因为t=1.23085<2.120所以在95%的置信度下接受原假设,说明X1变量对Y影响不显著。 当 191.572852 在时,(16)=2.120因为t=191.572852>2.120,所以在95%的置信度下拒绝原假设,说明X2变量对Y影响
23、显著。 当 0.428337 在时,(16)=2.120因为t=0.428337<2.120,所以在95%的置信度下接受原假设,说明X3变量对Y影响不显著。 (4)、的置信区间 的置信区间为:,计算得: (-4192.346287,-1648.971713); 的置信区间为:,计算得: (-38.978374,10.342934); 的置信区间为:,计算得: (6.056183,6.191721); 的置信区间为:,计算得:; (0.010271,0.030403) 综上所述,模型通过各种检验,符合要求。 四、方差分析(新增解释变量对被解释变量
24、边际贡献显著性的分析) 引入不同解释变量的ESS,RSS, 首先做Y对的回归,得到样本回归方程为 -2920.659-14.31772 (-4.868962) (-1.230850) =5064.34336, 44152.95 =0.885300, 由t检验可知,对Y有显著影响。=0.409922 表明,对于农民收入Y来说,财政用于农业支出的比重只解释了Y的总离差的40%,还有60%没有解释。 引入第二个解释变量后,样本回归方程为: =-2920.659-14.31772+6.123952 =23338.1805, 94783.19,=0.753773
25、 新引入的方差分析表 变差来源 平方和 自由度 F统计量 对回归 =5064.34336 1 对和回归 =23338.1805 2 对和回归,新增的部分对和回归的残差 -=18273.8371 RSS= 94783.19 1 20-3=17 F=26.02092 对于给定的显著性水平=0.05,查F分布表可得临界值,由于F=26.02092>4.45,所以新引入的解释变量是显著的,的引入可以显著的提高对Y的解释程度,即的边际贡献较大,因此从0.409922提高到0.753773,RSS从227145.6降低到94783
26、19 再引入第三个解释变量: =-2920.659-14.31172+6.123952+0.020337 =5064.34336, 44152.95,=0.885300; 新引入的方差分析表 变差来源 平方和 自由度 F统计量 对和回归 =23338.1805, 2 对,和回归 =5064.34336 3 对,和回归,由新增的部分对,和回归的残差 -=-18273.837 44152.95 1 20-4=16 F=41.16462 查F分布表可得临界值=4.49,F=41.16462>4.49,所以新引入的解释变量显著,即的
27、边际贡献较大,因此从0.753773提高到0.885300,RSS从94783.19下降到44152.95,因此应该引入。 只引入一个解释变量,或;引入两个解释变量和,和或和;以及引入三个变量的ESS,RSS和的结果如表 引入不同解释变量时的ESS,RSS, 引入解释变量 回归平方和ESS 残差平方和RSS 判定系数 = 134035.392 227148.6, =0.409922 =23420.7 RSS=94950.58 =0.753338 =25355.194 =98794.04 =0.743353 , =23338.1805 94783.
28、19 =0.753773 , =772.286143 5452.15 =0.858352 , =6068.82143 =48333.65 =0.874439 =5064.34336 44152.95 =0.885300 由Eviews可得,只引入一个解释变量,,时的F统计量分别为=12.5044,=54.97425,=52.13528,由,和都大于临界值,所以如果单独用,或作解释变量都显著,如果引入两个解释变量,显然引入,的结果最好,如果引入三个解释变量无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回顾方程为 : =-2920.6
29、59-14.31772+6.123952-0.020337 =0.885300 =0.863793 结论: 本文主要通过由浅入深的依次描述回归分析方法中:两类变量间的关系;一元线性回归分析的具体定义及其模型建立;运用二元线性回归分析方法建立模型解决实际问题的简单步骤;紧接着引出了多元线性回归分析方法的基本定义以及用最小二乘法估计回归方程参数的一般通用方法,并再次重点阐述了得出估计参数后对回归方程所进行的相应的,为验证所建模型合理的三种检验过程即回归方程的显著性检验( F检验)、回归方程拟合度检验(R检验)、回归系数的显著性检验(t检验)。 通过上述过程中回归分析方法的概念性总结与
30、叙述,之后结合多元线性回归分析方法在自变量对因变量影响的显著性判断的应用,多元线性回归分析方法在事物中预测作用及多元线性回归分析方法的综合运用三种应用实例,研究得出多元线性回归分析方法在实际运用中的一般应用步骤: (1)从一组数据出发,确定这些变量(参数)间的定量关系(回归模型); (2)对模型的可信度进行回归方程的显著性检验( F检验)、回归方程拟合度检验(R检验)、回归系数的显著性检验(t检验)。 (3)从有关的许多变量中,通过SPSS软件计算结果,判断变量的显著性(即哪些是显著的,哪些是不显著的,显著的保留,不显著的忽略)以及判断方程是否合理,合理可以运用于预测和后期事物判断,不
31、合理的进行模型修正; (4)应用建立模型所得到的结果对实际问题做出判断。 1、在模型的假设时,我们假定了农作物总播种面积、农产品生产价格总指数、第一产 业就业人数占全社会就业人数的比重、农村用电量、财政支出对农业的投入对农民收入的影响。而从最终确定的模型来看,只保留了农作物总播种面积、第一产业就业人数占全社会就业人数的比重、财政支出对农业的投入对农业收入的影响;因此,政府应当尽量减少政府支出的中间环节,通过规范化和透明化的支出政策支持农村经济发展,促进农民增收;在加大政府投入的同时,应利用财政、金融、税收等优惠政策吸引民间资金及外资加大对农业的科技投入,以改变我国农业投资收益率过低的现
32、状,形成农业投资收益的良性循环,从而在根本上解决农民增收这一问题。 2、农民的主要收入还是来自农业生产,必须保证合理的农作物播种面积,是农民增收的前提;倘若不能保证基本的耕地资源,农作物的播种面积势必会下降。从模型中可以看出,农作物播种面积的边际系数并不大,这说明我国单位土地的产出不高,农业规模化和商品化程度不高,农业生产整体效益较低。因此,国家应该保证耕地面积的同时,积极推广优质农作物品种的种植,大力倡导新型农业、生态农业,竭力支持那样的商品化和产业化经营,提高我国农业生产的整体效益。 五、模型预测 设2006年农民收入为540.60亿元,财政收入用于农业支出的比重为8.10,
33、乡村从业人员占农村人口的比重7.80,农作物的播种面积为156087.73将值代入样本回归方程,得到2006年的各项税收总量预测值的点估计值Y,因此 Y=-2920.659-14.31772*8.10-6.123952*7.80+0.020337*156087.73,则农民实际收入为5931.305807(亿元) 六、模型总结 根据上述模型分析可得: =-2920.659-14.31772+6.123952-0.020337 (-4.868962) (-1.230850) (1.938816) (4.283366) 0.885300 0。86
34、3793 F=41.16462 DW=0.609953 上述回归结果基本上消除了多重共线性,拟合优度较高,整体效果的F检验通过,其解释变量X的t检验均较为显著。 参考文献 [1]茆诗松. 概率论与数理统计[M].高等教育出版社.2001.3. [2]韩中庚.数学建模方法及其应用[M].高等教育出版社.2009,6 [3]鲍 玲. 浅论人力资源预测及规划评估[J] .经营管理,2004,20(10):77-78 [4]韩 萍.近代回归分析及其应用新疆师范大学学报[J] ( 自然科学版) 2007,20(2):12-16 [5]马立平. 现代统计分析方法的学与用: 多元线性回归分析[J]. 北京计,2000,40(4):2-6 [6]林彬. 多元线性回归分析及其应用[J].中国科技信息,2010,36(5):10-12 [7]丁胜国 李涛.SPSS统计教程[M]机械工业出版社, 2006 [8]陈柳钦. 房地产宏观调控回顾及2008年展望[J].市场营销导刊.2008,25(7):12-16 [9]汪劲松. 经济全球化形势下加入世界贸易组织对中国房地产业的影响[J].经济问题探索. 2000,26(8):7-18 仅供学习与交流,如有侵权请联系网站删除 谢谢20
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818