多元统计分析大论文-我国各地区生产总值水平综合分析.docx

资源描述

本科毕业论文（设计）模板课程论文论文题目：我国各地区生产总值水平综合分析课程名称：多元统计分析专业：统计学班级： 1302班小组成员：指导老师：完成日期：2016 年 5 经济增长是世界各国永恒的主题，不论是在发达国家还是在发展中国家，都处于一个极其重要的地位。近年来，我国国内生产总值（GDP）逐年飞速增长，经济发展令世人瞩目。国内生产总值（GDP）是宏观经济中最受关注的经济统计数字，被公认为是衡量国民经济发展情况最重要的一个指标。GDP是指本国在一年内所生产创造的劳动产品及劳务的总价值。GDP 的增长对于一个国家有着十分重要的意义，它衡量一国在过去的一年里所创造的劳动成果，本文运用多元统计中的相关知识，本文选取了2014年统计年鉴各地区不同行业的增加值相关数据，主要以全国15个地区的生产总值为研究对象，选取了影响生产总值的9个指标，运用spss软件对这9个指标进行因子分析，应用多元所学的知识分析影响生产总值的主要因子，并对其进行经济意义的解释，提出相关的建议。这9个指标涵盖了我国三大产业，反应目前的经济现状。9个指标分别为：（农历牧渔业增加值），（工业增加值），（建筑业增加值）（批发零售业增加值），（交通运输仓储和邮政业增加值），（住宿餐饮业增加值）（金融业增加值），（房地产业增加值），（其他行业增加值）。表1-1 各地区不同行业增加值数据表地区 X1 X2 X3 X4 X5 X6 X7 X8 X9 北京市 161.32 3746.77 902.66 2411.14 948.1 363.76 3357.71 1329.2 8110.18 天津市 201.53 7079.1 686.98 1950.71 720.72 230.28 1422.28 550.86 2884.47 上海市 128.62 7362.84 831.86 3647.33 1044.46 359.28 3400.41 1530.96 5261.94 广东省 3242.42 29144.15 2341.18 7778.82 2740.76 1333.81 4447.43 4486.92 12294.21 江苏省 3835.16 26962.97 3899.47 6559.03 2591.15 1094.45 4723.69 3564.44 11857.96 山东省 4992.88 25340.86 3534.48 7826.46 2326.25 1112.19 2709.65 2526.16 9057.67 重庆市 1076.72 5175.8 1353.26 1229.88 705.83 321.64 1225.27 817.04 2357.16 浙江省 1808.68 16771.9 2467.1 4911.71 1525.93 884.91 2767.44 2166.86 6870.58 福建省 2085.12 10426.71 2112.03 1961.18 1320.35 374.61 1449.82 1090.22 3235.8 湖北省 3255.95 10992.79 1925.09 2143.21 1181.58 635.32 1372.61 1062.71 4809.96 辽宁省 2403.17 12656.83 1875.69 2653.65 1488.93 568.77 1482.17 1145.7 4351.67 陕西省 1635.85 7993.39 1645.65 1413.16 675.66 365.85 948.93 579.44 2432.01 吉林省 1570.19 6424.88 891.4 1059.66 518.05 283.79 464.96 432.85 2157.54 湖南省 3266.89 10749.88 1744.86 2211.82 1257.64 545.69 950.04 673.38 5637.13 河南省 4259.98 15809.09 2077.24 2278.45 1676.46 998.35 1509.2 1541.76 4786.15 表1-1为15个各区与9个指标的数据表。运用spss软件进行因子分析，部分结果如下：表1-2 各指标相关矩阵 Zscore(X1) Zscore(X2) Zscore(X3) Zscore(X4) Zscore(X5) Zscore(X6) Zscore(X7) Zscore(X8) Zscore(X9) 相关 Zscore(X1) 1.000 .760 .817 .527 .729 .787 .128 .475 .460 Zscore(X2) .760 1.000 .865 .909 .968 .952 .642 .901 .818 Zscore(X3) .817 .865 1.000 .742 .843 .811 .471 .687 .659 Zscore(X4) .527 .909 .742 1.000 .903 .853 .807 .920 .893 Zscore(X5) .729 .968 .843 .903 1.000 .940 .725 .921 .878 Zscore(X6) .787 .952 .811 .853 .940 1.000 .619 .879 .815 Zscore(X7) .128 .642 .471 .807 .725 .619 1.000 .876 .898 Zscore(X8) .475 .901 .687 .920 .921 .879 .876 1.000 .923 Zscore(X9) .460 .818 .659 .893 .878 .815 .898 .923 1.000 由表1-2是原有变量相关系数矩阵。可以看到大部分相关系数>0.3都比较高，各变量程较强的线性关系，能够从中提取公共因子，适合进行因子分析。表1-3 解释的总方差成份初始特征值提取平方和载入合计方差的 % 累积 % 合计方差的 % 累积 % 1 7.254 80.605 80.605 7.254 80.605 80.605 2 1.224 13.604 94.209 1.224 13.604 94.209 3 .199 2.216 96.425 4 .137 1.521 97.946 5 .087 .968 98.914 6 .045 .496 99.410 7 .029 .319 99.729 8 .016 .173 99.902 9 .009 .098 100.000 由表1-3可知，按照特征值大于1的原则，选入两个公共因子，其累计方差贡献率为94.209%，这说明前两个主成分代表原来的9个指标对不同地区生产增加值的影响。基本上保留了原来指标的信息，由原来的9个指标转化为两个指标起到了降维作用。图1-1 碎石图由图1-1可知，第2个特征根及第3个特征根变化的趋势已经开始趋于平稳，所以取前两个或前三个主成分比较合适。这种方法确定的主成分个数与按累积贡献率确定的主成分个数是一致的。表1-4 成份矩阵a 成份 1 2 Zscore(X1) .698 .691 Zscore(X2) .972 .144 Zscore(X3) .852 .369 Zscore(X4) .943 -.168 Zscore(X5) .984 .057 Zscore(X6) .952 .168 Zscore(X7) .772 -.608 Zscore(X8) .947 -.258 Zscore(X9) .916 -.306 由表1-4可知，对输出结果第1列的每个元素分别除以第一个特征根的平方根, 对输出结果第2列的每个元素分别除以第二个特征根的平方根。表1-5 主成分系数表 Zscore(X1) 0.259 0.625 Zscore(X2) 0.361 0.130 Zscore(X3) 0.316 0.334 Zscore(X4) 0.35 -0.152 Zscore(X5) 0.365 0.052 Zscore(X6) 0.353 0.152 Zscore(X7) 0.287 -0.55 Zscore(X8) 0.352 -0.233 Zscore(X9) 0.34 -0.277 由表1-5可得到前两个主成分，的线性组合为：式中的X1~X9是对原始变量标准化后的变量。对主成分的经济解释：在三大产业的各地区生产总值的影响中，我们选择了有很强的依赖性9个指标，通过主成分计算后，我们选择了两个主成分。但此时得到的未旋转的公共因子的实际意义不好解释，因此对公共因子进行方差最大化正交旋转，得到下表。表1-6 旋转平方和载入合计方差的 % 累积 % 4.581 50.903 50.903 3.898 43.306 94.209 由表1-6可知，对公共因子进行方差最大化正交旋转，得到输出结果。，可以看到由于指定的提取两个因子，两个因子共解释了原有变量总方差的94.209%，总体上原有变量信息丢失少，因子分析效果较理想。可见，因子旋转后，总的累计方差共线率没有变化，也就是没有影响原有变量的共同度，但却重新分配了各个因子解释原有变量的方差，改变了各个因子的方差共线，使得因子更易于解释。表1-7 旋转成份矩阵a 成份 1 2 Zscore(X1) .061 .980 Zscore(X2) .629 .755 Zscore(X3) .390 .843 Zscore(X4) .815 .502 Zscore(X5) .696 .697 Zscore(X6) .598 .759 Zscore(X7) .981 .060 Zscore(X8) .879 .438 Zscore(X9) .887 .381 如表1-7所示，原变量可由各因子表示为：其余以此类推。由因子模型可知，第一个主因子F1主要由X4(批发和零售的增加值)，X7 （金融产业的增加值），X8 （房地产业的增加值），X9 （其他产业的增加值），等这四个指标决定，这四个指标在主因子F1上的载荷均在0.85左右，主要代表着第三产业各地区生产增加值。表1-8 公共因子得分排序表地区 F1 F2 F 名次广东省 2.14339 0.35967 1.36226 1 江苏省 1.64803 0.84217 1.29512 2 山东省 0.55816 1.71751 1.06587 3 浙江省 0.64502 -0.10393 0.31704 4 河南省 -0.70368 1.31175 0.17892 5 辽宁省 -0.42896 0.23809 -0.13684 6 湖北省 -0.73939 0.611 -0.14802 7 湖南省 -0.83006 0.61224 -0.19844 8 福建省 -0.60459 0.09082 -0.30005 9 上海市 0.69406 -1.6381 -0.3272 10 陕西省 -0.90895 -0.17141 -0.58596 11 重庆市 -0.71461 -0.61164 -0.66952 12 天津市 -0.36392 -1.17449 -0.71889 13 北京市 0.7119 -1.75941 -0.76389 14 吉林省 -1.10638 -0.32427 -0.76389 15 如表1-8可知，以各因子的方差共线率占两个因子的总方差贡献率的比重作为权重进行加权汇总，得出15各省市的综合得分F，及其排序。图2-1 因子得分图如图2-1所示，以因子得分为X轴，以因子得分为Y轴，画出各省市的因子得分图。分布在第一象限的是广东、江苏、山东、浙江这四个省，这四个省的生产总值相对来说都比较高，其中广东省生产总值最高。广东主要在第二第三产业发展较好，所以生产总值较高。分布在第四象限的是北京市，上海市，这两个直辖市相比各省规模较小，主要以二三产业为主生产总值次之。分布在第二第三象限的地区同属同一类，这些地区第一产业相对发达，所以生产总值都较低。加快这些地区第二三产业的发展，会有效提高国民生产总值。经济意义：由旋转后的因子载荷矩阵可以看出，公共因子在（批发零售业增加值），（金融业增加值），（房地产业增加值），（其他行业增加值），在第一主成分因子载荷值都很大，，，，，是第三产业增加值的指标，是反映新兴经济发展的代表。因而，F1为各地区商品经济发展是新兴经济代表，在这个因子上得分越高，说明各地区新兴经济的发展较为良好。公共因子F2在（农历牧渔业增加值），（工业增加值），（建筑业增加值）（交通运输仓储和邮政业增加值），（住宿餐饮业增加值）上的载荷较大，是反映各地区传统经济增长的公共因子，对各地区经济发展的影响没有新兴经济发展的影响大，对各地区生产总值的影响多。将各地区在两个因子上的得分进行加权综合，得到综合得分F。根据综合得分可以得出各地区的增加值影响最大的指标。在综合得分前三的地区依次为：广东省，江苏省，山东省。综合得分最低的三个城市依次为天津市，北京市，吉林省。结合各因子得分分析，广东在新兴经济方面的发展情况较好，但在传统经济上的因子得分较低，发展较差。因此需要加大第一产业方面的发展，平衡发展结构，稳中有增河南省在新兴经济方面因子得分较低，说明其发展较为缓慢，而在传统经济方面得分较高，说明其发展良好。因此需要加大第二、三产业方面的发展，平衡发展结构，努力前进。综合得分较低的城市在传统产业上的发展得分都较低，在新兴产业方面得分也较低，应综合考虑各个产业的发展，加强经济建设，实现经济又好又快发展。 9

展开阅读全文