收藏 分销(赏)

多重共线性案例.doc

上传人:丰**** 文档编号:3123244 上传时间:2024-06-19 格式:DOC 页数:5 大小:126KB 下载积分:6 金币
下载 相关 举报
多重共线性案例.doc_第1页
第1页 / 共5页
多重共线性案例.doc_第2页
第2页 / 共5页


点击查看更多>>
资源描述
能源消耗量多重共线性 能源消耗量 (万吨标准煤) GDP (亿元) 汽车 (万辆) 发电量 (亿千瓦时) 化学纤维 (万吨) 大中型拖拉机 (万台) 化肥 (万吨) 粮食产量 (万吨) 2001 150406.00 110270.00 234.17 14808.02 828.00 3.80 3397.00 45262.00 2002 159431.00 121002.00 325.10 16540.00 991.00 4.50 3791.00 45711.00 2003 183792.00 136565.00 444.39 19105.75 1181.14 4.88 4200.00 43067.00 2004 213456.00 160714.00 509.11 22033.09 1424.54 9.83 4469.47 46947.00 2005 235997.00 185896.00 570.49 25002.60 1618.00 16.20 5220.00 48401.00 2006 258676.00 217657.00 727.89 28657.26 2025.50 19.90 5592.80 49746.00 2007 280508.00 268019.00 888.89 32815.53 2390.00 20.30 5786.90 50150.00 2008 291448.00 316752.00 930.59 34957.61 2415.00 31.70 6012.70 52850.00 2009 306647.00 345629.00 1379.53 37146.51 2730.00 37.10 6599.70 53082.00 2010 324939.00 408903.00 1826.53 42071.60 3090.00 38.40 6740.60 54641.00 2011 348002.00 484124.00 1841.60 47000.00 3390.00 40.20 6217.20 57121.00 2012 365000.00 534123.00 1927.70 49377.70 3800.00 46.30 7296.00 58957.00 2013 385000.00 588019.00 2211.70 53975.90 4121.90 58.70 7037.00 60194.00 2014 426000.00 635910.00 2372.50 56495.80 4389.80 64.40 6887.20 60710.00 2015 430000.00 676708.00 2450.40 58105.80 4831.70 68.80 7432.00 62144.00 数据来源:《2001年—2015年中国统计年鉴》 最小二乘法: 得到的回归模型为 Y = 132333.984713 - 0.344084350491*GDP - 20.9639535518*QC + 7.64716297259*FDL + 35.5980328128*HXXW + 1337.53288876*TLJ - 3.05654212394*HF - 1.66965708916*LSCL t= (1.273) (-1.617) (-1.018) (3.249) (1.269) (1.834) (-0.353) (-0.613) R²=0.996,F =258.647,DW=2.661 由以上结果可见,该模型=0.996149,修正的可决系数为0.992297,可决系数非常高,检验值为258.6471,明显显著。但是当时,,不仅HF、HXXW的系数检验不显著,而且GDP、QC、LSCL系数的符号与预期相反,这样表明可能存在严重的多重共线性。 计算各解释变量的相关系数,选择GDP、QC、FDL、HXXW、TLJ、HF、LSCL的数据。 全部解释变量的相关系数矩阵 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高吗,证实确实存在严重的多重共线性。 多重共线性的修正 为消除共线性的影响,首先分别拟合Y对GDP QC FDL HXXW TLJ HF LSCL的一元回归,得到七个回归模型的参数估计结果。 7个解释变量分别进行一元回归模型的参数估计结果 参数估计值 GDP QC FDL HXXW TLJ HF LSCL 系数估计值 0.4507 110.966 6.0959 69.7543 4059.198 66.3748 14.3492 T统计量 17.29886 14.7851 32.50876 28.4108 18.9907 11.6337 17.0138 0.9585 0.9439 0.987848 0.9842 0.9652 0.9124 0.9570 修正的 0.9552 0.9396 0.986914 0.9829 0.9625 0.9056 0.9537 F统计量 299.2504 2186001 1056.820 807.171 360.646 135.3427 289.4691 可以发现,变量FDL拟合效果最佳,且整体拟合效果最好。即发电量对能源消耗量起主要作用。按照各个解释变量一元回归模型的拟合优度大小进行排序:FDL,HXXW,TLJ,GDP,LSCL,QC,HF,以FDL为基础依次加入其他解释变量进行逐步回归。 加入HXXW Y = 79506.7054599 + 4.7901720539*FDL + 15.018962978*HXXW t = (5.08510) (2.011848) (0.550224) =0.988,F=500.22,RSS=1.37*10^9 系数为正 加入TLJ Y = 83502.3622712 + 4.7662124355*FDL + 10.3033091555*HXXW + 296.631527853*TLJ t=(4.1385) (1.925450) (0.325176) (0.334023) =0.988266,F=308.8278,RSS=1.35*10^9 系数为正 加入TLJ Y = 57002.1055085 + 5.90241783797*FDL + 49.5728951535*HXXW - 0.311419040916*GDP t=(4.088001) (3.191238) (2.101646) (-3.107994) =0.993689,F=577.3510,RSS=7.27*10^8 系数为负,剔除GDP 加入LSCL Y = 165163.157653 + 5.61116988855*FDL + 16.2680580598*HXXW - 2.25051469861*LSCL t=(1.420467) (2.104788) (0.583718) (-0.743696) =0.988715,F=321.2445,RSS=1.3*10^9 系数为负,剔除LSCL 加入QC Y = 56459.2268715 + 6.33133390691*FDL + 21.8258849727*HXXW - 40.2663627237*QC t=(3.160903) (2.821108) (0.891906) (-2.051861) =0.991428,F=424.0930,RSS=9.88*10^8 系数为负,剔除QC 加入HF Y = 49317.0081576 + 3.58414062424*FDL + 18.0157355404*HXXW + 11.3550355173*HF t=(2.315445) (1.593152) (0.726667) (1.898782) =0.991073,F=407.0851,RSS=1.03*10^9 最后,从此模型中可以看出,发电量、化学纤维、和化肥对能源消耗量有显著影响。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 考试专区 > 中考

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服