ImageVerifierCode 换一换
格式:DOC , 页数:14 ,大小:318.50KB ,
资源ID:3199768      下载积分:8 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3199768.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(北航数理统计大作业(逐步回归).doc)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

北航数理统计大作业(逐步回归).doc

1、 应用数理统计 第一次大作业 学号: 姓名:   班级: B11班 2015年12月 民航客运量的多元线性回归分析 摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的

2、结果达到预期,证明该模型建立是较为成功的。 关键词:多元线性回归,逐步回归法,民航客运量 0.符号说明 变量 符号 民用航空客运量 Y 国民生产总值 X1 铁路客运量 X2 民航航线里程 X3 入境过夜旅游人数 X4 城镇居民人均可支配收入 X5 1.引言 随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安

3、排班机数量。科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。采用逐步回归法建立线性模型,选出较优的线性回归模型。 2.数据的统计与分析 本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2014》以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量

4、因素的数据,分析它们之间的联系。整理如表1所示。 表1: 年份 民航客运量(万人) 国内生产总值(亿元) 铁路客运量(万人) 民航航线里程(万公里) 入境过夜旅游人数(万人) 城镇居民可支配收入(元) 1996 5555 78973 94797 116.65 1356.26 4838.9 1997 5630 84402.3 93308 142.5 1578.53 5160.3 1998 5755 89677.1 95085 150.58 1692.45 5425.1 1999 6094 88479.2 100

5、164 152.22 1765.25 5854.1 2000 6722 99214.6 105073 150.29 1750.96 6280.1 2001 7524 109655.2 105155 155.36 1880.36 6859.6 2002 8594 120332.7 105606 163.77 2012.45 7702.8 2003 8759 135822.8 97260 174.95 2033.58 8472.2 2004 12123 159878.3 111764 204.94 2519.89 9421

6、6 2005 13827 184937.4 115583 199.85 2925.63 10493.1 2006 15968 216314.4 125656 211.35 3486.45 11759.5 2007 18576 265810.3 135670 234.3 3398.58 13785.8 2008 19251 314045.4 146193 246.18 3696.71 15780.8 2009 23052 340506.9 152451 234.51 4025.96 17174.7 2010 26769

7、 397983.5 168145 276.5 4753.84 19109.4 2011 29316 473104 146192 349.05 4924.32 21809.8 2012 31896 519470.1 189337 328.01 5668.63 24564.7 2013 35397 568845.2 210597 410.6 5562.39 26955.1 2.1模型的建立 以民航客运量y为因变量,以上5种影响因素为自变量Xi ,构建回归方程: 其中为常数项,为误差项。 先

8、观察自变量与因变量的关系,用SPSS得到各个自变量与因变量的散点图: 图1 民航客运量与国内生产总值散点图 图2 民航客运量与铁路客运量散点图 图3 民航客运量与航线里程散点图 图4 民航客运量与入境过夜人数散点图 图5 民航客运量与人均可支配收入散点图 从以上五张散点图,我们可以看出因变量民航客运量与国内生产总值,入境过夜旅游人数和城镇居民人均可支配收入均有较好的线性关系,这说明建立线性模型是有意义的。 继续下一步逐步回归分析,逐步回归的基本思想是将变量逐个引入模型,每引入一个变量后都要进行F检验,并对已经选入的变量逐个进行

9、t检验,当原来引入的变量由于后面变量的引入变得不再显著时,则将其删除。以确保每次引入新的变量之前回归方程中只包含先主动变量。这是一个反复的过程,直到既没有显著的变量选入回归方程,也没用不显著的变量从回归方程中剔除为止。在SPSS软件中可直接进行逐步回归分析,得出以下结果: 由表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其他自变量都没有进入模型,模型2在1的基础上再纳入了过夜入境旅游人数,其他的自变量也都被排除了。 表2 输入/移去的变量a 模型 输入的变量 移去的变量 方法 1 城镇居民人均可支配收入 . 步进(准则: F-to-ent

10、er 的概率 <= .050,F-to-remove 的概率 >= .100)。 2 过夜游客 . 步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。 a. 因变量: 民用航空客运量 表3 已排除的变量a 模型 Beta In t Sig. 偏相关 共线性统计量 容差 1 国内生产总值 .197b .517 .612 .132 .003 铁路客运量 -.001b -.014 .989 -.004 .058 民航航线里程 -.040b -.388 .704 -.100

11、 .044 过夜游客 .421b 3.432 .004 .663 .018 2 国内生产总值 .306c 1.059 .308 .272 .003 铁路客运量 -.020c -.289 .777 -.077 .058 民航航线里程 .011c .138 .892 .037 .043 a. 因变量: 民用航空客运量 b. 模型中的预测变量: (常量), 城镇居民人均可支配收入。 c. 模型中的预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。 表4 模型汇总c 模型 R R 方 调整 R 方 标准 估计的误差 更改

12、统计量 R 方更改 F 更改 df1 df2 Sig. F 更改 1 .996a .993 .992 876.7400 .993 2183.841 1 16 .000 2 .998b .996 .995 677.6913 .003 11.779 1 15 .004 a. 预测变量: (常量), 城镇居民人均可支配收入。 b. 预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。 c. 因变量: 民用航空客运量 2.2拟合度检验 由表4,模型1的决定系数R2=0.992,模型2的决定系数R2=0.995,可以看出回归方程都高度显

13、著,且模型2比模型1更优。 2.3回归方程的显著性检验: 由表5,方差分析表Sig值都<0.05,说明每个模型都拒绝回归系数均为0的假设,每个方程都是显著的。 表5 Anovaa 模型 平方和 df 均方 F Sig. 1 回归 1678659397.184 1 1678659397.184 2183.841 .000b 残差 12298767.261 16 768672.954 总计 1690958164.444 17 2 回归 1684069181.370 2 842034590.685 1833.

14、437 .000c 残差 6888983.075 15 459265.538 总计 1690958164.444 17 a. 因变量: 民用航空客运量 b. 预测变量: (常量), 城镇居民人均可支配收入。 c. 预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。 由表6可以得到两个模型的回归方程分别: 1. 以城镇居民可支配收入为自变量的拟合函数: y=-1698.669+1.406X5 2. 以城镇居民可支配收入和过夜入境旅游人数为自变量的拟合函数: y=-3267.728+

15、0.817X5+2.871X4 且所有系数的显著性水平都小于0.05,每个回归方程都是有意义的。 表6 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -1698.669 423.955 -4.007 .001 城镇居民人均可支配收入 1.406 .030 .996 46.732 .000 2 (常量) -3267.728 562.492 -5.809 .000 城镇居民人均可支配收入 .817 .173 .579 4.721 .000 过夜游客 2.871 .83

16、7 .421 3.432 .004 a. 因变量: 民用航空客运量 表7是残差统计结果。主要显示预测值、标准化预测值、残差和标准化残差等统计量的最大值、最小值、均值和标准差。残差平方和Q描述的是随机误差引起因变量Y的分散程度,Q越大分散性也越大,则线性关系越不明显。由表7可见标准化残差的最大绝对值为1.758。而且标准残差的均值为0,说明随机误差对Y值的影响很小。 表7 残差统计量a 极小值 极大值 均值 标准 偏差 N 预测值 4581.804 35339.836 15600.444 9953.0344 18 残差 -1191.52

17、25 973.1963 .0000 636.5802 18 标准 预测值 -1.107 1.983 .000 1.000 18 标准 残差 -1.758 1.436 .000 .939 18 a. 因变量: 民用航空客运量 2.4多重共线性的诊断 表8 共线性诊断a 模型 维数 特征值 条件索引 方差比例 (常量) 城镇居民人均可支配收入 过夜游客 1 1 1.873 1.000 .06 .06 2 .127 3.843 .94 .94 2 1 2.852 1.000 .01 .00 .00

18、2 .147 4.410 .37 .01 .00 3 .002 39.683 .62 .99 1.00 a. 因变量: 民用航空客运量 表8是SPSS软件的多重共线性诊断表,它包括3项诊断值:特征值、条件数和方差比率。特征值表明在自变量中存在多少截然不同的维数,当几个特征值都接近0是,变量是高度相关的。条件数是最大特征值对每一个连续特征值的比率的平方根,若条件数大于15则表明可能存在多重共线问题,若大于30则表明存在严重的多重共线性问题。显然表8中变量X4过夜入境旅游人数的条件数大于30,说明回归方程存在多重共线性。 2.5残差检验 如图6是残差分布直

19、方图。在回归分析中,总是假定残差服从正态分布,这个图就是根据样本数据的计算结果显示残差分析的实际情况。从图来看标准化残差还是近似服从正态分布的。 图6 如图7残差的积累概率图基本围绕在假设直线 (正态分布)周围,说明残差分布基本符合正态分布,说明民航客运量这个因变量基本上可以用线性回归方法建立模型。 3.结论 为了解决多重共线性的问题,排除模型2,考虑到模型1的拟合度也是很好的,综合来看认为模型1为更优。最终得到的回归方程为: y=-1698.669+1.406X5 并以2014年的数据检验该回归方程,2014年航空客运量为39195万人,城镇居民人均可支配收入为28843.9

20、将自变量X5带入回归方程得到y=38855.85万人,与实际的客运量39195万人的误差为0.86%。因此可以认为该模型 基本达到了预期的目标。 通过最优回归方程,我们可以发现航空客运量与城镇居民的可支配收入线性相关十分显著,这是符合常识的,只有居民可支配收入越来越高,才会选择航空这种昂贵的客运方式。 图7 参考文献: [1] 2015年中国统计年鉴 [2] 孙海燕、周梦、李卫国、冯伟. 应用数理统计.北京航空航天大学出版社,2009 [3] 朱卫卫. 基于偏最小二乘回归的我国民航客运量影响因素分析[J]. 中国市场. 2010(41): 110-112 (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服