ImageVerifierCode 换一换
格式:DOC , 页数:14 ,大小:318.50KB ,
资源ID:3199768      下载积分:4 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3199768.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(北航数理统计大作业(逐步回归).doc)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

北航数理统计大作业(逐步回归).doc

1、应用数理统计第一次大作业学号: 姓名: 班级: B11班 2015年12月民航客运量的多元线性回归分析摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的结果达到预期,证明该模型建立是较为成功的。关键词:多元线性回归,逐步回归法,民航客运量0.符号说明变量符号民用航空客运量Y国民生产总值X1铁路客

2、运量X2民航航线里程X3入境过夜旅游人数X4城镇居民人均可支配收入X51.引言随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安排班机数量。科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万

3、人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。采用逐步回归法建立线性模型,选出较优的线性回归模型。2.数据的统计与分析本文在进行统计时,查阅中国统计摘要,中国统计年鉴2014以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量因素的数据,分析它们之间的联系。整理如表1所示。表1:年份民航客运量(万人)国内生产总值(亿元)铁路客运量(万人)民航航线里程(万公里)入境过夜旅游人数(万人)城镇居民可支配收入(元)199655557897394797116.651356.264838.91997563084402.3933081

4、42.51578.535160.31998575589677.195085150.581692.455425.11999609488479.2100164152.221765.255854.12000672299214.6105073150.291750.966280.120017524109655.2105155155.361880.366859.620028594120332.7105606163.772012.457702.820038759135822.897260174.952033.588472.2200412123159878.3111764204.942519.899421.6

5、200513827184937.4115583199.852925.6310493.1200615968216314.4125656211.353486.4511759.5200718576265810.3135670234.33398.5813785.8200819251314045.4146193246.183696.7115780.8200923052340506.9152451234.514025.9617174.7201026769397983.5168145276.54753.8419109.4201129316473104146192349.054924.3221809.8201

6、231896519470.1189337328.015668.6324564.7201335397568845.2210597410.65562.3926955.12.1模型的建立以民航客运量y为因变量,以上5种影响因素为自变量Xi ,构建回归方程: 其中为常数项,为误差项。先观察自变量与因变量的关系,用SPSS得到各个自变量与因变量的散点图:图1 民航客运量与国内生产总值散点图图2 民航客运量与铁路客运量散点图图3 民航客运量与航线里程散点图图4 民航客运量与入境过夜人数散点图图5 民航客运量与人均可支配收入散点图从以上五张散点图,我们可以看出因变量民航客运量与国内生产总值,入境过夜旅游人数

7、和城镇居民人均可支配收入均有较好的线性关系,这说明建立线性模型是有意义的。继续下一步逐步回归分析,逐步回归的基本思想是将变量逐个引入模型,每引入一个变量后都要进行F检验,并对已经选入的变量逐个进行t检验,当原来引入的变量由于后面变量的引入变得不再显著时,则将其删除。以确保每次引入新的变量之前回归方程中只包含先主动变量。这是一个反复的过程,直到既没有显著的变量选入回归方程,也没用不显著的变量从回归方程中剔除为止。在SPSS软件中可直接进行逐步回归分析,得出以下结果:由表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其他自变量都没有进入模型,模型2在1的基础上再纳入了过夜入境旅游人

8、数,其他的自变量也都被排除了。表2输入移去的变量a模型输入的变量移去的变量方法1城镇居民人均可支配收入.步进(准则: F-to-enter 的概率 = .100)。2过夜游客.步进(准则: F-to-enter 的概率 = .100)。a. 因变量: 民用航空客运量表3已排除的变量a模型Beta IntSig.偏相关共线性统计量容差1国内生产总值.197b.517.612.132.003铁路客运量-.001b-.014.989-.004.058民航航线里程-.040b-.388.704-.100.044过夜游客.421b3.432.004.663.0182国内生产总值.306c1.059.30

9、8.272.003铁路客运量-.020c-.289.777-.077.058民航航线里程.011c.138.892.037.043a. 因变量: 民用航空客运量b. 模型中的预测变量: (常量), 城镇居民人均可支配收入。c. 模型中的预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。表4模型汇总c模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.996a.993.992876.7400.9932183.841116.0002.998b.996.995677.6913.00311.779115.004a. 预测变量: (常量), 城

10、镇居民人均可支配收入。b. 预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。c. 因变量: 民用航空客运量2.2拟合度检验由表4,模型1的决定系数R2=0.992,模型2的决定系数R2=0.995,可以看出回归方程都高度显著,且模型2比模型1更优。2.3回归方程的显著性检验:由表5,方差分析表Sig值都0.05,说明每个模型都拒绝回归系数均为0的假设,每个方程都是显著的。表5Anovaa模型平方和df均方FSig.1回归1678659397.18411678659397.1842183.841.000b残差12298767.26116768672.954总计1690958164.4

11、44172回归1684069181.3702842034590.6851833.437.000c残差6888983.07515459265.538总计1690958164.44417a. 因变量: 民用航空客运量b. 预测变量: (常量), 城镇居民人均可支配收入。c. 预测变量: (常量), 城镇居民人均可支配收入, 过夜游客。由表6可以得到两个模型的回归方程分别:1. 以城镇居民可支配收入为自变量的拟合函数: y=-1698.669+1.406X52. 以城镇居民可支配收入和过夜入境旅游人数为自变量的拟合函数: y=-3267.728+0.817X5+2.871X4且所有系数的显著性水平都

12、小于0.05,每个回归方程都是有意义的。表6系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-1698.669423.955-4.007.001城镇居民人均可支配收入1.406.030.99646.732.0002(常量)-3267.728562.492-5.809.000城镇居民人均可支配收入.817.173.5794.721.000过夜游客2.871.837.4213.432.004a. 因变量: 民用航空客运量表7是残差统计结果。主要显示预测值、标准化预测值、残差和标准化残差等统计量的最大值、最小值、均值和标准差。残差平方和Q描述的是随机误差引起因变量Y的分散程度,Q

13、越大分散性也越大,则线性关系越不明显。由表7可见标准化残差的最大绝对值为1.758。而且标准残差的均值为0,说明随机误差对Y值的影响很小。表7残差统计量a极小值极大值均值标准 偏差N预测值4581.80435339.83615600.4449953.034418残差-1191.5225973.1963.0000636.580218标准 预测值-1.1071.983.0001.00018标准 残差-1.7581.436.000.93918a. 因变量: 民用航空客运量2.4多重共线性的诊断表8共线性诊断a模型维数特征值条件索引方差比例(常量)城镇居民人均可支配收入过夜游客111.8731.000

14、.06.062.1273.843.94.94212.8521.000.01.00.002.1474.410.37.01.003.00239.683.62.991.00a. 因变量: 民用航空客运量表8是SPSS软件的多重共线性诊断表,它包括3项诊断值:特征值、条件数和方差比率。特征值表明在自变量中存在多少截然不同的维数,当几个特征值都接近0是,变量是高度相关的。条件数是最大特征值对每一个连续特征值的比率的平方根,若条件数大于15则表明可能存在多重共线问题,若大于30则表明存在严重的多重共线性问题。显然表8中变量X4过夜入境旅游人数的条件数大于30,说明回归方程存在多重共线性。2.5残差检验如图

15、6是残差分布直方图。在回归分析中,总是假定残差服从正态分布,这个图就是根据样本数据的计算结果显示残差分析的实际情况。从图来看标准化残差还是近似服从正态分布的。图6如图7残差的积累概率图基本围绕在假设直线 (正态分布)周围,说明残差分布基本符合正态分布,说明民航客运量这个因变量基本上可以用线性回归方法建立模型。3.结论为了解决多重共线性的问题,排除模型2,考虑到模型1的拟合度也是很好的,综合来看认为模型1为更优。最终得到的回归方程为:y=-1698.669+1.406X5并以2014年的数据检验该回归方程,2014年航空客运量为39195万人,城镇居民人均可支配收入为28843.9,将自变量X5

16、带入回归方程得到y=38855.85万人,与实际的客运量39195万人的误差为0.86%。因此可以认为该模型基本达到了预期的目标。 通过最优回归方程,我们可以发现航空客运量与城镇居民的可支配收入线性相关十分显著,这是符合常识的,只有居民可支配收入越来越高,才会选择航空这种昂贵的客运方式。图7参考文献:1 2015年中国统计年鉴2 孙海燕、周梦、李卫国、冯伟. 应用数理统计.北京航空航天大学出版社,20093 朱卫卫. 基于偏最小二乘回归的我国民航客运量影响因素分析J. 中国市场. 2010(41): 110-112 (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服