ImageVerifierCode 换一换
格式:PPTX , 页数:21 ,大小:1.85MB ,
资源ID:10282799      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10282799.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(对Boston数据集的分析--统计机器学习期中考试知识分享.pptx)为本站上传会员【w****g】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

对Boston数据集的分析--统计机器学习期中考试知识分享.pptx

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,5/24/2016,#,Analysis of,boston datasets,组员:郭晋 郭煜,田甜 刘一诺,Questions,:,怎样预测波士顿的犯罪率?,怎么预测某市民是否犯罪?,Q1,:怎样预测波士顿的犯罪率,下面是我们的解决过程:,1,、做出每个变量对变量,crim,的简单线性回归,进行预测,2,、由简单线性回归的预测,做残差分析,发现预测效果不佳,3,、以,crim,为响应变量,其余变量为预测变量,做多元线性回归。,4,、发现多元线性回归预测效果不佳,进行多元回归分析,不断改变归回模型,最终得到最

2、佳回归模型。,下面是具体操作过程:,首先我们画出,Boston,的散点图矩阵,大致观察图像,之后我们以其中的,zn,对,crim,的线性回归为例,向您展示我们的造作过程,首先,我们拟合了,zn,与,crim,之间的线性关系,得到相关结果如下:,lm.fit0=lm(crimzn,data=Boston1),summary(lm.fit0),Call:,lm(formula=crim zn,data=Boston1),Residuals:,Min 1Q Median 3Q Max,-2.811-2.652-1.755-0.360 86.141,Coefficients:,Estimate Std

3、Error t value Pr(|t|),(Intercept)2.83564 0.40955 6.924 1.74e-11*,zn -0.04657 0.01415 -3.291 0.00109*,-,Signif.codes:0*0.001*0.01*0.05.0.1 1,Residual standard error:7.197 on 404 degrees of freedom,Multiple R-squared:0.02611,Adjusted R-squared:0.0237,F-statistic:10.83 on 1 and 404 DF,p-value:0.001086

4、发现,p,值小于,0.01,,我们有理由认为,zn,和,crim,之间存在关联,之后,画出,zn,对,crim,的散点图与拟合曲线,我们发现,拟合效果不佳。,plot(Boston$zn,Boston$crim),abline(lm.fit0),之后我们又画出真实值和拟合值的残差图,看预测准确度如何,横坐标是测试集的,crim,预测值,纵坐标是预测值和真实值的残差,注:在拟合时,我们用前,406,个观测当作训练集,后,100,个观测当作测试集,preb=predict(lm.fit0,data.frame(zn=(c(Boston407:506,2),interval=confidence)

5、plot(Boston407:506,1-preb,1)2preb,1),我们发现预测效果十分不好,,事实上,所有简单线性回归的预测效果均不是很好,,下面我们给出具体操作数据与图像。,下面是各简单线性回归的,p,值:,从中可以看出,和,crim,有(,0.01,)线性关系的预测变量有,:zn,indus,nox,rm,age,dis,rad,tax,ptratio,black,crimzn,crimindus,crimchas,crimnox,crimrm,crimage,crimdis,crimrad,crimtax,crimptratio,crimblack,crimlstat,crim

6、medv,Intercept,2.83564,-1.6457,2.2066,-10.843,13.768,-2.64658,6.7596,-2.66513,-9.25268,-10.9243,5.416339,-2.78713,8.20163,系数,-0.04657,0.40041,-0.355,24.447,-1.8314,0.07469,-1.1015,0.70423,0.032243,0.7263,-0.00853,0.43449,-0.25013,p,值,0.00109,7.25E-14,0.783,8.20E-16,0.000192,9.08E-10,8.65E-12,2e-16,2

7、e-16,6.71E-06,0.34,2e-16,4.02E-11,各简单线性回归的散点图与拟合曲线如下:,各简单线性回归残差图如下,:,从中可以看出,预测情况较好的变量有:,nox,rm,age,dis,black,lstat,medv,鉴于简单线性回归给出的预测均不好,,下面我们对变量进行多元回归分析。,首先直接对其进行多元回归,生成诊断图并分析问题。,lm.fit13=lm(crim.,data=Boston1),par(mfrow=c(2,2),plot(lm.fit13),注:,图一和图三都用于检查数据的非线性。图一是残差和预测变量的散点图,红线是对残差的一个光滑拟合,目的是更易于识

8、别趋势,残差呈现明显大的,U,形,说明响应变量和预测变量之间是非线性关系。图三是标准化残差的平方根和预测变量的散点图。拟合红线和图一呈现相近的趋势,说明数据存在异方差性,因此数据有非线性关系。,图二用于观察残差是否服从正态分布,是残差平方根和理论分位点的散点图,很显然残差不服从正态分布。,图四用于判断高杠杆点:是标准化残差和杠杆值的散点图,红线表示的是,cooks,距离等高线,我们发现,381,号样本有较大的影响。,(Cooks distance,衡量的是一个某样本的改变会使得所有样本的残差改变的幅度,该值越大,说明该样本异常,),为使回归模型预测效果更好,我们通过对预测变量做非线性变换来改进模型,我们分别作了对数变换、平方变换和开方变换,发现对数变换预测性最好,最优拟合是,lm.fit13,,对应的是多元回归拟合,这个答案是合理的,,lmfit13,对训练集的数据拟合程度最高,也就导致了它预测性不会比做了非线性变换之后的回归好,.,具体操作如下:,多元线性:,参数显著性:,残差图:,对数变换,参数显著性,残差图,平方变换,参数显著性,残差图,开方变换,参数显著性,残差图,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服