ImageVerifierCode 换一换
格式:PDF , 页数:46 ,大小:1.55MB ,
资源ID:3313682      下载积分:14 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3313682.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(人工智能和机器学习--PPT04-K近邻.pdf)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

人工智能和机器学习--PPT04-K近邻.pdf

1、分类-K近邻王秋月中国人民大学信息学院什么是分类?一家花店想根据某顾客最近买花的情况,来预测某种新来的花是否会被该顾客购买?什么是分类??什么是分类??什么是分类??什么是分类?分类需要什么?数据:将对象表示为量化的一组特征 给定类别标签 对象间相似性的度量060SurvivedDid notsurvive40Age201020Number of Malignant NodesK近邻(KNN)分类06040Age201020Number of Malignant Nodes预测预测K近邻(KNN)分类近邻数目(K=1):0106040Age201020Number of Malignant N

2、odes预测预测K近邻(KNN)分类06040Age201020Number of Malignant NodesK近邻(KNN)分类近邻数目(K=2):11预测预测06040Age201020Number of Malignant NodesK近邻(KNN)分类近邻数目(K=3):21预测预测06040Age201020Number of Malignant NodesK近邻(KNN)分类近邻数目(K=4):31预测预测0 正确的“K”值 如何度量相邻两点之间的相似性/距离?6040201020Number of Malignant NodesK近邻模型需要选择40AgeK值的选择值的选择K

3、=106040Age201020Number of Malignant NodesK近邻模型的判定边界K=All01020Number of Malignant Nodes6040Age20K近邻模型的判定边界01020Number of Malignant Nodes6040200K=16040201020Number of Malignant NodesK=AllK值的大小会影响判定边界决定最佳决定最佳K的方法将在下节课讨论的方法将在下节课讨论距离的度量距离的度量06040Age201020Number of Malignant NodesK近邻模型中的距离测度06040Age201020

4、Number of Malignant NodesK近邻模型中的距离测度06040Age201020Number of Malignant Nodes欧几里得距离0Age6040201020Number of Malignant Nodes=2+2AgedNodes欧几里得距离(L2距离)0Age6040201020Number of Malignant NodesAgeNodes=+曼哈顿距离(L1或街区距离)数据缩放数据缩放12345Number ofSurgeries6040Age20缩放比例对计算距离非常重要12345Number ofSurgeriesAge6040202422201

5、8缩放比例对计算距离非常重要Age6040202422201812345Number ofSurgeriesNearest Neighbors!缩放比例对计算距离非常重要特征缩放1506040Age20234Number ofSurgeries缩放比例对计算距离非常重要特征缩放1506040Age20234Number ofSurgeries缩放比例对计算距离非常重要特征缩放1506040Age20234Number ofSurgeriesNearest Neighbors!缩放比例对计算距离非常重要 Standard Scaler:即标准化,尽量将数据转化为均值为0,方差为1的数据,形如标准

6、正态分布(高斯分布)。Minimum-Maximum Scaler:将数据缩放到某一给定范围(通常是0,1)。Maximum Absolute Value Scaler:通过除以最大绝对值,将数据缩放到-1,1。使各特征的数值都处于同一数量级上。特征缩放的不同方法导入包含缩放方法的类:导入包含缩放方法的类:from sklearn.preprocessing import StandardScaler创建该类的一个对象:创建该类的一个对象:StdSc=StandardScaler()拟合缩放的参数,然后对数据做转换:拟合缩放的参数,然后对数据做转换:StdSc=StdSc.fit(X_data

7、)X_scaled=StdSc.transform(X_data)或者或者 X_scaled=StdSc.fit_transform(X_data)特征缩放的语法导入包含缩放方法的类:导入包含缩放方法的类:from sklearn.preprocessing import StandardScaler创建该类的一个对象:创建该类的一个对象:StdSc=StandardScaler()拟合缩放的参数,然后对数据做转换:拟合缩放的参数,然后对数据做转换:StdSc=StdSc.fit(X_data)X_scaled=StdSc.transform(X_data)特征缩放的语法其他缩放方法其他缩放方

8、法:MinMaxScaler,MaxAbsScaler.KNN多分类、多分类、KNN回归回归K=5Full remissionPartialremission06040AgeDid notsurvive201020Number of Malignant NodesK近邻多分类的判定边界投票决定:投票决定:少数服从多数,近邻中哪个类别的点最多就分为该类。加权投票法:加权投票法:根据距离的远近,对近邻的投票进行加权,距离越近则权重越大(权重为距离平方的倒数)K=1K=3K=20K近邻回归KNN模型特点及语法模型特点及语法 建模快,因为它只是简单地存储数据 运行速度慢,因为需要计算很多的距离 占用内

9、存多,如果数据集大的话K近邻模型的特点导入包含分类方法的类:导入包含分类方法的类:from sklearn.neighbors import KNeighborsClassifier创建该类的一个对象:创建该类的一个对象:KNN=KNeighborsClassifier(n_neighbors=3)拟合数据集,即训练拟合数据集,即训练KNN模型,并用训练好的模型预测数据模型,并用训练好的模型预测数据的标签:的标签:KNN=KNN.fit(X_data,y_data)y_predict=KNN.predict(X_data)K近邻模型的语法http:/scikit-learn.org/stabl

10、e/modules/generated/sklearn.neighbors.KNeighborsClassifier.html导入包含分类方法的类:导入包含分类方法的类:from sklearn.neighbors import KNeighborsClassifier创建该类的一个对象:创建该类的一个对象:KNN=KNeighborsClassifier(n_neighbors=3)拟合数据集,即训练拟合数据集,即训练KNN模型,并用训练好的模型预测数据模型,并用训练好的模型预测数据的标签:的标签:KNN=KNN.fit(X_data,y_data)y_predict=KNN.predict

11、(X_data)K近邻模型的语法这种这种 fit 和和 predict/transform 语法会贯穿整个课程语法会贯穿整个课程导入包含分类方法的类:导入包含分类方法的类:from sklearn.neighbors import KNeighborsClassifier创建该类的一个对象:创建该类的一个对象:KNN=KNeighborsClassifier(n_neighbors=3)拟合数据集,即训练拟合数据集,即训练KNN模型,并用训练好的模型预测数据模型,并用训练好的模型预测数据的标签:的标签:KNN=KNN.fit(X_data,y_data)y_predict=KNN.predict(X_data)K近邻模型的语法回归使用回归使用KNeighborsRegressor案例研究:鸢尾花数据集 150个鸢尾花样例 来自3个不同的属种 Setosa,Versicolor,Virginica 每种50个样例 用4个特征度量 花萼的长度和宽度,花瓣的长度和宽度 分类问题:给定一株鸢尾花,判定其属种鸢尾花数据集样例特征类别标签创建机器学习应用路线图数据预处理学习评价预测演示第4章-K近邻.ipynb

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服