ImageVerifierCode 换一换
格式:DOC , 页数:14 ,大小:529KB ,
资源ID:4700699      下载积分:5 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4700699.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(基于weka的数据分类分析实验报告.doc)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

基于weka的数据分类分析实验报告.doc

1、数据挖掘实验报告 xxx 201021030483 男人看完这些文章还没过隐吗?请速度看下面的 ↓↓男人推荐精彩文章↓↓  注:下载原文后点及连接进入,不下载无法观看 ㊙少妇*女主播*玩车震,一晚17次*姿势诱人,原来是因为。。。。  【视频】新婚妻子对 忄生·生·活不满足,老公被迫离婚.... !点此进入(太刺激了!)  少妇自述:老公出差,邻居偷进我房间,要了我7次(视频)点此进入……(好给力)  ㊙ge哥秘啊!爽,爽..死..宝贝..呀!我还要...啊..内附视频...  ↓↓女人推荐精彩文章↓↓ 注:下载原文后点及连接进入,不下载无法观看  30天提升1

2、个罩杯, 不做男人一手掌握的女人!嫩模内供 全国货到付款(推荐阅读)  谁说丰胸是长久之计?我的罩杯一日暴涨,想多大就多大,老公永远在骚动!  波波小姐”让你的胸不再尴尬,想要多大就有多大! (女人必看) 500万人见证减肥牛货!少吃多运动都是骗人的,她们回家都在偷偷喝这个! 基于weka的数据分类分析实验报告 姓名:xxx 学号:201021030483 1实验基本内容 本实验的基本内容是通过使用weka中的三种常见分类方法(朴素贝叶斯,KNN和决策树C4.5)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试和评价,找出各个模型最优的参数值,并对三个模型进

3、行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。 2数据的准备及预处理 2.1格式转换方法 原始数据是excel文件保存的xlsx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。 转换方法:在excel中打开“movie_given.xlsx”,选择菜单文件->另存为,在弹出的对话框中,文件名输入“total_data”,保存类型选择“CSV(逗号分隔)”,保

4、存,我们便可得到“total_data.csv”文件;然后,打开Weka的Exporler,点击Open file按钮,打开刚才得到的“total_data”文件,点击“save”按钮,在弹出的对话框中,文件名输入“total_data”,文件类型选择“Arff data files(*.arff)”,这样得到的数据文件为“total_data.arff”。 2.2如何建立数据训练集,校验集和测试集 数据的预处理过程中,为了在训练模型、评价模型和使用模型对数据进行预测能保证一致性和完整性,首先要把movie_given.xslx和test.xslx合并在一起,因为在生成arff文件的时候,

5、可能会出现属性值不一样的情况,否则将为后来的测试过程带来麻烦。 通过统计数据信息,发现带有类标号的数据一共有100行,为了避免数据的过度拟合,必须把数据训练集和校验集分开,目前的拆分策略是各50行。类标号为‘female’的数据有21条,而类标号为‘male’的数据有79条,这样目前遇到的问题是,究竟如何处理仅有的21条female数据?为了能在训练分类模型时有更全面的信息,所以决定把包含21条female类标号数据和29条male类标号数据作为模型训练数据集,而剩下的另49条类标号类male的数据将全部用于校验数据集,这是因为在校验的时候,两种类标号的数据的作用区别不大,而在训练数据模型时

6、则更需要更全面的信息,特别是不同类标号的数据的合理比例对训练模型的质量有较大的影响。 2.3预处理具体步骤 第一步:合并movie_given.xlsx和test.xlsx,保存为total_data.xlsx; 第二步:在total_data.xlsx中删除多余的ID列信息; 第三步:在excel中打开“total_data.xlsx”,选择菜单文件->另存为,在弹出的对话框中,文件名输入“total_data”,保存类型选择“CSV(逗号分隔)”; 第四步:使用UltraEdit工具把total_data.csv中的数据缺失部分补上全局常量‘?’; 第五步:打开Weka的E

7、xporler,点击Open file按钮,打开刚才得到的“total_data.csv”文件,点击“save”按钮,在弹出的对话框中,文件名输入“total_data”,文件类型选择“Arff data files(*.arff)”,这样得到的数据文件为“total_data.arff”。 第六步:从total_data.arff文件里面剪切所有没有分类标号的数据作为预测数据集(test.arff),共26项。 第七步:把剩下含有类标号数据的total_data.arff文件复制一份,作为总的训练数据集。文件名称为build_model.arff。 第八步:从total_data

8、arff文件中剩下的数据里面选取所有分类标号为male的49行数据作为校验数据集(validate_data.arff)。 第九步:从把剩下的total_data.arff文件改名为train_data.arff。 3. 实验过程及结果截图 3.1决策树分类 用“Explorer”打开刚才得到的“train-data.arff”,并切换到“Class”。点“Choose”按钮选择“tree (weka.classifiers.trees.j48)”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 训练

9、数据集训练决策树得出的结果 使用不同配置训练参数,得到的实验数据: 配置不同的叶子节点的实例个数 实例数/叶节点 2 3 4 5 6 准确率 54% 60% 56% 56% 56% 结果分析:使用决策树时,每个叶子节点最优的实例个数为3。 校验数据集校验决策树得出的结果 初步结果分析: 使用决策树进行分类,对于已知的49个类标号为male的数据都进行了准确的分类,并且达到100%;虽然是个很好的数据,但是完美背后隐藏了缺陷,是以对female类的低准确率作为代价的,因为这样会说明该分类器很有可能偏向male类。 3.2 K最近邻算法分类 点“

10、Choose”按钮选择“laze->ibk”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 训练数据集训练KNN得出的结果 使用不同配置训练参数,得到的实验数据: 配置不同的叶子节点的实例个数 K值 1 2 3 4 5 6 7 8 9 10 准确率 52% 54% 56% 58% 60% 58% 60% 68% 62% 62% 结果分析:使用KNN算法分类时,K最优值为8。 校验数据集校验KNN得出的结果 初步结果分析: 对使用k=8训练出来的

11、分类模型进行校验的结果,准确率达到77.6%,算是一个比较合理的分类结果。 3.3 朴素贝叶斯分类 点“Choose”按钮选择“bayes”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 训练数据集训练Naïve Bayes得出的结果 校验数据集校验Naïve Bayes得出的结果 初步结果分析: 评价结果中准确率仅仅达到59.1%,结果不是很让人满意。 3.4 三类分类方法的校验结果比较 决策树 K最近邻 朴素贝叶斯 校验准确率 100% 77.55% 59.

12、18% 训练 混淆矩阵 校验 混淆矩阵 标准误差 0.42 0.4654 0.5918 比较结果分析: 根据上述数据,虽然决策树有最高的完美的准确率和相对较好的标准误差,但是这种完美的背后,很有可能是以类标号female的较大错误率作为代价,这点可以从训练混淆矩阵中得到印证;而朴素贝叶斯分类算法的准确率相对较低,而标准误差也较高,综合评价可以得知,当前最好的分类算法是KNN算法,并且它是最优设置参数为k=8。 3.5 训练最优模型 使用预处理中的buildmodel_data.arff数据文件训练分类模型,算法为k=8的KNN。

13、数据集训练KNN得出的结果 使用最终模型对测试集进行预测结果 4.三种算法在进行测试的性能比较 4.1实验结果 决策树的测试结果: KNN测试结果: 朴素贝叶斯测试结果: 比较分析结论: 性能分析应该包括两个部分,一个部分是测试速度,另一个部分是测试的质量。由于本次使用所使用的数据量太少,在测试速度的对比上相差太少,无法进行准确的分析。而在测试质量上,可以从上述数据中得到,决策树依然是由于它对与male类标号的偏爱,导致质量的降低;而KNN与朴素贝叶斯相比,KNN具有较高的准确率,从性能角度上讲,KNN算法略胜一筹。 5.实

14、验总结 本次实验进行比较顺利,使我对如何在Weka中进行分类分析有了更深刻的了解,对Weka中进行分类分析的KNN算法,朴素贝叶斯算法和决策树算法都有了进一步的理解,同时也深刻体会到数据预处理对于数据挖掘的重要性。 男人看完这些文章还没过隐吗?请速度看下面的 ↓↓男人推荐精彩文章↓↓  注:下载原文后点及连接进入,不下载无法观看  ㊙少妇*女主播*玩车震,一晚17次*姿势诱人,原来是因为。。。。(点此进入 男人必看) 卖爆了,堪称装逼国产iPhone6~顶极高配神机~万众期待,顶级配置卖爆了!(苹果) ㊙ 一夜七次郎从此不再是神话!娱乐圈只用不说的秘密.... 男人的加油站

15、 一"战"到底,性福不停歇!用玛卡,还需要什么甜言蜜语! 【警惕】千万别让你的情敌先吃了“玛卡”!否则宝马车都留不住她! 那些如花般娇艳的女人,都因为有个强壮男人的浇灌!(点此进入 男人必看) 女人看完这些文章还没过隐吗?请速度看下面的  ↓↓女人推荐精彩文章↓↓ 注:下载原文后点及连接进入,不下载无法观看 养胸美胸比养脸更重要,女性朋友一定要知道 男人厌倦女人身体的全过程,惊呆了! 卖爆了!采用iphone6外观设计理念~顶极高配神机~万众期待,顶级配置卖爆了! TVS沿用劳力士经典款设计打造,顶级镶钻机械腕表官方活动价698元】限量1折抢大牌! 仅此一天全国货到付款!送自己送朋友送父母(孝敬父母首选) 14

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服