资源描述
《物联网智能信息处理》
实 验 报 告
学院:计算机科学技术学院
专业班级:物联网工程1101
学号:2011001557
姓名: 孙泽东
日期:2014年11月25日
实验一 数据预处理实验(2个学时)
一、实验目的:
熟悉数据预处理的一般流程,重点掌握异常点检测算法,为进一步挖掘数据做准备。
二、实验内容:
1.了解数据特点,熟悉2-3种数据集数据格式;
2.掌握1种以上异常点检测原理;
3.验证某种异常点检测算法;
4.分析异常点检测算法检测结果。
三、实验要求:
在熟悉2-3种数据集数据格式的基础上,选择Dev- C++等开发环境打开异常点检测算法源代码,搞清算法基本原理,接着修改其数据源(数据文件路径及文件名等)、常量大小等,调试程序并试运行,在此基础上修改数据输出方式,统计异常点个数等,完成实验报告。
四、实验环境:
软件环境:Windows/Linux,C++(Dev-C++);
硬件环境:P4 2.4G/80G/1G/64M及较高配置的PC机。
五、实验步骤:
1.安装和配置Dev-C++开发环境;
2.通过查阅课本、网络资料和研读教师提高的材料,了解相关知识;
3.按照实验要求,逐步完成实验内容;
4. 调试程序,输出结果,并进行记录。
结果
六、思考题:
1.为什么要对数据进行预处理?
数据预处理是非常重要的一环,且必不可少,要获得满意的处理效果(挖掘出有用的知识),必须提供干净,准确,简洁的数据,而实际系统中有很多“脏数据”,必须处理掉。
2. 什么样的数据点算异常点?
异常点是在数据集中与众不同的数据,使人怀疑这些数据并非书记偏离,而是产生于完全不同的机制。
展开阅读全文