1、物联网智能信息处理实 验 报 告 学院:计算机科学技术学院 专业班级:物联网工程1101 学号:2011001557 姓名: 孙泽东 日期:2014年11月25日实验一 数据预处理实验(2个学时)一、实验目的:熟悉数据预处理的一般流程,重点掌握异常点检测算法,为进一步挖掘数据做准备。二、实验内容:1.了解数据特点,熟悉2-3种数据集数据格式;2.掌握1种以上异常点检测原理;3.验证某种异常点检测算法;4.分析异常点检测算法检测结果。三、实验要求:在熟悉2-3种数据集数据格式的基础上,选择Dev- C+等开发环境打开异常点检测算法源代码,搞清算法基本原理,接着修改其数据源(数据文件路径及文件名等
2、)、常量大小等,调试程序并试运行,在此基础上修改数据输出方式,统计异常点个数等,完成实验报告。四、实验环境:软件环境:Windows/Linux,C+(Dev-C+);硬件环境:P4 2.4G/80G/1G/64M及较高配置的PC机。五、实验步骤:1安装和配置Dev-C+开发环境;2通过查阅课本、网络资料和研读教师提高的材料,了解相关知识;3按照实验要求,逐步完成实验内容;4. 调试程序,输出结果,并进行记录。结果六、思考题:1为什么要对数据进行预处理?数据预处理是非常重要的一环,且必不可少,要获得满意的处理效果(挖掘出有用的知识),必须提供干净,准确,简洁的数据,而实际系统中有很多“脏数据”,必须处理掉。2 什么样的数据点算异常点?异常点是在数据集中与众不同的数据,使人怀疑这些数据并非书记偏离,而是产生于完全不同的机制。