1、大数据挖掘原理实践实习Theoretical Practice of Big Data Mining一、课程基本情况教学周数:1周学 分:1开课学期:第5学期课程性质:选修先修课程:数据库原理、概率论与数理统计、SAS软件基础适用专业:计算机相关专业教 材:David Hand, Heikki Mannila, Padhraic Smyth张银奎、廖丽、宋俊等译,数据挖掘原理,机械工业出版社,2003开课单位:计算机与软件学院计算机科学与技术系二、实习目标通过实践环节,使学生在了解大数据挖掘课程理论基础上,深入掌握大数据挖掘的原理。 使用理论课的基础知识的方法及步骤,进一步加深对大数据挖掘有关
2、概念和理论的理解,并且 使学生能够提高运用大数据挖掘解决实际问题的能力,并为毕业设计做准备。三、实习基本要求实习环节要求学生能够独立或小组合作形式,按预定题目实现出功能并完善相关算法的功 能。1)掌握大数据挖掘的开发方法学、各阶段的步骤、基本技术与方法;2)要求规范化完成系统设计、实施与转换等阶段;3)能够编写开发过程各阶段的主要文档;4)要求提交算法说明书和报告书;5)要求提交算法代码;6)实践环节终了要求进行算法功能演示。四、实习内容及时间安排具体实习内容时间安排所需时长 或学时数场地安排内容一数据挖掘常用的知识表示模式与 方法第17周2亚培楼内容二数据中的知识发现处理过程模型第17周2亚
3、培楼内容三知识发现工程的过程化管理第17周2亚培楼内容四关联规那么挖掘理论和算法第17周2亚培楼内容五层次聚类方法第17周2亚培楼内容六Web挖掘技术第17周2亚培楼内容七分类算法(C4.5算法、ID3算法)第17周2亚培楼内容八神经网络分类(感知器算法)第17周2亚培楼五、课程考核(1)实习报告的撰写要求:数据结构合理、功能完善、程序结构清晰、文档齐全并符合规范(2)实习报告:6次(3)考核及成绩评定:依据提交的各项文档、报告的齐全性、规范性,源码质量,以及功能演 示等进行综合评定。六、参考书目1、张云涛、龚玲著,数据挖掘原理与技术,电子工业出版社,20042、陈京民编著,数据仓库与数据挖掘技术,电子工业出版社,20023、林杰斌主编,数据挖掘与OLAP理论与实务,清华大学出版社,2003.14、朱明编著,数据挖掘,中国科学技术大学出版社,2002.25、Richard J. Roiger, Michael W. Geatz著,翁敬农 译,数据挖掘教程,清华大学出版社,20036、David Hand, Heikki Mannila, Padhraic Smyth 张银奎、廖丽、宋俊等译,数据挖掘原理, 机械工业出版社,2003七、有关说明