1、数据仓库与数据挖掘课程教学大纲一、课程基本信息课程代码:05120113课程名称:数据分析与挖掘课程英文名称:Data Mining课程所属单位:计算机与信息工程系计算机科学与技术教研室课程面向专业:计算机科学与技术本科、信息管理与信息系统课程类型:(填写必修课或选修课) 选修先修课程:数据库原理学分:1.5总学时:30(其中理论学时:20 实验学时:10)二、课程性质与目的随着计算机应用的普及,各个领域、各个行业都积累了大量的数据,这些数据的开发使用并从中得 到新的知识已是当今重要而又紧迫的任务。学生学习这个课程,即可用一种科学的、系统的、完善的方 法去解决这些问题,而且也还可使他们能有进一
2、步直接阅读近年内这个课程有关论文的基础知识,为他 们进一步深造做了准备。了解数据仓库与数据挖掘的概念,掌握数据仓库的系统框架及整体结构,掌握数据仓库的设计及开 发过程,正确理解OLAP及其在数据仓库系统中的作用。了解数据挖掘的开展及基本概念,能够掌握一 些数据挖掘的技术及算法,能够使用一两种数据挖掘工具进行商业智能系统中知识的发现及分析。三、课程教学内容与要求(-)引言1、基本要求:了解数据挖掘的基本知识和开展历程(1)什么是数据挖掘(2)在何种数据上进行数据挖掘(3)数据挖掘的功能和开展历史(4)数据挖掘系统的分类2、重难点内容:什么是数据挖掘及其功能(二)数据仓库和数据挖掘的OLAP技术1
3、、基本要求:明确数据仓库和数据挖掘的概念,并且了解其中的联系和区别(1)什么是数据仓库(2)数据仓库的基本结构及实现(3)从数据仓库到数据挖掘2、本章重难点内容:数据仓库和数据挖掘之间的联系和区别(三)数据预处理1、基本要求:了解数据预处理的几种基本方法和过程(1)为什么要进行数据预处理(2)数据清理(3)数据集成和变换(4)数据归约(5)离散化和概念分层生成2、本章重难点内容:数据预处理的目的和过程(四)数据挖掘原语、语言和系统结构1、基本要求:制定数据挖掘查询语言,数据挖掘系统的结构(1)数据挖掘原语:定义数据挖掘任务(2) 一种数据挖掘查询语言(3)数据挖掘系统的结构2、本章重难点内容:
4、数据挖掘系统的结构(五)概念描述:特征化与比拟1、基本要求:概念描述的目的和过程(1)什么是概念描述(2)数据概化(3)解析特征化(4)区分不同的类(5)在大型数据库中挖掘描述统计度量2、本章重难点内容:概念描述的过程(六)挖掘大型数据库中的关联规那么1、基本要求:了解关联规那么挖掘的基本算法apriori,以及在此基本算法基础上衍生出来的其他算 法(1)关联规那么挖掘(2)由事务数据库挖掘单维布尔关联规那么(3)由关联规那么到相关分析2、本章重难点内容:关联规那么的基本算法(七)分类和预测1、基本要求:了解分类和预测的基本算法,例如决策树、贝叶斯分类,后向传播分类等(1)分类和预测的基本概念
5、(2)用决策树归纳分类(3)贝叶斯分类和后向传播分类(4)预测2、本章重难点内容:决策树分类的具体过程(八)聚类分析1、基本要求:了解聚类分析的基本算法,例如k-means和BIRCH等(1)聚类分析中的数据类型(2)主要聚类方法(3)孤立点分析2、本章重难点内容:k-means方法的具体过程(九)数据挖掘的应用和开展趋势1、基本要求:了解数据挖掘的应用和开展趋势(1)数据挖掘系统产品和研究原型(2)数据挖掘的社会影响(3)数据挖掘的开展趋势2、本章重难点内容:数据挖掘的产品及其开展趋势四、学时分配学时分配表合计序 号教学内容(按章填写)学时课 堂 讲 授实 验 课习 题 课讨 论 课其它1引
6、言22数据仓库和数据挖掘的OLAP技术23数据预处理24数据挖掘原语、语言和系统结构245概念描述:特征化与比拟26挖掘大型数据库中的关联规那么367分类和预测38聚类分析29数据挖掘的应用和开展趋势2小计2010比例66.7%33.3%30实验学时分配表序 号实验工程(或内容)名称实验学时实验类型每组 实验 人数说明验 证 性设 计性综 合 性其它1数据挖掘工具的应用42Apriori算法在vc下的实现6小计10五、教学环节与教学要求:了解数据仓库与数据挖掘的概念,掌握数据仓库的系统框架及整体结构,掌握数据仓库的设计及开 发过程,正确理解OLAP及其在数据仓库系统中的作用。了解数据挖掘的开展及基本概念,能够掌握一 些数据挖掘的技术及算法,能够使用一两种数据挖掘工具进行商业智能系统中知识的发现及分析。六、课程考核方法:本课程采用闭卷考试1、案例作业/实验:25%2、课堂参与:5%3、考试:70%七、教材与主要参考书:数据挖掘-概念与技术Jiawei Han, Micheline Kamber.范明孟小峰译.机械工业出版社,2001