1、数据仓库与数据挖掘教学大纲一、课程概述数据挖掘是一门新兴的交叉性学科,是在信息技术领域迅速兴起的决策支持新技术。数据挖掘是数据库研究、开发、和应用最为活跃的分支之一。本课程的先修课程为数据结构、高等数学、数据库技术等。本课程标准适用于计算机科学与技术、信息管理与信息系统专业。二、课程目标1了解数据管理技术从数据库到数据仓库的发展过程。 2掌握数据仓库的定义、特点和研究数据仓库的必要性。 3掌握数据仓库的体系结构和联机分析处理的概念4掌握数据仓库的数据组织、数据预处理与规划管理 5掌握数据仓库规划、设计、管理的基本方法 6掌握数据挖掘的基本概念及与数据仓库的关系7熟悉聚类分析、分类发现和关联规则
2、等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。8认识数据挖掘的发展趋势和应用前景9能够在科研实践中应用数据仓库技术和应用数据挖掘的方法。三、课程内容和教学要求这门学科的知识与技能要求分为知道、理解、掌握、学会四个层次。这四个层次的一般涵义表述如下:知道是指对这门学科和教学现象的认知。理解是指对这门学科涉及到的概念、原理、策略与技术的说明和解释,能提示所涉及到的教学现象演变过程的特征、形成原因以及教学要素之间的相互关系。掌握是指运用已理解的教学概念和原理说明、解释、类推同类教学事件和现象。学会是指能模仿或在教师指导下独立地完成某些教学知识和技能的操作任务,或能识别操作中的一般差错
3、。教学内容和要求表中的“”号表示教学知识和技能的教学要求层次。本标准中打“*”号的内容可作为自学,教师可根据实际情况确定要求或不布置要求。教学内容及教学要求表教学内容知道理解掌握学会1 数据仓库概述1.1从数据库到数据仓库 1.2 数据仓库的概念与特点 1.3 数据仓库中的关键概念 1.4 数据仓库的数据组织 1.5 数据仓库与数据集市的关系 1.6 数据仓库体系结构 1.7 操作数据存储ODS 2 联机分析处理2.1 联机分析处理的概念 2.2 OLAP多维数据分析 2.3 OLAP数据组织 2.5 OLAP工具及评价 3 数据仓库设计3.1 数据仓库中的数据模型概述3.2概念模型设计3.3
4、 逻辑模型设计3.4 物理模型设计3.5 元数据模型3.6 粒度模型4数据仓库的规划与开发4.1 数据仓库的投资分析4.2 数据仓库的开发方法4.3 数据仓库的建立过程4.4 数据仓库的维护4.5 提高数据仓库的性能4.6 数据仓库的安全性4.7 分布式数据仓库5数据仓库的工具51数据仓库的工具选择5.2 常用数据仓库产品介绍5.3 SQL Server 数据仓库的操作应用6 数据挖掘概述6.1 数据挖掘的定义对象6.2 数据挖掘的分类6.3 数据挖掘系统6.4 数据预处理7数据挖掘的算法7.1 分类规则挖掘7.2 预测分析与趋势分析规则7.3 数据挖掘的关联算法7.4 聚类分析7.5 神经网
5、络算法8数据挖掘新技术9数据挖掘的工具及其应用9.1 国内外数据挖掘工具及评价9.2 SQL Server 2005数据挖掘工具应用10基于数据挖掘的上市公司财务危机预警应用实例四、 课程实施数据仓库与数据挖掘为计算机类选修课程,对于本科生着重强调理解基本概念和掌握最基本的方法,一般情况下,每周安排2课时,共36课时。课时安排及教学方法表教学内容课时建议教与学的方法建议按36课时计1 数据仓库概述讲课3学时讲授为主2 联机分析处理讲课4学时讲授为主并辅以实例讨论. 分析3 数据仓库设计讲课4学时讲授为主并辅以实例讨论. 分析4 数据仓库的规划与开发讲课3学时讲授为主并辅以实例讨论. 分析5 数
6、据仓库的工具讲课3学时讲授为主并辅以实例讨论. 分析6 数据挖掘概述讲课2学时讲授为主7 数据挖掘的算法讲课6学时讲授为主并辅以实例讨论. 分析8 数据挖掘新技术讲课2学时讲授为主9 数据挖掘的工具及其应用讲课2学时讲授为主并辅以实例讨论. 分析10数据仓库与数据挖掘的综合应用讲课4学时讲授为主并辅以实例分析11基于数据挖掘的上市公司财务危机预警应用实例讲课2学时讲授为主并辅以实例讨论. 分析合计:36课时五、教材及参考书目教材:李志刚 马刚主编 数据仓库与数据挖掘的原理及应用 高等教育出版社 2008年参考资料:1、Richard J. Roiger, Michael W. Geatz 著,
7、 翁敬农 译数据挖掘教称, 清华大学出版社,20032、Jiawei Han, Micheline Kamber. 著,范明、孟小峰等译数据挖掘概念与技术,机械工业出版社,20013、Mehmed Kantardzic 著,闪四清、陈茵、程雁等译数据挖掘概念、模型、方法和算法,清华大学出版社,20034、R.Groth著,何迪、宋擒豹译,数据挖掘构筑企业竞争优势,西安交通大学出版社,20015、史忠植编著,知识发现,清华大学出版社,20026、陈京民编著,数据仓库与数据挖掘技术,电子工业出版社,20027、David Hand, Heikki Mannila, Padhraic Smyth著,
8、张银奎、廖丽、宋俊等译,数据挖掘原理,机械工业出版社,20038、陈文伟编著,智能决策技术,电子工业出版社,19989、张云涛、龚玲著,数据挖掘原理与技术,电子工业出版社,200410、施鸿宝编著,神经网络及其应用,西安交通大学出版社,1993六、课程评价1. 这门学科的评价依据是本课程标准规定的课程目标. 教学内容和要求。2. 考试时间:120分钟。3. 考试方式. 分制与分数解释采用闭卷笔试的期终考试方式,以百分制评分,60分为及格,满分为100分。其中,平时成绩为30分,期终考试卷面为70分。4. 题型:填空题,名词解释,简答题,论述题。5. 样题与目标定位示例( 1 )填空题(着重考察学生对知识的识别程度) 例:数据准备的主要内容包括_ 、和数据精简。 ( 2 )名词解释(着重考察学生对知识的识别与理解程度) 例:联机分析处理( 3 )简答题(着重考察学生对知识的理解程度) 例:请简单说说什么是数据仓库,它有哪些特点? ( 4 )论述题(着重考察学生对知识的识别与理解程度) 例:简述在数据挖掘中数据精简的必要性与主要内容制定该课程标准小组成员: 审核者名: