资源描述
数据挖掘教学大纲
一、课程概况所属专业:计算机科学与技术开课单位:数学计算机科学学院
课程类型:院系选修课程课程代码:07492210学分:
学分:
开课学期:
学时:
课堂讲授24+实验16
核心课程:
拟使用教材:
Jiawei Han and Micheline Kamberz 著,范明,孟小峰译.Data mining: Concepts and Techniques (3nd edition).北京:机械工业出版社.2012.8 国内(外)现有教材:
Jiawei Han and Micheline Kamber.Data Mining: Concepts and Techniques(影印 版).高等教育出版社.2001 学习参考资料:
著,王志海等译,《数据仓库》,机械工业出版社,2000
著,王天佑译,《数据仓库管理》,机械工业出版社,2002
[3]Pang-Ning Tan著,范明等译.数据挖掘导论.人民邮电出版社.2006
⑷王珊.数据仓库技术与联机分析处理.清华大学出版社.2002
[5]安淑芝等•数据仓库与数据挖掘.清华大学出版社.2005
|6]二、课程描述
《数据挖掘》是计算机科学与技术专业的选修课程,后继于《数据库原理》,主要内容有常用数据处埋技术,分析提取数据中关联规那么,根据数据特征进行分 类与预测以及聚类。对学生了解计算机开展的前沿具有重要作用,也促进提高学 生独立分析、解决实际应用或者理论问题的能力。
三、课程目标
本课程的教学目的是使学生了解数据仓库与数据挖掘的产生和开展,了解数 据仓库与数据挖掘的作用;掌握数据仓库设计与实现的关键技术;掌握数据挖掘 的基本概念和方法;掌握几种主要数据挖掘算法并能应用于实际数据的处理;了 解局部变种数据挖掘算法的思路;最终能够胜任数据仓库设计与管理、数据挖掘 的工作。
四、教学要求
通过本课程的学习,要求学生初步掌握数据挖掘的重要概念和任务、数据挖 掘中的常用算法(决策树、关联规那么、范例推理、模糊聚类法、粗糙集、贝叶斯 网络、支持向量机、隐马尔科夫模型、进化和遗传算法、神经网络),以及数据 挖掘当前的研究动向。
依据本课程的教学目标、内容特点以及学生知识范围、主动性能动性等方面 特点,对授课教师“教”这一方面的要求有:(1)按照学校本科教学工作有关要 求做好课程教学各项工作;(2)多角度、多渠道学习、了解、掌握本领域相关前 沿知识,做好知识储藏工作;(3)授课过程力求内容充实、概念准确、思路清晰、 详略得当、逻辑性强、重难点突出,力戒平铺直叙、照本宣科;(4)重视对学生 的学习方法指导和课堂教学效果信息的反应,实现教与学的双向互动;(5)工程 驱动法、探究法等多种教学方法的深入或者结合使用。
对学生,,学”这方面的要求有:(1)认真阅读教材和参考资料,课前做好预 习,课上作好笔记,积极参与课堂案例讨论,课后按时完成书后每章的练习题和 教师补充的习题以及案例分析作业。(2)学习时要处理好全面和重点的关系、理 解和记忆的关系、理论方法和应用的关系,在全面学习的基础上掌握重点,在理 解的基础上记忆。不要死记硬背,要以理解基本原理和掌握分析方法为主。(3) 理论联系实际,结合上机实验,增强动手能力,提高理论理解水平。
五、考核方式及要求
为实现课程教学目标,本门课程考核方式及要求为:平时分40%+期末考试分60%。平时分包括:出勤率、作业完成情况、随堂测验。期末考试分卷面考试 与实践操作两局部,分别占总成绩的30%。
六、课程内容课堂讲授
第一章:引言
(授课时间:第六学期第一周)教学目标:了解在何种数据上进行数据挖掘、数据挖掘的功能、数据挖掘的分类、 数据挖掘的主要任务。
教学重点:在何种数据上进行数据挖掘、数据挖掘的分类教学难点:数据挖掘的分类
学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)什么是数据挖掘(2)在何种数据上进行数据挖掘
(3)数据挖掘的功能(4)所有模式都有趣吗
(5)数据挖掘的分类(6)数据挖掘的主要任务
学习方法:小组讨论、学习笔记、典型问题分析课后作业:
第二章:数据预处理(授课时间:第六学期第二周)
教学目标:掌握为什么要进行数据预处理,了解数据清理的作用、数据集成和转 换、数据归约、离散化和概念分层。
教学重点:为什么要进行数据预处理教学难点:数据归约、离散化和概念分层
学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)为什么要进行数据预处理(2)数据清理
(3)数据集成和转换(4)数据归约
(5)离散化和概念分层学习方法:小组讨论、学习笔记、典型问题分析
课后作业:
第三章:数据仓库和数据挖掘的OLAP技术
(授课时间:第六学期第三周)
教学目标:了解数据立方体技术,掌握多维数据模型、数据仓库的实现,数据仓 库的体系结构。
教学重点:数据仓库的体系结构教学难点:多维数据模型
学 时:课堂教学2学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)什么是数据仓库(2)多维数据模型
(3)数据仓库的体系结构(4)数据仓库的实现
(5)数据立方体技术(6)从数据仓库到数据挖掘
学习方法:小组讨论、学习笔记、典型问题分析课后作业:
第四章:挖掘大型数据库中的关联规那么
(授课时间:第六学期第四至六周)教学目标:了解有效的频繁项集挖掘方法,挖掘不同类型的关联规那么,从关联挖 掘到相关度分析,掌握基于约束的关联规那么挖掘。
教学重点:基于约束的关联规那么挖掘教学难点:从关联挖掘到相关度分析
学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)关联规那么基本概念(2)有效的频繁项集挖掘方法
(3)挖掘不同类型的关联规那么(4)从关联挖掘到相关度分析
(5)基于约束的关联规那么挖掘学习方法:小组讨论、实验操作(4学时)
课后作业:
第五章:分类和预测
(授课时间:第六学期第七至八周)教学目标:了解什么是分类?什么是预测,掌握基本决策树分类、贝叶斯分类、 后向传播分类、关联分类。
教学重点:决策树分类、贝叶斯分类教学难点:决策树分类、贝叶斯分类
学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)什么是分类?什么是预测(2)决策树分类
(3)贝叶斯分类(4)基于规那么的分类
(5)后向传播分类(6)关联分类
(7)精确度和错误度度量学习方法:小组讨论、实验操作(4学时)
课后作业:
第六章:聚类分析
(授课时间:第六学期第十至十二周)
教学目标:了解什么是聚类分析、主要的聚类分析方法分类,掌握基本划分方法、 层次方法、密度方法、异常点分析。
教学重点:划分方法、层次方法教学难点:划分方法、层次方法
学 时:课堂教学6学时,课外自主学习时间不少4学时教学方法:讲授法、演示法
主要内容:(1)什么是聚类分析(2)聚类分析的数据类型
(3)主要的聚类分析方法分类(4)划分方法
(5)层次方法(6)密度方法
(7)异常点分析学习方法:小组讨论、实验操作(4学时)
课后作业:
实验实验一:Microsoft SQL Server Analysis Services 的使用
(授课时间:第六学期第十至十一周)教学目标:学习并掌握Analysis Services的操作,加深理解数据仓库中涉及的一 些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机 分析处理等。
主要内容:在实验之前,先通读自学SQL SERVER自带的Analysis Manager概 念与教程。按照自学教程的步骤,完成对FoodMart数据源的联机分 析。建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析 数据。
学 时:4学时教学方法:演示法/讲授/现场指导
实验类型:验证性实验实验二:使用WEKA进行关联规那么分析
(授课时间:第六学期第十二至十三周)
教学目标:掌握数据挖掘平台WEKA的使用。综合运用数据预处理、关联规那么 挖掘算法、结果的解释等知识进行数据挖掘。从而加深理解课程中的 相关知识点。
主要内容:阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA, 针对实际数据,能够使用WEKA进行数据的预处理,了解属性选择, 能选择合适的关联规那么算法对数据进行分析,并能解释分析结果。
学 时:4学时教学方法:演示法/讲授/现场指导
实验类型:综合性实验实验三:使用WEKA进行分类与预测
(授课时间:第六学期第十四至十五周)教学目标:掌握数据挖掘平台WEKA的使用。综合运用数据预处理、分类与预 测的挖掘算法、结果的解释等知识进行数据挖掘。从而加深理解课程 中的相关知识点。
主要内容:阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA, 针对实际数据,能够使用WEKA进行数据的预处理,能选择合适的 分类与预测算法对数据进行分析,并能解释分析结果。
学 时:4学时教学方法:演示法/讲授/现场指导
实验类型:综合性实验实验四:数据挖掘算法的程序实现
(授课时间:第六学期第十六至十七周)教学目标:运用数据挖掘、程序设计等相关知识,选择一个数据挖掘的常用算法 进行程序设计实现。加深对数据挖掘算法基本原理、详细执行过程和 具体应用情况的理解
主要内容:采用任何一种自己熟悉的编程语言,完成算法的程序设计,并在每个 程序设计语句后面进行详细的注释。能够运用实现的算法来解决某个 具体的问题,得到并解释程序运行的结果。推荐的算法:1关联规那么: Apriori 算法;2 分类与预测:ID3,C4.5,KNN,BP; 3 聚类:k-means 学 时:4学时教学方法:演示法/讲授/现场指导
实验类型:设计性实验
实验三、四也可以继续在Microsoft SQL Server Analysis Services进行。
展开阅读全文