1、商务智能与数据挖掘Business Intelligence and Data Mining一、课程基本情况课程类别:专业主干课课程学分:4 学分课程总学时:64学时,其中讲课:28学时,实验(含上机):36学时课程性质:必修开课学期:第5学期先修课程:概率论与数理统计、数据库原理及应用、数据结构适用专业:信息管理与信息系统教 材:数据挖掘概念与技术,机械工业出版社,Jiawei Ilan, Micheline Kamber著, 范明等译,2012年,第三版。开课单位:经济管理学院信管系二、课程性质、教学目标和任务商务智能和数据挖掘课程根据我校人才培养的特点和要求,面向信息管理与信息系统本 科
2、专业,从企业实际应用出发,全面、系统地介绍商务智能和数据挖掘的基本概念、基本方 法和基本技术,以及商务智能和数据挖掘的最新进展,使学生对商务智能和数据挖掘的概念 和技术有深入的认识和了解。通过对商业数据的分析使学生更加深入地理解常用的数据挖掘 模型,掌握大型数据挖掘软件IBM SPSS Modeler等工具的使用,培养学生将实际的商业问题 转化为数据挖掘目标、理解和收集数据、应用数据挖掘工具建模、评估模型以判断是否符合 商业目的,并将发现的结果组织成可读文本的能力,使学生的理论知识和实践技能得到共同 开展。三、教学内容和要求第1章引言(3学时)(1)了解商务智能的起源和驱动力,数据挖掘系统的分
3、类和应用;(2)理解数据挖掘的对象,模式的筛选;(3)掌握商务智能的定义和架构,数据挖掘概念、数据挖掘功能;重点:商务智能的定义和架构,数据挖掘的概念和功能难点:数据挖掘的功能第2章数据仓库和OLAP (2学时)(1)了解数据仓库的系统结构;(2)理解数据库与数据仓库的区别,多维数据模型上的OLAP操作;(3)掌握数据仓库的概念,多维数据模型;重点:数据仓库,OLAP难点:多维数据模型第3章数据预处理(3学时)(1) 了解数据预处理的作用及原因;(2)理解数据清理、数据集成和变换、数据归约的方法;(3)掌握数据预处理的各种形式;重点:数据预处理的形式难点:离散化和概念分层第4章挖掘大型数据库中
4、的关联规那么(4学时)(1) 了解由事务数据库挖掘多层关联规那么的方法步骤,由关系数据库和数据仓库挖掘多维 关联规那么;(2)理解相关分析的意义,关联规那么的基本思想、概念和意义;(3)掌握经典Apriori算法;重点:关联规那么,Apriori算法难点:相关分析第5章分类分析(4学时)(1) 了解分类的一般方法;(2)理解分类分析的基本思想、概念和意义;(3)掌握常用的分类算法;重点:分类分析的基本思想,常用的分类算法难点:决策树归纳算法的属性选择第6章聚类分析(4学时)(1)了解基本的聚类方法;(2)理解聚类分析的基本思想、概念和意义;(3)掌握常用的聚类算法,如k-means算法;重点:
5、常用的聚类算法难点:相异度计算第7章IBM SPSS Modeler基础(2学时)(1) 了解 IBM SPSS Modeler 的功能;(2)理解使用IBM SPSS Modeler中一些可用的数据处理技术,并使用这些技术清洗和精炼 数据(3)掌握数据读入IBM SPSS Modeler的常用方法重点:数据读入IBM SPSS Modeler的方法难点:CLEM第8章IBM SPSS Modeler建模技术(6学时)(1)理解数据建模的结果;(2)掌握IBM SPSS Modeler的常用建模节点如aprior节点、C5.0节点、C&R树节点、k-means节点、kohonen 节点等;重点
6、:IBM SPSS Modeler的常用建模节点难点:数据建模结果的解释四、课程考核(1)作业等:作业:3次;(2)考核方式:考试(3)总评成绩计算方式:平时成绩和期末考核成绩等综合计算五、参考书目(1)数据挖掘:概念、模型、方法和算法,清华大学出版社,(美)坎塔尔季奇著,王晓 海译,2013年,第2版。(2)数据挖掘导论(完整版),人民邮电出版社(美)陈封能,(美)斯坦巴赫,(美)库玛 尔著,范明等译,2011年(3)大数据:互联网大规模数据挖掘与分布式处理,美Anand RajaramanJeffrey David Ullman 著,王斌 译,2012 年(4)数据挖掘技术(第3版)一一应用于市场营销、销售与客户关系管理,(美)林那夫 等著,等译,2013年。(5)商务智能:数据分析的管理视角(原书第3版),机械工业出版社,(美)拉姆什沙 尔达(Ramesh Sharda)等著;赵卫东译,2015年