资源描述
大数据技术教学大纲
一、课程概况所属专业:计算机科学与技术 开课单位:数学计算机科学学院
课程类型:院系选修课程课程代码:07492280开课学期:6学分:2
学时:课堂讲授24+实验16核心课程:否拟使用教材:
林子雨.大数据技术原理与应用——概念、存储、处理、分析与应用.人民邮 电出版社.2015.8国内(外)现有教材:
[1]陆嘉恒.Hadoop实战.机械工业出版社.2011
[2]曾大聃,周傲英(译).Hadoop权威指南中文版.清华大学出版社.2010
[3]迪米达克(Nick Dimiduk),卡拉纳(AmandeepKhurana),谢磊.《HBase 实 战中文版》.人民邮电出版社.2013.9学习参考资料:
厦门大学教材官网:二、课程描述
本课程为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识 体系、说明基本原理、引导初级实践、了解相关应用”为原那么,为学生在大数据 领域“深耕细作”奠定基础、指明方向。课程将系统讲授大数据的基本概念、大 数据处理架构Hadoop>分布式文件系统HDFS、分布式数据库HBase、NoSQL 数据库、云数据库及大数据在互联网领域的应用。在Hadoop> HDFS和HBase 等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技 术。
三、课程目标
建立对大数据知识体系的轮廓性认识,了解大数据开展历程、基本概念、主 要影响、应用领域、关键技术、计算模式和产业开展,并了解云计算、物联网的 概念及其与大数据之间的紧密关系;
了解Hadoop的开展历史、重要特性和应用现状,Hadoop工程结构及其各个 组件,并熟练掌握Hadoop平台的安装和使用方法;
了解分布式文件系统的基本概念、结构和设计需求,掌握Hadoop分布式文 件系统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌握分布式 文件系统HDFS的使用方法;
了解分布式数据库HBase的访问接口、数据模型、实现原理和运行机制, 并熟练掌握HBase的使用方法;
了解NoSQL数据库与传统的关系数据库的差异、NoSQL数据库的四大类型 以及NoSQL数据库的三大基石;基本掌握Redis、MongoDB等NoSQL数据库 的使用方法;
了解云数据库的概念、基本原理;
了解大数据在互联网等领域的典型应用。
四、教学要求
大数据技术是紧跟时代需求的一门专业技术,实践性强,因此教师在教授课 程时需要掌握大数据最新技术动态,并注意理论与实验相结合,锻炼学生实践动 手和实际应用能力。
五、考核方式及要求
为实现课程教学目标,本门课程采用过程性考核和期末考核结合的方式进行 考核。过程性考核占总成绩40%,其中:考勤占20%,随机点到,每人不少于5 次,其中无故缺席2次,按无考勤成绩计算;课程测验1次,占40%,测验时间 和内容根据教学进度由教师安排;课程作业6次,按批改成绩折算,占40%。期 末考核占总成绩60%,为闭卷考试。
六、课程内容课堂教授
第一章:大数据概述
(授课时间:第六学期第一至二周)教学目标:介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网 的相互关系。
教学重点:大数据的概念;大数据、云计算和物联网三者之间的区别与联系。
教学难点:大数据、云计算和物联网三者之间的区别与联系。
学时:课堂教学4学时教学方法:讲授法、演示法
主要内容:(1)大数据时代(2)大数据概念
(3)大数据的影响(4)大数据的应用
(5)大数据关键技术(6)大数据计算模式
(7)大数据产业(8)大数据与云计算、物联网的关系
学习方法:小组讨论课后作业:大数据的应用及大数据关键技术;大数据与云计算、物联网的关系
第二章:大数据处理架构Hadoop(授课时间:第六学期第三至四周)
教学目标:介绍大数据处理架构Hadoop,在Linux系统下完成Hadoop的安装和 配置。
教学重点:HDFS和MapReduce是Hadoop的两大核心组件;在Linux系统下完 成Hadoop的安装和配置。
教学难点:HDFS和MapReduce是Hadoop的两大核心组件;在Linux系统下完 成Hadoop的安装和配置。
学时:课堂教学4学时教学方法:讲授法、演示法
主要内容:(1)概述Hadoop工程结构
(2) Hadoop的安装与使用Hadoop集群的部署与使用
学习方法:小组讨论课后作业:在Linux系统下完成Hadoop的安装和配置。
第三章:分布式文件系统HDFS(授课时间:第六学期第五至六周)
教学目标:了解分布式文件系统的基本概念、结构和设计需求,掌握分布式文件 系统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌 握分布式文件系统HDFS的使用方法。
教学重点:分布式文件系统HDFS的基本原理和使用方法教学难点:分布式文件系统HDFS的基本原理
学时:课堂教学4学时教学方法:讲授法、演示法
主要内容:(1)分布式文件系统HDFS 简介
(2) HDFS相关概念HDFS体系结构
(3) HDFS存储原理HDFS数据读写过程
(4) HDFS编程实践学习方法:小组讨论 课后作业:掌握分布式文件系统HDFS的基本原理和使用方法。
第四章:分布式数据库HBase(授课时间:第六学期第七至八周)
教学目标:了解分布式数据库HBase的访问接口、数据模型、实现原理和运行 机制,并熟练掌握HBase的使用方法。
教学重点:分布式数据库HBase的基本原理和使用方法教学难点:分布式数据库HBase的基本原理
学时:课堂教学4学时教学方法:讲授法、演示法
主要内容:(1)概述HBase访问接口
(5) HBase数据模型HBase的实现原理
(6) HBase运行机制HBase应用方案
(7) HBase编程实践学习方法:小组讨论
课后作业:掌握分布式数据库HBase的访问接口、数据模型、实现原理和运行 机制,并熟练掌握HBase的使用方法。
第五章:NoSQL数据库
(授课时间:第六学期第九周)教学目标:了解NoSQL数据库与传统的关系数据库的差异、NoSQL数据库的四 大类型以及NoSQL数据库的三大基石;基本掌握Redis、MongoDB 等NoSQL数据库的使用方法。
教学重点:NoSQL数据库的概念和基本原理教学难点:NoSQL数据库的基本原理
学时:课堂教学2学时教学方法:讲授法、演示法
主要内容:(1) NoSQL简介NoSQL兴起的原因
(2) NoSQL与关系数据库的比拟NoSQL的四大类型
(3) NoSQL的三大基石(6)从NoSQL到NewSQL数据库
(7)文档数据库MongoDB学习方法:小组讨论
课后作业:基本掌握Redis、MongoDB等NoSQL数据库的使用方法。
第六章:云数据库(授课时间:第六学期第十周)
教学目标:了解云数据库的概念、特性及其与其他数据库的关系;云数据库的代 表性产品和厂商;如何使用云数据库。
教学重点:云数据库的概念和基本原理教学难点:云数据库的基本原理
学时:课堂教学2学时教学方法:讲授法、演示法
主要内容:(1)云数据库概述(2)云数据库产品
(3)云数据库系统架构(4)Amazon AWS和云数据库
学习方法:小组讨论课后作业:掌握云数据库系统架构。
第十一章:大数据在互联网领域的应用
(授课时间:第六学期第十一至十二周)教学目标:了解推荐系统的概念及不同的推荐方法以及推荐系统在电子商务等网 站中的具体应用和协同过滤算法的基本思想、协同过滤实践。
教学重点:协同过滤算法的基本思想教学难点:协同过滤算法的基本思想
学时:课堂教学4学时教学方法:讲授法、演示法
主要内容:(1)推荐系统概述(2)推荐算法-协同过滤
(3)协同过滤实践-电影推荐系统学习方法:小组讨论
课后作业:掌握协同过滤算法和协同过滤实践。
实验实验一:Hadoop安装与使用
(授课时间:第六学期第一至二周)教学目标:掌握Hadoop的三种安装方式。
主要内容:在Linux系统的基础上,Hadoop的安装和配置及其使用。
学时:4学时教学方法:演示法/讲授/现场指导
实验类型:验证性实验实验二:HDFS安装与使用
(授课时间:第六学期第三至五周)教学目标:掌握HDFS相关实验
主要内容:掌握HDFS的安装方法和HDFS编程的使用。
学时:6学时教学方法:演示法/讲授/现场指导
实验类型:验证性实验实验三:HBase安装与使用
(授课时间:第六学期第六至八周)
教学目标:掌握HBase相关实验主要内容:掌握HBase的安装、配置和HBase数据库基本操作的使用。
学时:6学时教学方法:演示法/讲授/现场指导
实验类型:验证性实验
展开阅读全文