1、第2章源数据获取教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:8学时一、材料清单(1)ETL数据整合和处理(Kettle)教材。(2)引导性提问。(3)探究性问题。(4)拓展性问题。二、教学目标与基本要求1.教学目标在Kettle软件上,讲授Kettle与MySQL数据库之间的连接。讲授从数据库、Excel和 csv文件等源数据中获取数据的方法和操作,以及通过生成记录、生成随机数和获取系统 信息等源数据生成的方法和操作。让学生到达以下教学目标:(1)掌握数据库连接的创立方法和参数设置。
2、(2)熟悉抽取源数据和生成数据的常用方法。(3)掌握常用抽取源数据和生成数据组件及其参数设置。(4)熟悉组件处理后的结果数据解读。2 .基本要求(1)掌握Kettle与MySQL数据库之间的连接。(2)熟练建立转换工程和创立相关的转换组件。(3)掌握获取源数据的常用组件和参数设置。(4)掌握生成数据的常用组件和参数设置。(5)熟练浏览组件执行结果和掌握出错处理方法。问题1 .引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导 学生去思考和解决问题,从而到达理解、掌握课程知识点和技术点。(1) Kettle通过什么方法与数据库建立连接?(2) Kettle是怎
3、样获取数据的?(3) ) Kettle能够生成数据吗?(4) Kettle可以获取哪些典型类型文件的数据?(5)获取源数据需要编程吗?(5) .探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚 未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。(1)获取源数据的处理过程是怎么样的?(2)组件是什么?(3)组件参数有什么用?(4)获取数据库数据与文件数据的方法是否一样?(5)获取数据和生成数据的应用场景有何异同?(6)通过什么方法可以浏览获取的源数据?(6) 展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学
4、习层次, 而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完 成拓展性的问题。(1)组件的参数的作用是什么?(2) CSV和Excel文件都能用Excel查看文件数据,为何需要使用CSV文件、Excel 输入两个不同的组件来获取其数据?四、主要知识点、重点与难点L主要知识点(1)数据库连接,以及共享/停止数据库连接。(2)表输入、CSV文件、Excel输入等组件的参数设置和使用。(3)生成记录、生成随机数、获取系统信息等组件的参数设置和使用。2.重点(1)数据库连接以及共享连接的应用场景。(2)表输入、CSV文件、Excel输入等获取源数据组件的应用场景和操作。(
5、3)生成记录、生成随机数、获取系统信息等生成数据组件的应用场景和操作。3.难点表输入、CSV文件、Excel输入等组件的参数设置和不同之处。生成记录、生成随机数、获取系统信息等组件的参数设置和不同之处。五、教学过程设计1.理论教学过程(1)创立数据库连接。(2)共享/停止共享数据库连接。(3)表输入组件及其参数设置。(4) CSV文件组件及其参数设置。(5) Excel输入组件及其参数设置。(6)生成记录组件及其参数设置。(7)生成随机数组件及其参数设置。(8)获取系统信息组件及其参数设置。2.实验教学过程(1)在Kettle软件上,与MySQL建立数据库连接。(2)进行共享/停止共享数据库连接(3)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。(4)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。(5)建立转换工程和Excel输入组件,设置组件参数,运行和预览数据。(6)建立转换工程和生成记录组件,设置组件参数,运行和预览数据。(7)建立转换工程生成随机数组件,设置组件参数,运行和预览数据。(8)建立转换工程和获取系统信息组件,设置组件参数,运行和预览数据。六、教材与参考资料1 .教材.参考资料