1、第5章高级转换
教案
课程名称:ETL数据整合和处理课程类别:必修
适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)
总学分:4.0学分本章学时:10学时
一、材料清单(1)《ETL数据整合和处理(Kettle)》教材。
(2)引导性提问。
(3)探究性问题。
(4)拓展性问题。
二、教学目标与基本要求.教学目标
讲授记录集连接、多路数据合并连接、单变量统计、公式、利用Janino计算Java表达 式、JavaScript代码、设置变量和获取变量等高级转换组件,进行复杂的数据转换处理的方 法和操作,让学生到达以下教学目标:
(1) 了解高级
2、转换常用组件的作用。
(2)掌握高级转换常用组件的参数及参数的设置方法。
(3)熟悉使用高级转换常用组件后的结果数据解读。
2.基本要求(1)掌握进行复杂数据处理的高级转换组件和参数设置。
(2)掌握浏览高级转换组件执行结果和出错处理的方法。
三、问题
1.引导性提问
引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导 学生去思考和解决问题,从而到达理解、掌握课程知识点和技术点。
(1)高级转换与字段处理、记录处理有什么不同?
(2)高级转换的参数设置是否十分复杂?
(3)高级转换组件是否可以代替常用的字段处理、记录处理中的组件?
(4)多路数据
3、合并为什么比记录集连接改为高效、快速?
(5)单变量统计能否对多个字段进行计算?
2 .探究性问题
探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚 未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。
(1)记录集连接要根据什么来进行数据连接?
(2)多路数据合并连接在什么场景下使用?
(3)利用janineo计算Java表达式、JavaScript代码组件中,哪一个需要编写脚本?
(4)单变量统计会产生新字段吗?
(5)单变量统计与公式的计算有什么不同?
(6)公式和利用janineo计算Java表达式的计算有什么相同和不
4、同点?
(7)为什么要设置变量?
(8)获取变量前需要设置什么?
3 .拓展性问题
拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完 成拓展性的问题。
(1)记录集连接为什么要进行记录排序?
(2)公式和利用janine。计算Java表达式两种计算方法,它们是否可以互为代替进行 计算?
(3)计算器组件计算3个以上字段的数据该如何处理?
(4)设置变量、获取变量在什么场景下使用?
四、主要知识点、重点与难点
1 .主要知识点
记录集连接、多路数据合并连接、单变量统计
5、公式、利用janineo计算Java表达式、 JavaScript代码、设置变量、获取变量等组件的参数设置和使用。
2 .重点
记录集连接、多路数据合并连接、单变量统计、公式、利用janine。计算Java表达式、 JavaScript代码、设置变量、获取变量等组件的应用场景和操作。
3 .难点
(1)记录集连接、多路数据合并连接、单变量统计、公式、利用janineo计算Java表 达式、JavaScript代码、设置变量、获取变量等组件的参数设置和不同之处。
(2) JavaScript代码组件的参数设置(3)设置变量、获取变量的场景应用
五、教学过程设计
1.理论教学过程(
6、1)记录集连接组件及其参数设置。
(2)多路数据合并连接组件及其参数设置。
(3)单变量统计组件及其参数设置。
(4)公式组件及其参数设置。
(5)利用janineo计算Java表达式组件及其参数设置。
(6) JavaScript代码组件及其参数设置。
(7)设置变量组件及其参数设置。
(8)获取变量组件及其参数设置。
2.实验教学过程(1)建立转换工程和记录集连接等组件,设置组件参数,运行和预览数据。
(2)建立转换工程和多路数据合并连接等组件,设置组件参数,运行和预览数据。
(3)建立转换工程和单变量统计等组件,设置组件参数,运行和预览数据。
(4)建立转换工程和公式等组件,设置组件参数,运行和预览数据。
(5)建立转换工程和利用janine。计算Java表达式等组件,设置组件参数,运行和预 览数据。
(6)建立转换工程和JavaScript代码等组件,设置组件参数,运行和预览数据。
(7)建立转换工程和设置变量等组件,设置组件参数,运行和预览数据。
(8)建立转换工程和获取变量等组件,设置组件参数,运行和预览数据。
六、教材与参考资料
1 .教材
2 .参考资料