ImageVerifierCode 换一换
格式:PPTX , 页数:34 ,大小:1.50MB ,
资源ID:858294      下载积分:11 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/858294.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(IBMDataStage技能培训.pptx)为本站上传会员【可****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

IBMDataStage技能培训.pptx

1、2017/03/022017/03/02 IBM DataStage技能培训技能培训内部培训内部培训编写者编写者-Wanke.Li-Wanke.Li培训内容大纲1 IBM DatastageV9.1.01工具介绍2 DataStage工具的组成3 Stage控件介绍,源库的连接方式及比较4 常用Stage使用的介绍5 Parallel JOB,Sequence JOB例子6 DataStage的调度7 DataStage存储过程的调用8 DataStage 备份及恢复9 DataStage常见错误处理培训内容大纲培训内容大纲什么是DataStage?最专业的ETL工具工具,价格不菲,使用难度一

2、般。IBM WebSphere DataStage(下面简称为DataStage)为整个 ETL 过程提供了一个图形化的开发环境,它是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化,并将其输入数据集市或数据仓库的集成工具。多种字符集支持,Datastage几乎支持目前所有的编码格式。传统的数据整合方式需要大量的手工编码,而采用 IBM DataStage 进行数据整合可以大大的减少手工编码的数量,而且更加容易维护。数据整合的核心内容是从数据源中抽取数据,然后对这些数据进行转化,最终加载到目标数据库或者数据仓库中去,这也就是我们通常所说的ETL过程其它ETL集成工具Infor

3、matica 公司的PowerCenter 专业程度如Datastage旗鼓相当,也是图形化界面开发,很多控件的功能与Datastage相似,价格似乎比Datastage便宜,可以在Window、Linux、Unix、Aix等多个环境上运行。Kettle Kettle 中文名叫水壶,纯java编写的开源ETL工具,开源当然就免费,免费的有些东西使用就不是很方便,很多功能需要结合Java开发,可以在Window、Linux、Unix、Aix上运行,数据抽取高效稳定。ODI Oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深完完备的开的开发环境境 IBM WebSphere

4、DataStage 的开发环境是基于 C/S 模式的,通过 DataStage Client 连接到DataStage Server 上进行开发,DataStage Server 支持多种平台,比如 Windows、Redhat Linux、IBM AIX、HP-UNIX等。DataStage架构图DataStage可操作的数据源DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统等,以下列出它所能处理的主要数据源:1、大型主机系统数据库:IMS,DB2,ADABAS,VSAM等2、开放系统的关系数据库:Oracle,DB2,Micro

5、soft SQL Server,Teradata,Informix,Sybase等3、ERP系统:SAP/R3,PeopleSoft,SAS(Statistical Analysis System)系统等4、普通文件和复杂文件系统,FTP文件系统,XML等5、Web ServicesDataStage工具的组成DataStage企业版使用了Client-server架构,如下所示。Designer 工具Designer:用来创建各种可执行的Job(Job Sequence,Parallel Job,Server Job),修改删除各种Job,设置Job的参数;导入表的元数据(表结构),自定义用

6、户元数据1.Job的开发2.Job的编译3.Job的执行4.Job的DEBUG5.Job Report的生成Administrator 工具 用来执行管理任务,如建立DataStage用户、建立和删除工程并且建立清洗标准。设置工程的各种参数属性;系统的环境变量属性,服务器字符集、并行作业字符集设置,自动清除日志设置等。Manager 工具DataStage Manager主要用来管理项目资源。一个项目可能包含多个ETL Job,可以用DataStage Manager把一个项目里面的ETL Job导出来。然后再用DataStage Manager导入到另外一个项目中去,利用这个功能一方面可以实

7、现ETL Job的备份,另一方面可以通过Manager实现多版本客户端切换。在DataStage Manager里面可以把数据库中的表结构直接导入到项目中来,供这个项目中的所有ETL Job使用。9.1.01以上版本可以在Designer中直接用Import、Export对JOB、Table Definitions、Routines进行备份。Director 工具DataStage Director 主要有以下两个功能:1 监测ETL Job的运行状态ETL Job在DataStage Designer中编译好后,可以通过DataStage Director来运行它。前面在介绍DataStag

8、e Designer的时候提到在DataStage Designer中也可以运行ETL Job,但是如果要监测ETL Job的运行情况还是要登陆到DataStage Director中。在这里,你可以看到ETL Job运行的详细的日志文件,还可以查看一些统计数据,比如ETL Job处理的数据量,JOB运行时长等。2 设置ETL Job调度ETL Job开发完成后,我们可能希望ETL Job在每天的某个时间都运行一次。DataStage Director为这种需求提供了解决方案。在DataStage Director中可以设置在每天、每周或者每月的某个时间运行ETL Job。Parallel J

9、OB 常用Stage控件介绍1.DB操作控件Oracle Connector,ODBC Connector,DB2 Connector,Sybase,Teradata Connector2.文件操作控件常用的有Sequential File;可指定编码形式和格式的txt文件,可设置字段分隔符,行记录分隔符,日期时间格式,空值处理等。3数据处理控件主要的处理控件有Transformer、Aggregator、Join、Lookup、Copy、Sort、Filter、Switch、Remove Duplicates、Funnel、Change Capture;Transformer是负责数据转换的

10、关键控件,在该控件中可以调用一些自定义函数。Aggregator是用于统计的控件,类似于SQL中的 GROUP BY,也提供Count、Max、Min、Sum、AVG的统计操作,还支持如First、Last等操作。Switch数据分流,Remove Duplicates去除重复数据,Funnel相当于Union Aall,Change Capture 根据key值做数据比对用的,华为那边做缓慢变化使用该控件。Sequence JOB常用Stage控件介绍序列:1.Job_Activity:调用对应的Parallel JOB2.Execute_Command:执行Shell、Perl等脚本,命令

11、3.Sequencer:序列控制,有2中值,”ALL”或”Any”。4.Wait_ For_File_Activity:文件等待,等待文件出现或者消失的时候开始执行后面的序列 5.UserVariables_Activity:自定义参数控件,可以定义全局参数,供整个JOB引用6.Routine_Activity:调用封装好的Routine,Routine类似于SQL中的存储过程。Demo:SEQ_POL_MAIN一个数据抽取转换装载的实例Demo:CopyCopyPjob_PRIP_LJTEMPFEE实例目的:暂收费表,根据中保信二期逻辑改造而来,介绍Prallel JOB常用Stage使用方

12、法。制作步骤1.在Administrator里定义参数,设置默认值。2.导入目标表的元数据信息(字段名称,字段类型)3.在面板上放入上页图示的控件并进行连线4.检查目标表和SQL字段别名的一一对应关系,字段个数必须相等5.填入Oracle控件数据库连接参数,导入目标表数据列,填入SQL,Test数据库连通性,SQL正确性。6.在Transform拖入输出列,并对需要类型转换的字段做处理。7.填入文件路径,并设置字段分隔符,行记录分隔符,字符集,Null值处理,日期时间处理。8.编译并运行第一步截图设置自定义参数设置自定义参数第二步(导入目标表元数据)选择如图功能选择如图功能项,填入数据项,填入

13、数据库参数,选择库参数,选择导入表及导入导入表及导入目录目录第三步(建job并放入控件)在Designer中新建一个Paralle Job,可以使用Annotation进行美化注释第四步(填入ORACLE连接参数,SQL逻辑,并Test是否能够连通DB,SQL是否正确。)第五步(调整transform输出列,进行类型转换)第六步(填入Sequential文件参数)第七步(编译运行)点击编译,没有错误后,打开Director察看日志,然后运行DataStage的调度运行Director,选择需要设置的Job,在右键菜单中点击“Add to schedule”,在窗口中选择需要定时执行的选项Dat

14、aStage存储过程的调用(方法一)可以通过可以通过SQL语句块调用存储过程语句块调用存储过程DataStage存储过程的调用(方法二)两种调用比较:第一种简两种调用比较:第一种简单明了,但是取不到存储单明了,但是取不到存储过程的返回值;第二种方过程的返回值;第二种方法比较复杂,下去可以在法比较复杂,下去可以在测试环境搞搞。测试环境搞搞。DS备份(导出)可以选择不同的对象进行备份,一般建议完全备份,选择可以选择不同的对象进行备份,一般建议完全备份,选择Whole projectDS恢复(导入)可以选择不同的对象进行导入,可以选择不同的对象进行导入,.dsx 格式或格式或.XML格式格式Data

15、Stage常见错误处理(1)Filler和sqlload的关键字冲突问题 DataStage在oracle全表插入的时候,原理是将文件打散后并行调用sqlldr,由于filler字段是其关键字,所以不能有字段叫filler。测试中将其该为 filler1或其他名字。(2)Table columns和tab columns 一致的问题Stage Colums里面的名字一定要和SQL指定的字段名字,或者字段别名相同;sql里面如果有名字相同的字段,一定要有别名,保持字段名字的唯一性,Colums字段顺序要和SQL字段顺序一致,否则数据会错乱;(3)数据库连接失败问题在Administrator客户

16、端已经配置好DB_TNS,DB_USER,DB_PWD,但是在跑Parallel JOB的时候数据库Test不通。本次连不上数据库是因为作业属性设置的密码是错误的,重新把缺省值改为$PROJDEF连接成功。注:建议把所有参数对应的缺省值都改为$PROJDEF,表示默认从Administrator获取参数值。DataStage常见错误处理(4)Decimal类型字段生成文件,数据不符合要求 在生成文件的时候Decimal(16,2)这种带精度的字段输出的数据错误,前面补了很多0,补齐16位;把Decimal类型改为Varchar DataStage常见错误处理(5)时间戳问题 Oracle中字段

17、中字段类型是型是Date类型,但是数据是型,但是数据是带时分秒的,分秒的,在在DS中如果中如果选用用Date类型,生成文件会型,生成文件会丢失失时分秒;改分秒;改为Timestamp类型型(6)文件数据中途换行 字段值中间有换行符,导致文件数据自动换行了;解决方法:找到换行符对应的ASCII 码值,替换成“;”或者其他符号 REPLACE(REPLACE(REPLACE(REPLACE(S.INVESTIGATIONCONCLUSION,CHR(10),),CHR(13),),CHR(124),),CHR(92),)AS INVESTIGATIONCONCLUSIONDataStage常见错误处理DataStage常见错误处理(7)主键更新问题主键更新问题 DS中中SQL SERVER控件选择控件选择 Insert then update加载方式报如下错误。加载方式报如下错误。原因:原因:Insert then update是根据主键字段进行更新目标表数据的,主键字段需要是根据主键字段进行更新目标表数据的,主键字段需要勾上,否则报主键冲突错误。勾上,否则报主键冲突错误。解决方法:勾上主键字段解决方法:勾上主键字段

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服