InfoSphere DataStage是IBM统一数据集成平台InfoSphere Information Server(IIS) 的重要组件,是业界主流的 ETL(Extract, Transform, Load) 工具。DataStage执行从源系统到目标系统的批量和实时的数据转换和移动,它广泛支持各种异构平台的数据源和各种类型的数据格式(结构化、半结构化和非结构化数据);通过简单易用的图形化设计方式,并内置丰富的功能组件,从而支持从简单到高度复杂的数据结构中,对大量数据进行收集、清洗、整合和转换,具有满足最苛刻的数据集成需求所需的功能性、灵活性和可伸缩性。本课程主要介绍InfoSphere DataStage的基本架构和产品特点,并基于实战案例详细讲解DataStage的安装、配置、开发以及较佳实践。
第一部份 IBM数据集成与治理方案简介
第二部份 Infosphere Datastage 架构、安装与配置
第三部份 Infosphere Datastage 管理与开发部署流程
第四部份 Infosphere Datastage 数据连接组件使用
第五部份 Infosphere Datastage 数据合并、排序与聚合组件使用
第六部份 Infosphere Datastage 数据转换组件使用
第七部份 Infosphere Datastage 自定义公共组件与过程
第八部份 Infosphere Datastage 作业序列和作业控制
第九部份 Infosphere Datastage 作业调试、调度与监控
第十部份 Infosphere Datastage 数据血源分析
第十一部份 Infosphere Datastage 性能调优和较佳实践
第十二部份 Infosphere Datastage 实战案例分享