班.级.规.模.及.环.境--热.线:4008699035 手.机:15921673576( 微.信.同.号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上.课.时.间.和.地.点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服! |
实.验.设.备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实.验.设.备请点击这儿查看★ |
质.量.保.障 |
1、免费重修;
2、课程结束后,授课老师留联系方式,保障培训效果,免费技术支持。
3、推荐机会。 |
课程大纲 |
一、 课程简介
大数据技术已经给新兴互联网企业(如电商平台、搜索引擎、社交平台网站、位置服务平台、通信运营服务平台商、广告服务商等)、银行金融企业、高端装备制造企业、IT基础设施提供商等带来了巨大的商业机遇,企业的大数据平台的实施建设与运维在企业信息化建设中发挥着至关重要的作用。
本课程让学员充分掌握Hadoop大数据处理平台、MySQL分布式数据库应用和Greenplum为代表的MPP数据库、以HBase为代表的NoSQL新型数据库平台的技术架构、以及平台的安装部署、运维配置、应用开发实战技能,熟悉国内外主流的大数据处理解决方案、以及大数据应用案例。强调主流的大数据关键技术及其在不同行业中企业的实际应用,立足于实际的行业应用需求,旨在让企业学员能够掌握大数据平台技术及应用如何落地,以及基于大数据平台的技术架构实现、高性能大数据应用程序开发,以及大数据集群的运维技术,让学员掌握业界主流的大数据平台的应用和部署,并且结合当前互联网+行业应用场景下产生的大规模结构化与非结构化数据管理以及分析处理需求,详细讲解有机地集成大数据平台各个功能组件(大数据收集、大数据存储、大数据管理、大数据挖掘、大数据分析和大数据可视化组件)设计大数据项目,并分享大数据项目应用实施案例。
本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。通过学习基于Hadoop、MySQL、MPP数据库平台的大数据应用项目解决方案,紧密结合行业市场需求和国际国内最新技术发展潮流,促进企业利用大数据技术对现有的信息化设施进行改造升级,提升企业的商业价值,拥抱云-网-端与大数据时代的光明前景!
二、 培训目标
1. 本课程让学员学员掌握Hadoop平台的平台架构、核心关键技术、二次应用开发、大数据平台集群运维和性能调优技能。
2. 让学员掌握主流的MySQL数据库集群架构、应用开发和性能优化技术的实战技巧。
3. 让学员掌握业界主流的MPP数据库的集群架构、部署配置,并以Greenplum为代表,讲解运用MPP数据库技术结合Hadoop和MySQL技术实现大数据解决方案
4. 让学员全面掌握大数据高性能处理平台架构设计与项目选型规划、大数据分布式存储管理技术、NoSQL与NewSQL分布式数据库技术、大数据仓库与统计机器学习技术、大数据分析挖掘与商业智能(BI)技术、大数据实时处理技术、大数据离线处理技术、流式数据处理技术、大数据采集技术和大数据管理技术的原理知识和应用实战技能。
5. 深入理解业界最流行的Hadoop与Spark大数据技术体系和平台应用实战,能根据给定的应用场景娴熟地运用大数据技术体系规划解决方案满足实际项目需求,结合所学的Hadoop、MySQL和MPP数据库知识,设计并部署符合生产环境要求的大型数据仓库和大数据处理平台集群,熟练地掌握基于Hadoop、MySQL和MPP大数据平台进行应用程序开发、集群运维管理和性能调优技巧,并通过具体的实践训练项目贯穿整个课程,提高学员的动手技能。
三、 培训人群
1. 数据库与大数据项目的开发工程师
2. 数据库与大数据项目的规划咨询管理人员
3. 数据库与大数据项目的IT项目高管人员
4. 数据库与大数据分析与挖掘处理算法应用工程师
5. 数据库与大数据集群运维工程师
6. 数据库与大数据项目的售前和售后技术支持服务人员
四、 培训特色
1. 定制授课+ 案例分析讲解 + 实战操作,共3天
2. 实验环境:Linux 虚拟机集群+ Hadoop + MySQL数据库 + MPP(Greenplum)+ HBase,讲师提供VMware虚拟机镜像
五、 详细大纲与培训内容
培训模块 培训要点
一、 业界主流的大数据技术产品与项目解决方案 1. 国内外主流的大数据解决方案介绍
2. 当前大数据解决方案与传统数据库方案的剖析比较
3. Apache Hadoop大数据平台方案剖析
4. CDH Hadoop大数据平台方案剖析
5. HDP Hadoop大数据平台方案剖析
6. 开源的Hadoop大数据生态系统平台剖析
二、 Hadoop大数据平台剖析 7. Hadoop的发展历程以及产业界的实际应用介绍
8. Hadoop大数据平台架构
9. 基于Hadoop平台的PB级大数据存储管理与分析处理的工作原理与机制
10. Hadoop的核心组件剖析
三、 大数据分布式存储系统原理及其应用实践 11. 分布式文件系统HDFS的简介
12. HDFS系统的主从式平台架构和工作原理
13. HDFS核心组件技术讲解
14. 基于HDFS的大型存储系统应用开发实战
15. HDFS集群的安装、部署、配置与性能优化实践
16. HDFS与Linux NFS3交互技术以及本地化挂载部署应用实践
17. 分布式键值存储系统介绍、平台架构、核心技术以及应用开发
18. PB及大数据存储系统的项目案例分析
四、 大数据并行处理MapReduce和Yarn并行处理平台的架构与应用实践 19. MapReduce并行计算模型
20. MapReduce作业执行与调度技术
21. 第二代大数据计算框架Yarn的工作原理以及DAG并行执行机制
22. MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发
23. MapReduce高级编程技巧与性能优化实践
24. MapReduce与Yarn大数据分析处理案例分析
五、 基于Hadoop的大型数据仓库Hive集群平台 25. 基于Hadoop的大型分布式数据仓库基础知识,HIVE在行业中的数据仓库应用案例
26. Hive大数据仓库简介以及应用介绍
27. Hive数据仓库集群的平台体系结构、核心技术剖析
28. Hive Server的工作原理、机制与应用
29. Hive数据仓库集群的安装部署与配置优化
30. Hive应用开发技巧
31. Hive SQL剖析与应用实践
32. Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧
33. Hive数据仓库报表设计
34. Hive JDBC与ODBC的工作原理与实现机制
35. Hive HWI、CLI客户端操作以及UDF应用实践
六、 Hadoop+Hive应用实践操作训练 36. 部署与配置HIVE集群,以及HIVE性能调优
37. 构建HIVE开发环境
38. HIVE数据仓库操作及项目实践
七、 开源MySQL数据库技术及其应用实践 39. MySQL的发展历程以及业界的实际应用介绍
40. MySQL数据库管理系统的平台架构和核心模块剖析
41. MySQL应用开发实践和数据库编程实践
42. MySQL读写分离技术应用实践
43. MySQL主从复制技术应用实践
44. 基于MySQL集群的数据分析项目应用实践案例
八、 MySQL应用开发与运维实践操作训练 45. MySQL集群的部署与配置
46. MySQL读写分离与主从复制下的应用程序开发
47. MySQL性能调优技巧
九、 开源PostgreSQL 数据库技术及应用实践 48. PostgreSQL的发展历程以及业界的实际应用介绍
49. PostgreSQL数据库管理系统的平台架构和核心模块剖析
50. PostgreSQL应用开发实践和数据库编程实践
51. PostgreSQL读写分离技术应用实践
52. PostgreSQL主从复制技术应用实践
53. 基于PostgreSQL集群的数据分析项目应用实践案例
十、 PostgreSQL应用开发与运维实践操作训练 54. PostgreSQL集群的部署与配置
55. PostgreSQL读写分离与主从复制下的应用程序开发
56. PostgreSQL性能调优技巧
十一、 HBase分布式数据库管理系统 57. NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践
58. HBase分布式数据库简介、数据模型以及工作原理
59. HBase分布式数据库集群的平台架构和关键技术剖析
60. HBase应用项目开发技巧,以及客户端开发实战
61. HBase表设计与数据操作以及数据库管理API调用
62. HBase集群的安装部署与配置优化
63. ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战
64. HBase集群的运维与监控管理
十二、 HBase应用实践操作训练 65. 部署与配置HBase集群以及HBase的性能优化
66. 部署与配置ZooKeeper分布式集群
67. 构建HBase开发环境
68. HBase数据库操作及项目实践
十三、 MPP数据库技术原理及其应用实践 69. MPP数据库、数据仓库与大数据分析处理解决方案概述70.
十四、 主流MPP并行数据库的代表:Greenplum数据库技术及应用实践 (注:GPDB是Greenplum Database的简称) 71. Greenplum发展历程、GPDB数据库应用场景和应用案例,主要讲解Greenplum在数据仓库与数据分析方面的应用解决方案
72. Greenplum体系结构设计原理和模块,以及高性能与高可用架构设计
73. Greenplum的数据仓库、多维OLAP分析和机器学习模块详解
74. Greenplum分布式存储引擎工作原理,数据的分布式存储策略和负载均衡策略
75. 讲解GPDB的SQL中的DDL语言,DCL语言,DML语言和常用分析函数的语法和用法
76. GPDB的模式定义方法和示例
77. GPDB查询处理引擎工作原理
78. GPDB查询规划与分发
79. GPDB的SQL语句解析与查询处理机制
80. GPDB的MPP并行查询执行计划
81. GPDB的数据管理方法,以及数据库操作应用实践
82. GPDB事务处理
83. GPDB数据库监控分析
84. GPDB数据库中的数据查询处理机制和应用操作实践
85. GPDB的角色设置和权限分配
十五、 Greenplum应用实践操作训练 86. 在Linux虚拟机集群上部署Greenplum分布式数据库
87. 安装并初始化GPDB数据库集群系统
88. 启动、停止GPDB实例,查看运行状态
89. PSQL和pgAdminIII的安装、部署和配置
90. PSQL客户端接口和程序应用,常用SQL命令的应用操作
91. pgAdmin III客户端功能模块讲解,以及应用操作实践
92. 部署配置GPDB数据应用程序二次开发环境
93. GPDB数据库系统性能调优方法和配置参数优化操作
94. GPDB高可用性配置方法和应用操作实践
95. GPDB数据批量加载和导入导出操作实践
96. GPDB数据库备份和恢复的实现原理和操作应用
十六、 基于Hadoop、 MySQL、Greenplum和 Mahout的大数据分析挖掘平台解决方案(可选) 97. 大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例
98. Mahout大数据挖掘平台的体系架构和核心技术
99. 基于Mahout的数据分析挖掘算法应用,包括分类算法、聚类算法、关联规则挖掘算法、推荐与协同过滤分析算法、预测分析等算法的应用及其案例剖析
100. 基于Mahout的数据分析挖掘应用程序开发实战
101. 利用MySQL数据源、Mahout与Hadoop集成大数据挖掘平台应用实战
十七、 大数据项目应用完整实践与咨询讨论 102. 根据讲师布置的实际应用案例,根据所学的Hadoop、MySQL、Greenplum等技术,开展大数据完整项目部署设计和应用开发实践、大数据项目的需求分析、应用实施以及解决方案分享咨询与交流讨论 |
|
|
|
|