中培IT学院

大数据计算框架Spark+Storm+Flink培训方案

浏览:72次 作者:小编

培训背景

本课程以通俗易懂的方式深入解析大数据技术,全面涉及Spark、Storm和Flink的关键理论架构与实施细节,同时对大数据框架下的数据仓库建设提供细致的指导。通过系统的操作练习和丰富的实践,学员将积累大数据技术全面的实战经验。

 

培训收益

① 精通大数据基础架构的核心原理、高效管理策略、灵活部署技巧,以及相关组件的运作机理与应用实践,全方位掌握大数据技术的精髓。

② 培养学员在复杂企业级大数据平台环境中,具备高效部署与优化配置的专业技能,确保大数据平台的稳定运行与性能最大化。

 

日程安排

大数据计算框架Spark+Storm+Flink

模块一:大数据实时计算引擎Storm

Storm

大数据实时计算框架简介

Apache Storm体系结构

Apache Storm的伪分布模式的搭建

Apache Storm的全分布模式和HA

Storm的Demo演示

Storm集群在ZooKeeper上保存的数据结构

WordCount数据流动的过程

开发自己的Storm的WordCount程序

部署和运行Storm任务

Storm任务执行的过程与通信机制

流式计算系统的典型的架构与集成Storm

模块二:Spark基础之Scala编程语言

Scala编程语言

Scala语言基础

Scala语言的面向对象

Scala语言的函数式编程

Scala中的集合

Scala语言的高级特性

模块三:大数据执行引擎Spark Core

Spark Core

什么是Spark?

Spark的体系结构与安装部署

执行Spark Demo程序

Spark运行机制及原理分析

Spark的算子

Spark RDD的高级算子

Spark基础编程案例

Spark性能诊断和优化案例

案例分享

模块四:数据分析引擎Spark SQL

Spark SQL

Spark SQL基础

使用数据源

性能优化

IDEA中开发Spark SQL程序

模块五:流式计算引擎Spark Streaming

Spark Streaming

Spark Streaming基础

Spark Streaming进阶

高级数据源

性能优化

模块六:机器学习MLLib

Spark  MLLib

什么是MLLib?

MLLib中的常见算法

MLlib的应用案例:推荐系统的实现

模块七:新一代大数据处理引擎Flink

3章:Flink的体系架构与部署

Flink简介

Flink的体系架构

Flink的安装与部署

Flink的分布式缓存

对比:Flink、Storm和Spark Streaming

4章:Flink on Yarn的实现

什么是Yarn?与Yarn的体系架构

部署Yarn

Flink on Yarn的两种

Flink on Yarn两种模式的区别

5章:Flink HA的实现

什么是HA?为什么需要HA?

大数据分布式协调框架ZooKeeper

部署Flink HA高可用架构环境

6章:Flink开发入门

Flink批处理开发

Flink流处理开发

使用Flink Scala Shell

Flink的并行度分析

7章:Flink DataSet API开发

Map、FlatMap与MapPartition

Filter与Distinct

Join操作

笛卡尔积

First-N

外链接操作

8章:Flink DataStreaming API开发

DataSources

DataStream

Transformation 转换操作

Data Sinks

集成Flink与Kafka

9章:状态管理和恢复

状态:State

检查点:Checkpoint

Restart Strategies(重启策略)

10章:Window和Time

窗口:Window

Time:时间

WaterMark:水位线

11章:Flink Table & SQL

Flink Table & SQL简介

开发Flink Table & SQL程序

使用Flink SQL Client

模块八:大数据安全认证框架

1章:大数据安全框架

大数据安全问题

大数据安全管控措施

Kerberos安全认证机制

Sentry安全授权组件


推荐讲师

赵老师 清华大学计算机双学士,拥有15年IT行业经验和10年培训授课经验,专长于大数据、数据库、中间件技术和Java。目前担任甲骨文(中国)高级技术顾问,曾任职于BEA系统、北电网络和Motorola等公司。

工作经历要点:

① 甲骨文全球支持中心高级技术顾问,为亚太地区客户提供技术支持和解决方案。

② 北电网络高级软件架构师,负责CDMA网络管理系统架构设计。

③ Motorola高级软件工程师,参与JUIX&EZX手机平台开发。

培训经历:

为多家企业进行Hadoop、Oracle数据库、NoSQL数据库和Weblogic系统管理培训。

项目经验:

① 设计大数据背景下基于Oracle的互联网企业级应用架构解决方案。

② 开发中石油油罐运输车辆实时监控子系统,负责需求分析、系统架构设计。

通过认证:

Oracle Weblogic 11g系统管理员、IBM DB2数据库、Sun SCJP、CCNA和Oracle Database OCP 11g认证。


企业内训1 企业内训1
标签: Flink培训 Flink基础 Flink课程 Flink的体系架构与部署 Flink 大数据计算框架课程 大数据计算框架培训 大数据计算机框架

上篇: 华为大数据体系培训方案

下篇: 大数据建模分析师培训方案