中培IT学院

大数据Flink架构培训方案

浏览:805次 作者:小编

培训简述

Apache Flink(Flink)是大数据处理领域的新星,以其独特的分布式处理引擎和对有限/无限数据流的有状态计算能力受到广泛关注。

本课程深入剖析Flink的关键技术与特性,助您全面了解其体系架构和生态圈组件,对大数据系统开发者有益。结合MapReduce、Spark及Storm等框架和业务场景,帮助学员掌握大数据流处理与批处理的基本概念。

主要内容包括:

☆  Flink大数据架构与互联网企业应用

☆  Flink DataSet API深度解析

☆  Flink DataStream API深度解析

☆  Kafka与Flink的集成

☆  Table API熟悉

☆  Flink ML熟悉

☆  Flink优化与大数据体系架构熟悉

 

培训收益

掌握基于Flink的大数据的体系架构、管理、部署。

让学员具备部署基于Flink的企业大数据平台环境的能力。

 

培训特色

PPT+教材+参考资料,理论讲解

提供配套的实验环境

场景+案例+模拟环境,动手实践

手把手解决问题+解决问题经验分享


日程安排

章节 ——第一天:Flink基础

练习

学习目标

第1章:Scala编程语言

· Scala语言基础

· Scala语言的面向对象

· Scala语言的函数式编程

· Scala中的集合

· Scala语言的高级特性

编程Scala程序

掌握Scala编程语言

第2章:常见的大数据计算引擎及其架构

· 大数据离线计算引擎

· MapReduce

· Spark Core

· Flink DataSet

· 大数据实时计算引擎

· Storm

· Spark Streaming

· Flink DataStream


掌握不同的大数据计算引擎的架构特点

第3章:Flink的体系架构与部署

· Flink简介

· Flink的体系架构

· Flink的安装与部署

· Flink的分布式缓存

· 对比:Flink、Storm和Spark Streaming

安装与部署Flink环境

掌握Flink的体系架构与生态圈组件

第4章:Flink on Yarn的实现

· 什么是Yarn?与Yarn的体系架构

· 部署Yarn

· Flink on Yarn的两种模式

· 内存集中管理模式

· 内存Job管理模式

· Flink on Yarn两种模式的区别

部署Flink on Yarn

理解并掌握Flink on Yarn的两种模式的特点

第5章:Flink HA的实现

· 什么是HA?为什么需要HA?

· 大数据分布式协调框架ZooKeeper

· 什么是ZooKeeper

· 搭建ZooKeeper环境

· ZooKeeper的特性

· 实现分布式锁

· 部署Flink HA高可用架构环境

部署Flink HA环境

什么是HA?Flink HA的架构

第6章:Flink开发入门

· Flink批处理开发

· Java版本WordCount

· Scala版本WordCount

· Flink流处理开发

· Java版本WordCount

· Scala版本WordCount

· 使用Flink Scala Shell

· Flink的并行度分析

搭建Flink开发环境并开发应用程序

掌握基本的Flink API编程

第7章:集成Kafka

· 大数据流式计算的典型架构

· Kafka的体系结构和环境部署

· Kafka核心原理解析

· 集成Flink与Kafka

集成Kakfa与Flink

掌握大数据实时计算的架构与集成


企业内训1 企业内训1
标签: Flink培训 Flink基础 Flink课程 Flink的体系架构与部署 Flink

上篇: 大数据关键技术与实战应用培训方案

下篇: 大流量套餐精准营销建模与实战培训方案