大数据Flink架构培训方案

日期：2021-08-16 00:00:00 浏览：1807次作者：小编

培训简述

Apache Flink（Flink）是大数据处理领域的新星，以其独特的分布式处理引擎和对有限/无限数据流的有状态计算能力受到广泛关注。

本课程深入剖析Flink的关键技术与特性，助您全面了解其体系架构和生态圈组件，对大数据系统开发者有益。结合MapReduce、Spark及Storm等框架和业务场景，帮助学员掌握大数据流处理与批处理的基本概念。

主要内容包括：

☆ Flink大数据架构与互联网企业应用

☆ Flink DataSet API深度解析

☆ Flink DataStream API深度解析

☆ Kafka与Flink的集成

☆ Table API熟悉

☆ Flink ML熟悉

☆ Flink优化与大数据体系架构熟悉

培训收益

掌握基于Flink的大数据的体系架构、管理、部署。

让学员具备部署基于Flink的企业大数据平台环境的能力。

培训特色

PPT+教材+参考资料，理论讲解

提供配套的实验环境

场景+案例+模拟环境，动手实践

手把手解决问题+解决问题经验分享

日程安排

章节 ——第一天：Flink基础		练习	学习目标
第1章：Scala编程语言	· Scala语言基础 · Scala语言的面向对象 · Scala语言的函数式编程 · Scala中的集合 · Scala语言的高级特性	编程Scala程序	掌握Scala编程语言
第2章：常见的大数据计算引擎及其架构	· 大数据离线计算引擎 · MapReduce · Spark Core · Flink DataSet · 大数据实时计算引擎 · Storm · Spark Streaming · Flink DataStream		掌握不同的大数据计算引擎的架构特点
第3章：Flink的体系架构与部署	· Flink简介 · Flink的体系架构 · Flink的安装与部署 · Flink的分布式缓存 · 对比：Flink、Storm和Spark Streaming	安装与部署Flink环境	掌握Flink的体系架构与生态圈组件
第4章：Flink on Yarn的实现	· 什么是Yarn？与Yarn的体系架构 · 部署Yarn · Flink on Yarn的两种模式 · 内存集中管理模式 · 内存Job管理模式 · Flink on Yarn两种模式的区别	部署Flink on Yarn	理解并掌握Flink on Yarn的两种模式的特点
第5章：Flink HA的实现	· 什么是HA？为什么需要HA？ · 大数据分布式协调框架ZooKeeper · 什么是ZooKeeper · 搭建ZooKeeper环境 · ZooKeeper的特性 · 实现分布式锁 · 部署Flink HA高可用架构环境	部署Flink HA环境	什么是HA？Flink HA的架构
第6章：Flink开发入门	· Flink批处理开发 · Java版本WordCount · Scala版本WordCount · Flink流处理开发 · Java版本WordCount · Scala版本WordCount · 使用Flink Scala Shell · Flink的并行度分析	搭建Flink开发环境并开发应用程序	掌握基本的Flink API编程
第7章：集成Kafka	· 大数据流式计算的典型架构 · Kafka的体系结构和环境部署 · Kafka核心原理解析 · 集成Flink与Kafka	集成Kakfa与Flink	掌握大数据实时计算的架构与集成

企业内训1

标签： Flink培训 Flink课程 Flink基础 Flink的体系架构与部署 Flink

上篇： 大数据关键技术与实战应用培训方案

下篇： 大流量套餐精准营销建模与实战培训方案