中培IT学院
大数据平台搭建与高性能计算最佳实践

大数据平台搭建与高性能计算最佳实践

授课方式:录播/入企

课程时长:16课时

面向对象:软件开发工程师、数据工程师、架构工程师、运维工程师

学习重点:掌握业界最流行的Hadoop与Spark大数据技术体系

课程价格:¥2980.00

课程介绍 开班计划 课程大纲 往期课堂

课程介绍

【培训背景】

深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;洞察大数据的潜在价值;理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考。

 

【培训收益】

掌握业界最流行的Hadoop与Spark大数据技术体系;

掌握大数据采集技术;

掌握大数据分布式存储技术;

深入理解大数据平台技术架构和使用场景;

掌握NoSQL与NewSQL分布式数据库技术;

掌握大数据仓库与统计机器学习技术。

 

【适合人群】

软件开发工程师、数据工程师、架构工程师、运维工程师

 

【培训特色】

一、理论与实践深度融合

理论基础:课程首先会深入浅出地介绍大数据的产生背景、发展历程和演化趋势,以及大数据的4V特征(Volume、Velocity、Variety、Value)和与云计算的关系。同时,还会分析大数据的应用需求和潜在价值,让学员对大数据有全面而深刻的理解。

实战演练:课程不仅仅停留在理论层面,更注重实战技能的培养。通过模拟真实的大数据项目场景,让学员亲手搭建和运维大数据平台,进行数据采集、存储、处理和分析等操作,从而熟练掌握大数据平台搭建与高性能计算的最佳实践。

二、业界前沿技术覆盖

流行技术体系:课程会详细介绍并实践当前业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。这些技术体系是大数据处理和分析的核心,掌握它们对于从事大数据相关工作至关重要。

新技术趋势:随着大数据技术的不断发展,新的技术和工具不断涌现。课程会紧跟技术发展趋势,介绍最新的大数据技术、工具和平台,帮助学员保持技术前沿性。

三、全栈式技能培养

技术广度:课程涵盖了大数据采集、存储、处理、分析和可视化等全栈式技能培养。学员将学习到如何从海量数据中提取有价值的信息,并通过可视化手段呈现出来,为企业的决策提供有力支持。

技术深度:在广度的基础上,课程还会深入剖析每个技术环节的核心原理和实现细节。例如,在Hadoop框架中,会详细介绍HDFS、YARN和MapReduce等核心组件的工作原理和性能优化技巧;在Spark框架中,会深入讲解RDD、Spark SQL、Spark Streaming等核心组件的应用场景和实现方式。

四、项目导向的教学模式

项目实战:课程采用项目导向的教学模式,通过实际的大数据项目案例进行教学。学员将分组进行项目开发,从需求分析、系统设计、编码实现到测试验收全程参与,从而掌握大数据项目开发的全过程。

沙盘模拟:为了更好地模拟真实项目环境,课程还会进行沙盘模拟实战。通过模拟企业实际的大数据应用场景和业务流程,让学员在虚拟环境中进行项目开发和运维实践,提升解决实际问题的能力。

五、专家团队授课与辅导

顶尖专家:课程邀请了在大数据领域具有丰富实战经验和深厚理论功底的顶尖专家进行授课。他们能够提供最专业、最权威的指导,帮助学员快速掌握大数据平台搭建与高性能计算的最佳实践。

全程辅导:除了授课之外,专家团队还会为学员提供全程的辅导和答疑服务。学员在学习过程中遇到任何问题都可以随时向专家请教,确保学习效果的最大化。

 

【结业证书】

参加培训并通过考试学员,由工业和信息化部教育与考试中心统一颁发证书,证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

 

 证书样本


开班计划

开课时间 授课形式 培训类型 上课城市 在线报名
随报随学 录播 特惠班 IT云课 在线报名

课程大纲

大数据平台搭建与高性能计算最佳实践培训班,录播课为16课时,企业内训可按需求定制。 

课程安排如下:

第0章 Linux 安装

0.1.Linux 安装

第1章 什么是大数据?核心问题

1.1.什么是大数据?核心问题

第2章 数据仓库与大数据

2.1.数据仓库与大数据

第3章 OLTP与OLAP

3.1.OLTP与OLAP

第4章 Google的核心思想

4.1.GFS

4.2.MapReduce计算模型

4.3.BigTable大表

第5章 搭建Hadoop环境

5.1.搭建Hadoop环境

第6章 HDFS

6.1.HDFS

第7章 部署Hadoop

7.1.部署Hadoop

第8章 操作HDFS

8.1.操作HDFS

第9章 MapReduce

9.1.开发自己的WordCount程序00:55:38

9.2.高级特性01:00:32

第10章 Hadoop生态圈

10.1.Hadoop生态圈

第11章 HBase

11.1.HBase

第12章 数据分析引擎

12.1.数据分析引擎

第13章 ZooKeeper与HA

13.1.ZooKeeper与HA

第14章 Scala编程语言

14.1.Scala编程语言

第15章 Spark

15.1.什么是Spark

15.2.部署Spark

15.3.执行Spark的任务

15.4.RDD

15.5.Spark SQL

15.6.Spark Streaming

第16章 Flink

16.1.Flink


往期课堂

暂无信息