中培IT学院

Greenplum技术与应用培训方案

浏览:67次 作者:小编

培训背景

GreenPluma是一个基于PostgreSQL的高性能、可扩展大数据处理平台,由Pivotal(现为VMware一部分)开发。其基于共享存储架构的并行计算,使用MPP将数据划分为小块并分布式存储于多个节点,每个节点独立处理数据和执行查询。数据被分为多个片存储于不同节点,每个节点有独立的Greenplum实例。查询被解析为任务并分发到各节点并行执行,最后由协调节点聚合结果。GreenPluma提供数据分片、分区和基于统计的查询优化等技术以提高性能。

特性包括:分布式数据仓库,支持PB级数据、SQL查询和复杂分析;并行加载,快速导入大量数据;多维数据分析,支持OLAP操作和高级统计;高性能并行查询,智能优化器和分片技术;数据备份恢复,保障数据安全;并行处理,适合大规模数据转换和清洗;扩展性和容错性,可自动恢复和重新分布数据。

总之,GreenPluma以分布式数据仓库、并行加载、多维分析、高性能查询、备份恢复、并行处理及扩展容错性为特点,成为强大的大数据处理平台。

 

培训对象

IT相关从业人员,数据库管理员DBA,数据库架构师,IT运维人员,开源数据库爱好者

 

培训收益

了解、掌握Greenplum系统架构,核心组件,查询执行,存储机制和事务处理

了解、掌握并实践Greenplum安装与部署,数据库、表(分区表)、视图、索引、存储过程等操作

了解、掌握并实践Greenplum数据加载与优化

了解、掌握Greenplum运维管理操作

了解、掌握Greenplum性能优化方法与原因分析

了解、掌握Greenplum与Hadoop主流大数据产品的区别与联系,Greenplum与其他MPP数据库的区别与联系

 

日程安排

日程

章节

授课内容

第一天

主题1:Greenplum基础

Greenplum基本概念

Greenplum系统架构

大规模并行处理无共享架构特征

Greenplum核心组件

解析器

优化器

调度器

执行器

Greenplum与Hadoop大数据处理区别与联系

Greenplum与MapReduce

Greenplum与Spark

Greenplum与Impala

Greenplum适用场景

主题2:Greenplum安装部署

环境配置,安装并初始化GPDB系统

启停GPDB数据库

配置GPDB系统

主题3:GPDB客户端

pgAdmin III

PSQL

JDBC

GPDB管理命令

第二天

主题4:PostgreSQL基础

PostgreSQL特点

PostgreSQL数据库安装与配置

PostgreSQL数据库客户端连接与使用

用户管理

角色创建

角色权限管理

数据库逻辑结构

cluster、database、schema

object、field

数据库物理结构

tablespace、datafile、controlfile

segment、block

xlog、archivelog

主题5:PostgreSQL数据操作

PostgreSQL数据类型与类型转换

PostgreSQL函数

PostgreSQL操作符

PostgreSQL数据定义

约束定义

系统字段

模式和权限

分区实现与管理

PostgreSQL数据操作

插入数据

删除输出

更新数据

查询数据

窗口函数

组合查询

行排序

limit和offset

第三天

主题6 :GP SQL常用语法

数据库、表操作

创建并管理数据库

创建并管理表空间

创建并管理模式

创建并管理表

连接查询

视图操作

序列操作

索引操作

存储过程定义与使用

主题7:PostgreSQL服务器端编程

触发器与事件触发器

规则系统

查询树

视图与规则系统

规则与触发器比较

过程语言

PL/pgSQL过程语言

服务器编程接口

主题8: 角色权限管理

客户端认证

管理用户和组

主题9 :GPDB数据库存储

数据分布式存储机制

数据分布策略

系统目录表

数据库物理存储

多态存储

压缩存储

行列存储与转换

分区表

分区表的创建与分区方式

分区表添加、删除、重命名、清空与拆分

第四天

主题10 :GPDB查询与操作

GPDB SQL查询处理机制

并行查询计划

数据操作DML

UDI操作

数据查询DQL

SELECT的OLAP分组扩展

ROLLUP

GROUPING SETS

CUBE

窗口函数

事务处理机制

两阶段提交机制

事务并发控制

主题11 :数据加载

外部表加载

外部表定义

并行文件分布程序gpfdist

外部表错误处理

COPY加载

GPLOAD加载

第五天

主题12:GPDB运维与管理

GPDB日志配置与查看

GPDB 备份恢复

串行备份和恢复

并行恢复和恢复

GPDB系统扩展

节点的准备和添加

初始化新Instance

重分布表

GPDB高可用

镜像Segment

热备Master

主题13:PostgreSQL性能优化

explain的使用

规划器

常用优化技术

主题14 :GPDB性能调优

常见性能问题与原因分析

硬件问题

资源竞争

数据分布

索引设计

SQL编写

跟踪性能问题

查询程序分析与优化

EXPLAIN, EXPLAIN ANALYZE


企业内训1 企业内训1
标签: Greenplum技术与应用培训 Greenplum存储机制 Greenplum系统架构 Greenplum Greenplum核心组件 Greenplum查询执行 Greenplum技术与应用课程

上篇: DB2数据库管理培训方案

下篇: ORACLE BIEE管理应用培训方案