Greenplum技术与应用培训方案
浏览:193次 作者:小编培训背景
GreenPluma是一个基于PostgreSQL的高性能、可扩展大数据处理平台,由Pivotal(现为VMware一部分)开发。其基于共享存储架构的并行计算,使用MPP将数据划分为小块并分布式存储于多个节点,每个节点独立处理数据和执行查询。数据被分为多个片存储于不同节点,每个节点有独立的Greenplum实例。查询被解析为任务并分发到各节点并行执行,最后由协调节点聚合结果。GreenPluma提供数据分片、分区和基于统计的查询优化等技术以提高性能。
特性包括:分布式数据仓库,支持PB级数据、SQL查询和复杂分析;并行加载,快速导入大量数据;多维数据分析,支持OLAP操作和高级统计;高性能并行查询,智能优化器和分片技术;数据备份恢复,保障数据安全;并行处理,适合大规模数据转换和清洗;扩展性和容错性,可自动恢复和重新分布数据。
总之,GreenPluma以分布式数据仓库、并行加载、多维分析、高性能查询、备份恢复、并行处理及扩展容错性为特点,成为强大的大数据处理平台。
培训对象
IT相关从业人员,数据库管理员DBA,数据库架构师,IT运维人员,开源数据库爱好者
培训收益
了解、掌握Greenplum系统架构,核心组件,查询执行,存储机制和事务处理
了解、掌握并实践Greenplum安装与部署,数据库、表(分区表)、视图、索引、存储过程等操作
了解、掌握并实践Greenplum数据加载与优化
了解、掌握Greenplum运维管理操作
了解、掌握Greenplum性能优化方法与原因分析
了解、掌握Greenplum与Hadoop主流大数据产品的区别与联系,Greenplum与其他MPP数据库的区别与联系
日程安排
日程 | 章节 | 授课内容 |
第一天 | 主题1:Greenplum基础 | Greenplum基本概念 Greenplum系统架构 大规模并行处理无共享架构特征 Greenplum核心组件 解析器 优化器 调度器 执行器 Greenplum与Hadoop大数据处理区别与联系 Greenplum与MapReduce Greenplum与Spark Greenplum与Impala Greenplum适用场景 |
主题2:Greenplum安装部署 | 环境配置,安装并初始化GPDB系统 启停GPDB数据库 配置GPDB系统 | |
主题3:GPDB客户端 | pgAdmin III PSQL JDBC GPDB管理命令 | |
第二天 | 主题4:PostgreSQL基础 | PostgreSQL特点 PostgreSQL数据库安装与配置 PostgreSQL数据库客户端连接与使用 用户管理 角色创建 角色权限管理 数据库逻辑结构 cluster、database、schema object、field 数据库物理结构 tablespace、datafile、controlfile segment、block xlog、archivelog |
主题5:PostgreSQL数据操作 | PostgreSQL数据类型与类型转换 PostgreSQL函数 PostgreSQL操作符 PostgreSQL数据定义 约束定义 系统字段 模式和权限 分区实现与管理 PostgreSQL数据操作 插入数据 删除输出 更新数据 查询数据 窗口函数 组合查询 行排序 limit和offset | |
第三天 | 主题6 :GP SQL常用语法 | 数据库、表操作 创建并管理数据库 创建并管理表空间 创建并管理模式 创建并管理表 连接查询 视图操作 序列操作 索引操作 存储过程定义与使用 |
主题7:PostgreSQL服务器端编程 | 触发器与事件触发器 规则系统 查询树 视图与规则系统 规则与触发器比较 过程语言 PL/pgSQL过程语言 服务器编程接口 | |
主题8: 角色权限管理 | 客户端认证 管理用户和组 | |
主题9 :GPDB数据库存储 | 数据分布式存储机制 数据分布策略 系统目录表 数据库物理存储 多态存储 压缩存储 行列存储与转换 分区表 分区表的创建与分区方式 分区表添加、删除、重命名、清空与拆分 | |
第四天 | 主题10 :GPDB查询与操作 | GPDB SQL查询处理机制 并行查询计划 数据操作DML UDI操作 数据查询DQL SELECT的OLAP分组扩展 ROLLUP GROUPING SETS CUBE 窗口函数 事务处理机制 两阶段提交机制 事务并发控制 |
主题11 :数据加载 | 外部表加载 外部表定义 并行文件分布程序gpfdist 外部表错误处理 COPY加载 GPLOAD加载 | |
第五天 | 主题12:GPDB运维与管理 | GPDB日志配置与查看 GPDB 备份恢复 串行备份和恢复 并行恢复和恢复 GPDB系统扩展 节点的准备和添加 初始化新Instance 重分布表 GPDB高可用 镜像Segment 热备Master |
主题13:PostgreSQL性能优化 | explain的使用 规划器 常用优化技术 | |
主题14 :GPDB性能调优 | 常见性能问题与原因分析 硬件问题 资源竞争 数据分布 索引设计 SQL编写 跟踪性能问题 查询程序分析与优化 EXPLAIN, EXPLAIN ANALYZE |
- 标签: Greenplum核心组件 Greenplum查询执行 Greenplum存储机制 Greenplum Greenplum系统架构 Greenplum技术与应用培训 Greenplum技术与应用课程
-
上篇: DB2数据库管理培训方案