大数据建模分析师培训方案

日期：2021-09-15 00:00:00 浏览：1147次作者：小编

培训背景

讲师凭借自身在数据化运营领域积累的丰富项目经验，运用贴近生活的“非技术性”语言，搭配众多生动有趣的实际案例，围绕数据分析挖掘的核心思路、策略、技巧及其应用，进行全面而深入的整理、归纳与分享。旨在帮助学员深刻理解和掌握“以业务为根本，以思路为主导，以分析技术为支撑”的数据挖掘实践精髓，从而提升其在实际工作中的应用能力。

培训特色

1.理论与实践相结合、案例分析与行业应用穿插进行

2.专家精彩内容解析、学员专题讨论、分组研究

3.通过全面知识理解、专题技能和实践结合的授课方式

日程安排

模块

内容

第一单元

概率论与

数理统计基础

数据分析方法概述：数据分析过程、数据分析的商业驱动

概率论基础：集合、概率、随机变量、概率密度、公理化

变换和期望：随机变量函数分布、矩、矩列唯一性

常见分布族：离散分布、连续分布、指数分布、中心极限定理、概率不等式

多维随机变量：联合分布与边缘分布、多层模型与混合分布、二维变化、协方差与相关系数

随机样本的性质：抽样、样本分布

数据简化原理：似然函数、辅助函数

参数估计：点估计、区间估计、矩估计、贝叶斯估计、EM 算法

假设检验：似然比检验、贝叶斯检验、最大功效检验、置信区间、P 值、损失函数

渐进评价：相合性、有效性、标准误差、稳健性、LTR 的渐进分布、近似极大似然区间

方差分析和回归分析：ANOVA 假设、简单线性回归与最小二乘

回归模型：变量有误差时的线性回归、Logistic 回归、稳健回归

第二单元

PYTHON

基础

基础知识：安装配置、基础语法等

数据可视化：数据可视化包介绍及图像绘制

数据整理和数据清洗：Numpy 数组基础；Pandas 对象基础

第三单元

机器学习算法

scikit-learn 入门：Scikit-Learn 库简介

KNN-最近邻分类算法：原理、实现、示例讲解

决策树算法：原理、实现、示例讲解

随机森林算法：原理、实现、示例讲解

K-Means 聚类算法：原理、实现、示例讲解

关联规则算法：原理、实现、示例讲解

线性回归：原理、实现、示例讲解

逻辑回归：原理、实现、示例讲解

SVM 支持向量机：原理、实现、示例讲解

朴素贝叶斯算法：原理、实现、示例讲解

第四单元

客户生命周期案例

结合客户生命周期案例，讲解精准营销、银行反欺诈、信用评分等内容。

推荐讲师

赵老师 京东大学/人才供应链发展中心：大数据学院院长（负责人），15年IT行业从业经历，精通大数据（Hadoop、Spark）、Oracle数据库、NoSQL（Redis、MongoDB），中间件Weblogic和Java技术，曾分别在摩托罗拉、北电网络、BEA、甲骨文等知名公司工作，北京交通大学软件学院特聘讲师（英文授课），英语优秀，能流利用英语交流，跨文化交流经验丰富。

谢老师 公司内部数据分析与建模、数据分析及可视化培训讲师，历届中国R语言大会演讲嘉宾，WOT“互联网+”大数据技术峰会演讲嘉宾，WOT百城沙龙大数据沙龙广深两地特邀嘉宾，各种数据沙龙分享嘉宾，与张良均老师合作的《R语言与数据挖掘》于2016年7月出版，某集团上市公司数据分析部负责人，主要利用R语言进行大数据的挖掘和可视化工作。从事数据挖掘建模工作已有10年，曾经从事过咨询、电商、金融、电购、电力、游戏等行业，了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验，部分研究成果曾获得国家专利。

覃老师 创业公司技术负责人。机器学习，深度学习领域多年一线开发研究经验，精通算法原理与编程实践。曾使用Tensorflow，Caffe，Keras等深度学习框架完成过多项图像，语音，nlp，搜索相关的人工智能实际项目，研发经验丰富。拥有两项国家专利。同时具有多年授课培训经验，讲课通熟易懂，代码风格简洁清晰。

企业内训1

标签： 大数据建模大数据建模分析师大数据建模分析师培训大数据建模分析师课程

上篇： 华为大数据体系培训方案

下篇： 大数据平台搭建与高性能计算培训方案