中培IT学院

大数据建模分析师培训方案

浏览:77次 作者:小编

培训背景

讲师凭借自身在数据化运营领域积累的丰富项目经验,运用贴近生活的“非技术性”语言,搭配众多生动有趣的实际案例,围绕数据分析挖掘的核心思路、策略、技巧及其应用,进行全面而深入的整理、归纳与分享。旨在帮助学员深刻理解和掌握“以业务为根本,以思路为主导,以分析技术为支撑”的数据挖掘实践精髓,从而提升其在实际工作中的应用能力。

 

培训特色

1.理论与实践相结合、案例分析与行业应用穿插进行

2.专家精彩内容解析、学员专题讨论、分组研究

3.通过全面知识理解、专题技能和实践结合的授课方式

 

日程安排

模块

内容

第一单元

概率论与

数理统计基础

 数据分析方法概述:数据分析过程、数据分析的商业驱动

概率论基础:集合、概率、随机变量、概率密度、公理化

变换和期望:随机变量函数分布、矩、矩列唯一性

常见分布族:离散分布、连续分布、指数分布、中心极限定理、概率不等式

多维随机变量:联合分布与边缘分布、多层模型与混合分布、二维变化、协方差与相关系数

随机样本的性质:抽样、样本分布

数据简化原理:似然函数、辅助函数

参数估计:点估计、区间估计、矩估计、贝叶斯估计、EM 算法

假设检验:似然比检验、贝叶斯检验、最大功效检验、置信区间、P 值、损失函数

渐进评价:相合性、有效性、标准误差、稳健性、LTR 的渐进分布、近似极大似然区间

方差分析和回归分析:ANOVA 假设、简单线性回归与最小二乘

回归模型:变量有误差时的线性回归、Logistic 回归、稳健回归

第二单元

PYTHON

基础

基础知识:安装配置、基础语法等

数据可视化:数据可视化包介绍及图像绘制

数据整理和数据清洗:Numpy 数组基础;Pandas 对象基础

第三单元

机器学习算法

scikit-learn 入门:Scikit-Learn 库简介

KNN-最近邻分类算法:原理、实现、示例讲解

决策树算法:原理、实现、示例讲解

随机森林算法:原理、实现、示例讲解

K-Means 聚类算法:原理、实现、示例讲解

关联规则算法:原理、实现、示例讲解

线性回归:原理、实现、示例讲解

逻辑回归:原理、实现、示例讲解

SVM 支持向量机:原理、实现、示例讲解

朴素贝叶斯算法:原理、实现、示例讲解

第四单元

客户生命周期案例

结合客户生命周期案例,讲解精准营销、银行反欺诈、信用评分等内容。

 

推荐讲师

赵老师 京东大学/人才供应链发展中心:大数据学院院长(负责人),15年IT行业从业经历,精通大数据(Hadoop、Spark)、Oracle数据库、NoSQL(Redis、MongoDB),中间件Weblogic和Java技术,曾分别在摩托罗拉、北电网络、BEA、甲骨文等知名公司工作,北京交通大学软件学院特聘讲师(英文授课),英语优秀,能流利用英语交流,跨文化交流经验丰富。

 

谢老师 公司内部数据分析与建模、数据分析及可视化培训讲师,历届中国R语言大会演讲嘉宾,WOT“互联网+”大数据技术峰会演讲嘉宾,WOT百城沙龙 大数据沙龙广深两地特邀嘉宾,各种数据沙龙分享嘉宾,与张良均老师合作的《R语言与数据挖掘》于2016年7月出版,某集团上市公司数据分析部负责人,主要利用R语言进行大数据的挖掘和可视化工作。从事数据挖掘建模工作已有10年,曾经从事过咨询、电商、金融、电购、电力、游戏等行业,了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验,部分研究成果曾获得国家专利。

 

覃老师 创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利。同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。

企业内训1 企业内训1
标签: 大数据建模 大数据建模分析师课程 大数据建模分析师培训 大数据建模分析师

上篇: 大数据计算框架Spark+Storm+F....

下篇: 大数据平台搭建与高性能计算培训方案