您现在的位置:首页 > 课程体系 > IT国内认证 > CDA认证
数据分析师CDA LEVEL I认证课程

 

CDA是国内数据分析领域培训的先行者,自2013年建立以来,一直致力于构建国际化的认证标准,帮助国家推动数据人才建设,成为引领数据科学人才认证的行业标杆。


CDA认证是一套科学化,专业化,国际化的人才考核标准,共分为CDA LEVELⅠ,LEVEL Ⅱ,LEVEL Ⅲ三个等级,涉及行业包括互联网、金融、咨询、电信、零售、医疗、旅游等,本文将重点详细介绍一下CDA LEVELⅠ数据业务分析师。

 

面向人群

零基础就业转行人群  高校应往届毕业生人群  研发、技术岗在职人群、产品、运营、营销等业务人群、待业、期待转行从事数据分析工作人员、可借助数据分析提高工作效率的人群、对数据分析感兴趣的高效教师、对商业BL数据分析感兴趣的各界人士、企业创始人、经理人、管理咨询类岗位从业人群

 

对标岗位

商业数据分析师、业务数据分析师、初级数据分析师、SQL数据分析师、BL数据分析师、数据产品运营、数字市场营销

 

认证条件

认证条件宽泛,对学历和相关工作经验无限制性要求,皆可报名。


考试信息

考试时间:随报随考

考试形式:线下在线机考

考试时长:120分钟

考试费用:1200元/人次

考试通过:考试成绩分A、B、C、D四个层次,A、B、C均为考试通过并取得CDA LEVELⅠ认证证书,D为不通过。

考试补考:仅提供一次补考机会,费用为6折优惠,补考未通过者,则需重新报名参加考试。

考试内容


 

认证课程

CDA LEVEL I 认证辅导课程,专门为希望零基础学习业务数据分析技能的在职人员以及希望参与 CDA LEVELI 考试的人员开设。课程技能覆盖各行业的业务数据分析岗、数据运营岗、数据产品岗、数据营销岗等数据分析专项技能岗所要求的技能,同时适用于财务数据分析、人力资源数据分析等数据赋能岗。课程适合零基础学员学习,课程设计遵循循序渐进的教学规律,包含Excel、PowerBI、SOL数据库、统计学基础等工具与理论课程模块,同时包含大量基于实际业务场景的各行业实战项目案例,比如通过制作客户运营分析仪表板实现客户价值分析、挖掘潜在客户、监控电商运营指标等,提升电商运营效益。

 

课程收益

1、掌握数据的基本预处理方法,数据分析法(描述性统计分析、推断性统计分析、线性回归分析、logistic回归、降维分析、时间序列等)市场调研(数据报告)精益化管理。


2、具备业务分析能力:熟知业务,能够根据问题业务指标提取公司数据库中相关数据,进行整理、清洗、处理,通过相应数据分析方法结合软件平台应用完成对数据的分析和报告。


3、具备结果展示能力:能够形成逻辑清晰的报告,传递分析结果,对实际业务提出建议和策略。

 

课程信息

学习建议:通过预习视频掌握数据分析工具及数据分析业务思维,按照课程设置分模块学习,数据工具适用,数据分析理论掌握,理解并运用数据库,

涉及技能 :EXCLE  SQL  Power BL   

学习方式:直播或面授

课程大纲:


章节

模块

培训内容

PART 1

数据分析概念与统计学基础

 1、数据分析概述

【领会】

数据分析和数据挖掘的概念

强调商业数据分析中对业务的理解

商业数据分析和预测的本质

数据分析的8个层次

大数据对传统小数据分析的拓展

【熟知】

明确数据分析目标及意义

数据分析的过程

数据分析与数据挖掘的常用方法

CRISP-DM、SEMMA 方法论

数据分析中不同人员的角色与职责

2、述性统计分析

【领会】

数据的计量尺度

数据的集中趋势、离中趋势和数据分布的概念

统计图的概念

各种统计图的含义和画法

【熟知】

衡量数据集中趋势、离中趋势和数据分布的常用指标及计算方法统计图形的绘制、图形元素的调整、可视化效果,主要涉及条形图、线图、直方图、盒须图、散点图、气泡图、马赛克图、玫瑰图及其多种图形整合。明确统计图形对统计指标表达上的对应关系

【应用】

根据不同数据类型选用不同的统计指标来进行数据的集中趋势、离中趋势和数据分布的衡量,不同统计图的使用场景。会写数据分析报告和结合业务需求对报告进行合理解释,对业务ᨀ出建设性意见建议。

3、抽样估计

【领会】

随机试验、随机事件、随机变量的概念

总体与样本的概念

抽样估计的理论基础

正态分布及三大分布的函数形式和图像形式

抽样的多种组织形式

确定必要样本容量的原因

【熟知】

随机事件的概率

抽样平均误差的概念与数学性质

点估计与区间估计方法的特点与优缺点

全体总体与样本总体

参数和统计量

重复抽样与不重复抽样

抽样误差的概念对总体平均数和总体成数的区间估计方法

必要样本容量的影响因素

中心极限定理的意义与应用

【应用】

随机变量及其概率分布

全部可能的样本单位数目的概念及其在不同抽样方法下的确定

抽样平均误差在实际数据分析中的计算方法

4、假设检验

【领会】

假设检验的基本概念

其基本思想在数据分析中的作用

假设检验的基本步骤

假设检验与区间估计的联系

假设检验中的两类错误

【熟知】

P值的含义及计算

如何利用P值进行检验

z检验统计量

t检验统计量

F检验统计量

c2检验统计量的函数形式和检验步骤

【应用】

实现单样本t检验

两独立样本t检验的步骤和检验中使用的统计量与原假设

两种检验应用的数据分析场景。

5、方差分析

【领会】

方差分析的相关概念

单因素方差分析的原理

统计量构造过程

【熟知】

单因素方差分析的基本步骤

总离差平方和(SST)的含义及计算

组间离差平方和(SSA)的含义及计算

组内离差平方和(SSE)的含义及计算

单因素方差分析的原假设

【应用】

实现单因素方差分析的步骤

对方差分析表的分析以及多重比较表的分析

6、简单线性回归分析

【领会】

相关图的绘制与作用

相关表的编制与作用

相关系数定义公式的字母含义

估计标准误差与相关系数的关系

【熟知】

相关关系的概念与特点

相关关系与函数关系的区别与联系

相关关系的种类

相关系数的意义以及利用相关系数的具体数值对现象相关等级的划分

回归分析的概念

回归分析的主要内容和特点

建立一元线性回归方程的条件

应用回归分析应注意的问题

估计标准误差的意义及计算

【应用】

运用简捷法公式计算相关系数

相关分析分析中应注意的问题

回归分析与相关分析的区别与联系

PART 2

SQL数据库基础

1、SQL 基础概念

【领会】

关系型数据库基本概念、属性

主键

外键

E-R 图

ANSI-SQL 以及不同的数据库实现的关系

【熟知】

逻辑运算符

比较运算符

算术运算符

通配符

2、SQL 查询语句

【应用】

select 语句

包括查询单列

多列,去重,前 N 列

from 语句、where 语句、group by 语句、having 语句、order by 语句、子查询

SQL 聚合函数,包括 count、sum、avg、max、min 等

3、SQL 连接语句

【领会】

表的连接类型,包括内连接(等值、不等值)、外连接(左、右、全)、交叉连接(笛卡

尔连接)

查询的集合操作,只包括并集操作

【应用】

inner join 的用法

left/right/full join 的用法

cross join 的用法

union 的用法

4、其它 SQL 语句

【领会】

表的创建

视图及索引的概念及创建

数据插入、更新、删除

【领会】

高级函数,如 Oracle 或 Hive 中的 row number over partition by、正则匹配等

PART 3

数据采集与处理

1、数据采集方法

【领会】

一手数据与二手数据来源渠道

优劣势分析

使用注意事项

【熟知】

一手数据采集中的概率抽样与非概率抽样的区别与优缺点

【运用】

概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样

明确每种抽样的优缺点

根据给定条件选择最可行的抽样方式

计算简单随机抽样所需的样本量

Ø 市场调研

【熟知】

市场调研的基本步骤(ᨀ出问题、调查收集材料、分析预测问题)

单选题及多项选择题的设置

数据编码及录入

Ø 数据预处理方法

【熟知】

数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数据变换(标

准化)、数据归约(维度归约技术、数值归约技术),这部分内容不需要涉及计算,只需要根

据需求明确可选的处理技术即可。

【应用】

数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数等方法,不

涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值(单变量根据中心

标准化值,多变量使用快速聚类),以及解决不一致问题(熟知概念即可),查重(只考核

SQL 的语句,不涉及 R、SAS 等其它语言)。

PART 4

数据建模分析

总体要求

领会模型基本原理,数值模型操作流程,懂得模型应用场景,能够完成数据建模分析报告。

1、描述性数据分析/挖掘方法——主成分分析

【领会】

主成分分析的计算步骤

主成分分析中对变量自身分布和多变量之间关系的假设以及模型设置

【熟知】

适用于主成分分析的变量度量类型。通过分析结果,选取合适的保留主成分的个数,注意区分两种不同的分析目的(尽量压缩变量、避免共线性情况下保留更多信息)保留主成分

个数的评判标准的差异。

【应用】

在深入理解主成分的意义的基础之上,在遇到业务问题时,有能力决定是否使用主成分分析方法;有能力决定何时采用相关系数计算方法和协方差矩阵计算方法;有能力解释主成分得分的结果;根据变量分布情况进行函数转换。

2、描述性数据分析/挖掘方法——因子分析

【领会】

了解因子分析模型设置,只需要关注主成分法的计算步骤

【熟知】

适用于因子分析的变量度量类型。通过分析结果,选取合适的因子个数;

知道最常用的因子旋转的方法。

【应用】

在遇到业务问题时,有能力决定是否使用因子分析,还是使用主成分分析方法就可以了;有能力根据原始变量在各因子上的权重明确每个因子的意义;有能力对大量变量进行维度分析,分维度打分,并比较与专家打分(德尔菲法)的区别;在聚类前对数据进行描述,发现理想的聚类方式和数量。

3、描述性数据分析/挖掘方法——聚类分析

【领会】

多种聚类算法的特点

【熟知】

聚类方法的基本逻辑

系统聚类和 K-Means 聚类的基本算法和优缺点

系统聚类的计算步骤,包括两点距离、两类合并的计算方法

系统聚类法中选择最优聚类数量的方法

K-Means 聚类的基本算法

聚类分析变量标准化的原因和计算方法

变量需要进行主成分分析的原因

变量进行函数转化的原因和计算方法

【应用】

结合客户画像、客户细分、商品聚类、离群值检验(欺诈、反洗钱)等业务运用场景,选取合适的聚类方法与步骤

聚类事后分析,根据聚类后变量分布情况获取每类的特征

4、描述性数据分析/挖掘方法——对应分析

【领会】

对应分析的算法

【熟知】

适用于对应分析的变量度量类型

对应分析与列联表分析、主成分分析的关系

这种方法优缺点及如何与其它模型结合使用

【应用】

对应分析使用的指标如何量化及其常见的量化方式

在客户满意度分析、市场绩效及产品细分等场景下的运用

双标图的可视化、解释与意义扩展

5、描述性数据分析/挖掘方法——多维尺度分析

【领会】

多维尺度分析的算法。

【熟知】

适用于多维尺度分析的变量度量类型

该分析方法和主成分分析、因子分析、对应分析的异同点,尤其是和因子分析的区别

【应用】

多维尺度分析在客户产品感知图等方面的运用

6、预测性数据分析方法——线性回归与模型诊断及优化

【领会】

线性回归系数的计算公式

【熟知】

明确线性回归的 6 个经典假设(线性模型、不存在共线性、残差期望为 0、同方差、正态性、随机抽样

明确违反前 5 个假设后出现的问题

模型是否违反前 5 个经典假设的检验方法与模型纠正的方法

变量筛选方法

离群值、指标计算方法

明晰横截面和时间序列数据在回归建模上的差异

【应用】

结合业务构建回归模型并且解释回归系数

根据业务场景与变量分布情况进行函数转换

解释变量为分类变量时的处理方法

区分预测性建模与解释性建模的关系

使用结果进行新样本预测

进行客户价值分析的基本步骤与注意事项

7、预测性数据分析方法——构造对二分类变量的预测模型

【领会】

卡方检验计算公式

二分类逻辑回归的计算公式

【熟知】

分类变量是否存在相关关系的述方法和检验方法,涉及列联表分析、卡方检验

似然比与 Logit 转换

二分类逻辑回归模型构建与变量筛选

模型评估的方法,涉及混淆矩阵、ROC 曲线

【应用】

结合业务构建回归模型并且解释回归系数

根据业务场景与变量分布情况进行函数转换

使用结果进行新样本预测

进行客户流失预测、信用评级、精准营销等模型的基本步骤与注意事项

8、时间序列

【领会】

明确趋势分解法、ARIMA 方法、时间序列回归方法的差异和适用场景

明确每种方法的计算方法

【熟知】

趋势分解法,涉及乘法模型、加法模型

ARIMA 方法的具体步骤;时间序列回归的方法

【应用】

结合业务(业绩预测、预警),选取合适的分析方法

进行业务时间序列预测等模型的基本步骤与注意事项

推荐学习书目

说明:推荐学习书目中,部分书籍结合软件,但考试不会考软件,考生可根据自身需求

选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。

[1] 贾俊平,何晓群,金勇进. 统计学(第 7 版)[M]. 中国人民大学出版社,2018.(必读)

[2] 斯蒂芬森,晋劳,琼斯. SQL 入门经典(第 5 版)[M]. 人民邮电出版社,2011.(必读)

[3] 黄缙华.MySQL 入门很简单[M].清华大学出版社,2011.(选读)

[4] 何晓群. 多元统计分析(第 4 版)[M]. 中国人民大学出版社, 2015. (必读)

[5] 盛骤,试式千,潘承毅. 概率论与数理统计(第 4 版), 高等教育出版社,2008.(选读)

[6] 王斌会 . 多元统计分析及 R 语言建模(第 4 版)[M]. 暨南大学出版社, 2016. (选读)

[7] 李静萍. 多元统计分析:原理与基于 SPSS 的应用(第二版), 中国人民大学出版社, 2015.

(选读)

[8] Wes McKinney. 利用 Python 进行数据分析[M]. 机械工业出版社,2014. (选读)

[9] 王燕. 应用时间序列分析(第四版),中国人民大学出版社, 2015. (9 和 10 二选一)

[10] 王燕. 时间序列分析:基于 R, 中国人民大学出版社, 2015. (9 和 10 二选一)

[11] Daniel T. Larose,Chantal D. Larose. 数据挖掘与预测分析(第 2 版)[M]. 清华大学出

版社, 2017. (选读)

[12] 经管之家,曹正凤. 从零进阶!数据分析的统计基础[M]. 电子工业出版社,2016. (选读)

[13] 经管之家,常国珍. 胸有成竹!数据分析的 SPSS 和 SAS EG 进阶[M]. 电子工业出版社,

2016. (选读)

[14] 经管之家,徐筱刚. 如虎添翼:数据处理的 SPSS 和 SAS EG 实现[M]. 电子工业出版社,

2016. (选读)

总结交流与答疑



中培IT学院作为CDA数据分析师认证培训的优质授权学院,全国各地的学员皆可报名。指定教材+同步讲义(纸质版,电子版),还可以加入我们的在线交流答疑群。强大好用的线上题库系统(最全历年真题,章节练习,模拟测试),保障您多端口、随时随地检测自己、查缺补漏。从而让自己面对有一定难度的考试,更有信心,更加从容。


 

[1]

 
网络安全热度最高的6本证书...
系统分析师VS系统架构设计...
项目经理考NPDP还是软考高...
盘点五个IT领域下证快的证...
CBA与TOGAF:探寻企业架构...
【收藏】软考电子证书下载...
项目经理任选两本证书,年...
DAMA中国推出“一考两证”...
数据分析具体指的是什么,...
数据分析师需要具备什么数...
CDA认证带你了解数据分析的...
敏捷与DevOps协同工作的注...
DevOps自动化测试的注意事...
DevOps五个好用的工具列表...
IT项目管理实现落地有哪些...
IT项目需求分析重点是建立...


中培IT学院 Copyright@2006-2024  北京中培伟业管理咨询有限公司.ALL Rights Reseved 备案号:京ICP备13024721号-2