CDA业务数据分析师-证书介绍
CDA(Certified Data Analyst),即“CDA数据分析师”,是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据分析人才。全球CDA持证者秉承着先进商业数据分析的新理念,遵循着《CDA数据分析师职业道德和行为准则》新规范,发挥着自身数据科学专业能力,推动科技创新进步,助力经济持续发展。
“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,共分为CDA LEVEL1(业务数据分析师) ,LEVEL 2(建模分析师、大数据分析师),LEVEL 3(数据科学家)三个等级
其中CDA LEVEL1业务数据分析师是初级,由于CDA不能跨级考试,所以持有CDA LEVEL1证书是数据分析师进阶的必备条件。
CDA各等级证书有效期均为三年,到期前需要进行年审。
CDA LEVEL1业务数据分析师-证书样本
CDA业务数据分析师-认证价值
1、CDA 数据分析师考试是评判「数据标准化人才」的唯一考核路径。
2、CDA 数据分析师是面向全行业数据分析及大数据相关岗位的一套科 学化、专业化、正规化、系统化的人才技能准则。
3、CDA 数据分析师考试大纲规定并明确了数据分析师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人才。
CDA业务数据分析师-适用人群
CDA Level1
适用人群:CDA认证涉及行业包括互联网、金融、咨询、电信、零售、医疗、旅游等;CDA认证涉及岗位包括大数据、数据分析、市场、产品、运营、咨询、投资等。
面向范围:人人皆需的职场数据思维与通用数据技能人群。如:
① 零基础就业转行者、应届毕业生。
② 产品、运营、营销等业务岗与研发、技术岗在职者。
③ 企业创始人、经理人、管理咨询类岗位从业者。
岗位去向:商业(业务)分析师、初级数据分析师、(数据)产品运营、(数字)市场营销、数据专员等。
CDA业务数据分析师-考试报名
报考条件:无具体限制。
考试方式:VUE线上考试,随约随考
考试题型:客观题(单选+多选)
考试时间:120 分钟
考试成绩:分为 A、B、C、D 四个层次,A、B、C 为通过考试,D 为不通过.
考试费用:1200元/人(未通过者可进行一次补考,补考费用为六折优惠)。
报考流程:
CDA业务数据分析师-培训服务
机构简介:
北京中培伟业管理咨询有限公司(以下简称“中培”)成立于2006年,公司核心业务是向世界500强企业、国有大中型集团化企业、上市公司、头部互联网企业等,提供IT认证培训、IT实践培训及信息化综合技术落地应用服务。培训业务涉及线上、线下两个渠道。
借助于优质的专家资源池和高实用性的课程体系,中培在业内逐步建立了良好口碑。先后为:中国石油、中国石化、燕山石化、中国移动、中国邮政、国家电网、北京奔驰、上汽集团、一汽集团、格力集团、中国银行、红塔银行、兴业银行、安信证券、东软集团、浪潮集团等企业,提供高质量的信息化战略规划、组织架构规划、科技人才管理、信息技术架构规划、信息系统开发和运维管理、信息化能力评测等培训服务,服务人次达62631人次,服务时长达102658小时,企业满意度高达98.36%。
培训形式:
【线上录播班】
注:10人以上团队可申请加开当地面授,具体情况可致电:400-808-2006
收费标准:
培训费用:1980元/人(含培训费、资料费、在线题库以及录播视频回放一年等费用)
考试费用:1200元/人(含考试费发票)。
增值服务:
官方指定教材、全真模拟题库,专家讲义、12小时值班微信群,面授/直播免费重修一次,录播视频免费回放一年。
课程安排:(5天,每天6-7小时)
章节
|
模块
|
培训内容
|
PART 1
数据分析概念与统计学基础
|
1、数据分析概述
|
【领会】
数据分析和数据挖掘的概念
强调商业数据分析中对业务的理解
商业数据分析和预测的本质
数据分析的8个层次
大数据对传统小数据分析的拓展
【熟知】
明确数据分析目标及意义
数据分析的过程
数据分析与数据挖掘的常用方法
CRISP-DM、SEMMA 方法论
数据分析中不同人员的角色与职责
|
|
2、描述性统计分析
|
【领会】
数据的计量尺度
数据的集中趋势、离中趋势和数据分布的概念
统计图的概念
各种统计图的含义和画法
【熟知】
衡量数据集中趋势、离中趋势和数据分布的常用指标及计算方法统计图形的绘制、图形元素的调整、可视化效果,主要涉及条形图、线图、直方图、盒须图、散点图、气泡图、马赛克图、玫瑰图及其多种图形整合。明确统计图形对统计指标表达上的对应关系
【应用】
根据不同数据类型选用不同的统计指标来进行数据的集中趋势、离中趋势和数据分布的衡量,不同统计图的使用场景。会写数据分析报告和结合业务需求对报告进行合理解释,对业务ᨀ出建设性意见建议。
|
|
3、抽样估计
|
【领会】
随机试验、随机事件、随机变量的概念
总体与样本的概念
抽样估计的理论基础
正态分布及三大分布的函数形式和图像形式
抽样的多种组织形式
确定必要样本容量的原因
【熟知】
随机事件的概率
抽样平均误差的概念与数学性质
点估计与区间估计方法的特点与优缺点
全体总体与样本总体
参数和统计量
重复抽样与不重复抽样
抽样误差的概念对总体平均数和总体成数的区间估计方法
必要样本容量的影响因素
中心极限定理的意义与应用
【应用】
随机变量及其概率分布
全部可能的样本单位数目的概念及其在不同抽样方法下的确定
抽样平均误差在实际数据分析中的计算方法
|
|
4、假设检验
|
【领会】
假设检验的基本概念
其基本思想在数据分析中的作用
假设检验的基本步骤
假设检验与区间估计的联系
假设检验中的两类错误
【熟知】
P值的含义及计算
如何利用P值进行检验
z检验统计量
t检验统计量
F检验统计量
c2检验统计量的函数形式和检验步骤
【应用】
实现单样本t检验
两独立样本t检验的步骤和检验中使用的统计量与原假设
两种检验应用的数据分析场景。
|
|
5、方差分析
|
【领会】
方差分析的相关概念
单因素方差分析的原理
统计量构造过程
【熟知】
单因素方差分析的基本步骤
总离差平方和(SST)的含义及计算
组间离差平方和(SSA)的含义及计算
组内离差平方和(SSE)的含义及计算
单因素方差分析的原假设
【应用】
实现单因素方差分析的步骤
对方差分析表的分析以及多重比较表的分析
|
|
6、简单线性回归分析
|
【领会】
相关图的绘制与作用
相关表的编制与作用
相关系数定义公式的字母含义
估计标准误差与相关系数的关系
【熟知】
相关关系的概念与特点
相关关系与函数关系的区别与联系
相关关系的种类
相关系数的意义以及利用相关系数的具体数值对现象相关等级的划分
回归分析的概念
回归分析的主要内容和特点
建立一元线性回归方程的条件
应用回归分析应注意的问题
估计标准误差的意义及计算
【应用】
运用简捷法公式计算相关系数
相关分析分析中应注意的问题
回归分析与相关分析的区别与联系
|
PART 2
SQL数据库基础
|
1、SQL 基础概念
|
【领会】
关系型数据库基本概念、属性
主键
外键
E-R 图
ANSI-SQL 以及不同的数据库实现的关系
【熟知】
逻辑运算符
比较运算符
算术运算符
通配符
|
|
2、SQL 查询语句
|
【应用】
select 语句
包括查询单列
多列,去重,前 N 列
from 语句、where 语句、group by 语句、having 语句、order by 语句、子查询
SQL 聚合函数,包括 count、sum、avg、max、min 等
|
|
3、SQL 连接语句
|
【领会】
表的连接类型,包括内连接(等值、不等值)、外连接(左、右、全)、交叉连接(笛卡
尔连接)
查询的集合操作,只包括并集操作
【应用】
inner join 的用法
left/right/full join 的用法
cross join 的用法
union 的用法
|
|
4、其它 SQL 语句
|
【领会】
表的创建
视图及索引的概念及创建
数据插入、更新、删除
【领会】
高级函数,如 Oracle 或 Hive 中的 row number over partition by、正则匹配等
|
PART 3
数据采集与处理
|
1、数据采集方法
|
【领会】
一手数据与二手数据来源渠道
优劣势分析
使用注意事项
【熟知】
一手数据采集中的概率抽样与非概率抽样的区别与优缺点
【运用】
概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样
明确每种抽样的优缺点
根据给定条件选择最可行的抽样方式
计算简单随机抽样所需的样本量
Ø 市场调研
【熟知】
市场调研的基本步骤(ᨀ出问题、调查收集材料、分析预测问题)
单选题及多项选择题的设置
数据编码及录入
Ø 数据预处理方法
【熟知】
数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数据变换(标
准化)、数据归约(维度归约技术、数值归约技术),这部分内容不需要涉及计算,只需要根
据需求明确可选的处理技术即可。
【应用】
数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数等方法,不
涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值(单变量根据中心
标准化值,多变量使用快速聚类),以及解决不一致问题(熟知概念即可),查重(只考核
SQL 的语句,不涉及 R、SAS 等其它语言)。
|
PART 4
数据建模分析
总体要求
领会模型基本原理,数值模型操作流程,懂得模型应用场景,能够完成数据建模分析报告。
|
1、描述性数据分析/挖掘方法——主成分分析
|
【领会】
主成分分析的计算步骤
主成分分析中对变量自身分布和多变量之间关系的假设以及模型设置
【熟知】
适用于主成分分析的变量度量类型。通过分析结果,选取合适的保留主成分的个数,注意区分两种不同的分析目的(尽量压缩变量、避免共线性情况下保留更多信息)保留主成分
个数的评判标准的差异。
【应用】
在深入理解主成分的意义的基础之上,在遇到业务问题时,有能力决定是否使用主成分分析方法;有能力决定何时采用相关系数计算方法和协方差矩阵计算方法;有能力解释主成分得分的结果;根据变量分布情况进行函数转换。
|
|
2、描述性数据分析/挖掘方法——因子分析
|
【领会】
了解因子分析模型设置,只需要关注主成分法的计算步骤
【熟知】
适用于因子分析的变量度量类型。通过分析结果,选取合适的因子个数;
知道最常用的因子旋转的方法。
【应用】
在遇到业务问题时,有能力决定是否使用因子分析,还是使用主成分分析方法就可以了;有能力根据原始变量在各因子上的权重明确每个因子的意义;有能力对大量变量进行维度分析,分维度打分,并比较与专家打分(德尔菲法)的区别;在聚类前对数据进行描述,发现理想的聚类方式和数量。
|
|
3、描述性数据分析/挖掘方法——聚类分析
|
【领会】
多种聚类算法的特点
【熟知】
聚类方法的基本逻辑
系统聚类和 K-Means 聚类的基本算法和优缺点
系统聚类的计算步骤,包括两点距离、两类合并的计算方法
系统聚类法中选择最优聚类数量的方法
K-Means 聚类的基本算法
聚类分析变量标准化的原因和计算方法
变量需要进行主成分分析的原因
变量进行函数转化的原因和计算方法
【应用】
结合客户画像、客户细分、商品聚类、离群值检验(欺诈、反洗钱)等业务运用场景,选取合适的聚类方法与步骤
聚类事后分析,根据聚类后变量分布情况获取每类的特征
|
|
4、描述性数据分析/挖掘方法——对应分析
|
【领会】
对应分析的算法
【熟知】
适用于对应分析的变量度量类型
对应分析与列联表分析、主成分分析的关系
这种方法优缺点及如何与其它模型结合使用
【应用】
对应分析使用的指标如何量化及其常见的量化方式
在客户满意度分析、市场绩效及产品细分等场景下的运用
双标图的可视化、解释与意义扩展
|
|
5、描述性数据分析/挖掘方法——多维尺度分析
|
【领会】
多维尺度分析的算法。
【熟知】
适用于多维尺度分析的变量度量类型
该分析方法和主成分分析、因子分析、对应分析的异同点,尤其是和因子分析的区别
【应用】
多维尺度分析在客户产品感知图等方面的运用
|
|
6、预测性数据分析方法——线性回归与模型诊断及优化
|
【领会】
线性回归系数的计算公式
【熟知】
明确线性回归的 6 个经典假设(线性模型、不存在共线性、残差期望为 0、同方差、正态性、随机抽样
明确违反前 5 个假设后出现的问题
模型是否违反前 5 个经典假设的检验方法与模型纠正的方法
变量筛选方法
离群值、指标计算方法
明晰横截面和时间序列数据在回归建模上的差异
【应用】
结合业务构建回归模型并且解释回归系数
根据业务场景与变量分布情况进行函数转换
解释变量为分类变量时的处理方法
区分预测性建模与解释性建模的关系
使用结果进行新样本预测
进行客户价值分析的基本步骤与注意事项
|
|
7、预测性数据分析方法——构造对二分类变量的预测模型
|
【领会】
卡方检验计算公式
二分类逻辑回归的计算公式
【熟知】
分类变量是否存在相关关系的描述方法和检验方法,涉及列联表分析、卡方检验
似然比与 Logit 转换
二分类逻辑回归模型构建与变量筛选
模型评估的方法,涉及混淆矩阵、ROC 曲线
【应用】
结合业务构建回归模型并且解释回归系数
根据业务场景与变量分布情况进行函数转换
使用结果进行新样本预测
进行客户流失预测、信用评级、精准营销等模型的基本步骤与注意事项
|
|
8、时间序列
|
【领会】
明确趋势分解法、ARIMA 方法、时间序列回归方法的差异和适用场景
明确每种方法的计算方法
【熟知】
趋势分解法,涉及乘法模型、加法模型
ARIMA 方法的具体步骤;时间序列回归的方法
【应用】
结合业务(业绩预测、预警),选取合适的分析方法
进行业务时间序列预测等模型的基本步骤与注意事项
|
推荐学习书目
|
说明:推荐学习书目中,部分书籍结合软件,但考试不会考软件,考生可根据自身需求
选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。
|
[1] 贾俊平,何晓群,金勇进. 统计学(第 7 版)[M]. 中国人民大学出版社,2018.(必读)
[2] 斯蒂芬森,晋劳,琼斯. SQL 入门经典(第 5 版)[M]. 人民邮电出版社,2011.(必读)
[3] 黄缙华.MySQL 入门很简单[M].清华大学出版社,2011.(选读)
[4] 何晓群. 多元统计分析(第 4 版)[M]. 中国人民大学出版社, 2015. (必读)
[5] 盛骤,试式千,潘承毅. 概率论与数理统计(第 4 版), 高等教育出版社,2008.(选读)
[6] 王斌会 . 多元统计分析及 R 语言建模(第 4 版)[M]. 暨南大学出版社, 2016. (选读)
[7] 李静萍. 多元统计分析:原理与基于 SPSS 的应用(第二版)
, 中国人民大学出版社, 2015.
(选读)
[8] Wes McKinney. 利用 Python 进行数据分析[M]. 机械工业出版社,2014. (选读)
[9] 王燕. 应用时间序列分析(第四版),中国人民大学出版社, 2015. (
9 和 10 二选一)
[10] 王燕. 时间序列分析:基于 R, 中国人民大学出版社, 2015. (
9 和 10 二选一)
[11] Daniel T. Larose,Chantal D. Larose. 数据挖掘与预测分析(第 2 版)[M]. 清华大学出
版社,2017. (选读)
[12] 经管之家,曹正凤. 从零进阶!数据分析的统计基础[M]. 电子工业出版社,2016. (选读)
[13] 经管之家,常国珍. 胸有成竹!数据分析的 SPSS 和 SAS EG 进阶[M]. 电子工业出版社,
2016. (选读)
[14] 经管之家,徐筱刚. 如虎添翼:数据处理的 SPSS 和 SAS EG 实现[M]. 电子工业出版社,
2016. (选读)
|
总结交流与答疑
|
[1] |