数据分析挖掘培训测验

感谢大家参与数据分析挖掘课程的考试,请认真填写。考题设置:1-7题为单选题;8-10题为多选题;11-20题为单选判断题;21题为主观题,请看清作答要求。
基础信息(与提交的主观题信息一致)
姓名    ____________
工号    ____________
一级部门    ____________
二级部门/项目组    ____________
邮箱    ____________
-----------------------------------------------------------------------------------------------------------------------------------------------
1、下列哪项不属于跨行业数据挖掘标准流程;(  )
商业理解
数据理解
模型构建
人工智能
2、从订购用户中随机抽取2万用户,为订购用户中随机抽取4万用户,组成数据集合。这是基于以下哪种抽样方法;(  )
随机抽样
分层抽样
整群抽样
系统抽样
3、以下哪个不属于数据标准化方法;(  )
zscore
minmax
sigmoid
K-Modoids
4、以下组件不属于分类预测类算法;(  )
cart算法
Logistic算法
支持向量机
线性回归
5、分类算法训练时,命中率和覆盖率如何取舍;(  )
命中率越大越好
覆盖率越大越好
F值越大越好
结合业务平衡命中率覆盖率
6、下列哪项不属于模型部署前前台跟踪报告的主要内容;(  )
数据稽核
客户群体稳定性报告
变量分析报告
评分分布报告
7、MapReduce采用了下面哪种思想。(  )
分而治之
以终为始
冠军挑战者
不易、变易、简易
8、数据主要从以下(多选)两个方向解决业务问题;(  )
业务流程
拓展思路
业务收入
提高效率
9、在数据据挖掘过程中,数据预处理包括(多选)等;(  )
缺失值处理
异常值处理
无效数据删除
衍生变量生成
10、数据探索分析常用方法(多选);(  )
相关性分析
方差分析
图形分布
卡方检验
-----------------------------------------------------------------------------------------------------------------------------------------------
11、one-hot是数据预处理时常用的数据标准化方法;(  )
12、Pearson相关性分析组件只能选择连续型数据类型字段,即字段类型为flaot或者double类型的;(  )
13、PCA主成份分析通过线性组合实现对原始数据的降维,在进行PCA降维时不用对原始数据进行数据标准化;(  )
14、使用PCA算法组件时,如果输入字段为5个时,设定的降维可以大于5;(  )
15、决策树是机器学习中比较常用的有监督学习的分类方法,其中常用的是C5.0;(  )
16、cart算法组件,设定的树的深度值越大,预测效果命中率越高、覆盖率越低;(  )
 17、在做k-means聚类前必须对数据进行标准化;(  )
18、Logistic算法组件的目标标签列是可多选的;(  )
19、3Sigma法常用来解决分类问题;(  )
20、字典Dict,是R中唯一的映射类型,是一个无序的集合,通过键来存取值;(  )
-----------------------------------------------------------------------------------------------------------------------------------------------
本次考试,由两部分考试结果组成最终成绩,选择题和判断题占本次成绩的60%,主观题占本次成绩的40%。请您及时完成上面的考试题目并提交。另外,第21题为主观题,请按要求完成考试题目,将答案在11月20日(周一)12点之前发至项目组培训负责人邮箱,由负责人统一打包发送至bonc-academy@bonc.com.cn,谢谢您的配合。
21、某省X卡情况数据如下: 

要求:用PPT完成你的分析及建议,材料中要提现
(1)从数据中你看到了哪些主要信息反映了哪些问题?
(2)如果让你提出一个运营建议,你会怎么做?
答案:标准
1、PPT分析思路逻辑清晰与否;
2、问题发现是否准确;
3、建议是否合理;
4、PPT版面组织是否简洁易读美观;

26题 | 被引用7次

使用此模板创建