基础信息(与提交的主观题信息一致)
姓名 ____________
工号 ____________
一级部门 ____________
二级部门/项目组 ____________
邮箱 ____________
-----------------------------------------------------------------------------------------------------------------------------------------------
2、从订购用户中随机抽取2万用户,为订购用户中随机抽取4万用户,组成数据集合。这是基于以下哪种抽样方法;( )
3、以下哪个不属于数据标准化方法;( )
zscore
minmax
sigmoid
K-Modoids
4、以下组件不属于分类预测类算法;( )
cart算法
Logistic算法
支持向量机
线性回归
5、分类算法训练时,命中率和覆盖率如何取舍;( )
命中率越大越好
覆盖率越大越好
F值越大越好
结合业务平衡命中率覆盖率
6、下列哪项不属于模型部署前前台跟踪报告的主要内容;( )
数据稽核
客户群体稳定性报告
变量分析报告
评分分布报告
8、数据主要从以下(多选)两个方向解决业务问题;( )
9、在数据据挖掘过程中,数据预处理包括(多选)等;( )
缺失值处理
异常值处理
无效数据删除
衍生变量生成
-----------------------------------------------------------------------------------------------------------------------------------------------
11、one-hot是数据预处理时常用的数据标准化方法;( )
12、Pearson相关性分析组件只能选择连续型数据类型字段,即字段类型为flaot或者double类型的;( )
13、PCA主成份分析通过线性组合实现对原始数据的降维,在进行PCA降维时不用对原始数据进行数据标准化;( )
14、使用PCA算法组件时,如果输入字段为5个时,设定的降维可以大于5;( )
15、决策树是机器学习中比较常用的有监督学习的分类方法,其中常用的是C5.0;( )
16、cart算法组件,设定的树的深度值越大,预测效果命中率越高、覆盖率越低;( )
17、在做k-means聚类前必须对数据进行标准化;( )
18、Logistic算法组件的目标标签列是可多选的;( )
20、字典Dict,是R中唯一的映射类型,是一个无序的集合,通过键来存取值;( )
-----------------------------------------------------------------------------------------------------------------------------------------------
本次考试,由两部分考试结果组成最终成绩,选择题和判断题占本次成绩的60%,主观题占本次成绩的40%。请您及时完成上面的考试题目并提交。另外,第21题为主观题,请按要求完成考试题目,将答案在11月20日(周一)12点之前发至项目组培训负责人邮箱,由负责人统一打包发送至bonc-academy@bonc.com.cn,谢谢您的配合。
21、某省X卡情况数据如下:
要求:用PPT完成你的分析及建议,材料中要提现
(1)从数据中你看到了哪些主要信息反映了哪些问题?
(2)如果让你提出一个运营建议,你会怎么做?
答案:标准
1、PPT分析思路逻辑清晰与否;
2、问题发现是否准确;
3、建议是否合理;
4、PPT版面组织是否简洁易读美观;