1、
2026下半年CDA数据分析师(数据挖掘算法)基础考点
(考试时间:90分钟 满分100分)
班级______ 姓名______
第 I 卷(选择题 共40分)
(总共8题,每题5分,每题只有一个正确答案,请将正确答案填在题后的括号内)
w1. 以下哪种算法不属于数据挖掘中的分类算法?( )
A. 决策树算法
B. 支持向量机算法
C. K均值算法
D. 朴素贝叶斯算法
w2. 在关联规则挖掘中,用于衡量规则重要性的指标是( )。
A. 支持度
B. 置信度
C. 提升度
D. 以上都是
w3. 数据挖掘中,处理高维数据时常用的降维
2、算法是( )。
A. 主成分分析
B. 聚类分析
C. 回归分析
D. 分类分析
w4. 以下关于决策树算法的说法,错误的是( )。
A. 决策树是一种基于树结构进行决策的算法
B. 信息增益是决策树分裂节点的常用依据
C. 决策树容易产生过拟合现象
D. 决策树只能处理数值型数据
w5. 支持向量机算法主要用于解决( )问题。
A. 分类
B. 聚类
C. 回归
D. 关联规则挖掘
w6. 对于K均值聚类算法,初始聚类中心的选择对聚类结果( )。
A. 有很大影响
B. 没有影响
C. 影响较小
D. 只有在数据量很大时才有影响
w7. 在数据
3、挖掘中,评估一个分类模型的性能,常用的指标不包括( )。
A. 准确率
B. 召回率
C. F1值
D. 相关系数
w8. 以下哪种算法常用于处理数据中的异常点检测?( )
A. 线性回归算法
B. 孤立森林算法
C. 支持向量机算法
D. 朴素贝叶斯算法
第 II 卷(非选择题 共60分)
w9. (10分)请简要阐述数据挖掘的定义,并说明数据挖掘在实际应用中的主要步骤。
w10. (15分)在数据挖掘中,分类算法和聚类算法有什么区别?请举例说明它们各自的应用场景。
材料:某电商平台收集了大量用户的购买行为数据,包括购买时间、购买商品种类、购买金
4、额等。
w11. (15分)如果你是数据分析师,利用这些数据进行关联规则挖掘,你会重点关注哪些方面?请说明理由,并给出可能挖掘出的一些关联规则示例。
材料:一家企业希望通过对销售数据进行分析,预测未来的销售趋势,以便合理安排生产和库存。
w12. (20分)请你选择一种合适的数据挖掘算法来解决这个问题,并详细说明该算法的原理、步骤以及如何应用到该企业的销售数据预测中。
答案:w1.C;w2.D;w3.A;w4.D;w5.A;w6.A;w7.D;w8.B;w9.数据挖掘是从大量数据中提取潜在的、有价值的信息和知识的过程。主要步骤包括:数据准备(收集、清理、集成等)、数据探索(了
5、解数据特征等)、模型选择与训练、模型评估、模型部署与应用。w10.分类算法是已知类别标签的数据中学习分类模型,用于预测未知数据的类别。聚类算法是将数据对象分组,使组内对象相似性高,组间对象差异大。应用场景:分类算法如预测客户是否会购买产品;聚类算法如对客户进行细分。w11.关注购买商品之间的关联。理由:可帮助了解用户购买习惯,优化商品推荐等。示例:购买笔记本电脑的用户常购买鼠标;购买洗发水的用户常购买护发素。w12.可选择回归算法。原理:通过建立自变量与因变量之间的关系模型进行预测。步骤:确定自变量和因变量,选择合适的回归模型,训练模型,评估模型。应用:将销售时间等作为自变量,销售金额作为因变量,训练模型预测未来销售金额,为企业生产和库存安排提供依据。