资源描述
2026下半年CDA数据分析师(商业数据分析)实战案例
(考试时间:90分钟 满分100分)
班级______ 姓名______
第I卷(选择题 共30分)
(总共6题,每题5分,每题给出的四个选项中,只有一项是符合题目要求的,请将正确答案填涂在答题卡相应位置。)
w1. 以下哪种数据预处理方法最适合处理商业数据中的缺失值?
A. 直接删除含有缺失值的记录
B. 使用均值填充缺失值
C. 采用回归分析预测缺失值
D. 忽略缺失值不做处理
w2. 在商业数据分析中,对于分类变量,以下哪种编码方式最能体现变量之间的顺序关系?
A. 独热编码
B. 标签编码
C. 序数编码
D. 二进制编码
w3. 当分析商业数据中的客户购买行为时,以下哪种聚类算法更适合发现具有相似购买模式的客户群体?
A. K-Means算法
B. DBSCAN算法
C. 层次聚类算法
D. 谱聚类算法
w4. 商业数据中,用于衡量两个变量之间线性关系强度的指标是?
A. 方差
B. 标准差
C. 相关系数
D. 协方差
w5. 对于时间序列数据,以下哪种模型常用于预测未来的趋势?
A. 决策树模型
B. 支持向量机模型
C. 自回归移动平均模型(ARIMA)
D. 朴素贝叶斯模型
w6. 在商业数据分析中,若要评估一个预测模型的准确性,以下哪个指标是最常用的?
A. 召回率
B. F1值
C. 均方误差
D. 准确率
第II卷(非选择题 共70分)
w7. 简答题(15分)
请简要阐述在商业数据分析中,数据可视化的重要性以及常用的可视化图表类型。
w8. 案例分析题(20分)
某电商平台收集了大量用户的购买数据,包括购买时间、购买商品、购买金额等。以下是部分数据示例:
用户A在2026年1月1日购买了手机,花费5000元;用户B在2026年2月10日购买了电脑,花费8000元。
现在需要分析不同时间段内各类商品的销售情况。
问题:请描述你会采用哪些数据分析步骤来完成这个任务?
w9. 数据分析操作题(20分)
假设你得到了一份包含公司员工年龄、薪资、工作年限的数据表格。要求通过数据分析回答以下问题:
1. 不同年龄段的平均薪资是多少?
2. 工作年限与薪资之间是否存在线性关系?
请简要描述你会使用的数据分析工具(如Excel、Python等)以及具体的操作步骤。
w10. 综合应用题(15分)
某连锁超市想要通过数据分析来优化其商品陈列。已知超市收集了顾客在各个货架区域的停留时间、购买商品种类及数量等数据。
材料:在A货架区域,顾客平均停留时间为5分钟,购买商品种类平均为3种,数量平均为5件;在B货架区域,顾客平均停留时间为3分钟,购买商品种类平均为2种,数量平均为3件。
问题:根据这些数据,你认为哪个货架区域的商品陈列可能需要优化?请说明理由,并提出一些优化建议。
答案:w1.C;w2.C;w3.A;w4.C;w5.C;w6.C;w7.数据可视化的重要性在于能将复杂的数据以直观的图形展示,便于快速理解和发现规律。常用的可视化图表类型有柱状图用于比较数据大小,折线图展示数据趋势,饼图体现各部分占比,散点图分析变量关系等。w8.首先导入数据,然后按时间段和商品类别进行分组,统计各类商品在不同时间段的销售金额等指标,接着可以通过图表(如柱状图)直观展示销售情况,还可进一步分析销售趋势等。w9.若用Excel,可通过数据透视表计算不同年龄段平均薪资;用相关性分析功能看工作年限与薪资关系。若用Python,可用pandas库导入数据,用groupby方法算平均薪资,用scipy库的stats模块计算相关性。w10.A货架区域可能需优化。理由是其顾客停留时间长但购买商品种类和数量优势不明显。优化建议可调整商品布局,将热门商品集中展示,增加促销标识吸引顾客,优化货架高度方便顾客拿取商品等。
展开阅读全文