收藏 分销(赏)

《数据挖掘与客户管理》期末考试试卷答案.doc

上传人:仙人****88 文档编号:8767594 上传时间:2025-03-01 格式:DOC 页数:2 大小:30KB
下载 相关 举报
《数据挖掘与客户管理》期末考试试卷答案.doc_第1页
第1页 / 共2页
《数据挖掘与客户管理》期末考试试卷答案.doc_第2页
第2页 / 共2页
本文档共2页,全文阅读请下载到手机保存,查看更方便
资源描述
广播电视大学秦皇岛电大试题库期末考试试题 《数据挖掘与客户管理》期末考试试卷答案 一、名词解释(每题4分,共20分) 1. 数据挖掘:是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。 2. 过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地对未来数据进行预测。 3. 过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模型集中稀疏数据与一般数据间的比例关系,使之保持在15%-30%. 4. 辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回地随机取得两个样品属于不同类别的概率。公式为:2×P1×(1-P1),其中P1是属于第一类的概率。 5. 数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、反映历史变化的和相对稳定的数据集合。 二、填空题(每空2分,共30分) 1. 数据挖掘技术与算法、 无所不在的数据、 建立有效的预测模型 2. 决策实施、 评价决策模型 3. 过去是将来的预言家、 数据是可以获得的、 数据中应包括我们的预期目标 4. 数据仓库是从一个点上观察整个企业,而不是许多小定义的“地下仓库”的拼凑集合、 数据挖掘记录的是最令人感兴趣的详细的数据 5. 纬度和事实 6. 人机交互 7. 将时间范围附加到时间字段上 8. 数据的分段是预先知道的还是模型决定的 9. 非自愿流失 三、单项选择题(每题2分,共20分) 1. A 2. C 3. B 4. D 5. B 6. B 7. D 8. C 9. C 10. B 四、简答题(每题6分,共30分) 1. 数据挖掘的六种常用算法和技术分别是什么? ①分类:处理结果是离散的 ②估计:处理的是连续的结果 ③预测:任何的预测都可以被认为是分类或估计。不同之处在于你强调的是什么:可以对分类后的结果加以检验;但在预测中,检验只能等待事物发生后才能确定。 ④组合或关联分析 ⑤聚类:其与分类的区别是聚类不依赖于事先确定好的组别。 ⑥描述与可视化:“女性比男性更支持民主党”。 2. 实现数据挖掘技术在企业中专业化应用的四种有效途径? ①购买与企业的商业问题配套的评分机制 ②购买数据挖掘软件这类整体解决方案 ③聘请外部专家完成预测模型的建立 ④组织内部掌握数据挖掘技能 3. 一般认为有哪几种方法可以提升客户的价值? 一般认为,有如下三种方法可以提升客户的价值: ①对客户已有产品,增添新功能,或者说提升产品的购买价值。 ②向客户出售更多、更容易升级的产品。 ③使客户能长期购买本公司的产品。 4. 数据挖掘中的数据需要采用哪些格式? 数据挖掘中的数据需要采用以下格式: ① 所有数据应该在一个表格/数据库视图中 ② 每一行对应于与业务问题相关的一个案例 ③ 忽略具有单一值/几乎单一值的列 ④ 忽略所有行的值都不同的列 ⑤ 删除所有同义列 ⑥ 对于预测模型,目标列必须是可识别的 5. 预测模型的建立过程有哪些? ① 搜集建模所需的尽可能多的适合的数据,即搜集模型集数据; ② 建立训练集数据,用于建立预测模型; ③ 建立测试集数据,用于预测模型的修正; ④ 建立评价集数据,用于估计模型的效果,或不同模型的效果比较; ⑤建立得分集数据,该数据不属于模型集的一部分,不知道这部分数据会产生什么样的结果。 2 共 2 页,第 页
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 小学其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服