资源描述
n
更多企业学院:
《中小企业管理全能版》
套讲座份资料
《总经理、高层管理》
套讲座份资料
《中层管理学院》
套讲座份资料
《国学智慧、易经》
套讲座
《人力资源学院》
套讲座份资料
《各阶段员工培训学院》
套讲座 份资料
《员工管理企业学院》
套讲座 份资料
《工厂生产管理学院》
套讲座 份资料
《财务管理学院》
套讲座 份资料
《销售经理学院》
套讲座 份资料
《销售人员培训学院》
套讲座 份资料
试卷代号: 卷
浙江广播电视大学年月期末考试试题
《数据挖掘与客户管理》期末考试试卷
(试卷总分:分,考试时间:分钟)
题号
一
二
三
四
总分
分数
一、名词解释(每题分,共分)
.数据挖掘:
. 过度拟合:
. 过抽样:
.辛普森差异系数(基尼系数):
.数据仓库:
二、填空题(每空分,共分)
. 数据挖掘的三大支柱分别是 、 和 。
. 互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据转换成可执行的决策、 和 。
. 预测模型成功应用的三个假定分别是 、 和 。
. 数据仓库的优点是
和 。
. 数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑战是要建立合适的 。
. 使用无监督的数据挖掘方法必须 。
. 为了确保输入数据早于输出结果,可以用 方法对数据时间元素进行处理。
. 分段输入组合模型和模型分段组合模型的最大区别在于 。
. 客户流失的原因,大致可以分为两类:自愿流失和 。
三、单项选择题(每题分,共分)
. 企业所建立的预测模型的好坏取决于模型在( )上的表现效果。
得分集 训练集 测试集 评价集
. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( )。
行为身份 所有权身份 学习身份 决策身份
. 下列四条描述中,正确的一条是( )。
企业实施数据挖掘,必须要有数据仓库。
企业要实施数据挖掘最好的方式是请编外专家。
企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。
在建模的时侯,增益最高的模型就是最好的模型。
. 数据挖掘算法以( )形式来组织数据。
行 列 记录 表格
. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( )。
数据越多越好。
尽可能多的适合的数据。
得分集数据是建模集数据的一部分。
以上三条都正确。
. —均值类别侦测要求输入的数据类型必须是( )。
整型 数值型 字符型 逻辑型
. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的( )相对应。
线段长度 线段斜率 相对应的线段长度 相对应的线段斜率
. 企业为提升每个客户的价值,应实现( )最优化。
促销活动 预算最优化 客户最优化 三者都不是
. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。
分类 预测 组合或关联法则 聚类
. 企业成功实施数据挖掘, 需要以下( )知识或技术
预先的规划 对商业文体的理解 综合商业知识和技能 都需要
四、简答题(每题分,共分)
. 数据挖掘的六种常用算法和技术分别是什么?
. 实现数据挖掘技术在企业中专业化应用的四种有效途径?
. 一般认为有哪几种方法可以提升客户的价值?
. 数据挖掘中的数据需要采用哪些格式?
. 预测模型的建立过程有哪些?
《数据挖掘与客户管理》期末考试试卷答案
(试卷总分:分,考试时间:分钟)
一、名词解释(每题分,共分)
. 数据挖掘:是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。
. 过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地对未来数据进行预测。
. 过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模型集中稀疏数据与一般数据间的比例关系,使之保持在.
. 辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回地随机取得两个样品属于不同类别的概率。公式为:××(-),其中是属于第一类的概率。
. 数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、反映历史变化的和相对稳定的数据集合。
二、填空题(每空分,共分)
. 数据挖掘技术与算法、 无所不在的数据、 建立有效的预测模型
. 决策实施、 评价决策模型
. 过去是将来的预言家、 数据是可以获得的、 数据中应包括我们的预期目标
. 数据仓库是从一个点上观察整个企业,而不是许多小定义的“地下仓库”的拼凑集合、 数据挖掘记录的是最令人感兴趣的详细的数据
. 纬度和事实
. 人机交互
. 将时间范围附加到时间字段上
. 数据的分段是预先知道的还是模型决定的
. 非自愿流失
三、单项选择题(每题分,共分)
. . . . .
. . . . .
四、简答题(每题分,共分)
. 数据挖掘的六种常用算法和技术分别是什么?
①分类:处理结果是离散的
②估计:处理的是连续的结果
③预测:任何的预测都可以被认为是分类或估计。不同之处在于你强调的是什么:可以对分类后的结果加以检验;但在预测中,检验只能等待事物发生后才能确定。
④组合或关联分析
⑤聚类:其与分类的区别是聚类不依赖于事先确定好的组别。
⑥描述与可视化:“女性比男性更支持民主党”。
. 实现数据挖掘技术在企业中专业化应用的四种有效途径?
①购买与企业的商业问题配套的评分机制
②购买数据挖掘软件这类整体解决方案
③聘请外部专家完成预测模型的建立
④组织内部掌握数据挖掘技能
. 一般认为有哪几种方法可以提升客户的价值?
一般认为,有如下三种方法可以提升客户的价值:
①对客户已有产品,增添新功能,或者说提升产品的购买价值。
②向客户出售更多、更容易升级的产品。
③使客户能长期购买本公司的产品。
. 数据挖掘中的数据需要采用哪些格式?
数据挖掘中的数据需要采用以下格式:
① 所有数据应该在一个表格数据库视图中
② 每一行对应于与业务问题相关的一个案例
③ 忽略具有单一值几乎单一值的列
④ 忽略所有行的值都不同的列
⑤ 删除所有同义列
⑥ 对于预测模型,目标列必须是可识别的
. 预测模型的建立过程有哪些?
① 搜集建模所需的尽可能多的适合的数据,即搜集模型集数据;
② 建立训练集数据,用于建立预测模型;
③ 建立测试集数据,用于预测模型的修正;
④ 建立评价集数据,用于估计模型的效果,或不同模型的效果比较;
⑤建立得分集数据,该数据不属于模型集的一部分,不知道这部分数据会产生什么样的结果。
展开阅读全文