1、江西科技师范大学大数据技术(职教资源优化决策版)江西科技师范大学大数据技术(职教资源优化决策版)20242024-2025 2025 学年第一学期期末试卷学年第一学期期末试卷 试卷说明:试卷说明:1、试卷满分 100 分,120 分钟完成试卷;2、钢笔或圆珠笔直接答在试题中(除题目有特殊规定外);3、答卷前将密封线内的项目填写清楚。题号 一 二 三 四 五 总分 合分人 复核人 满分 100 得分 一、精心选一选(本大题总共 15 小题,每题 2 分,共 30 分)1.大数据的特点不包括以下哪一项?()A.大量化 B.多样化 C.低价值密度 D.快速化 2.以下哪种数据类型不属于结构化数据?(
2、A.数据库表中的数据 B.XML 文件数据 C.二维表格数据 D.固定格式文本数据 3.数据采集的方法不包括()A.网络爬虫 B.传感器收集 C.人工录入 D.数据删除 4.数据预处理不包括以下哪个环节?()A.数据清洗 B.数据集成 C.数据分析 D.数据转换 5.以下哪种算法不属于分类算法?()A.决策树 B.支持向量机 C.聚类算法 D.朴素贝叶斯 6.数据挖掘中关联规则挖掘主要用于发现()A.数据之间的因果关系 B.数据之间的相似性 C.数据之间的相关性 D.数据的分布规律 7.大数据存储中,分布式文件系统的优点不包括()A.高可靠性 B.高性能 C.高成本 D.可扩展性 8.以下哪
3、个不是大数据分析的常用工具?()A.Hadoop B.Spark C.MySQL D.Tableau 9.数据可视化的作用不包括()A.快速理解数据 B.发现数据中的规律 C.隐藏数据的重要信息 D.辅助决策 10.机器学习中,监督学习的特点是()A.有标注数据 B.无标注数据 C.数据维度高 D.数据维度低 11.以下哪种数据结构适合存储海量数据?()A.数组 B.链表 C.哈希表 D.分布式数据结构 12.大数据安全面临的挑战不包括()A.数据泄露 B.数据篡改 C.数据备份 D.数据滥用 13.数据质量管理的目标不包括()A.提高数据准确性 B.降低数据一致性 C.提升数据完整性 D.增
4、强数据可用性 14.以下哪个是大数据在教育领域的应用?()A.学生成绩预测 B.校园建设规划 C.教师招聘 D.学校财务管理 15.数据挖掘中,频繁项集挖掘是为了发现()班 级 学 号 姓名 本科 密 封 线 A.经常同时出现的项集 B.出现频率最高的项 C.包含项最多的项集 D.与其他项集差异最大的项集 二、准确填一填(本大题总共 5 题,每题 4 分,共 20 分)1.大数据的 4V 特点是指大量化、多样化、_和价值密度低。2.数据采集的来源主要有内部数据和_。3.常见的数据预处理方法包括数据清洗、数据集成、数据转换和_。4.分类算法在大数据中的应用场景有客户分类、_等。5.数据可视化的主要类型有柱状图、折线图、_等。三、合理判一判(本大题总共 6 题,每题 4 分,共 24 分)1.大数据就是数据量特别大的数据。()2.所有的数据都是结构化数据。()3.数据挖掘的目的是从数据中发现有价值的信息和知识。()4.分布式文件系统不适合存储大数据。()5.机器学习中的无监督学习不需要标注数据。()6.数据可视化只能展示简单的数据关系。()四、灵活答一答(本大题总共 2 题,每题 6 分,共 12 分)1.简述数据采集的流程。2.请说明分类算法在大数据分析中的作用及应用场景。五、综合用一用(14 分)请结合大数据技术,谈谈如何对学校的学生学习数据进行分析和利用,以提高教学质量。