2025年大学本科四年级（人工智能）机器学习基础测试题及答案.doc

资源描述

2025年大学本科四年级（人工智能）机器学习基础测试题及答案（考试时间：90分钟满分100分）班级______ 姓名______ 第I卷（选择题共30分）答题要求：本卷共6题，每题5分。在每题给出的四个选项中，只有一项是符合题目要求的。 1. 以下关于机器学习中监督学习的说法，正确的是（） A. 监督学习不需要给定标注数据 B. 监督学习的目标是学习输入特征与输出标签之间的映射关系 C. 监督学习只能处理分类问题 D. 监督学习不包含回归问题答案：B 2. 在决策树算法中，用于选择划分属性的指标通常是（） A. 信息增益 B. 基尼系数 C. 均方误差 D. 以上都是答案：D 3. 支持向量机（SVM）主要用于解决（） A. 回归问题 B. 分类问题 C. 聚类问题 D. 降维问题答案：B 4. 以下哪种算法不属于基于模型的聚类算法（） A. K-Means算法 B. 高斯混合模型 C. DBSCAN算法 D. 层次聚类算法答案：A 5. 对于线性回归模型，其损失函数通常采用（） A. 交叉熵损失 B. 均方误差损失 C. 对数损失 D. 铰链损失答案：B 6. 在神经网络中，激活函数的作用是（） A. 增加模型的非线性 B. 减少模型的参数数量 C. 提高模型的训练速度 D. 降低模型的泛化能力答案：A 第II卷（非选择题共70分） 7. （10分）简述机器学习中无监督学习的概念，并列举两种常见的无监督学习算法。无监督学习是指在没有标注数据的情况下，让模型自动从数据中发现潜在的模式和结构。常见算法有K-Means算法，它通过迭代计算将数据点划分为不同的簇；还有主成分分析（PCA）算法，用于数据降维，提取数据的主要特征。 8. （15分）请详细说明决策树的构建过程。决策树构建过程如下：首先，从根节点开始，根据信息增益、基尼系数等指标选择最优划分属性，将数据集划分为不同的子集。然后，对每个子集递归地重复上述过程，构建子树。在构建过程中，当某个子集满足停止条件，如所有样本属于同一类别或样本数量小于阈值时，停止划分，该子集对应的节点成为叶节点。最终形成一棵完整的决策树。 9. （15分）已知有一组数据，包含特征x1,x2,x3，标签y，如下表所示（此处无表格，实际数据按行罗列）： 1.2, 3.5, 2.1, 1 2.3, 4.2, 1.8, 0 3.1, 5.0, 2.5, 1 4.5, 2.0, 3.0, 0 请使用K-Means算法对其进行聚类，假设K=2，初始聚类中心为(1,2,2)和(４,3,2)，写出第一次迭代后的聚类结果。首先计算每个数据点到两个聚类中心的距离。对于第一个数据点(1.2, 3.5, 2.1)，到(1,2,2)的距离为：sqrt((1.2 - 1)^2 + (3.5 - 2)^2 + (2.1 - 2)^2) = sqrt(0.04 + 2.25 + 0.01) = sqrt(2.3)；到(4,3,2)的距离为：sqrt((1.2 - 4)^2 + (3.5 - 3)^2 + (2.1 - 2)^2) = sqrt(7.84 + 0.25 + 0.01) = sqrt(8.1)。所以它属于第一个聚类中心(1,2,2)所在的簇。同理计算其他数据点，最终第一次迭代后的聚类结果为：第一个簇包含(1.

展开阅读全文