资源描述
2025年大学本科四年级(人工智能)机器学习基础测试题及答案
(考试时间:90分钟 满分100分)
班级______ 姓名______
第I卷(选择题 共30分)
答题要求:本卷共6题,每题5分。在每题给出的四个选项中,只有一项是符合题目要求的。
1. 以下关于机器学习中监督学习的说法,正确的是( )
A. 监督学习不需要给定标注数据
B. 监督学习的目标是学习输入特征与输出标签之间的映射关系
C. 监督学习只能处理分类问题
D. 监督学习不包含回归问题
答案:B
2. 在决策树算法中,用于选择划分属性的指标通常是( )
A. 信息增益
B. 基尼系数
C. 均方误差
D. 以上都是
答案:D
3. 支持向量机(SVM)主要用于解决( )
A. 回归问题
B. 分类问题
C. 聚类问题
D. 降维问题
答案:B
4. 以下哪种算法不属于基于模型的聚类算法( )
A. K-Means算法
B. 高斯混合模型
C. DBSCAN算法
D. 层次聚类算法
答案:A
5. 对于线性回归模型,其损失函数通常采用( )
A. 交叉熵损失
B. 均方误差损失
C. 对数损失
D. 铰链损失
答案:B
6. 在神经网络中,激活函数的作用是( )
A. 增加模型的非线性
B. 减少模型的参数数量
C. 提高模型的训练速度
D. 降低模型的泛化能力
答案:A
第II卷(非选择题 共70分)
7. (10分)简述机器学习中无监督学习的概念,并列举两种常见的无监督学习算法。
无监督学习是指在没有标注数据的情况下,让模型自动从数据中发现潜在的模式和结构。常见算法有K-Means算法,它通过迭代计算将数据点划分为不同的簇;还有主成分分析(PCA)算法,用于数据降维,提取数据的主要特征。
8. (15分)请详细说明决策树的构建过程。
决策树构建过程如下:首先,从根节点开始,根据信息增益、基尼系数等指标选择最优划分属性,将数据集划分为不同的子集。然后,对每个子集递归地重复上述过程,构建子树。在构建过程中,当某个子集满足停止条件,如所有样本属于同一类别或样本数量小于阈值时,停止划分,该子集对应的节点成为叶节点。最终形成一棵完整的决策树。
9. (15分)已知有一组数据,包含特征x1,x2,x3,标签y,如下表所示(此处无表格,实际数据按行罗列):
1.2, 3.5, 2.1, 1
2.3, 4.2, 1.8, 0
3.1, 5.0, 2.5, 1
4.5, 2.0, 3.0, 0
请使用K-Means算法对其进行聚类,假设K=2,初始聚类中心为(1,2,2)和(4,3,2),写出第一次迭代后的聚类结果。
首先计算每个数据点到两个聚类中心的距离。
对于第一个数据点(1.2, 3.5, 2.1),到(1,2,2)的距离为:sqrt((1.2 - 1)^2 + (3.5 - 2)^2 + (2.1 - 2)^2) = sqrt(0.04 + 2.25 + 0.01) = sqrt(2.3);到(4,3,2)的距离为:sqrt((1.2 - 4)^2 + (3.5 - 3)^2 + (2.1 - 2)^2) = sqrt(7.84 + 0.25 + 0.01) = sqrt(8.1)。所以它属于第一个聚类中心(1,2,2)所在的簇。
同理计算其他数据点,最终第一次迭代后的聚类结果为:第一个簇包含(1.
展开阅读全文