1、
2025年大学三年级(人工智能)机器学习基础试题及答案
(考试时间:90分钟 满分100分) 班级______ 姓名______
第I卷(选择题 共30分)
答题要求:请从每小题的四个选项中,选出一个最符合题意的答案,将其序号填在题后的括号内。(总共10题,每题3分)
1. 以下关于机器学习中监督学习的说法,正确的是( )
A. 监督学习不需要训练数据
B. 监督学习的目标是预测输入数据的类别或数值
C. 监督学习中没有明确的标签
D. 监督学习主要用于无监督的任务
答案:B
2. 在决策树算法中,用于选择划分属性的指标通常是( )
2、
A. 信息增益
B. 基尼系数
C. 均方误差
D. 以上都可以
答案:A
3. 以下哪种算法不属于线性模型( )
A. 线性回归
B. 逻辑回归
C. 支持向量机
D. 决策树
答案:D
4. 对于k近邻算法,k值的选择对模型性能有重要影响。当k值较小时,模型会( )
A. 更复杂,容易过拟合
B. 更简单,容易欠拟合
C. 更稳定,泛化能力强
D. 对性能无影响
答案:A
5. 神经网络中的激活函数作用是( )
A. 增加模型的复杂度
B. 对输入进行非线性变换
C. 加速模型训练
D. 减少模型参数
答案:B
6. 以
3、下哪个是深度学习中常用的优化算法( )
A. 梯度下降
B. 牛顿法
C. Adagrad
D. 以上都是
答案:D
7. 在支持向量机中,核函数的作用是( )
A. 对数据进行特征提取
B. 将低维数据映射到高维空间
C. 简化模型结构
D. 提高模型训练速度
答案:B
8. 以下关于模型评估指标的说法,错误 的是( )
A. 准确率适用于所有分类问题
B. 召回率在关注正例识别时很重要
C. F1值综合考虑了准确率和召回率
D. 均方误差常用于回归模型评估
答案:A
9. 交叉验证的主要目的是( )
A. 减少模型训练时间
B.
4、提高模型的泛化能力
C. 增加模型参数
D. 使模型更复杂
答案:B
10. 以下哪种数据预处理操作可以用于处理缺失值( )
A. 归一化
B. 标准化
C. 填充法
D. 降维
答案:C
第II卷(非选择题 共70分)
二、填空题(每题3分,共15分)
答题要求:请在每题的横线上填写正确的答案。
1. 机器学习的主要任务包括______、______、______等。
答案:分类、回归、聚类
2. 决策树的构建过程主要包括______和______两个步骤。
答案:特征选择、树的生成
3. 线性回归模型的目标是找到一条直线,使得_
5、最小。
答案:误差平方和
4. 神经网络中的反向传播算法用于计算______。
答案:梯度
5. 模型评估中,常用的性能指标有______、______、______等。
答案:准确率、召回率、F1值
三、简答题(每题10分,共30分)
答题要求:简要回答问题,条理清晰。
1. 简述监督学习和无监督学习的区别。
答案:监督学习有明确的标签,目标是根据输入数据预测标签;无监督学习没有明确标签,主要用于发现数据中的结构和规律,如聚类、降维等。
2. 解释一下梯度下降算法的原理及作用。
答案:梯度下降算法通过不断沿着梯度的反方向更新模型参数,使得损
6、失函数值逐渐减小。作用是找到使损失函数最小的参数值,从而优化模型。
3. 说明支持向量机中硬间隔和软间隔的区别。
答案:硬间隔要求所有样本都能被正确分类且间隔最大化;软间隔允许部分样本被错误分类,通过引入松弛变量来调整间隔,更适合存在噪声或线性不可分的数据。
四、材料分析题(共15分)
答题要求:阅读给定材料,回答问题。
材料:在一个预测房价的任务中,我们收集了一些房屋的面积、房间数量、房龄等特征数据,以及对应的房价作为标签。使用线性回归模型进行训练,得到了模型的参数。
1. 请分析线性回归模型在这个任务中的适用性。(7分)
答案:线性回归模型适用于房价预测任务,
7、因为房价与房屋面积、房间数量和房龄等特征可能存在线性关系。通过线性回归可以找到这些特征与房价之间的线性组合,从而进行房价预测。
2. 若发现模型预测结果与实际房价有较大偏差,可能的原因有哪些?(8分)
答案:可能原因有:数据存在噪声或异常值;特征选择不当,遗漏了重要特征;线性关系假设不成立,实际关系可能是非线性的;模型训练不足,参数未收敛到最优值等。
五、算法设计题(共20分)
答题要求:根据题目要求设计算法步骤。
请设计一个简单的k近邻分类算法,用于对新输入的数据点进行分类。
答案:
1. 确定k值。
2. 计算新数据点与训练数据集中所有点的距离(如欧氏距离)。
3. 选择距离最近的k个点。
4. 统计这k个点中各类别的数量。
5. 将新数据点分类为数量最多的类别。