1、
高职第二学年(人工智能技术应用)机器学习基础2026年阶段测试题及答案
(考试时间:90分钟 满分100分)
班级______ 姓名______
一、选择题(总共10题,每题3分,每题只有一个正确答案,请将正确答案填入括号内)
1. 以下关于机器学习中监督学习的说法,正确的是( )
A. 监督学习不需要训练数据
B. 监督学习的目标是预测输入数据的类别或数值
C. 监督学习只有分类任务
D. 监督学习不需要标签
2. 在决策树算法中,用于选择最佳划分属性的指标是( )
A. 信息增益
B. 基尼系数
C. 均方误差
D. 余弦相似度
2、3. 下列哪种算法不属于线性分类器( )
A. 逻辑回归
B. 支持向量机
C. 朴素贝叶斯
D. 感知机
4. 对于K近邻算法,K值的选择对分类结果有重要影响。当K值较小时,分类结果( )
A. 更平滑,偏差大,方差小
B. 更复杂,偏差小,方差大
C. 更平滑,偏差小,方差大
D. 更复杂,偏差大,方差小
5. 以下关于梯度下降算法的说法,错误的是( )
A. 梯度下降是一种迭代优化算法
B. 梯度下降的目标是使损失函数最小化
C. 梯度下降只能用于线性模型
D. 梯度下降需要选择合适的学习率
6. 在神经网络中,激活函数的作用是( )
A. 增加模
3、型的复杂度
B. 对输入数据进行归一化
C. 引入非线性因素,使模型能够处理非线性问题
D. 加速模型的收敛
7. 以下哪种模型是基于概率统计的分类方法( )
A. 决策树
B. 神经网络
C. 支持向量机
D. 朴素贝叶斯
8. 对于回归问题,常用的损失函数是( )
A. 交叉熵损失函数
B. 均方误差损失函数
C. 对数损失函数
D. 铰链损失函数
9. 以下关于模型评估指标的说法,正确的是( )
A. 准确率适用于所有分类问题
B. 召回率越高,模型性能越好
C. F1值是准确率和召回率的调和平均值
D. 均方误差只用于分类模型评估
10. 在
4、模型训练过程中,以下哪种方法可以防止模型过拟合( )
A. 增加训练数据
B. 减小模型复杂度
C. 增加模型参数
D. 提高学习率
二、多项选择题(总共5题,每题5分,每题至少有两个正确答案,请将正确答案填入括号内)
1. 以下属于机器学习中无监督学习算法的有( )
A. 聚类算法
B. 关联规则挖掘算法
C. 决策树算法
D. 线性回归算法
2. 支持向量机的核函数有( )
A. 线性核函数
B. 高斯核函数
C. 多项式核函数
D. 对数核函数
3. 以下关于深度学习的说法,正确的是( )
A. 深度学习是机器学习的一个分支
B. 深度
5、学习通常包含多个隐藏层
C. 深度学习只能处理图像数据
D. 深度学习在语音识别、自然语言处理等领域有广泛应用
4. 在模型评估中,常用的评估指标有( )
A. 准确率
B. 召回率
C. F1值
D. 均方误差
5. 以下哪些方法可以用于特征工程( )
A. 特征选择
B. 特征提取
C. 特征缩放
D. 特征编码
三、判断题(总共10题,每题2分,请判断对错,在括号内打“√”或“×”)
1. 机器学习就是让计算机自动从数据中学习模式和规律的过程。( )
2. 决策树的深度越大,模型的泛化能力越强。( )
3. 逻辑回归的输出值范围是[0, 1]
6、可以直接用于概率预测。( )
4. K近邻算法的计算复杂度较高,不适用于大规模数据集。( )
5. 梯度下降算法中,学习率越大,收敛速度越快,但可能会导致模型不收敛。( )
6. 神经网络中的神经元是对生物神经元的简单模拟。( )
7. 朴素贝叶斯算法假设特征之间是相互独立的。( )
8. 对于回归问题,R平方值越接近1,说明模型拟合效果越好。( )
9. 模型评估时,测试集应该与训练集相互独立,不能有重叠部分。( )
10. 特征工程对模型的性能有重要影响,好的特征可以提高模型的准确性和泛化能力。( )
四、简答题(总共3题,每题10分)
1. 简述
7、监督学习和无监督学习的区别,并分别举例说明。
2. 请解释决策树算法中的信息增益,并说明如何计算信息增益。
3. 什么是梯度下降算法?请简述梯度下降算法的基本步骤。
五、综合题(总共2题,每题15分)
1. 假设你有一个数据集,包含多个特征和一个目标变量(分类变量)。请描述你将如何使用决策树算法对该数据集进行分类,并说明如何评估决策树模型的性能。
2. 给定一个简单的线性回归模型:y = wx + b,其中w和b是模型参数。请使用梯度下降算法来训练该模型,以最小化均方误差损失函数。请详细描述梯度下降算法在这个模型中的应用过程。
答案
1. B
2. A
3. C
8、
4. B
5. C
6. C
7. D
8. B
9. C
10. B
1. AB
2. ABC
3. ABD
4. ABCD
5. ABCD
1. √
2. ×
3. √
4. √
5. √
6. √
7. √
8. √
9. √
10. √
简答题答案
1. 监督学习有标注数据,目标是根据输入预测输出,如分类和回归。无监督学习无标注,旨在发现数据结构,如聚类。
2. 信息增益衡量划分前后信息不确定性减少程度。计算:先求父节点信息熵,再求各子节点信息熵加权和,两者差值即信息增益。
3. 梯度下降是迭代优化算法。步骤:初始化参数,计算损失函数梯度,沿负梯度方向更新参数,重复直至收敛。
综合题答案
1. 用决策树算法:加载数据,选择划分属性构建树,剪枝避免过拟合。评估性能用准确率、召回率、F1值等指标,在测试集上计算评估。
2. 梯度下降应用:初始化w和b,计算预测值与真实值误差,求均方误差损失函数梯度,按梯度更新w和b,重复至损失最小。