资源描述
《人工智能算法设计与优化》测试题
1. 模型过于贴近历史数据,而难以预测新数据,这种现象称为()I单项选择题]*欠拟合
过拟合正确答奚)缺失值
噪音在不指定分类依据的情况下对客户细分,应采用的数据挖掘方法是()|单项选择题]*
回归聚类(正确答案)
分类时间序列
2. sklearn的K均值算法中,用于确定聚类数量的参数是()【单项选择题]*k
numn_total
n_clusters([确答奚)哪个聚类算法是基于密度的()【单项选择题]*
K均值DBSCAN(正确答案)
高斯混合聚类双聚类
3. 生成较少的新变量来描述原来多个变量所携带的信息,这种技术是[单项选择题]*交叉验证
主成分分析己确答案)数据离散化
分解主成分分析是最常用的降维方法,其函数名为()【单项选择题]*
pca(> .确竺案)svd()
svm()matrix()
4. sklearn中,用于把历史数据分为训练集和测试集的函数是()【单项选择题]*split
cross_validatelrain_test_split 确竺■案)
data_split决策树中不包含以下哪类结点()[单项选择题I*
根结点内部结点
外部结点[三矿j筌妄)叶结点
5. 评估分类模型时有个表格,主对角线给出了每一类正确分类的样本的个数,非对角线上的元素表示未被正确分类的样本个数,这个表格称为()[单项选择题]* 跟踪矩阵
评估矩阵混淆矩阵(正确答案)
正确率矩阵以下哪种数据挖掘方法用于预测连续值()[单项选择题]*
回归(正确答案)聚类
关联规那么分类
ll.Scikit-Learn是基于Python的机器学习库,使用时需支付费用()[判断题]对
错(正确答案)同一个数据挖掘任务往往需要建立多个模型并进行评估选优()[判断题]*
对(正确答案)错
12. 数据挖掘各流程执行一次即可,不需反复()[判断题]*对
错(正确答案)K-均值算法中的K是指算法进行K次迭代()[判断题]*
对错(正确答案)
13. 数据降维属于无监督学习算法()[判断题| *分类和回归属于有监督算法()[判断题]*
对(正确答案)错
14. r2用于度量回归模型的准确度,越接近于1越好()[判断题]*对(正确答案)
错为了评估分类模型的准确性,应该把历史数据分为训练集和测试集()[判断题I
*对匚确答案)
错决策树的层次越多,那么模型预测能力越强()[判断题]*
对错正确答案)
15. 可以使用剪枝来减少决策树模型的过拟合()[判断题]*
展开阅读全文