1、2019级物流管理专业专升本考试商业数据分析练习题1. 我们对性别字段(取值为“M”,“F”和“unknown” )进行编码: gender= ( W , “F” 和unknown” ) gender=(0, 1,2)。上述使用的特征 编码类型是()A. One-Hot 编码B. 哑变量编码C. 数字编码(正确答案)D. 变量编码2. 以下哪项不属于大数据的4V特性().A. 规模性(Volume)B. 多样性(Variety)C. 合法性(Validity)(正确答案)D. 价值性(Value)3. 下面有关KNIME的说法,错误的是()A. KNIME是一款功能强大的免费开源分析工具B.
2、KNIME是由Java编写的,基于Eclipse,利用其扩展机制来添加提供附加 功能的插件C. KNIME需要编程,上手非常容易(正确答案)D. KNIME提供可视化组件的拖拽,创建工作流,覆盖大数据应用的全过程4. 下列关于响应状态码的描述错误的是()A. 200表示请求成功B. 301代表跳转,永久性转移C. 404代表无权限访问(正确答案)D. 502代表服务器错误5. 下列选项不属于网络爬虫使用场景的是()A. 爬取电商网站某些商品的价格信息,并汇总分析B. 爬取某个人电脑中的数据和文件(正确答案)C. 通过爬取招聘网站的信息,观察不同岗位的薪资水平D. 爬取资讯网站中某个热点事件的评
3、论,进行舆情分析6. 以下关于关系型和非关系型数据库的说法,正确的是?A. 非关系型数据库易于存储非结构化数据,如二维表格型数据B. 关系型数据库易于存储非结构化数据,如二维表格型数据C. 关系型数据库易于存储结构化数据,如二维表格型数据(正确答案)D. 非关系型数据库易于存储结构化数据,如二维表格型数据7. 下列选项不属于缺失值处理范畴的是()?A. 确定缺失值的范围及所占比例B. 去除不需要的特征C. 删除缺失值或填补缺失值D. 将连续型数据转换成离散型数据(正确答案)8. 下列关于填补法的表述错误的是()A. 若数据集中某一样本或者特征缺失不多,可用特定值替代缺失值B. 当列特征是离散值
4、时,应采用回归模型填充(正确答案)C. 当列特征是连续值时,应采用平均数填充或中位数填充D. 当列特征前后取值有关联时,可采用向前填充、向后填充9. 我们对颜色字段(取值为“RED”,“BLACK”和“GREEN” )进行编码: RED的编码为(1,0,0), BLACK”的编码为(0,1,0), GREEN=(0, 0, 1)。上述使 用的特征编码类型是()A. One-Hot编码(正确答案)B. 哑变量编码C. 数字编码D. 变量编码10. 二维表由行和列组成,每一列称为一个()。A. 记录B. 元组C. 集合D. 字段(正确答案)11. 下列系统中不属于关系型数据库的是()A. Orac
5、leB. MySQLC. MongoDB (正确答案)D. SQL Server12. Views是KNIME中非常重要的组件,它常用来进行()A. 数据采集B. 数据管理C. 数据清洗D. 数据分析E. 数据可视化(正确答案)13. 大数据处理中,最重要的环节是()A. 数据采集B. 数据管理C. 数据清洗D. 数据分析(正确答案)E. 数据可视化14. 作为大数据处理软件,KNIME提供的组件能覆盖大数据处理的全过程,下 列主要用于数据清洗的是()A. GET RequestB. DBC. Manipulation(正确答案)D. AnalyticsE. Views15. ()属于机器学习
6、中的回归问题。A. 识别车牌B. 根据房屋特性预测房价(正确答案)C. 预测短信是否为垃圾短信D. 机场安检人脸识别16. 利用函数作为筛选条件时,以下说法正确的是:A. 函数针对第一行进行编写B. 函数针对第一条记录行进行编写(正确答案)C. 函数针对最后一行记录进行编写D. 函数的结果必须为True17. 制作多级别分类汇总时,应取消以下哪个设置?A. 替换当前分类汇总(正确答案)B. 每组数据分页C. 汇总结果显示在数据下方D. 以上设置都要取消18. 在Excel里如何实现最快的按“季度”汇总数据A. 公式函数B. 分类汇总C. 数据透视表(正确答案)D. 筛选+函数19. 通过多重合
7、并得到汇总表格后,如何得到一维表格:A. 对透视表进行筛选B. 对透视表的总计结果双击(正确答案)C. 将透视表运算方式改为平均值D. 对透视结果进行排序20. 汇总表中显示不同时间段的销售总额,通过哪种图表可以体现数据发展的 趋势?A. 柱形图B. 饼图C. 折线图(正确答案)D. 条形图21. 关于数据集的基本统计信息,下列说法错误的是()A. 均值可以描述数据的离散程度(正确答案)B. 方差可以描述数据的离散程度C. 直方图可以描述离散型数据的分类情况(正确答案)D. 条形图可以描述离散型数据的分类情况22. 关于MySQL中服务器,数据库,数据表的说法正确的是()?A. 一个服务器只能
8、有一个数据库B. 一个服务器能有多个数据库(正确答案)C. 一个数据库只能有一张表D. 一个数据库能有多张表(正确答案)23. 关于主键下列说法正确的是()A. 可以是表中的一个字段(正确答案)B. 是确定数据库中的表的记录的唯一标识字段(正确答案)C. 该字段不可为空也不可以重复(正确答案)D. 可以是表中的多个字段组成的(正确答案)24. Excel中有关数据库内容,描述正确的有()oA. 一个数据清单对应一个工作簿文件B. 一列为一个字段,描述实体对象的属性(正确答案)C. Excel数据库属于“关系数据模型”,又称为关系型数据库(正确答案)D. 一行为一个记录,描述某个实体对象(正确答
9、案)25. Excel中有关数据库内容,描述正确的有()oA. 一个数据清单对应一个工作簿文件B. 一列为一个字段,描述实体对象的属性(正确答案)C. Excel数据库属于“关系数据模型”,又称为关系型数据库(正确答案)D. 一行为一个记录,描述某个实体对象(正确答案)26. 关于主键下列说法正确的是()A. 可以是表中的一个字段(正确答案)B. 是确定数据库中的表的记录的唯一标识字段(正确答案)C. 该字段不可为空也不可以重复(正确答案)D. 可以是表中的多个字段组成的(正确答案)27. 商业领域中的数据挖掘分析方法有什么?28. 数据分析的商业作用?29. 异常值是指什么?请例举识别连续型变量异常值的方法?