资源描述
大数据知识竞赛试题
学院 队名
题号
一
二
三
总分
得分
一、单选题(每题1分)
1、 小米摄像头记录下来10分钟视频属于哪类数据:
A、构造化数据 B、半构造化数据 C、非构造化数据
2、 构造化数据具备哪种特性:
A、具备明确逻辑关系 B、不具备明确逻辑关系 C、不一定具备明确逻辑关系
3、 指纹打卡数据属于哪些数据:
A、 传感数据 B、交互数据 C、交易数据
4、 大数据擅长解决哪个级别数据?
A、 MB B、GB C、TB D、PB
5、 电子邮件是什么类型数据:
A、 非构造化数据 B、构造化数据 C、半构造化数据
6、 网络新闻是什么类型数据:
A、非构造化数据 B、构造化数据 C、半构造化数据
7、 下列属于构造化数据是:
A、图片 B、一卡通学生信息 C、简历
8、 表1属于几维列表?
姓名
性别
学号
年级
成绩
张三
男
80
李四
女
60
表1
A、 二维 B、三维 C、四维 D、五维
9、 图1中警衔级别属于哪种属性?
图1
A、标称属性 B、二元属性 C、序数属性 D、数值属性
10、 关系型数据库中所谓“关系”是指什么
A、数据库中数据彼此间存在任意关联
B、数据模型满足一定条件二维表格式
C、两个数据库之间有一定关联
11、 下列哪种数据类型不适合MySQL存储:
A、 EXCEL报表 B、图片和声音 C、数据库里财务数据
12、 如下不属于ACID原则是:
A、 原子性 B、相对性 C、隔离性 D、持久性
13、 淘宝自主设计自动化分布式存储系统是:
A、MongoDB B、HBase C、Oceanbase
14、 BeansDB 是一种由国内哪个公司网站自主开发:
A、淘宝 B、豆瓣社区 C、优酷 D、视觉中华人民共和国
15、 下列不是NewSQL数据库是:
A、Sybase B、MemSQL C、TokuDB
16、 下列不是NoSQL数据库是:
A、Bigtable B、Dynamo C、DB2
17、 下列不是老式关系型数据库是:
A、MySQL B、HBase C、Sybase
18、 下面关于数据挖掘说法哪些是错误:
A、 数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、 数据源必要是真实、大量、具有噪声和顾客感兴趣数据
C、 所有发现知识都是绝对
19、 下列不属于数据挖掘知识办法
A、数学办法 B、归纳办法 C、实验办法
20、 普通状况下,舆情监测内容不包括:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位有关刑事、民事、行政案件与信息进行全面收集、精准分析、清晰归类和个性记录
C、对个人或家成员庭银行帐户及个人财产状况进行全面收集、分析和记录
21、 科学可视化、信息可视化和可视分析三者之间如何区别:
A、三者从属关系 B、三者属于递进关系 C、三者之间没有清晰边界
22、 下列哪个不属于可视化作用:
A、信息传播与协调 B、支持对信息推理和分析 C、对信息进行筛选和储存
23、 下图为百度地图显示某地区加油站,此图为哪类可视化:
A、层次与网络可视化 B、时空数据可视化 C、多变量数据可视化
24、 下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化 B、时空数据可视化 C、多变量数据可视化
25、 下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化 B、时空数据可视化 C、非构造化数据可视化
26、 当前在全球云计算市场份额占有率最高公司是:
A、google B、亚马逊 C、微软 D、IBM
27、 在大数据背景下,电子商务价值创造方式呈现出新变化,下列说法错误是:
A、电子商务营销精准化和实时化
B、产品和服务高度差别化和个性化
C、价值链上公司运作差别化和静态化
D、新型增值服务模式不断涌现
28、 下列哪个不是大数据下互联网广告特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式变化
29、 微信朋友圈FEED流广告推广更为精确描述是:
A、大数据会使受众与产品距离更贴近
B、对于目的受众划分更加精细
C、大数据最本质应用就在于预测
D、随意投放广告
30、 啤酒与尿布营销案例应用了零售行业哪种办法:
A、发现关联购买行为 B、客户群体细分 C、供应链管理
二、多选题(每题2分)
1. Hadoop1.0平台最核心两个项目(组件)是:
A、HDFS B、HIVE C、HBase D、MapReduce
2. 如下平台属于Apache软件基金会项目是:
A、Hadoop B、Spark C、Storm D、MongoDB
3. 如下属于大数据挖掘算法是:
A、决策树 B、支持向量机 C、极差规格化 D、朴素贝叶斯
4. 如下属于Spark平台特点是:
A、共享变量 B、离线解决 C、内存计算 D、弹性分布式数据集
5. 在分布式云计算平台中,分布式文献系统块文献大小可以是:
A、28M B、64M C、100M D、128M
三、判断题(每题1分)
1. Newsql是一种新兴非关系型数据库。( )
2. 数据分析重要是指对过去数据进行分析总结可视化,而数据科学重要是通过数据模型指对将来发展趋势进行预测。( )
3. Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。( )
4. 数据ETL属于数据分析和挖掘范畴。( )
5. MapReduce输入是基于Key-Value键值对。( )
6. 云计算提供三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供软件。( )
7. Hadoop重要用于离线大数据分析,而Storm重要用于在线实时大数据分析。( )
8. 商务智能(BI)基本体系构造涉及数据仓库、联机分析解决和数据挖掘。( )
9. R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。( )
10. HDFS主服务器名称叫做DataNode。( )
展开阅读全文