大学生大数据技术原理与应用章节测验期末考试答案.docx-资源下载-咨信网-让知识获取变得高效

大学生大数据技术原理与应用章节测验期末考试答案.docx

1、大数据技术原理与应用第1章大数据概述1单选（2分）第三次信息化浪潮的标志是： A. 个人电脑的普及云计算、大数据、物联网技术的普及虚拟现实技术的普及互联网的普及正确答案：B你选对了2单选（2分）就数据的量级而言，1PB数据是多少TB? 正确答案：D你选对了3单选（2分）以下关于云计算、大数据和物联网之间的关系，论述错误的是： A. 云计算侧重于数据分析物联网可借助于云计算实现海量数据的存储物联网可借助于大数据实现海量数据的分析云计算、大数据和物联网三者紧密相关，相辅相成正确答案：A你选对了4单选（2分）以下哪个不是大数据时代新兴的技术： A. SparkHadoopHBaseM

2、ySQL 正确答案：D你选对了5单选（2分）每种大数据产品都有特定的应用场景，以下哪个产品是用于批处理的: A. 数据操作数据索引数据模型存储模式正确答案：ABCD你选对了10多选（3分）访问HBase表中的行，有哪些方式： A. 通过某列的值区间全表扫描通过一个行健的区间来访问通过单个行健访问正确答案：BCD你选对了第5章NoSQL数据库1单选（2分）下列关于NoSQL数据库和关系型数据库的比较，不正确的是： A. NoSQL数据库很容易实现数据完整性，关系型数据犀很难实现数据完整性NoSQL数据库缺乏统一的查询语言，而关系型数据原有标准化查询语言NoSQL数据库的可扩展性比

3、传统的关系型数据犀更好NoSQL数据库具有弱一致性，关系型数据库具有强一致性正确答案：A你选对了2单选（2分）以下对各类数据库的理解错误的是： A. 键值数据库的键是一个字符串对象，值可以是任意类型的数据，比如整型和字符型等文档数据库的数据是松散的，XML和JS0N文档等都可作为数据存储在文档数据库中图数据库灵活性高，支持复杂的图算法，可用于构建复杂的关系图谱HBase数据库是列族数据库，可扩展性强，支持事务一致性正确答案：D你选对了3单选（2分）下列数据库属于文档数据库的是： A. MySQLRed i sMongoDBHBase 正确答案：C你选对了4单选（2分） NoSQ

4、L数据库的三大理论基石不包括： A. 最终一致性BASEACIDCAP 正确答案：C你选对了5多选（3分）关于NoSQL数据原和关系数据原，下列说法正确的是： A. NoSQL数据库可支持超大规模数据存储，具有强大的横向扩展能力NoSQL数据库和关系数据犀各有优缺点，但随着NoSQL的发展，终将取代关系数据原大多数NoSQL数据库很难实现数据完整性关系数据库有关系代数理论作为基础，NoSQL数据犀没有统一的理论基础正确答案：ACD你选对了6多选（3分） NoSQL数据库的类型包括： A. 键值数据库列族数据库文档数据库图数据库正确答案：ABCD你选对了7多选（3分）CAP是指

5、 A. 一致性可用性持久性分区容忍性正确答案：ABD你选对了8多选（3分）NoSQL数据库的BASE特性是指： A. 软状态持续性最终一致性基本可用正确答案：ACD你选对了第6章云数据库1单选（2分）下列Amazon的云数据库属于关系数据库的是： A. Amazon S i mpIeDBAmazon DynamoDBAmazon RDSAmazon Redsh i ft 正确答案：C你选对了2单选（2分）下列关于UMP系统的说法不正确的是： A. Control ler服务器向UMP集群提供各种管理服务，实现集群成员管理、元数据存储等功能Agent服务器部署在运行MySQL

6、进程的机器上，用来管理每台物理机上的MySQL实例UMP系统是低成本和高性能的MySQL云数据库方案Mnesia是UMP系统的一个组件，是一个分布式数据库管理系统，且不支持事务正确答案：D你选对了3多选（3分）UMP依赖的开源组件包括LVS A. ZooKeeperMnes i aRabbitMQ正确答案：ABCD你选对了 4多选（3分）在UMP系统中，Zookeeper主要发挥的作用包括： A. 监控所有MySQL实例负责集群负载均衡提供分布式锁，选出一个集群的“总管”作为全局的配置服务器正确答案：ACD你选对了5多选（3分）UMP系统设计了哪些机制来保证数据安全:A.记录用户

7、操作日志数据访问IP白名单 B. SSL数据库连接SQL拦截正确答案：ABCD你选对了第 7 章 MapReduce 1单选（2分）下列说法错误的是： A. Map函数将输入的元素转换成〈key, vaIue>形式的键值对Hadoop框架是用Java实现的，MapReduce应用程序则一定要用Java来写MapReduce框架采用了 Master/SIave架构，包括一个Master和若干个Slave不同的Map任务之间不能互相通信正确答案：B你选对了2单选（2分）在使用MapReduce程序WordCount进行词频统计时，对于文本行"hello hadoop hello wor

8、Idn ,经过WordCount程序的Map函数处理后直接输出的中间结果，应是下面哪种形式： A. <"heI Io", 1, 1>、<"hadoop", 1）^K"wor Id", 1>〈"heI Io”, 2>、<"hadoop", 1>和<"wor Id", 1> <"hadoop",1>和<”wor Id”，1>〈”hello"，1>、<"hel Io", 1>. <"hadoop", 1>和<”world”，1> 正确答案：D你选对了3单选（2分）对于文本行“hello hadoop hello world”，经过WordCoun t的Redu

9、ce函数处理后的结果是： A. <"hel Io", <1,1»<,,hadoop,,, IX'wor Id", 1><"hel Io", 1><"hel Io", IX'^adoop", 1 ><"wor Id", 1><"heI Io",1,1><"hadoop", 1><"worId", 1><”he I I。"，2X”hadoop", 1><"wor Id", 1> 正确答案：B你选对了4多选（3分）下列关于传统并行计算框架（比如MPI）和MapReduce并行计算框架比较正确的是： A. 前者所需硬件价格贵，可扩展性差，后者硬件便宜，扩展性好前者相比后者学习起来更难前者是共享式

10、共享内存/共享存储），容错性差，后者是非共享式的，害错性好前者适用于实时、细粒度计算、计算密集型，后者适用于批处理、非实时、数据密集型正确答案：ABCD你选对了 5多选（3分）MapReduce 1.0的体系结构主要由哪几个部分组成： A. JobTrackerTaskTrackerCl ientTask 正确答案：ABCD你选对了第8章Hadoop再探讨1单选（2分）下列说法正确的是： A. HDFS HA可用性不好第二名称节点是热备份HDFS HA提供高可用性，可实现可扩展性、系统性能和隔离性第二名称节点无法解决单点故障问题正确答案：D你选对了2单选（2分）HDFS Fed

11、eration设计不能解决“单名称节点”存在的哪个问题: A. 单点故障问题HDFS集群扩展性性能更高效良好的隔离性正确答案：A你选对了3多选（3分）下列哪些是Hadoopl. 0存在的问题： A. 抽象层次低表达能力有限开发者自己管理作业之间的依赖关系执行迭代操作效率低正确答案：ABCD你选对了4多选（3分）下列对Hadoop各组件的理解正确的是： A. Ooz ie:工作流和协作服务引擎Pig:处理大规模数据的脚本语言Kafka:分布式发布订阅消息系统Tez:支持DAG作业的计算框架正确答案：ABCD你选对了5多选（3分）对新一代资源管理调度框架YARN的理解正确的是：

12、 A. YARN既是资源管理调度框架，也是一个计算框架MapReduce2. 0是运行在YARN之上的计算框架，由YARN来为MapReduce提供资源管理调度服务YARN可以实现''一个集群多个框架”，即在一个集群上部署一个统一的资源调度管理框架YARN 的体系结构包含三个组件：ResourceManager, NodeManager, AppI icat ionMaster 正确答案：BCD你选对了第9章数据仓库Hive1单选（2分）下列有关Hi ve和Impa I a的对比错误的是: A. H i ve与Impa I a中对SQL的解释处理比较相似，都是通过词法分析生成执行计划Hiv

13、e与Impala使用相同的元数据Hive适合于长时间的批处理查询分析，而Impala适合于实时交互式SQL查询Hive在内存不足以存储所有数据时，会使用外存，而Impala也是如此正确答案：D你选对了2单选（2分）下列关于Hive基本操作命令的解释错误的是： A. create tab I e if not exists usr（id bigint,name string, age int） ;//如 usr 表不存在，创建表 usr, 含三个属性id, name, ageIoad data I oca I i npath '/usr/1 oca I/data' overwr ite i

14、 nto tab Ie usr; // 把目录'/usr/1 oca I/data*下的数据文件中的数据以追加的方式装载进usr表create database userdb;//创建数据库 userdbi nsert overwr i te tab I e student se I ect * from user where age>10; //向表 usr1 中插入来自 usr表的age大于10的数据并覆盖student表中原有数据正确答案：B你选对了3多选（3分）下列说法正确的是： A. Impa I a和Hive、HDFS、HBase等工具可统一部署在一个Hadoop平台上数

15、据仓库Hive不需要借助于HDFS就可完成数据的存储Hive本身不存储和处理数据，依赖HDFS存储数据，依赖MapReduce处理数据HiveQL语法与传统的SQL语法很相似正确答案：ACD你选对了4多选（3分）Impa I a主要由哪几个部分组成： A. HiveImpaladState StoreCL I 正确答案：BCD你选对了5多选（3分）以下属于Hive的基本数据类型是： A. BINARYSTRINGFLOATTINYINT 正确答案：ABCD你选对了第 10 章 Spark1单选（2分）Spark SQL目前暂时不支持下列哪种语言: A. PythonJavaSea

16、 I aL i sp 正确答案：D你选对了2单选(2分)RDD操作分为转换(Transformation)和动作(Action)两种类型，下列属于动作(Action)类型的操作的是： A. groupByfiltercountmap 正确答案：C你选对了3单选(2分)下列说法错误的是： A. 在选择Spark Streaming和Storm时，对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架StormRDD采用惰性调用，遇到“转换(Transformation)"类型的操作时，只会记录RDD生成的轨迹，只有遇到“动作(Action)”类型的操作时才会触发真正的计算S

17、park 支持三种类型的部署方式:Standalone, Spark on Mesos, Spark on YARN B. RDD提供的转换接口既适用fi Iter等粗粒度的转换，也适合某一数据项的细粒度转换正确答案：D你选对了4单选(2分)下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是： A. f i Iter (func):筛选出满足函数func的元素，并返回一个新的数据集map (func):将每个元素传递到函数func中，并将结果返回为一个新的数据集count ():返回数据集中的元素个数take (n):返回数据集中的第n个元素

18、正确答案：D你选对了5单选(2分)下列大数据处理类型与其对应的软件框架不匹配的是： A. 复杂的批量数据处理：MapReduce基于历史数据的交互式查询：Impala基于实时数据流的数据处理：Storm图结构数据的计算：Hive 正确答案：D你选对了6多选（3分）Apache软件基金会最重要的三大分布式计算系统开源项目包括： A. Orac I eHadoopStormSpark 正确答案：ABC你选对了7多选（3分）Spark的主要特点包括： A. 运行模式多样运行速度快0.通用性好D.容易使用正确答案：ABCD你选对了8多选（3分）下列关于Scala的说法正确的是： A.

19、 Sea I a运行于Java平台，兼容现有的Java程序Sea I a具备强大的并发性，支持函数式编程Sea I a是一种多范式编程语言Sea I a是Spark的主要编程语言，但Spark还支持Java、Python、R作为编程语言正确答案：ABCD你选对了9多选（3分）Spark的运行架构包括: A. 运行作业任务的工作节点Worker Node每个工作节点上负责具体任务的执行进程Executor每个应用的任务控制节点Dr i ver集群资源管理器Cluster Manager 正确答案：ABCD你选对了第11章流计算1单选（2分）流计算秉承一个基本理念，即数据的价值随着时间的流

20、逝而，如用户点击流: A. 降低不确定不变升高正确答案：A你选对了2单选（2分）Hadoop运行的是MapReduce任务，类似地，Storm运行的任务叫做Spout A. BoltTup I eTopo I ogy正确答案：D你选对了 3多选（3分）对于一个流计算系统来说，它应达到如下哪些需求： A. 海量式高性能分布式实时性正确答案：A、B、C、D你选对了4多选（3分）数据采集系统的基本架构包括哪些部分： A. Contro I I erStoreAgentCol lector 正确答案：B、C、D你选对了5多选（3分）以下哪些是开源的流计算框架： A. MapRed

21、uceDreme IStormPrege I 正确答案：A你选对了6单选（2分）每种大数据产品都有特定的应用场景，以下哪个产品是用于流计算的： A. GraphXS4Impa I aHive 正确答案：B你选对了7单选（2分）每种大数据产品都有特定的应用场景，以下哪个产品是用于图计算的： A. Prege IStormCassandraFI ume 正确答案：A你选对了8单选（2分）每种大数据产品都有特定的应用场景，以下哪个产品是用于查询分析计算的: A. HDFSS4Dreme IMapReduce 正确答案：C你选对了9多选（3分）数据产生方式大致经历三个阶段，包括： A.

22、运营式系统阶段感知式系统阶段移动互联网数据阶段用户原创内容阶段 A. Facebook PumaYahoo! S4IBM InfoSphere StreamsTwitter Storm 正确答案：B、D你选对了6多选（3分）下面哪几个属于Storm中的Stream Groupings的分组方式： A. 按照字段分组广播发送随机分组全局分组正确答案：A、B、C、D你选对了第 12 章 Fl ink1单选（2分）以下哪个不是Fl ink的优势： A. 同时支持高吞吐、低延迟、高性能不支持增量迭代同时支持流处理和批处理支持有状态计算正确答案：B你选对了2单选（2分）在Fl ink中

23、哪个是基于批处理的图计算库： A. SQL&TabIe 库FlinkMLGel lyCEP 正确答案：C你选对了3多选（3分）下面关于Fl ink的说法正确的是： A. FI ink起源于Stratosphere项目，该项目是在2010年到2014年间由柏林工业大学、柏林洪堡大学和哈索普拉特纳研究所联合开展的Fl ink可以同时支持实时计算和批量计算FI ink不是Apache软件基金会的项目 B. FIink是Apache软件基金会的5个最大的大数据项目之一正确答案：A、B、D你选对了4多选（3分）Fl ink的主要特性包括： A. 精■确一次的状态一致性保障批流一体化精密的状态管

24、理事件时间支持正确答案：A、B、C、D你选对了5多选（3分）下面论述正确的是： A. Spark Streaming通过采用微批处理方法实现高吞吐和容错性，但是牺牲了低延迟和实时处理能力Storm虽然可以做到低延迟，但是无法实现高吞吐，也不能在故障发生时准确地处理计算状态0.流处理架构需要具备低延迟、高吞吐和高性能的特性，而目前从市场上已有的产品来看，只有Fl ink 可满足要求D.FI ink实现了 Google Dataflow流计算模型，是一种兼具高吞吐、低延迟和高性能的实时流计算框架，并且同时支持批处理和流处理正确答案：A、B、C、D你选对了6多选（3分）Fl ink常见的

25、应用场景包括： A. 数据流水线应用事件驱动型应用地图应用数据分析应用正确答案：A、B、D你选对了7多选（3分）Fl ink核心组件栈分为哪三层： A. 物理部署层Runtime核心层Core 层API&Libraries 层正确答案：A、B、D你选对了8多选（3分）Fl ink有哪几种部署模式： A. 运行在GCE （谷歌云服务）和EC2 （亚马逊云服务）上YARN集群模式Standa I one集群模式Loca I 模式正确答案：A、B、C、D你选对了9多选（3分）Fl ink系统主要由两个组件组成，分别为： A. JobManagerJobScheduI er0. T

26、askScheduI erD. TaskManager 正确答案：A、D你选对了10多选（3分）在编程模型方面，Fl ink提供了不同级别的抽象，以开发流或批处理作业，主要包括哪几个级别的抽象： A. DataStream API （有界或无界流数据）以及DataSet API （有界数据集）Table API状态化的数据流接口SQL 正确答案：A、B、C、D你选对了第13章图计算1单选（2分）Pregel是一种基于模型实现的并行图处理系统： A. TSPSTPBSPSBP 正确答案：C你选对了2单选（2分）谷歌在后Hadoop时代的新“三驾马车”不包括： A. Caffe i

27、neDremeIPregeIHama 正确答案：D你选对了3多选（3分）下列哪些是以图顶点为中心的，基于消息传递批处理的并行图计算框架： A. HamaGi raphPregeINeo4j 正确答案：A、B、C你选对了4多选（3分）以下关于Pregel图计算框架说法正确的是： A. 通常只对满足交换律和结合律的操作才会开启Combiner功能Pregel采用检查点机制来实现容错对于全局拓扑改变,Pregel采用了惰性协调机制Aggregator提供了一种全局通信、监控和数据查看的机制正确答案：A、B、C、D你选对了第14章大数据在不同领域的应用1单选（2分）下列说法错误的是：

28、A. ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品基于用户的协同过滤算法（简称UserCF算法）是目前业界应用最多的算法UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品UserCF算法的推荐更偏向社会化，而ItemCF算法的推荐更偏向于个性化正确答案：B你选对了2多选（3分）推荐方法包括哪些类型： A. 专家推荐协同过滤推荐基于内容的推荐基于统计的推荐正确答案：A、B、C、D你选对了期末试卷1单选（2分）数据产生方式的变革主要经历了三个阶段，以下哪个不属于这三个阶段： A. 运营式系统阶段感知式系统阶段数据流阶段用户原创内容阶段正

29、确答案：C你选对了2单选（2分）第三次信息化浪潮的发生标志是以下哪种技术的普及： A. 互联网CPU物联网、云计算和大数据个人计算机正确答案：C你选对了3单选（2分）在Fl ink中哪个是基于批处理的图计算库： A. SQL&Table 库CEPGeliyFlinkML 正确答案：C你选对了4单选（2分）Hadoop的两大核心是和MapReduce; HBase A. HDFS； HBaseHDFS; MapReduceGFS; MapReduce正确答案：C你选对了 5单选（2分）HDFS默认的一个块大小是64MB8KB A. 32KB16KB正确答案：A你选对了6单选（2

30、分）在分布式文件系统HDFS中，负责数据的存储和读取： A. 数据节点第二名称节点名称节点主节点正确答案：A你选对了7单选（2分）上传当前目录下的本地文件fi le.txt到分布式文件系统HDFS的“/path"目录下的Shel I命令是: A. hdfs dfs -put /path file.txthadoop dfs -put /path file.txthdfs fs -put file.txt /pathhdfs dfs -put file.txt /path 正确答案：D你选对了8单选（2分）在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文

31、件夹d i r,正确的she I I命令是： A. hadoop fs -mkd i r -p /test/d i rhdfs fs -mkd i r -p /test/d i rhadoop dfs -mkd i r /test/d i rhdfs dfs *mkd i r -p /test/d i r 正确答案：A你选对了9单选（2分）下列有关HBase的说法正确的是： A. 在向数据原中插入记录时，HBase和关系数据库一样，每次都是以“行"为单位把整条记录插入数据库HBase是针对谷歌BigTable的开源实现，是高可靠、高性能的图数据库HBase是一种NoSQL数据库HBase

32、数据库表可以设置该表任意列作为索引正确答案：C你选对了10单选（2分）已知一张表 student 存储在 HBase 中，向表中插入一条记录（id：2015001, name：Mary, {score：math} ：88},其 id 作为行键，其中，在插入数学成绩88分时，正确的命令是： A. put 'student','score：math', '88'put 'student','2015001','score:math','88'put 'student\ *2015001','math', '88'put 'student', *2015001', '88' 正确答案：B你选

33、对■了11单选（2分）NoSQL数据库的三大理论基石不包括： A. ACID最终一致性BASECAP 正确答案：A你选对了12单选（2分）在设计词频统计的MapReduce程序时，对于丈本行44hel Io bigdata hello hadoop v ,经过map函数处理后直接输出的结果应该是（没有发生combine和merge操作）： A. <"helI。”，1,1>、〈"bigdata",1>和〈"hadoop",1>和〈"hadoop", 1><"helI。"，2>、〈"bigdata”，1>和

34、1><"helIo",1>s <"hello",1>、<"bigdata", 1>和〈"hadoop",1> 13单选（2分）假设已经配置好PATH环境变量，启动Hadoop的命令是： A. start-hdfs. shstart-fs. shstart-dfs. shstart-hadoop. sh 正确答案：C你选对了14单选（2分）下列说法错误的是： A. HDFS Federation使得HDFS的命名服务能够水平扩展第二名称节点是热备份，而HDFS HA不是热备份HDFS HA可以解决单点故障问题第二名称节点无法解决单点故障问题正确答案：B你选对了15单选（2分）RDD操

35、作包括转换（Transformation）和动作（Action）两种类型,下列RDD操作属于动作（Action）类型的是: A. joinmapcol IectgroupBy 正确答案：C你选对了16单选（2分）下列关于Hive的说法正确的是： A. Hive支持频繁数据更新Hive不支持索引Hive支持批量导入Hive的可扩展性差正确答案：C你选对了17多选（3分）大数据的特点包括： A. 数据量大处理速度快价值密度低数据种类繁多正确答案：A、B、C、D你选对了18多选（3分）下列适用于批处理计算的框架有哪些： A. PregeISparkMapReduceStorm 1

36、9多选（3分）下列适用于流计算的框架有哪些： A. StormDremeISpark StreamingPregeI 正确答案：A、C你选对了20多选（3分） Fl ink核心组件栈分为哪三层： A. Core 层Runtime核心层API&Librar ies 层物理部署层正确答案：B、C、D你选对了21多选（3分）从技术架构上来看，物联网可以分为哪几层： A. 感知层处理层应用层网络层正确答案：A、B、C、D你选对了22多选（3分）HBase需要根据哪些属性来唯一地确定一个单元格（cell）中的某个版本数据: A. 行键列族列限定符时间戳正确答案：A、B、C、D你选

37、对了23多选（3分）典型的NoSQL数据库的类型包括： A. 键值数据犀列族数据库图数据库文档数据库正确答案：A、B、C、D你选对了24多选（3分）CAP是指： A. 持久性可用性一致性分区容忍性 25多选（3分）云计算主要包括哪3种类型： A. CaaSI aaSPaaSSaaS 正确答案：B、C、D你选对了26多选（3分）以下属于流计算的应用有哪些： A. 实时交通路线推荐购物网站的广告推荐根据过去一年购物记录判断用户的消费能力数据仓库数据批处理分析正确答案：A、B你选对了27多选（3分）下列关于图计算产品Pregel的说法正确的是： A. Pregel是一种基于BS

38、P模型实现的并行图处理系统在每个超步中，每个顶点会根据其接收消息的最大值和自身值比较，来确定自己状态作何种改变当多个顶点的操作请求发生冲突时,Pregel采用局部有序和Handler来解决冲突传统的图计算框架通常表现出比较好的内存访问局部性正确答案：A、B、C你选对了28多选（3分）下列哪些是图计算框架Pregel的应用： A. 单源最短路径二分匹配流数据处理PageRank 正确答案：A、B、D你选对了29多选（3分）关于Spark的特性说法正确的是： A. Sea I a是Spark的主要编程语言，但Spark还支持Java、Python > R作为编程语言Spark的计算模式也

39、属于MapReduce,但编程模型比Hadoop MapReduce更灵活Spark基于DAG的任务调度执行机制，要优于Hadoop MapReduce的迭代执行机制Spark提供了内存计算，可将中间结果放到内存中，对于迭代运算效率更高正确答案：A、B、C、D你选对了30多选（3分）BASE的基本含义是： A. 持续性软状态基本可用最终一致性 31判断（2分）Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，是基于Java语言开发的，具有很好的跨平台特性。正确答案：J你选对了32判断（2分）HDFS分布式文件系统，是谷歌丈件系统GFS的开源实现，而Hadoop M

40、apReduce也是针对谷歌MapReduce的开源实现。正确答案：J你选对了33判断（2分）在分布式文件系统HDFS中，名称节点负责管理HDFS的元数据，这些元数据被保存在磁盘中。正确答案：X你选对了34判断（2分）HDFS可以高效存储大量的小文件。正确答案：X你选对了35判断（2分）Fs I mage用维护文件系统树以及文件树中所有的文件和文件夹的元数据。正确答案：J你选对了36判断（2分）第二名称节点（Secondary NameNode）是HDFS架构中的一个组成部分，它是来保存名称节点中对HDFS元数据信息的备份，并减少名称节点重启的时间。正确答案：。你选对了

41、37判断（2分）HDFS采用了主从（Master/Slave）架构模型，一个HDFS集群包括一个名称节点和若干个数据节点。正确答案：J你选对了38判断（2分）NoSQL数据库的数据库模式灵活，可扩展性好，同时，所有NoSQL数据库都支持事务的ACID四性。正确答案：X你选对了39判断（2分）传统的关系数据库和NoSQL数据库各有所长，不存在一方完全取代另一方的问题，在很长的一段时期内，二者都会共同存在，满足不同应用的差异化需求。正确答案：。你选对了40判断（2分）正确答案：ABD你选对了 10多选（3分）大数据发展三个阶段是： A. 低谷期成熟期大规模应用期萌芽期正确答案

42、BCD你选对了11多选（3分）大数据的特性包括： A. 价值密度低处理速度快数据类型繁多数据量大正确答案：ABCD你选对了12多选（3分）图领奖获得者、著名数据库专家Jim Gray博士认为，人类自古以来在科学研究上先后经历哪几种范式： A. 计算科学数据密集型科学实验科学理论科学正确答案：ABCD你选对了13多选（3分）大数据带来思维方式的三个转变是： A. 效率而非精确相关而非因果精确而非全面全样而非抽样正确答案：ABD你选对了14多选（3分）大数据主要有哪几种计算模式： MongoDB是一种图数据库，由C++语言编写的，其数据类型类似于JS0N对象。正确答案：

43、X你选对了41判断（2分）正确答案：J你选对了 42判断（2分）协同过滤是最早、最知名的推荐算法，可分为基于用户的协同过滤和基于物品的协同过滤。正确答案：J你选对了43判断（2分）Hive适合于实时交互式SQL查询，而Impala适合于长时间的批处理查询分析。正确答案：X你选对了 A. 流计算图计算查询分析计算批处理计算正确答案：ABCD你选对了15多选（3分）云计算的典型服务模式包括三种： A. SaaSlaaSMaaSPaaS 正确答案：ABD你选对了第2章大数据处理架构Hadoop1单选（2分）启动hadoop所有进程的命令是： A. start-dfs. shst

44、art-aI I.shstart-hadoop.shstart-hdfs. sh 正确答案：B你选对了2单选（2分）以下对Hadoop的说法错误的是： A. Hadoop是基于Java语言开发的，只支持Java语言编程Hadoop2. 0 增加了 NameNode HA 和 Wi re-compat i b i I i ty 两个重大特性Hadoop MapReduce是针对谷歌MapReduce的开源实现，通常用于大规模数据集的并行计算Hadoop 的核心是 HDFS 和 MapReduce 正确答案：A你选对了3单选（2分）以下哪个不是Hadoop的特性： A. 成本高支持多种编程

45、语言高容错性高可靠性正确答案：A你选对了4单选（2分）以下名词解释不正确的是： A. Zookeeper:针对谷歌Chubby的一个开源实现，是高效可靠的协同工作系统HBase:提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现Hive: 一个基于Hadoop的数据仓库工具，用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储HDFS:分布式文件系统，是Hadoop项目的两大核心之一，是谷歌GFS的开源实现正确答案：B你选对了5多选（3分）以下哪些组件是Hadoop的生态系统的组件： A. HBaseOrac I e0. HDFSD. MapR

46、educe 正确答案：ACD你选对了6多选（3分）以下哪个命令可用来操作HDFS文件： A. hadoop f shadoop df shdf s fshdf s df s 正确答案：ABD你选对了第3章分布式文件系统HDFS1单选（2分）HDFS的命名空间不包含： A. 字节文件块目录正确答案：A你选对了2单选（2分）对HDFS通信协议的理解错误的是： A. 客户端与数据节点的交互是通过RPC （Remote Procedure Call）来实现的客户端通过一个可配置的端口向名称节点主动发起TCP连接，并使用客户端协议与名称节点进行交互名称节点和数据节点之间则使用数据节点协议

47、进行交互HDFS通信协议都是构建在loT协议基础之上的正确答案：D你选对了3单选（2分）采用多副本冗余存储的优势不包含： A. 保证数据可靠性容易检查数据错误加快数据传输速度节约存储空间正确答案：D你选对了4单选（2分）假设已经配置好环境变量，启动Hadoop和关闭Hadoop的命令分别是： A. start-dfs.sh, stop-hdfs.shstart-hdfs. sh, stop-hdfs. shstart-dfs.sh, stop-dfs.shstart-hdfs. sh, stop-dfs.sh 正确答案：C你选对了5单选（2分）分布式文件系统HDFS采用主从结构模

48、型，由计算机集群中的多个节点构成的，这些节点分为两类，一类存储元数据叫，另一类存储具体数据叫： A. 名称节点，主节点从节点，主节点名称节点，数据节点数据节点，名称节点正确答案：C你选对了6单选（2分）下面关于分布式文件系统HDFS的描述正确的是： A. 分布式文件系统HDFS是Google Bigtable的一种开源实现分布式文件系统HDFS是谷歌分布式文件系统GFS （Google Fi le System）的一种开源实现分布式文件系统HDFS比较适合存储大量零碎的小文件分布式文件系统HDFS是一种关系型数据库正确答案：B你选对了7多选（3分）以下对名称节点理解正确的是：

49、 A. 名称节点作为中心服务器，负责管理文件系统的命名空间及客户端对文件的访问名称节点用来负责具体用户数据的存储名称节点通常用来保存元数据名称节点的数据保存在内存中正确答案：ACD你选对了8多选（3分）以下对数据节点理解正确的是： A. 数据节点通常只有一个数据节点用来存储具体的文件内容数据节点的数据保存在磁盘中数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作正确答案：BCD你选对了9多选（3分）HDFS只设置唯一一个名称节点群来的局限性包括： A. 集群的可用性性能的瓶颈命名空间的限制隔离问题正确答案：ABCD你选对了10多选（3分）以下HDFS相关的shel

50、 I命令不正确的是： A. hadoop dfs mkd i r :创建指定的文件夹hdfs dfs -rm :删除路径指定的文件hadoop fs -copyFromLocaI :将路径指定的文件或文件夹复制到路径指定的文件夹中hadoop fs -Is :显示指定的文件的详细信息正确答案：AC你选对了第4章分布式数据库HBase1单选（2分）HBase是一种数据库 A. 行式数据库关系数据库文档数据库列式数据库正确答案：D你选对了2单选（2分）

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？