ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:48.21KB ,
资源ID:4555480      下载积分:5 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/4555480.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(大学生大数据技术原理与应用章节测验期末考试答案.docx)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

大学生大数据技术原理与应用章节测验期末考试答案.docx

1、大数据技术原理与应用第1章大数据概述1单选(2分)第三次信息化浪潮的标志是:A. 个人电脑的普及云计算、大数据、物联网技术的普及虚拟现实技术的普及互联网的普及正确答案:B你选对了2单选(2分)就数据的量级而言,1PB数据是多少TB?正确答案:D你选对了3单选(2分)以下关于云计算、大数据和物联网之间的关系,论述错误的是:A. 云计算侧重于数据分析物联网可借助于云计算实现海量数据的存储物联网可借助于大数据实现海量数据的分析云计算、大数据和物联网三者紧密相关,相辅相成正确答案:A你选对了4单选(2分)以下哪个不是大数据时代新兴的技术:A. SparkHadoopHBaseMySQL正确答案:D你选

2、对了5单选(2分)每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:A. 数据操作数据索引数据模型存储模式正确答案:ABCD你选对了10多选(3分)访问HBase表中的行,有哪些方式:A. 通过某列的值区间全表扫描通过一个行健的区间来访问通过单个行健访问正确答案:BCD你选对了第5章NoSQL数据库1单选(2分)下列关于NoSQL数据库和关系型数据库的比较,不正确的是:A. NoSQL数据库很容易实现数据完整性,关系型数据犀很难实现数据完整性NoSQL数据库缺乏统一的查询语言,而关系型数据原有标准化查询语言NoSQL数据库的可扩展性比传统的关系型数据犀更好NoSQL数据库具有弱一致

3、性,关系型数据库具有强一致性正确答案:A你选对了2单选(2分)以下对各类数据库的理解错误的是:A. 键值数据库的键是一个字符串对象,值可以是任意类型的数据,比如整型和字符型等文档数据库的数据是松散的,XML和JS0N文档等都可作为数据存储在文档数据库中图数据库灵活性高,支持复杂的图算法,可用于构建复杂的关系图谱HBase数据库是列族数据库,可扩展性强,支持事务一致性正确答案:D你选对了3单选(2分)下列数据库属于文档数据库的是:A. MySQLRed i sMongoDBHBase正确答案:C你选对了4单选(2分)NoSQL数据库的三大理论基石不包括:A. 最终一致性BASEACIDCAP正确

4、答案:C你选对了5多选(3分)关于NoSQL数据原和关系数据原,下列说法正确的是:A. NoSQL数据库可支持超大规模数据存储,具有强大的横向扩展能力NoSQL数据库和关系数据犀各有优缺点,但随着NoSQL的发展,终将取代关系数据原大多数NoSQL数据库很难实现数据完整性关系数据库有关系代数理论作为基础,NoSQL数据犀没有统一的理论基础正确答案:ACD你选对了6多选(3分)NoSQL数据库的类型包括:A. 键值数据库列族数据库文档数据库图数据库正确答案:ABCD你选对了7多选(3分)CAP是指:A. 一致性可用性持久性分区容忍性正确答案:ABD你选对了8多选(3分)NoSQL数据库的BASE

5、特性是指:A. 软状态持续性最终一致性基本可用正确答案:ACD你选对了第6章云数据库1单选(2分)下列Amazon的云数据库属于关系数据库的是:A. Amazon S i mpIeDBAmazon DynamoDBAmazon RDSAmazon Redsh i ft正确答案:C你选对了2单选(2分)下列关于UMP系统的说法不正确的是:A. Control ler服务器向UMP集群提供各种管理服务,实现集群成员管理、元数据存储等功能Agent服务器部署在运行MySQL进程的机器上,用来管理每台物理机上的MySQL实例UMP系统是低成本和高性能的MySQL云数据库方案Mnesia是UMP系统的一

6、个组件,是一个分布式数据库管理系统,且不支持事务正确答案:D你选对了3多选(3分)UMP依赖的开源组件包括LVSA. ZooKeeperMnes i aRabbitMQ正确答案:ABCD你选对了4多选(3分)在UMP系统中,Zookeeper主要发挥的作用包括:A. 监控所有MySQL实例负责集群负载均衡提供分布式锁,选出一个集群的“总管”作为全局的配置服务器正确答案:ACD你选对了5多选(3分)UMP系统设计了哪些机制来保证数据安全:A.记录用户操作日志数据访问IP白名单B. SSL数据库连接SQL拦截正确答案:ABCD你选对了第 7 章 MapReduce1单选(2分)下列说法错误的是:A

7、. Map函数将输入的元素转换成key, vaIue形式的键值对Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写MapReduce框架采用了 Master/SIave架构,包括一个Master和若干个Slave不同的Map任务之间不能互相通信正确答案:B你选对了2单选(2分)在使用MapReduce程序WordCount进行词频统计时,对于文本行hello hadoop hello wor Idn ,经 过WordCount程序的Map函数处理后直接输出的中间结果,应是下面哪种形式:A. 、heI Io”, 2、和Hhel loM, 和”hello,1、.

8、和正确答案:D你选对了3单选(2分)对于文本行“hello hadoop hello world”,经过WordCoun t的Reduce函数处理后的结果是:A. hel Io, 1,1正确答案:B你选对了4多选(3分)下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是:A. 前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好前者相比后者学习起来更难前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,害错性好前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型 正确答案:ABCD你选对了5多选(3分)MapReduce 1

9、.0的体系结构主要由哪几个部分组成:A. JobTrackerTaskTrackerCl ientTask正确答案:ABCD你选对了第8章Hadoop再探讨1单选(2分)下列说法正确的是:A. HDFS HA可用性不好第二名称节点是热备份HDFS HA提供高可用性,可实现可扩展性、系统性能和隔离性第二名称节点无法解决单点故障问题正确答案:D你选对了2单选(2分)HDFS Federation设计不能解决“单名称节点”存在的哪个问题:A. 单点故障问题HDFS集群扩展性性能更高效良好的隔离性正确答案:A你选对了3多选(3分)下列哪些是Hadoopl. 0存在的问题:A. 抽象层次低表达能力有限开

10、发者自己管理作业之间的依赖关系执行迭代操作效率低正确答案:ABCD你选对了4多选(3分)下列对Hadoop各组件的理解正确的是:A. Ooz ie:工作流和协作服务引擎Pig:处理大规模数据的脚本语言Kafka:分布式发布订阅消息系统Tez:支持DAG作业的计算框架正确答案:ABCD你选对了5多选(3分)对新一代资源管理调度框架YARN的理解正确的是:A. YARN既是资源管理调度框架,也是一个计算框架MapReduce2. 0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务YARN可以实现一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架YA

11、RN 的体系结构包含三个组件:ResourceManager, NodeManager, AppI icat ionMaster正确答案:BCD你选对了第9章数据仓库Hive1单选(2分)下列有关Hi ve和Impa I a的对比错误的是:A. H i ve与Impa I a中对SQL的解释处理比较相似,都是通过词法分析生成执行计划Hive与Impala使用相同的元数据Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询Hive在内存不足以存储所有数据时,会使用外存,而Impala也是如此正确答案:D你选对了2单选(2分)下列关于Hive基本操作命令的解释错误的是:A

12、. create tab I e if not exists usr(id bigint,name string, age int) ;/如 usr 表不存在,创建表 usr, 含三个属性id, name, ageIoad data I oca I i npath /usr/1 oca I/data overwr ite i nto tab Ie usr; / 把 目 录/usr/1 oca I/data*下的数据文件中的数据以追加的方式装载进usr表create database userdb;/创建数据库 userdbi nsert overwr i te tab I e student

13、se I ect * from user where age10; /向表 usr1 中插入来自 usr表的age大于10的数据并覆盖student表中原有数据正确答案:B你选对了3多选(3分)下列说法正确的是:A. Impa I a和Hive、HDFS、HBase等工具可统一部署在一个Hadoop平台上数据仓库Hive不需要借助于HDFS就可完成数据的存储Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据HiveQL语法与传统的SQL语法很相似正确答案:ACD你选对了4多选(3分)Impa I a主要由哪几个部分组成:A. HiveImpaladState S

14、toreCL I正确答案:BCD你选对了5多选(3分)以下属于Hive的基本数据类型是:A. BINARYSTRINGFLOATTINYINT正确答案:ABCD你选对了第 10 章 Spark1单选(2分)Spark SQL目前暂时不支持下列哪种语言:A. PythonJavaSea I aL i sp正确答案:D你选对了2单选(2分)RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的 操作的是:A. groupByfiltercountmap正确答案:C你选对了3单选(2分)下列说法错误的是:A. 在选择Spark Strea

15、ming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架StormRDD采用惰性调用,遇到“转换(Transformation)类型的操作时,只会记录RDD生成的轨迹,只 有遇到“动作(Action)”类型的操作时才会触发真正的计算Spark 支持三种类型的部署方式:Standalone, Spark on Mesos, Spark on YARNB. RDD提供的转换接口既适用fi Iter等粗粒度的转换,也适合某一数据项的细粒度转换正确答案:D你选对了4单选(2分)下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的

16、是:A. f i Iter (func):筛选出满足函数func的元素,并返回一个新的数据集map (func):将每个元素传递到函数func中,并将结果返回为一个新的数据集count ():返回数据集中的元素个数take (n):返回数据集中的第n个元素正确答案:D你选对了5单选(2分)下列大数据处理类型与其对应的软件框架不匹配的是:A. 复杂的批量数据处理:MapReduce基于历史数据的交互式查询:Impala基于实时数据流的数据处理:Storm图结构数据的计算:Hive正确答案:D你选对了6多选(3分)Apache软件基金会最重要的三大分布式计算系统开源项目包括:A. Orac I e

17、HadoopStormSpark正确答案:ABC你选对了7多选(3分)Spark的主要特点包括:A. 运行模式多样运行速度快0.通用性好D.容易使用正确答案:ABCD你选对了8多选(3分)下列关于Scala的说法正确的是:A. Sea I a运行于Java平台,兼容现有的Java程序Sea I a具备强大的并发性,支持函数式编程Sea I a是一种多范式编程语言Sea I a是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言正确答案:ABCD你选对了9多选(3分)Spark的运行架构包括:A. 运行作业任务的工作节点Worker Node每个工作节点上负责具体

18、任务的执行进程Executor每个应用的任务控制节点Dr i ver集群资源管理器Cluster Manager正确答案:ABCD你选对了第11章流计算1单选(2分)流计算秉承一个基本理念,即数据的价值随着时间的流逝而,如用户点击流:A. 降低不确定不变升高正确答案:A你选对了2单选(2分)Hadoop运行的是MapReduce任务,类似地,Storm运行的任务叫做SpoutA. BoltTup I eTopo I ogy正确答案:D你选对了3多选(3分)对于一个流计算系统来说,它应达到如下哪些需求:A. 海量式高性能分布式实时性正确答案:A、B、C、D你选对了4多选(3分)数据采集系统的基本

19、架构包括哪些部分:A. Contro I I erStoreAgentCol lector正确答案:B、C、D你选对了5多选(3分)以下哪些是开源的流计算框架:A. MapReduceDreme IStormPrege I正确答案:A你选对了6单选(2分)每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:A. GraphXS4Impa I aHive正确答案:B你选对了7单选(2分)每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:A. Prege IStormCassandraFI ume正确答案:A你选对了8单选(2分)每种大数据产品都有特定的应用场景,以下哪个产品

20、是用于查询分析计算的:A. HDFSS4Dreme IMapReduce正确答案:C你选对了9多选(3分)数据产生方式大致经历三个阶段,包括:A. 运营式系统阶段感知式系统阶段移动互联网数据阶段用户原创内容阶段A. Facebook PumaYahoo! S4IBM InfoSphere StreamsTwitter Storm正确答案:B、D你选对了6多选(3分)下面哪几个属于Storm中的Stream Groupings的分组方式:A. 按照字段分组广播发送随机分组全局分组正确答案:A、B、C、D你选对了第 12 章 Fl ink1单选(2分)以下哪个不是Fl ink的优势:A. 同时支持

21、高吞吐、低延迟、高性能不支持增量迭代同时支持流处理和批处理支持有状态计算正确答案:B你选对了2单选(2分)在Fl ink中哪个是基于批处理的图计算库:A. SQL&TabIe 库FlinkMLGel lyCEP正确答案:C你选对了3多选(3分)下面关于Fl ink的说法正确的是:A. FI ink起源于Stratosphere项目,该项目是在2010年到2014年间由柏林工业大学、柏林洪堡大学和哈索普拉特纳研究所联合开展的Fl ink可以同时支持实时计算和批量计算FI ink不是Apache软件基金会的项目B. FIink是Apache软件基金会的5个最大的大数据项目之一正确答案:A、B、D你

22、选对了4多选(3分)Fl ink的主要特性包括:A. 精确一次的状态一致性保障批流一体化精密的状态管理事件时间支持正确答案:A、B、C、D你选对了5多选(3分)下面论述正确的是:A. Spark Streaming通过采用微批处理方法实现高吞吐和容错性,但是牺牲了低延迟和实时处理能力Storm虽然可以做到低延迟,但是无法实现高吞吐,也不能在故障发生时准确地处理计算状态0.流处理架构需要具备低延迟、高吞吐和高性能的特性,而目前从市场上已有的产品来看,只有Fl ink 可满足要求D.FI ink实现了 Google Dataflow流计算模型,是一种兼具高吞吐、低延迟和高性能的实时流计算框 架,并

23、且同时支持批处理和流处理正确答案:A、B、C、D你选对了6多选(3分)Fl ink常见的应用场景包括:A. 数据流水线应用事件驱动型应用地图应用数据分析应用正确答案:A、B、D你选对了7多选(3分)Fl ink核心组件栈分为哪三层:A. 物理部署层Runtime核心层Core 层API&Libraries 层正确答案:A、B、D你选对了8多选(3分)Fl ink有哪几种部署模式:A. 运行在GCE (谷歌云服务)和EC2 (亚马逊云服务)上YARN集群模式Standa I one集群模式Loca I 模式正确答案:A、B、C、D你选对了9多选(3分)Fl ink系统主要由两个组件组成,分别为:

24、A. JobManagerJobScheduI er0. TaskScheduI erD. TaskManager正确答案:A、D你选对了10多选(3分)在编程模型方面,Fl ink提供了不同级别的抽象,以开发流或批处理作业,主要包括哪几个级别的抽象:A. DataStream API (有界或无界流数据)以及DataSet API (有界数据集)Table API状态化的数据流接口SQL正确答案:A、B、C、D你选对了第13章图计算1单选(2分)Pregel是一种基于 模型实现的并行图处理系统:A. TSPSTPBSPSBP正确答案:C你选对了2单选(2分)谷歌在后Hadoop时代的新“三驾

25、马车”不包括:A. Caffe i neDremeIPregeIHama正确答案:D你选对了3多选(3分)下列哪些是以图顶点为中心的,基于消息传递批处理的并行图计算框架:A. HamaGi raphPregeINeo4j正确答案:A、B、C你选对了4多选(3分)以下关于Pregel图计算框架说法正确的是:A. 通常只对满足交换律和结合律的操作才会开启Combiner功能Pregel采用检查点机制来实现容错对于全局拓扑改变,Pregel采用了惰性协调机制Aggregator提供了一种全局通信、监控和数据查看的机制正确答案:A、B、C、D你选对了第14章 大数据在不同领域的应用1单选(2分)下列说

26、法错误的是:A. ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品基于用户的协同过滤算法(简称UserCF算法)是目前业界应用最多的算法UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品UserCF算法的推荐更偏向社会化,而ItemCF算法的推荐更偏向于个性化正确答案:B你选对了2多选(3分)推荐方法包括哪些类型:A. 专家推荐协同过滤推荐基于内容的推荐基于统计的推荐正确答案:A、B、C、D你选对了期末试卷1单选(2分)数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:A. 运营式系统阶段感知式系统阶段数据流阶段用户原创内容阶段正确答案:

27、C你选对了2单选(2分)第三次信息化浪潮的发生标志是以下哪种技术的普及:A. 互联网CPU物联网、云计算和大数据个人计算机正确答案:C你选对了3单选(2分)在Fl ink中哪个是基于批处理的图计算库:A. SQL&Table 库CEPGeliyFlinkML正确答案:C你选对了4单选(2分)Hadoop的两大核心是 和MapReduce; HBaseA. HDFS; HBaseHDFS; MapReduceGFS; MapReduce正确答案:C你选对了5单选(2分)HDFS默认的一个块大小是64MB8KBA. 32KB16KB正确答案:A你选对了6单选(2分)在分布式文件系统HDFS中,负责

28、数据的存储和读取:A. 数据节点第二名称节点名称节点主节点正确答案:A你选对了7单选(2分)上传当前目录下的本地文件fi le.txt到分布式文件系统HDFS的“/path目录下的Shel I命令是:A. hdfs dfs -put /path file.txthadoop dfs -put /path file.txthdfs fs -put file.txt /pathhdfs dfs -put file.txt /path正确答案:D你选对了8单选(2分)在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹d i r,正确的she I I命令是:A. hado

29、op fs -mkd i r -p /test/d i rhdfs fs -mkd i r -p /test/d i rhadoop dfs -mkd i r /test/d i rhdfs dfs *mkd i r -p /test/d i r正确答案:A你选对了9单选(2分)下列有关HBase的说法正确的是:A. 在向数据原中插入记录时,HBase和关系数据库一样,每次都是以“行为单位把整条记录插入数据库HBase是针对谷歌BigTable的开源实现,是高可靠、高性能的图数据库HBase是一种NoSQL数据库HBase数据库表可以设置该表任意列作为索引正确答案:C你选对了10单选(2分)已

30、知一张表 student 存储在 HBase 中,向表中插入一条记录(id:2015001, name:Mary, score:math :88,其 id 作为行键,其中,在插入数学成绩88分时,正确的命令是:A. put student,score:math, 88put student,2015001,score:math,88put student *2015001,math, 88put student, *2015001, 88正确答案:B你选对了11单选(2分)NoSQL数据库的三大理论基石不包括:A. ACID最终一致性BASECAP正确答案:A你选对了12单选(2分)在设计词频

31、统计的MapReduce程序时,对于丈本行44hel Io bigdata hello hadoop v ,经过map函数处理后直 接输出的结果应该是(没有发生combine和merge操作):A. 、 bigdata,1和hadoop,1nhello,1,1. 和hadoop, 1、 bigdata”,1和s 、和hadoop,113单选(2分)假设已经配置好PATH环境变量,启动Hadoop的命令是:A. start-hdfs. shstart-fs. shstart-dfs. shstart-hadoop. sh正确答案:C你选对了14单选(2分)下列说法错误的是:A. HDFS Fed

32、eration使得HDFS的命名服务能够水平扩展第二名称节点是热备份,而HDFS HA不是热备份HDFS HA可以解决单点故障问题第二名称节点无法解决单点故障问题正确答案:B你选对了15单选(2分)RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是:A. joinmapcol IectgroupBy正确答案:C你选对了16单选(2分)下列关于Hive的说法正确的是:A. Hive支持频繁数据更新Hive不支持索引Hive支持批量导入Hive的可扩展性差正确答案:C你选对了17多选(3分)大数据的特点包括:A. 数据量

33、大处理速度快价值密度低数据种类繁多正确答案:A、B、C、D你选对了18多选(3分)下列适用于批处理计算的框架有哪些:A. PregeISparkMapReduceStorm19多选(3分)下列适用于流计算的框架有哪些:A. StormDremeISpark StreamingPregeI正确答案:A、C你选对了20多选(3分)Fl ink核心组件栈分为哪三层:A. Core 层Runtime核心层API&Librar ies 层物理部署层正确答案:B、C、D你选对了21多选(3分)从技术架构上来看,物联网可以分为哪几层:A. 感知层处理层应用层网络层正确答案:A、B、C、D你选对了22多选(3

34、分)HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据:A. 行键列族列限定符时间戳正确答案:A、B、C、D你选对了23多选(3分)典型的NoSQL数据库的类型包括:A. 键值数据犀列族数据库图数据库文档数据库正确答案:A、B、C、D你选对了24多选(3分)CAP是指:A. 持久性可用性一致性分区容忍性25多选(3分)云计算主要包括哪3种类型:A. CaaSI aaSPaaSSaaS正确答案:B、C、D你选对了26多选(3分)以下属于流计算的应用有哪些:A. 实时交通路线推荐购物网站的广告推荐根据过去一年购物记录判断用户的消费能力数据仓库数据批处理分析正确答案:A、B

35、你选对了27多选(3分)下列关于图计算产品Pregel的说法正确的是:A. Pregel是一种基于BSP模型实现的并行图处理系统在每个超步中,每个顶点会根据其接收消息的最大值和自身值比较,来确定自己状态作何种改变当多个顶点的操作请求发生冲突时,Pregel采用局部有序和Handler来解决冲突传统的图计算框架通常表现出比较好的内存访问局部性正确答案:A、B、C你选对了28多选(3分)下列哪些是图计算框架Pregel的应用:A. 单源最短路径二分匹配流数据处理PageRank正确答案:A、B、D你选对了29多选(3分)关于Spark的特性说法正确的是:A. Sea I a是Spark的主要编程语

36、言,但Spark还支持Java、Python R作为编程语言Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高正确答案:A、B、C、D你选对了30多选(3分)BASE的基本含义是:A. 持续性软状态基本可用最终一致性31判断(2分)Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台 特性。正确答案:J你选对了32判断(2分)HDFS

37、分布式文件系统,是谷歌丈件系统GFS的开源实现,而Hadoop MapReduce也是针对谷歌MapReduce的开 源实现。正确答案:J你选对了33判断(2分)在分布式文件系统HDFS中,名称节点负责管理HDFS的元数据,这些元数据被保存在磁盘中。正确答案:X你选对了34判断(2分)HDFS可以高效存储大量的小文件。正确答案:X你选对了35判断(2分)Fs I mage用维护文件系统树以及文件树中所有的文件和文件夹的元数据。正确答案:J你选对了36判断(2分)第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分,它是来保存名称节点中对HDFS元数据 信息的备份,

38、并减少名称节点重启的时间。正确答案:。你选对了37判断(2分)HDFS采用了主从(Master/Slave)架构模型,一个HDFS集群包括一个名称节点和若干个数据节点。正确答案:J你选对了38判断(2分)NoSQL数据库的数据库模式灵活,可扩展性好,同时,所有NoSQL数据库都支持事务的ACID四性。正确答案:X你选对了39判断(2分)传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者 都会共同存在,满足不同应用的差异化需求。正确答案:。你选对了40判断(2分)正确答案:ABD你选对了10多选(3分)大数据发展三个阶段是:A. 低谷期成熟期大规

39、模应用期萌芽期正确答案:BCD你选对了11多选(3分)大数据的特性包括:A. 价值密度低处理速度快数据类型繁多数据量大正确答案:ABCD你选对了12多选(3分)图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历哪几种范 式:A. 计算科学数据密集型科学实验科学理论科学正确答案:ABCD你选对了13多选(3分)大数据带来思维方式的三个转变是:A. 效率而非精确相关而非因果精确而非全面全样而非抽样正确答案:ABD你选对了14多选(3分)大数据主要有哪几种计算模式:MongoDB是一种图数据库,由C+语言编写的,其数据类型类似于JS0N对象。正确答案:X你选对了4

40、1判断(2分)正确答案:J你选对了42判断(2分)协同过滤是最早、最知名的推荐算法,可分为基于用户的协同过滤和基于物品的协同过滤。正确答案:J你选对了43判断(2分)Hive适合于实时交互式SQL查询,而Impala适合于长时间的批处理查询分析。正确答案:X你选对了A. 流计算图计算查询分析计算批处理计算正确答案:ABCD你选对了15多选(3分)云计算的典型服务模式包括三种:A. SaaSlaaSMaaSPaaS正确答案:ABD你选对了第2章大数据处理架构Hadoop1单选(2分)启动hadoop所有进程的命令是:A. start-dfs. shstart-aI I.shstart-hadoo

41、p.shstart-hdfs. sh正确答案:B你选对了2单选(2分)以下对Hadoop的说法错误的是:A. Hadoop是基于Java语言开发的,只支持Java语言编程Hadoop2. 0 增加了 NameNode HA 和 Wi re-compat i b i I i ty 两个重大特性Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算Hadoop 的核心是 HDFS 和 MapReduce正确答案:A你选对了3单选(2分)以下哪个不是Hadoop的特性:A. 成本高支持多种编程语言高容错性高可靠性正确答案:A你选对了4单选(2分)以下名

42、词解释不正确的是:A. Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现Hive: 一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询 和分析存储HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现正确答案:B你选对了5多选(3分)以下哪些组件是Hadoop的生态系统的组件:A. HBaseOrac I e0. HDFSD. MapReduce正确答案:ACD你选对了6多选(3分)以下哪个命令可用来操作HDF

43、S文件:A. hadoop f shadoop df shdf s fshdf s df s正确答案:ABD你选对了第3章分布式文件系统HDFS1单选(2分)HDFS的命名空间不包含:A. 字节文件块目录正确答案:A你选对了2单选(2分)对HDFS通信协议的理解错误的是:A. 客户端与数据节点的交互是通过RPC (Remote Procedure Call)来实现的客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交 互名称节点和数据节点之间则使用数据节点协议进行交互HDFS通信协议都是构建在loT协议基础之上的正确答案:D你选对了3单选(2分)采用多副本冗

44、余存储的优势不包含:A. 保证数据可靠性容易检查数据错误加快数据传输速度节约存储空间正确答案:D你选对了4单选(2分)假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:A. start-dfs.sh, stop-hdfs.shstart-hdfs. sh, stop-hdfs. shstart-dfs.sh, stop-dfs.shstart-hdfs. sh, stop-dfs.sh正确答案:C你选对了5单选(2分)分布式文件系统HDFS采用主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类, 一类存储元数据叫 ,另一类存储具体数据叫:A. 名称节点,主节点

45、从节点,主节点名称节点,数据节点数据节点,名称节点正确答案:C你选对了6单选(2分)下面关于分布式文件系统HDFS的描述正确的是:A. 分布式文件系统HDFS是Google Bigtable的一种开源实现分布式文件系统HDFS是谷歌分布式文件系统GFS (Google Fi le System)的一种开源实现分布式文件系统HDFS比较适合存储大量零碎的小文件分布式文件系统HDFS是一种关系型数据库正确答案:B你选对了7多选(3分)以下对名称节点理解正确的是:A. 名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问名称节点用来负责具体用户数据的存储名称节点通常用来保存元数据名

46、称节点的数据保存在内存中正确答案:ACD你选对了8多选(3分)以下对数据节点理解正确的是:A. 数据节点通常只有一个数据节点用来存储具体的文件内容数据节点的数据保存在磁盘中数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作正确答案:BCD你选对了9多选(3分)HDFS只设置唯一一个名称节点群来的局限性包括:A. 集群的可用性性能的瓶颈命名空间的限制隔离问题正确答案:ABCD你选对了10多选(3分)以下HDFS相关的shel I命令不正确的是:A. hadoop dfs mkd i r :创建指定的文件夹hdfs dfs -rm :删除路径指定的文件hadoop fs -copyFromLocaI :将路径指定的文件或文件夹复制到路径 指定的文件夹中hadoop fs -Is :显示指定的文件的详细信息正确答案:AC你选对了第4章 分布式数据库HBase1单选(2分)HBase是一种 数据库A. 行式数据库关系数据库文档数据库列式数据库正确答案:D你选对了2单选(2分)

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服