1、一、选择题1。云计算是对(D)技术的发展与运用A。并行计算B网格计算C分布式计算D三个选项都是2.从研究现状上看,下面不属于云计算特点的是(C)A。超大规模B。虚拟化C。私有化D.高可靠性3.与网络计算相比,不属于云计算特征的是(B)A.资源高度共享B.适合紧耦合科学计算C.支持虚拟机D.适用于商业领域4。IBM在2007年11月退出了“改进游戏规则”的(A)计算平台,为客户带来即买即用的云计算平台。A.蓝云B。蓝天C。ARUZED。EC25.微软于2008年10月推出云计算操作系统是(C)A.GoogleAppEngineB。蓝云C.AzureD。EC26。2008年,(A)先后在无锡和北京
2、建立了两个云计算中心A。IBMB.GoogleC。AmazonD.微软7.亚马逊AWS提供的云计算服务类型是(D)A。IaaSB.PaaSC.SaaSD。三个选项都是8。将平台作为服务的云计算服务类型是(B)A。IaaSB。PaaSC。SaaSD。三个选项都不是9。将基础设施作为服务的云计算服务类型是(A)A。IaaSB。PaaSC.SaaSD.三个选项都不是10.IaaS计算实现机制中,系统管理模块的核心功能是(A)A。负载均衡B监视节点的运行状态C应用APID.节点环境配置11.云计算体系结构的(C)负责资源管理、任务管理用户管理和安全管理等工作A.物理资源层B.资源池层C.管理中间件层D
3、.SOA构建层12.云计算技术的层次结构中包含(ABCD)下层A。物力资源层B。资源池层C。管理中间件D.SOA构建层13.云计算体系结构中,最关键的两层是(BC)A.物力资源层B。资源池层C.管理中间件D。SOA构建层14.云计算按照服务类型大致可分为以下类(ABC)A。IaaSB。PaaSC。SaaSD.效用计算15。下列不属于Google云计算平台技术架构的是(D)A。并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC216。与开源云计算系统HadoopHDFS相对应的商用云计算软件系统是(A)A。GoogleGFSB。GoogleM
4、apReduceC。GoogleBigtableD。GoogleChubby17.Google文件系统(GFS)分块默认的块大小是(B)A.32MBB。64MBC.128MBD。16MB18。Google文件系统(GFS)分成固定大小的块,每个块都有一个对应的(C)A。代理B.结点C。索引号D。计数器19。Google文件系统(GFS)提供给应用程序的访问接口是(A)A。专用接口B。遵守POSIX规范的接口C。网络文件系统接口D。Web网页接口20.下列不属于GFS的假设和目标是(C)A.硬件出错正常B.主要负载是流数据读写C.数据写主要是“插入写”D。需要存储大尺寸的文件21.Google文
5、件系统(GFS)通过(B)方式提高可靠性双备份冗余日志校验码22.Google文件系统(GFS)中每个数据块默认是在()个数据块服务器上冗余23。Google文件系统(GFS)中客户端直接从()角色完成数据存取主服务器桶数据块服务器管理块服务器24.下列不属于文件系统(GFS)中主服务器节点任务的是()存储元数据文件系统目录管理与数据块服务器进行周期性通信向客户端传输数据25。在主服务器节点容错中,采用日志进行容错的是()命名空间与文件名的映射表26。在数据块服务器容错中,每个Block对应()的校验码27.GFS在Google中管理着(C)级别的数据A。TBB。GBC。PBD.MB28.在目
6、前GFS集群中,每个集群包含(B)个存储节点A.几百个B。几千个C.几十个D.几十万个29.下列选项中,哪条不是GFS次啊用中心服务器模式的原因(A)A。不易成为整个系统的瓶颈B.可以方便增加数据块服务器C。不存在元数据的一致性问题D。方便进行负载均衡30。下列选项中,哪条不是GFS选择在用户态下实现的原因(D)A.调试简单B。不影响数据块服务器的稳定性C.降低实现难度,提高通用性D.容易扩展31。Google文件系统将整个系统的节点分为(ABC)的角色A。客户端B.主服务器C.数据块服务器D。监测服务器32。Google文件系统具有(ABD)特点A.采用中心服务器模式B不缓存数据C。采用边缘
7、服务器模式D在用户态下实现33.Google不缓存数据的原因是(ABCD)A.OFS的文件操作大部门是流式读写;B.维护缓存与实际数据之间的一致性太复杂C.不存在大量的重复读写D.数据块服务器上的数据存取使用本地文件系统34。GFS中主服务器节点存储的元数据包含这些信息(BCD)A.文件副本的位置信息B.命名空间C。Chunk与文件名的映射D。Chunk副本的位置信息35。单一主服务器(Master)解决性能瓶颈的方法是(ABCD)A。减少其在数据存储中的参与程度B。不适用Master读取数据C。客户端缓存元数据D.采用大尺寸的数据块36。(B)是Google提出的用于处理海量数据的并行编程模
8、式和大规模数据集的并行运算的软件架构。A.GFSB。MapReduceC.ChubbyD.BitTable37。Mapreduce适用于(D)A。任意应用程序B.任意可在windowsservet2008上运行的程序C.可以串行处理的应用程序D.可以并行处理的应用程序38。下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(A)A.一个Map函数就是对一部分原始数据进行指定的操作B。一个Map操作就是对每个ReD。uce所产生的一部分中间结果进行合并操作C。Map与Map之间不是相互独立的D。Reduce与Reduce之间不是相互独立的39.MapReduce执行过程中
9、,数据存储位置不是在GFS上的是(A)A.Map处理结果B。ReD.uce处理结果C.日志40。MapReduce通常把输入文件按照(C)MB来划分A.16B32C64D12841.与传统的分布式程序设计相比,Mapreduce封装了(ABCD)等细节,还提供了一个简单而强大的接口。A。并行处理B.容错处理C。本地化计算D。负载均衡BitTable分布式结构化数据表42。(D)是Google的分布式数据存储于管理系统A。GFSB。MapReduceC.ChubbyD。Bigtable43。下面哪条不是bigtable主服务器作用(B)A。为每个子表服务器分配子表,对外提供服务B。对bigtab
10、le表中的数据进行存储C.探测子表服务器的故障和管理D。负载均衡44。Bigtable中时间戳是(D)位整型数。A.32B。48C.56D.6445.Bigtable中的数据压缩形式有(B)种A.2B.3C。4D。546.Bigtable中行关键字的大小不能超过(D)KBA16B32C48D6447。(D)是Bigtable中数据划分和负载均衡的基本单位A。行B列C列族D子表48。(C)是Bigtable中访问控制的基本单元A。行B列C列族D子表49。(B)是Google为Bigtable设计的内部数据存储格式A。行B。SSTableC列族D子表50。SSTable结尾的索引保存的是(A)信息
11、A.SSTable中块的位置B.SSTable的位置C。SSTable中块的大小D。Sstable的大小51。在Bigtable中,(A)主要用来存储子表数据以及一些日志文件A.GFSB。ChubbyC.SSTableD.MapReduce52.Google设计Bigtable的动机主要是(ABC)A。需要存储的数据种类繁多B.海量的服务请求C。商用数据库无法满足Google的需求D。需要频繁的修改数据53。Bigtable主要由(ABC)三个部分组成A.客户端程序库B。一个主服务器C.多个子表服务器D数据管理服务器54。Bigtable表中的数据是通过(ABD)来进行索引的A。行关键字B列关
12、键字C子表地址D时间戳55.Bigtable开发团队确定了Bigtable设计所需达到的基本目标(ABCD)A.广泛的适用性B很强的可扩展性C高可用性D简单性56.GoogleAPPEngine使用的数据库是(C)A。改进的SQLServerB。OrackC。DatestoreD.亚马逊的SimpleDB57。GoogleAPPEngine目前支持的编程语言有(AD)A。Python语言B。C+语言C。汇编语言D。JAVA语言58.下列不属于亚马逊及其映像(AMI)类型的是(C)A.公共AMIB。私有AMIC。通用AMID.共享AMI59。亚马逊AWS采用(A)虚拟化技术A。未使用B.Hype
13、rVC。VmwareD.Xen60。亚马逊将区域分为(AC)A地理区域B不可用区域C可用区域D隔离区域61。下面选项属于Amazon提供的云计算服务是(ABC)A。弹性云计算EC2B简单存储服务S3C简单队列服务SQSD.Net服务62.在使用弹性计算云EC2服务时,第一步要做的是(A)A.创建或选用AMIB.运行实例C。选择区域D.建立对象63.不属于弹性计算云EC2包含的IP地址的是(C)A.公共IP地址B.私有IP地址C。隧道IP地址D。弹性IP地址64.在EC2中用户最多可以拥有(B)个实例A、10B、20C、30D、4065。在EC2服务中,每个实例自身携带(A)个存储模块A。1B。
14、2C。3D。466.在EC2服务的通信机制中,每个账户限制由(B)个弹性IP。A。4B。5C.6D。767.在EC2的安全与容错机制中,一个用户目前最多可以创建(B)安全组。A。50B。100C。150D。20068。EC2定义了CPU的计算单元ECU,下列资源中使用一个计算单元的是(B)A。LargeB。SmallC。extrA。LargeD.High-CPUMeD。ium69。每个弹性存储EBS最多可以创建(B)个卷A。10B。20C.30D。4070.下列选项属于弹性块存储EBS功能的是(A)A。快照B0负载均衡C。队列D。映像71。EC2常用的API包含下列哪些类型的操作(ABCD)A
15、。AMIB.安全组C实例D弹性IP地址72。S3的基本存储单元是(B)A。服务B.对象C。卷D。组73。下列操作类型不属于S3API范畴的是(C)A.创建桶B.读取对象C。运行实例D。设置访问控制策略74.桶是S3用于存储对象的容器,每个用户最多可以创建(D)个桶A10B50C80D10075.与SDB相比较,下列选项属于S3范畴的是(B)A.支持数据查找、删除等操作B。专为大型、非结构化的数据块设计C.为复杂的数据建立D。为结构化的数据建立76。S3采用的专门安全措施是(AB)A。身份认证B。访问控制列表C防火墙D防木马病毒技术77。S3中对象有下面的(ABCD)组成A。键B数据C元数据D访
16、问控制78。与关系数据库比较,下列选项属于SDB特性的是(ACD)A。无需预定义模式B。具有事物的概念C。支持自动索引D.单个属性允许有多个值79。SDB不能完成的操作有(ABCD)A。没有事物的概念B不支持连接操作C实际存储的数据类型过于单一D查询结果只包含条目名称而不包含相应属性值,且返回结果不支持排序操作80。简单队列服务SQS中采用的是(A)队列方式A。先进先出模式B堆栈模式C。权重模式D.后进先出模式81.SQS由三个基本部分组成(ABC)A.系统组件B队列C消息82。SQS常用的API有(ABCD)A队列管理B消息管理C访问控制D可见性设置83。在云计算系统中,提供“云端”服务模式
17、是(D)公司的云计算服务平台.A.IBMB。GOOGLEC。AmaxonD。微软84.下面关于Live服务的描述不正确的是(C)A。LIVE框架的核心组件是live操作系统;B。开发者可以使用基于浏览器的live服务开发者入口创建和管理应用程序所需的live服务;C。Live操作环境不可以运行在桌面操作系统上。D。Live操作环境既可以运行在云端,也可以运行在网络中的任何操作系统上。85。下列四种云计算方案中,服务间的耦合度最高的是()A。亚马逊AWSB。微软AZUREC.GoogleAPPEngineD。IBM的“蓝云”86。云格可以完成的服务有(ACD)A。数据处理服务B。格处理服务C。高
18、性能计算服务D。协作服务87云计算的特点?(ABCDE)A大规模B。平滑扩展 C资源共享D.动态分配E。跨地域88.目前,选用开源的虚拟化产品组建虚拟化平台,构建基于硬件的虚拟化层,可以选用(BCD)A。XenB。VMwareC。HypervD。Citrix89在云计算中,虚拟层主要包括(ABC)A.服务器虚拟化B。存储虚拟化C。网络虚拟化D.桌面虚拟化90。下列哪个选项能正确地在Hive中返回“查询年龄在18到25岁之间的用户返回的前5页”的结果(A)A。SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspON(u.name=p。user
19、)WHEREu。age=18ANDu.age=25GROUPBYp.urlORDERBYclicksLIMIT5;B。SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspWHEREu.age=18ANDu。age=25GROUPBYp.urlORDERBYclicksLIMIT5;C。SELECTp.url,COUNT(1)asclicksFROMpage_viewspON(u。name=p.user)ORDERBYclicksLIMIT5;D。SELECTp。url,COUNT(1)asclicksFROMusersuJOINpage_v
20、iewspON(u.name=p.user)WHEREu.age=18ANDu。age=25GROUPBYp。urlORDERBYclicks;二、填空题1。云计算是以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片云”成为每一个网民的数据中心和计算中心。2.对提供者而言,云计算可以三种部署模式,即共有云、私有云和混合云.3。当前,几乎所有的知名IT提供商、互联网提供商,甚至电信运营商都在向云计算进军,都在提供相关的云服务。但归纳起来,当前云提供者可以分为三大类,即SaaS提供商、PaaS和IaaS提供商.4云时代宝德科技在其中扮演的角色是公有
21、云提供商、云基础设备提供商和私有云解决方案提供商。5。云计算(CloudComputing):一种利用大规模低成本运算单元通过IP网络连接,以提供各种计算和存储服务的IT技术。三、简答题1、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请回答关于分布式文件系统的下列问题:(1)。在设计分布式文件系统时需要注意哪些方面?(2)。原先存储超大文件的分布式文件系统现用来存储大规模小文件,如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能?(3).分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上,当用户对数据进行修
22、改时系统存在两种方案:完成一个副本的修改并给用户响应,之后待系统空闲时完成其它副本的修改;完成所有副本的修改之后给用户响应。请说明两种方案的优劣,并做出你的选择并说明选择原因(或者你有更好的方案?).2、在社会计算和移动计算迅猛发展的潮流下涌现了许多著名的互联网公司,假设你和你的朋友也准备加入创业大潮中,建立自己的企业.现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘,如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价,拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信息,当然你们已经设计了比较好的图形匹配算法及搜索算法,并计划使用云计算来进行处理
23、,根据以上背景回答下面问题:1).你们公司需要构建数据中心现在由你来负责,根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些?2)。在数据中心中使用虚拟化技术是必须的,请说说如何部署、管理虚拟化解决方案?你又如何使用商业公司的现有虚拟化产品?3).受经济危机的影响以及公司盈利能力的不确定性,风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了,你需要将业务创建在云计算平台上a)。与建立自己的数据中心相比,使用商业公司的云计算平台有什么优点和缺点?b)。云构架的基本层次有哪些?并给出给出各个层次的实例.谈谈你如何在云计算平台上部署公司业务?c).谈谈你对云计算发展的看
24、法。(注:题中商业公司包括课堂上介绍的IBM、Amazon、Google、S、Microsoft以及其它现实存在的涉及虚拟化、云计算业务的公司)3、举例描述aaS的概念。云计算按照其提供的“产品”或者是用户获得资源的类型,大致可以分为一些几种类别:1)IaaS,全称InfrastructureasaService,基础设施即服务。将多台服务器组成的“云端”计算资源和存储,作为计量服务提供给用户。它将内存、I/O、存储和计算能力整合成一个虚拟的资源池向业界用户提供存储资源和虚拟化服务器等服务。如AmazonEC2/S3。2)PaaS,全称PlatformasaService,平台即服务,把服务器
25、平台或者开发环境作为一种服务提供的商业模式,以SaaS的模式提交给用户。用户在服务提供商的基础架构上开发程序并通过网络传送给其他用户(最终用户)。如F,GoogleAppEngine,MicrosoftWindowsAzure。3)SaaS,全称SoftwareasaService,软件即服务,是基于互联网提供软件服务的软件应用模式。将应用软件统一部署于服务器(集群),通过网络向用户提供软件。用户根据实际需求定制或者租用应用软件。消除了企业或者机构购买、构建和维护基础设施和应用程序的投入。如SaleforceonlineCRM.4)DaaS,全称DataasaService,数据即服务,是继S
26、aaS,PaaS之后又一个新的服务概念。5)MaaS,全称M2MasaService,M2M即服务,M2M是将数据从一台终端传送到另一台终端,也就是就是机器与机器(MachinetoMachine)的对话,是物联网四大支撑技术之一。6)TaaS,全称everyTHINGAsAService,虚拟化云计算技术,SOA等技术的结合实现物联网的泛在即服务.4、写出MapReduce分布式编程环境中的Map/Reduce原理,用基本概念、关键词排序的图描述思路。MapReduce通过“Map(映射)和“Reduce(化简)”这样两个简单的概念来构成运算基本单元,用户只需提供自己的Map函数以及Redu
27、ce函数即可并行处理海量数据。MapReduce实现了Map和Reduce两个功能:1)Map把一个函数应用于集合中的所有成员,然后返回一个基于这个处理的结果集;2)Reduce对结果集进行分类和归纳;Map()和Reduce()两个函数可能会并行运行,即使不是在同一的系统的同一时刻.MapReduce的编程方式:map程序从输入文件中读取records的集合,执行任何需要的过滤或者转换,并且以(key,data)的形式输出records的集合.当map程序产生输出记录,”split函数对每一个输出的记录的key应用一个函数,将records分割为M个不连续的块(buckets)。这个spli
28、t函数有可能是一个hash函数,而其他确定的函数也是可用的。当一个块被写满后,将被写道磁盘上。然后map程序终止,输出M个文件,每一个代表一个块(bucket).排序程序处理10的10次方个100个字节组成的记录.这个程序的Map函数从文本行中解析出10个字节的key值作为排序的key,并且把这个key和原始文本行作为中间的key/valuepair值输出。我们使用了一个内置的恒等函数作为Reduce操作函数。这个函数把中间的key/valuepair值不作任何改变输出。最终排序结果输出到两路复制的GFS文件系统。5、简述Azure/VMware云的对比与不同,描述四点以上(优缺点)。1)Wi
29、ndowsAzure基于一个灵活且易于管理的基础设施为用户提供服务,即IaaS,与此同时还可以提供一系列基础设施服务平台即服务和软件即服务解决方案.而VMware目前则主要只提供基础设施即服务IaaS。2)WindowsAzure提供了从硬件到应用程序的全面集成监控和管理,而VMware都没有包含对应用程序的全面监控和管理。3)WindowsAzure提供了简便灵活的云端解决方案,有丰富的价值和多样化的选择,能够以更少的成本、人力轻松实现云部署,而VMware使用了大量的组件来创建自己的云解决方案,其中一些更是只限VMware最昂贵许可等级才能使用,另外一些组件需要单独的许可以及额外的费用。4
30、)WindowsAzure提供了一整套免费的云端基础设施工具,为客户带来更好成效的简便方法,而VMware没有提供类似的工具。6、举一个例子描述paas云产品(不可以是GAE),总结五点做技术描述。7、假设应用(企业软件)如何通过云计算转化成服务,如webservice服务进行改造?安全和隐私问题如何兼顾?保证访问安全有如下一些做法:访问应用的授权与签名。客户端系统或应用接入云服务前,必须经过云服务商的认证。认证结果以授权码方式交给客户方。以后的每次访问,客户方都需要出示授权码,或请求使用授权码进行签名。系统返回的结果也同样由系统证书进行签名,以达到通信双方的互信。时间戳方式。对于异步系统,使
31、用时间戳及唯一的客户端ID作为请求的序列号,系统返回时同样使用相同的方式构造序列号以进行适配。幂等检查。通过客户端生成唯一的序列号,服务端可以检测客户端命令是否重复发送,如有重复将直接抛弃。幂等检查可以保证所有服务请求都是一次性且唯一的,即使被恶意截获并通过网络设备重播,也不会执行.通过安全白名单进行控制.通过白名单制度,系统保证只有经过安全认证的客户端能够接入,通常可以通过认证证书实现,这是最严格的访问限制。8、通过云计算做数据中心DC(data-center)的关键问题是什么?怎么解决?1)提示:数据中心的选址标准:1、大量的廉价电力;2、绿色能源,更注重可再生能源;3、靠近河流或湖泊;(
32、设备冷却需要大量水源)4、用地广阔;(隐秘性和安全性)5、和其他数据中心的距离;(数据中心之间的快速链接)6、税收优惠.2)云计算datacenter:一个数据中心(或数据中心或数据中心或数据中心)是一个设施用于内部计算机系统和相关的部件,如电信和存储系统.它一般包括冗余或备份电源,冗余数据通信连接,环境控制(例如,空调,消防)和安全设备。1)经营和管理运营的电信网络2)提供数据中心应用程序直接向承运人的客户3)提供托管应用三分之一方提供其客户服务4)提供一个组合这些和类似的数据中心的应用。9、GFS经典结构描述.GFS的架构:一个GFS集群包含一个单独的Master节点、多台Chunk服务器
33、,并且同时被多个客户端访问,如图所示GFS的工作过程:1)客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引,向master(主)发送包含文件名和块索引的请求;2)。master收到客户端发来的请求,master向块服务器发出指示,同时时刻监控众多chunkserver的状态。Chunkserver缓存master从客户端收到的文件名和块索引等信息。3)master通过和chunkserver的交互,向客户端发送chunkhandle和副本位置。其中文件被分成若干个块,而每个块都是由一个不变的,全局唯一的64位的chunk-handle标识。Handle是由master在块创建时分配的.而出于安全性考虑,每一个文件块都要被复制到多个chunkserver上,一般默认3个副本;4)客户端向其中的一个副本发出请求,请求指定了chunkhandle(chunkserver以chunkhandle标识chunk)和块内的一个字节区间。5.客户端从chunkserver获得块数据,任务完成。通常Client可以在一个请求中询问多个chunk的地址,而master也可以很快回应这些请求。10、HDFS结构描述.11、hadoop结构描述