1、一、选择题 1。 云计算是对D技术的发展与运用 A. 并行计算 B网格计算 C分布式计算 D三个选项都是 2。 从研究现状上看下面不属于云计算特点的是C A。 超大规模 B。 虚拟化 C.私有化 D。 高可靠性 3。 与网络计算相比不属于云计算特征的是B A。资源高度共享 B。适合紧耦合科学计算 C。 支持虚拟机 D. 适用于商业领域 4。 IBM在2007年11月退出了“改进游戏规则”的 A 计算平台为客户带来即买即用的云计 算平台。 A。 蓝云 B. 蓝天 C. ARUZE D. EC2 5. 微软于2008年10月推出云计算操作系统是C A。 Google App Engine B. 蓝
2、云 C. Azure D。 EC2 6. 2008年A先后在无锡和北京建立了两个云计算中心 A. IBM B. Google C。 Amazon D。 微软 7。 亚马逊AWS提供的云计算服务类型是D A. IaaS B.PaaS C.SaaS D。三个选项都是 8. 将平台作为服务的云计算服务类型是B A. IaaS B。PaaS C。SaaS D。三个选项都不是 9. 将基础设施作为服务的云计算服务类型是A A。 IaaS B.PaaS C.SaaS D.三个选项都不是 10。 IaaS计算实现机制中系统管理模块的核心功能是A A. 负载均衡 B 监视节点的运行状态 C应用API D. 节
3、点环境配置 11. 云计算体系结构的C负责资源管理、任务管理用户管理和安全管理等工作 A.物理资源层 B. 资源池层 C. 管理中间件层 D. SOA构建层 12. 云计算技术的层次结构中包含ABCD下层 A。物力资源层 B。资源池层 C.管理中间件 D。SOA构建层 13。 云计算体系结构中最关键的两层是BC A。物力资源层 B。资源池层 C.管理中间件 D.SOA构建层 14。 云计算按照服务类型大致可分为以下类ABC A。IaaS B。 PaaS C. SaaS D.效用计算 15。 下列不属于Google云计算平台技术架构的是D A. 并行数据处理MapReduce B.分布式锁Chu
4、bby C. 结构化数据表BigTable D.弹性云计算EC2 16。 与开源云计算系统Hadoop HDFS相对应的商用云计算软件系统是A A。 Google GFS B. Google MapReduce C .Google Bigtable D。Google Chubby 17。 Google文件系统GFS分块默认的块大小是B A. 32MB B。 64MB C。 128MB D。16MB 18。 Google文件系统GFS分成固定大小的块每个块都有一个对应的C A。 代理 B。 结点 C。 索引号 D. 计数器 19。 Google文件系统GFS提供给应用程序的访问接口是A A .
5、专用接口 B。 遵守POSIX规范的接口 C.网络文件系统接口 D。 Web网页接口 20。 下列不属于GFS的假设和目标是C A。 硬件出错正常 B。 主要负载是流数据读写 C。 数据写主要是“插入写” D。 需要存储大尺寸的文件 21。 Google文件系统GFS通过B方式提高可靠性 A双备份 B冗余 C日志 D校验码 22。 Google文件系统GFS中每个数据块默认是在个数据块服务器上冗余 A。2 B 。3C。4D。5 23。 Google文件系统GFS中客户端直接从C角色完成数据存取 A主服务器 B桶 C数据块服务器 D管理块服务器 24。 下列不属于文件系统GFS中主服务器节点任务
6、的是D A存储元数据 B文件系统目录管理 C与数据块服务器进行周期性通信 D向客户端传输数据 25。 在主服务器节点容错中采用日志进行容错的是C、命名空间、Chunk与文件名的映射表 A命名空间 B.Chunk与文件名的映射表 26. 在数据块服务器容错中每个Block对应C、32bit的校验码 27。 GFS在Google中管理着C级别的数据 A。 TB B。 GB C。 PB D。 MB 28。 在目前GFS集群中每个集群包含B个存储节点 A。几百个 B。 几千个 C。几十个 D.几十万个 29。 下列选项中哪条不是GFS次啊用中心服务器模式的原因A A。不易成为整个系统的瓶颈 B.可以方
7、便增加数据块服务器 C。 不存在元数据的一致性问题 D。 方便进行负载均衡 30. 下列选项中哪条不是GFS选择在用户态下实现的原因D A。调试简单 B。不影响数据块服务器的稳定性 C。 降低实现难度提高通用性 D。 容易扩展 31。 Google文件系统将整个系统的节点分为ABC的角色 A。客户端 B.主服务器 C。数据块服务器 D.监测服务器 32。 Google文件系统具有ABD特点 A.采用中心服务器模式 B不缓存数据 C。采用边缘服务器模式 D在用户态下实现 33. Google不缓存数据的原因是 ABCD A。 OFS的文件操作大部门是流式读写 B. 维护缓存与实际数据之间的一致性
8、太复杂 C。 不存在大量的重复读写 D。 数据块服务器上的数据存取使用本地文件系统 34。 GFS中主服务器节点存储的元数据包含这些信息BCD A.文件副本的位置信息 B.命名空间 C. Chunk与文件名的映射 D。 Chunk副本的位置信息 35。 单一主服务器Master解决性能瓶颈的方法是ABCD A。减少其在数据存储中的参与程度 B. 不适用Master读取数据 C.客户端缓存元数据 D. 采用大尺寸的数据块 36. B是Google提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构. A。 GFS B。MapReduce C。Chubby D。BitTable
9、37。 Mapreduce适用于 D A. 任意应用程序 B。 任意可在windows servet2008上运行的程序 C。可以串行处理的应用程序 D。 可以并行处理的应用程序 38. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(A ) A .一个Map函数就是对一部分原始数据进行指定的操作 B。一个Map操作就是对每个ReD。uce所产生的一部分中间结果进行合并操作 C。Map与Map之间不是相互独立的 D。 Reduce与Reduce之间不是相互独立的 39。 MapReduce执行过程中数据存储位置不是在GFS上的是A A. Map处理结果 B. ReD
10、.uce处理结果 C。日志 40。 MapReduce通常把输入文件按照CMB来划分 A。 16 B32 C64 D128 41。 与传统的分布式程序设计相比Mapreduce封装了 ABCD 等细节还提供了一个简单而强大的接口。 A. 并行处理 B. 容错处理 C。 本地化计算 D。 负载均衡 BitTable分布式结构化数据表 42。 D是Google的分布式数据存储于管理系统 A. GFS B。 MapReduce C. Chubby D.Bigtable 43。 下面哪条不是bigtable主服务器作用 B A。 为每个子表服务器分配子表对外提供服务 B. 对bigtable表中的数据
11、进行存储 C。 探测子表服务器的故障和管理 D. 负载均衡 44。 Bigtable中时间戳是 D位整型数。 A. 32 B。 48 C。 56 D. 64 45。 Bigtable中的数据压缩形式有 B种 A. 2 B。 3 C. 4 D。 5 46。 Bigtable中行关键字的大小不能超过DKB A16 B32 C48 D64 47. D是Bigtable中数据划分和负载均衡的基本单位 A. 行 B列 C列族 D子表 48. C是Bigtable中访问控制的基本单元 A。 行 B列 C列族 D子表 49. B是Google为Bigtable设计的内部数据存储格式 A. 行 B。 SSTa
12、ble C列族 D子表 50。 SSTable结尾的索引保存的是A信息 A.SSTable中块的位置 B。 SSTable的位置 C。SSTable中块的大小 D.Sstable的大小 51. 在Bigtable中A主要用来存储子表数据以及一些日志文件 A。 GFS B。 Chubby C。SSTable D。MapReduce 52。 Google设计Bigtable的动机主要是ABC A。需要存储的数据种类繁多 B。海量的服务请求 C. 商用数据库无法满足Google的需求 D。需要频繁的修改数据 53. Bigtable主要由ABC三个部分组成 A。 客户端程序库 B. 一个主服务器 C
13、。多个子表服务器 D数据管理服务器 54。 Bigtable表中的数据是通过ABD来进行索引的 A。行关键字 B列关键字 C子表地址 D时间戳 55。 Bigtable开发团队确定了Bigtable设计所需达到的基本目标ABCD A.广泛的适用性 B很强的可扩展性 C高可用性 D简单性 56。 Google APP Engine使用的数据库是 C A。 改进的SQLServer B. Orack C。 Date store D。 亚马逊的SimpleDB 57. Google APP Engine目前支持的编程语言有 AD A. Python语言 B. C+语言 C。 汇编语言 D。 JAVA
14、语言 58。 下列不属于亚马逊及其映像AMI类型的是C A。公共AMI B.私有AMI C.通用AMI D。共享AMI 59。 亚马逊AWS采用 A 虚拟化技术 A。 未使用 B。 HyperV C。 Vmware D。 Xen 60。 亚马逊将区域分为AC A地理区域 B不可用区域 C可用区域 D隔离区域 61. 下面选项属于Amazon提供的云计算服务是ABC A。弹性云计算EC2 B简单存储服务S3 C简单队列服务SQS D。Net服务 62。 在使用弹性计算云EC2服务时第一步要做的是A A。创建或选用AMI B。运行实例 C。选择区域 D。建立对象 63. 不属于弹性计算云EC2包含
15、的IP地址的是C A. 公共IP地址 B。 私有IP地址 C.隧道IP地址 D。 弹性IP地址 64。 在EC2中用户最多可以拥有B个实例 A、10 B、20 C、30 D、40 65。 在EC2 服务中每个实例自身携带A个存储模块 A.1 B.2 C。 3 D.4 66. 在EC2服务的通信机制中每个账户限制由 B个弹性IP。 A. 4 B。 5 C. 6 D。 7 67. 在EC2的安全与容错机制中一个用户目前最多可以创建 B安全组。 A。 50 B. 100 C。 150 D。 200 68。 EC2定义了CPU的计算单元ECU下列资源中使用一个计算单元的是B A。Large B。Sma
16、ll C. extrA。Large D。 HighCPUMeD.ium 69. 每个弹性存储EBS最多可以创建B个卷 A。 10 B. 20 C. 30 D。 40 70。 下列选项属于弹性块存储EBS功能的是A A. 快照 B0负载均衡 C。 队列 D。映像 71. EC2常用的API包含下列哪些类型的操作ABCD A。AMI B。 安全组 C实例 D弹性IP地址 72. S3的基本存储单元是B A。服务 B.对象 C。卷 D. 组 73. 下列操作类型不属于S3API范畴的是C A。 创建桶 B. 读取对象 C.运行实例 D。设置访问控制策略 74。 桶是S3用于存储对象的容器每个用户最多
17、可以创建D个桶 A10 B50 C80 D100 75。 与SDB相比较下列选项属于S3范畴的是B A。支持数据查找、删除等操作 B。 专为大型、非结构化的数据块设计 C。 为复杂的数据建立 D。 为结构化的数据建立 76。 S3采用的专门安全措施是AB A。身份认证 B.访问控制列表 C防火墙 D防木马病毒技术 77。 S3中对象有下面的ABCD组成 A。键 B数据 C元数据 D访问控制 78。 与关系数据库比较下列选项属于SDB特性的是ACD A。无需预定义模式 B。具有事物的概念 C。支持自动索引 D。 单个属性允许有多个值 79. SDB不能完成的操作有ABCD A。没有事物的概念 B
18、不支持连接操作 C实际存储的数据类型过于单一 D查询结果只包含条目名称而不包含相应属性值且返回结果不支持排序操作 80. 简单队列服务SQS中采用的是A队列方式 A.先进先出模式 B堆栈模式 C.权重模式 D。后进先出模式 81。 SQS由三个基本部分组成ABC A.系统组件 B队列 C消息 82。 SQS常用的API有ABCD A队列管理 B消息管理 C访问控制 D可见性设置 83。 在云计算系统中提供“云端服务模式是D 公司的云计算服务平台。 A。 IBM B. GOOGLE C。 Amaxon D. 微软 84。 下面关于Live服务的描述不正确的是 C A。 LIVE框架的核心组件是l
19、ive操作系统 B. 开发者可以使用基于浏览器的live服务开发者入口创建和管理应用程序所需的live服务 C。 Live操作环境不可以运行在桌面操作系统上。 D. Live操作环境既可以运行在云端也可以运行在网络中的任何操作系统上。 85。 下列四种云计算方案中服务间的耦合度最高的是 A。 亚马逊AWS B. 微软AZURE C。 Google APP Engine D。 IBM的“蓝云” 86。 云格可以完成的服务有 ACD A. 数据处理服务 B。 格处理服务 C。 高性能计算服务 D. 协作服务 87云计算的特点( ABCDE ) A大规模 B。 平滑扩展 C资源共享 D。 动态分配
20、E。 跨地域 88。目前选用开源的虚拟化产品组建虚拟化平台构建基于硬件的虚拟化层可以选用BCD A 。Xen B.VMware C。 Hyper-v D。 Citrix 89在云计算中虚拟层主要包括ABC A.服务器虚拟化 B。存储虚拟化 C。网络虚拟化 D。桌面虚拟化 90。下列哪个选项能正确地在Hive中返回 “查询年龄在18到25岁之间的用户返回的前5页”的结果A A. SELECT p。url, COUNT(1) as clicks FROM users u JOIN page_views p ON (u。name = p。user) WHERE u。age = 18 AND u.ag
21、e = 25 GROUP BY p.url ORDER BY clicks LIMIT 5; B。 SELECT p.url, COUNT(1) as clicks FROM users u JOIN page_views p WHERE u.age = 18 AND u。age = 25 GROUP BY p.url ORDER BY clicks LIMIT 5; C。 SELECT p。url, COUNT(1) as clicks FROM page_views p ON (u。name = p.user) ORDER BY clicks LIMIT 5; D。 SELECT p。ur
22、l, COUNT(1) as clicks FROM users u JOIN page_views p ON (u。name = p。user) WHERE u。age = 18 AND u。age = 25 GROUP BY p。url ORDER BY clicks; 二、填空题 1。 云计算是以 公开 的标准和 服务 为基础以 互联网 为中心提供安全、快速、便捷的数据存储和网络计算服务让互联网这片”云”成为每一个网民的数据中心和计算中心. 2。 对提供者而言云计算可以三种部署模式即共有云、私有云和混合云。 3。 当前几乎所有的知名IT 提供商、互联网提供商甚至电信运营商都在向云计算进军
23、都在提供相关的云服务。但归纳起来当前云提供者可以分为三大类即 SaaS提供商、 PaaS 和 IaaS 提供商。 4云时代宝德科技在其中扮演的角色是公有云提供商、云基础设备 提供商和私有云解决方案 提供商 . 5。 云计算Cloud Computing一种利用大规模低成本 运算单元通过IP网络连接以提供各种计算和存储服务的IT技术。 三、简答题 1、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上这时就需要分布式文件系统来管理这些数据请回答关于分布式文件系统的下列问题 (1)。在设计分布式文件系统时需要注意哪些方面 (2).原先存储超大文件的分布式文件系统现用来存储大规模小文
24、件如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能 (3).分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上当用户对数据进行修改时系统存在两种方案完成一个副本的修改并给用户响应之后待系统空闲时完成其它副本的修改完成所有副本的修改之后给用户响应。请说明两种方案的优劣并做出你的选择并说明选择原因或者你有更好的方案。 2、在社会计算和移动计算迅猛发展的潮流下涌现了许多著名的互联网公司假设你和你的朋友也准备加入创业大潮中建立自己的企业.现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价拍下某个
25、人的头像可以得到这个人在社交网站的主页以及微博等相关信息当然你们已经设计了比较好的图形匹配算法及搜索算法并计划使用云计算来进行处理根据以上背景回答下面问题 1)。你们公司需要构建数据中心现在由你来负责根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些 2).在数据中心中使用虚拟化技术是必须的请说说如何部署、管理虚拟化解决方案你又如何使用商业公司的现有虚拟化产品 3)。受经济危机的影响以及公司盈利能力的不确定性风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了你需要将业务创建在云计算平台上 a)。 与建立自己的数据中心相比使用商业公司的云计算平台有什么优点和缺点 b
26、)。 云构架的基本层次有哪些并给出给出各个层次的实例.谈谈你如何在云计算平台上部署公司业务 c). 谈谈你对云计算发展的看法。 注题中商业公司包括课堂上介绍的IBM、Amazon、Google、Salesforce。com、Microsoft以及其它现实存在的涉及虚拟化、云计算业务的公司 3、举例描述aaS的概念. 云计算按照其提供的“产品”或者是用户获得资源的类型大致可以分为一些几种类别 1IaaS全称Infrastructure as a Service基础设施即服务。将多台服务器组成的“云端”计算资源和存储作为计量服务提供给用户。它将内存、I/O、存储和计算能力整合成一个虚拟的资源池向业
27、界用户提供存储资源和虚拟化服务器等服务。如Amazon EC2/S3。 2PaaS全称Platform as a Service平台即服务把服务器平台或者开发环境作为一种服务提供的商业模式以SaaS的模式提交给用户。用户在服务提供商的基础架构上开发程序并通过网络传送给其他用户最终用户.如FGoogle App EngineMicrosoft Windows Azure. 3SaaS全称Software as a Service软件即服务是基于互联网提供软件服务的软件应用模式。将应用软件统一部署于服务器集群通过网络向用户提供软件.用户根据实际需求定制或者租用应用软件.消除了企业或者机构购买、构建
28、和维护基础设施和应用程序的投入.如Saleforce online CRM. 4DaaS全称Data as a Service数据即服务是继SaaSPaaS之后又一个新的服务概念。 5MaaS全称M2M as a ServiceM2M即服务M2M是将数据从一台终端传送到另一台终端也就是就是机器与机器Machine to Machine的对话是物联网四大支撑技术之一。 6TaaS全称everyTHING As A Service虚拟化云计算技术,SOA等技术的结合实现物联网的泛在即服务. 4、写出MapReduce 分布式编程环境中的Map/Reduce原理用基本概念、关键词排序的图描述思路。
29、MapReduce 通过“Map(映射)和“Reduce(化简)”这样两个简单的概念来构成运算基本单元用户只需提供自己的Map函数以及Reduce函数即可并行处理海量数据。MapReduce实现了Map和Reduce两个功能 1Map把一个函数应用于集合中的所有成员然后返回一个基于这个处理的结果集 2Reduce对结果集进行分类和归纳 Map()和 Reduce() 两个函数可能会并行运行即使不是在同一的系统的同一时刻. MapReduce的编程方式 map程序从输入文件中读取”records”的集合执行任何需要的过滤或者转换并且以(key,data)的形式输出records的集合。当map程
30、序产生输出记录split函数对每一个输出的记录的key应用一个函数将records分割为M个不连续的块(buckets)。这个split函数有可能是一个hash函数而其他确定的函数也是可用的.当一个块被写满后将被写道磁盘上。然后map程序终止输出M个文件每一个代表一个块(bucket)。 排序程序处理10的10次方个100个字节组成的记录.这个程序的Map函数从文本行中解析出10个字节的key值作为排序的key并且把这个key和原始文本行作为中间的key/value pair值输出.我们使用了一个内置的恒等函数作为Reduce操作函数.这个函数把中间的key/value pair值不作任何改变
31、输出。最终排序结果输出到两路复制的GFS文件系统. 5、简述Azure/VMware云的对比与不同描述四点以上(优缺点)。 1Windows Azure基于一个灵活且易于管理的基础设施为用户提供服务即IaaS与此同时还可以提供一系列基础设施服务平台即服务和软件即服务解决方案.而VMware目前则主要只提供基础设施即服务IaaS。 2Windows Azure提供了从硬件到应用程序的全面集成监控和管理而VMware都没有包含对应用程序的全面监控和管理。 3Windows Azure提供了简便灵活的云端解决方案有丰富的价值和多样化的选择能够以更少的成本、人力轻松实现云部署而VMware使用了大量的
32、组件来创建自己的云解决方案其中一些更是只限VMware最昂贵许可等级才能使用另外一些组件需要单独的许可以及额外的费用。 4Windows Azure提供了一整套免费的云端基础设施工具为客户带来更好成效的简便方法而VMware没有提供类似的工具. 6、举一个例子描述paas云产品(不可以是GAE)总结五点做技术描述。 7、假设应用企业软件如何通过云计算转化成服务,如webservice服务进行改造安全和隐私问题如何兼顾 保证访问安全有如下一些做法 访问应用的授权与签名.客户端系统或应用接入云服务前必须经过云服务商的认证。认证结果以授权码方式交给客户方。以后的每次访问客户方都需要出示授权码或请求使
33、用授权码进行签名。系统返回的结果也同样由系统证书进行签名以达到通信双方的互信. 时间戳方式。对于异步系统使用时间戳及唯一的客户端ID作为请求的序列号系统返回时同样使用相同的方式构造序列号以进行适配。 幂等检查.通过客户端生成唯一的序列号服务端可以检测客户端命令是否重复发送如有重复将直接抛弃。幂等检查可以保证所有服务请求都是一次性且唯一的即使被恶意截获并通过网络设备重播也不会执行. 通过安全白名单进行控制.通过白名单制度系统保证只有经过安全认证的客户端能够接入通常可以通过认证证书实现这是最严格的访问限制。 8、通过云计算做数据中心DCdatacenter的关键问题是什么怎么解决 1提示 数据中心
34、的选址标准 1、大量的廉价电力 2、绿色能源更注重可再生能源 3、靠近河流或湖泊设备冷却需要大量水源 4、用地广阔隐秘性和安全性 5、和其他数据中心的距离数据中心之间的快速链接 6、税收优惠。 2云计算datacenter一个数据中心或数据中心或数据中心或数据中心是一个设施用于内部计算机系统和相关的部件如电信和存储系统。它一般包括冗余或备份电源冗余数据通信连接环境控制例如空调消防和安全设备。 1经营和管理运营的电信网络 2提供数据中心应用程序直接向承运人的客户 3提供托管应用三分之一方提供其客户服务 4提供一个组合这些和类似的数据中心的应用。 9、GFS经典结构描述。 GFS的架构:一个GFS
35、集群包含一个单独的Master节点、多台Chunk服务器并且同时被多个客户端访问如图所示 GFS的工作过程: 1客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引向master主发送包含文件名和块索引的请求 2。master收到客户端发来的请求master向块服务器发出指示同时时刻监控众多chunkserver的状态.Chunkserver缓存master从客户端收到的文件名和块索引等信息。 3master通过和chunkserver的交互向客户端发送chunkhandle和副本位置。其中文件被分成若干个块而每个块都是由一个不变的全局唯一的64位的chunkhandle标识.Handle是由master在块创建时分配的。而出于安全性考虑每一个文件块都要被复制到多个chunkserver上一般默认3个副本 4客户端向其中的一个副本发出请求请求指定了chunk handlechunkserver以chunk handle标识chunk和块内的一个字节区间。 5。客户端从chunkserver获得块数据任务完成。 通常Client可以在一个请求中询问多个chunk的地址而master也可以很快回应这些请求. 10、HDFS结构描述. 11、hadoop结构描述