1、 从云计算到雾计算的范式转变 基金项目:计算机软件新技术国家重点实验室(南京大学)开放课题(No. KFKT2014B21);作者简介:方巍(1975-),男,副教授,博士、博士后,中国计算机学会高级会员,主要研究方向为智能信息处理、云计算和大数据分析。 方巍1,2,3 (1南京信息工程大学, 江苏省网络监控中心,计算机与软件学院,江苏 南京,210044 2计算机软件新技术国家重点实验室(南京大学),江苏 南京210046 3佛罗里达大学,电子与计算机工程系,美国 盖恩斯维尔32608) 摘 要 虽然云计算的应用越来越广泛,但其具有如不能支持高移动性、
2、不支持地理位置信息及高时延等亟待解决的问题。为此,雾计算已经出现,将云计算扩展到网络的边缘,以减少延迟和网络拥塞.本文首先介绍了雾计算的概念、特点和结构,然后讨论了具有代表性的应用场景以及雾计算安全问题。并对雾计算相似的原位计算和连续计算也进行了介绍.最后,给出了云计算与雾计算的区别与联系,并分析了雾计算未来发展方向。雾计算扩大了以云计算为特征的网络计算范式,将网络计算从网络的中心扩展到网络的边缘,从而更加广泛地运用于更多的应用形态和服务类型。 关键词:大数据,物联网,云计算,雾计算,原位计算,边缘计算 中图分类号:TP393。4 1 引言 近年来,随着大数据、云计算、物联网技术的广
3、泛应用,越来越多应用把大量数据存放到“云”里去计算或存储.这样,就解决了目前电脑或手机存储量不够,或者是运算速度不够快的问题,也带来了很多其他益处。这里所谓的“云”的核心,就是装配大量服务器和存储器的“数据中心”.同时,随着物联网技术运用,今后各种家庭电器以及大量传感器,包括嵌入在可穿戴设备里的传感器都会连网,从而产生极其大量的数据。而大量数据的发送和接收,可能造成数据中心和终端之间的I/O(输入输出)瓶颈,传输速率大大下降,甚至造成很大的时延。虽然现今计算资源大多存放在数据中心托管,巨量的数据集从分布式机器,显示器,测量仪和各种传感器中产生。例如,大约有3000万个监控摄像头部署在美国,一周
4、生成超过40亿小时记录[1]。甚至一个摄像头也能生成几百个GB级的日常数据[2].同样,智能传感器用于监测范围广,一个星期内很容易生成一些TB级的数据[3]。此外,今天的快速增长的科学数据集(例如,气候数据和基因组数据),通常分布在世界各地的众多站点和研究机构中。这些位置相关数据的广域协作通常需要每年日常PB级数据共享[4]。根据Gartner公司最近的一项研究,大数据时代将所有这些分布式数据集中到一个中心位置进行处理无论从技术上还是经济上来说都是不可行的[5]。如果说现在用了大量电能来维持的云计算中心,还能给广大用户提供互联网云服务的话,当数据传输量进一步成指数式增长,可能这个云中心会无法再
5、维持下去。 从分布式来源产生的海量数据给目前数据移动带来巨大挑战,特别是当数据的体积和速度超越今天的商业机器的运行能力和容量。海量的数据移动将带来巨大的管理费用如图1所示。图1(a)为典型的网络速度传输1TB数据所需的传输时间。没有高吞吐量和可伸缩的网络,它可能需要花费数天或数周来移动TB级数据到云中[6,7].而10GB以太网接入设备和新兴的40GB以太网正成为数据中心的核心骨干网接入方式,但由于高成本代价它们仍然还没有广泛采用在网络边界中(如靠近数据源那部分)(CAPEX)[8,9]。因此,亚马逊网络服务(AWS)和谷歌离线磁盘输入允许用户通过寄送硬盘来加速批量数据的迁移[10,11]。
6、尽管有一些第三方解决方案,如CERN的File Transfer Service[12]和LIGO的Data Replicator[13]可以提供高级的数据移动,但它们往往需要复杂的软件和专用的基础设施,因此仅限于极少数科研社区使用[14]。 (a)传输时间 (b)传输代价 图1 巨大数据移动带来的管理费用 Fig. 1 The overhead associated with bulk data movement 此外,与数据迁移相关的运营成本(OpEx)也快速增长.例如,Globus,沿用已久的批量数据共享服务提供商,收费为每月1950美元
7、300 TB的数据传输量[15]。截至2014年1月,亚马逊的收费从它数据中心传输1TB数据超过60美元,如图1(b)所示。更重要的是,对于许多数据驱动项目由于缺乏宽带接入,数据移动问题变得特别严重。例如石油/天然气勘探[16],农村地理测量[17],偏远地区的天文观测[18],野生动物行为研究的视频监控[19]和非洲地区流行病监测(如,埃博拉病毒).虽然在某些情况下,卫星/微波传输已被使用,但它每月超过数千美元且非常有限网络带宽的花费。 为了解决上述问题,可以不再拘泥于云计算,并研究如何在物联网设备上存储和处理它们自身产生的数据,或者是在设备之间、网络上。不用不断地移动巨量的数据到中央数据
8、仓库进行处理,放在设备边缘进行处理如嵌入原位服务器系统(in—situ server systems).把服务器中大部分数据集放到数据预处理部分所在位置进行处理。即在终端和数据中心之间再加一层,叫网络边缘层,如再加一个带有存储器的小服务器或路由器,把一些并不需要放到“云”的数据在这一层直接处理和存储,可大大减少“云”本身的压力,既提高其处理效率,也提升其传输速率,减低了时延。如最近思科公司提出的称为雾计算(Fog Computing)的原位数据处理模式,能有效防止云系统过载[21],但它目前只能使用思科自己的路由器来处理网络流量。另外原位计算(in—situ computing)的概念提出也被
9、应用在高性能计算(HPC)社区,用以解决计算密集型工作负载的I/O开销[22,23]。本文后续章节中,将进一步探讨云计算、雾计算、边缘计算和原位计算的概念、原理、应用和相互之间区别和联系等。 2 雾计算概念与应用 物联网技术推动各种业务转型,通过连接日常的对象和设备,和云托管服务,正在推动着我们的生活和商业的各个方面的数字转换。物联网越来越多的连接的设备正在以指数级速率创建数据。目前的“云”物联网架构导致基础设施和连接的限制和缓慢的采用,并减少通过这种转换技术可以实现的价值。相反,有选择地移动计算,通信,控制和决策的网络边缘的数据正在生成的是一个新兴的领域,这被称为雾计算(Fog Comp
10、uting)或边缘计算(edge computing)。目前的构建方法不能维持物联网的增长速度和体积要求。一种被称为雾计算的方法可以解决基础设施和连接的挑战,强调更接近数据产生或使用所在地的信息处理。可见,雾计算处于云计算与边缘设备之间,其所处层次如图2所示。 图2 雾计算在云和边缘设备之间 Fig. 2 Fog between edge and cloud 2.1 雾计算定义与特点 雾计算(Fog Computing)是云计算(Cloud Computing)的延伸概念,由思科公司(Cisco)首创。这个因“云"而“雾"的命名源自“雾是更贴近地面的云”这一名句。根据Openfog
11、社区定义雾计算[24]是一个系统级的水平架构,在网络的边缘连续提供了从云到终端的有吸引力的计算能力、存储容量和网络服务。具体如, l 水平结构:支持多个垂直行业和应用领域,为用户和商业提供智力服务; l 云到终端的连续服务:能提供接近云和终端之间分布任何地方连续的服务和应用程序; l 系统级:通过云在网络边缘对终端进行延伸,即终端和数据中心之间再加一层,叫网络边缘层,把一些并不需要放到“云”中的数据在这一层直接处理和存储。如图2所示。 根据Wiki百科的定义[25],雾计算[26 ]或雾的网络,也被称为雾,是一种体系结构,在一个或一个众多协同的终端用户或用户边缘设备附近进行大量的存储(
12、而主要不存储在云数据中)、通信(而不在互联网骨干路由上)、控制、配置、管理和测量(而不通过如那些主要用于控制的LTE核心网络的网关)。雾计算可以在巨大的云系统和大数据结构中被感知,使得在客观上获取信息的困难越来越大。这导致获得缺乏高质量的内容。雾计算在云计算和大数据系统的影响有所不同,但有一个共同的方面就是可以提取是一个有限、准确的分布内容,尝试提高解决的问题的精度[27]。 雾计算主要具有以下特点: l 处于边缘位置,低延迟和位置和内容感知。这对于目前正在蓬勃发展中的物联网有着十分重要的意义,如网上游戏、视频传输、增强现实等也都需要极低的时延。 l 地理分布广泛。这正好与集中在某个地点
13、的云计算(数据中心)形成强烈的对比。 l 海量节点数。有大量网络节点的大规模传感器网络,用于监控环境。 l 无线接入的主导作用.对于雾计算来说,手机和其他移动设备可以互相之间直接通信,信号不必到云端甚至基站去绕一圈,因此可以支持很高的移动性。 l 实时分析与近源控制。支持实时互动,支持云端在线分析。 l 异构性.不同的形式因素,不同的环境,支持多样化的异构软硬件设备。 从上可知,雾计算是一种新的云计算服务模式,又称边缘计算,它利用了虚拟化的基础设施更接近最终用户,在云的边缘进行处理的好处,包括更少的带宽和网络应变,降低成本,减少延迟,和更多的访问。这样的计算既扩展了云的能力,同时又降
14、低组织利用它的要求。雾计算和云计算名称一样,两者十分生动形象。云在天空飘浮,高高在上,遥不可及,刻意抽象;而雾却现实可及,贴近地面,就在你我身边。雾计算对企业来说有着明显效果:企业大量的内部数据不用传到“云”里再从“云”里传回来进行处理,而是直接通过身边的“雾”来直接处理,这样减少了数据传输消耗则能大大提高企业业务效率和降低运营成本。对个人而言,雾计算也能提供快速有效服务,如手机中软件需要升级,也不必到“云”里去升级,只需在最近的“雾计算”的设备 (如小区内)升级就可以快速解决。 2.2 雾计算结构 雾计算的设备本质上是异构的,且部署在各种环境中,如核心、边缘、访问网络和端点.因此,雾结构
15、应能跨平台进行无缝资源管理.雾节点部署在不同环境和异构的核心、边缘、访问网络和端点中,雾计算结构应能方便无缝管理这些平台设备资源。一种参考的雾计算结构如图3所示[30]: 图3 雾计算结构[30] Fig。 3 Architecture of Fog computing [30] 雾结构设计应采用能适用于不同的应用程序间访问的通用API,如图3所示的雾平台。雾平台主机不同的应用程序属于各种不同领域,如智能互联汽车、智能城市、石油、天然气、智能电网等。雾平台应提供必要的方法来满足基于分布式策略的业务流程,可扩展管理的各个子系统和提供整体服务。雾平台主机中不同的应用程序属于各种环境,智能连
16、接车辆到智能城市、石油和天然气和智能电网等,因此,这种架构应该能公开通用并可以在雾平台中不同的应用程序中灵活使用.它还能促进一些基于分布式策略的方法在可扩展管理的业务流程和整体服务中应用。参考雾结构的各组成部分含义如下: 2。2。1 异构物理资源层 上述讨论的雾节点是异构的。它们从高端服务器,边缘路由器,访问点,机顶盒,甚至终端节点,如车辆、传感器、手机等。不同的硬件平台有不同级的内存,二级存储和基础设施支持新的要求.这个平台运行各种操作系统,软件应用程序具有广泛的硬件和软件功能。该雾网络设施也是异构的,从连接企业数据的高速连接到多个无线接入技术到边界(如:3G、4G、LTE,WiFi等)
17、 2。2。2 雾抽象层 雾抽象层通过自定义的资源管理API和用户界面(UI),可以提供一致性的基础设施使它能在不同异构平台中访问、控制。使用这些API内存、网络、能源和CPU等物理资源和物理机器监控和管理不同系统管理程序,服务器实例和容器。资源的有效利用是由在物理机上运行的具有虚拟化技术和多租户支持的操作系统数量决定.在相同的物理基础设施中,多租户通过通用API考虑相同设备上不同租户系统的安全、隔离和隐私情况。单一的特定模式可以持续提供隔离的所有服务.对于管理员而言,该抽象层暴露了逻辑和物理网络以及该网络中每个租户的资源使用情况。 2.2.3 业务流程服务层 雾业务流程服务层策略采
18、用基于动态雾服务生命周期管理。雾的服务和基础设施自然分配。考虑到雾能力要求大量雾节点、范围广服务,需要采用先进技术和组件,如: l Foglet,可持续性业务流程层上体积尽可能小的软件agent(代理),它遵循这一层边缘设备必需的功能。 l 一致和分布式存储资源能力,高性能,易于检索和更新. l 业务流程和资源管理通过消息总线进行传输控制信息服务。 l 本地执行和存在一个分布式策略引擎的单一全局视图. 2。2。4 Foglet软件Agent 几个Foglet软件雾平台,分布式雾业务流程框架由Foglet软件agent运行在每个节点的API来监控物理机和部署在机器上的服务状态和健康
19、情况。为了全局处理需要,该信息被推送到分布式存储和进行本地分析,承载客户操作系统,服务容器,并配置和消除服务实例等。Foglet负责这类生命周期管理等活动。Foglet agent使用抽象层,雾结点上的Foglet在物理机、管理程序、客户机操作系统、服务容器和服务实例的实体范围内进行交互。对于程序化的管理和控制,Foglet则通过抽象层API调用这些函数,所有这些实体都实现了所需功能. 2.2.5 分布式数据库 为增加雾计算的可扩展性和容错性,分布式数据库可以很快地存储和检索数据而不是采用集中式数据系统。应用数据和必要的数据库元数据存储辅助雾服务业务流程。这样的样本元数据有:雾结点的硬件和
20、软件能力使服务实例与平台能力相匹配.负载平衡,生成如运行服务实例和雾节点的健康及其他状态信息的性能报告。配置这类服务的生命周期,安全执行和嵌入的业务策略. 2。2.6 基于策略的业务流程服务 基于公开策略的业务流程框架的路由服务,如,传入的服务请求被路由到指定的所需的服务实例确认业务策略相关.这个框架,有助于基于策略的业务流程服务。业务流程框架是管理员通过一个直观的交互面板(UI)进行操作。业务策略通过UI和策略模板管理和监控雾平台并根据需求进一步细化。 这些策略包括: l 用于指定负载平衡的阈值的策略如作为最大用户数,连接和中央处理器负载等。 l 用于指定服务质量(QoS)的要求如
21、网络、存储、计算最低延迟和最大速率等的服务。 l 在一个特定的环境配置设备和服务实例。 l 用于租户/雾平台相关联的电源管理能力。 l 指定在多租户隔离的安全和隐私,如视频服务前的防火墙。 2。3 雾计算应用 下面主要讨论雾计算几种代表性的应用场景,进一步理解雾计算概念和原理。比如无线传感网络,它的特点是极低的功耗,电池可以5到6年换一次,甚至可以不用电池而使用太阳能来供电。这样对网络节点要求极低,只须很低的带宽及低端处理器以及小容量的存储器即可。传感器可用于收集环境中的温度、湿度、雨量、光照量等数据,这样就不需要把这些大量数据传到“云"中去处理,而直接在“雾”里进行处理就行了.这就
22、是雾计算的典型应用之一.雾计算能满足这些情况下的应用程序的要求,很多领域也能受益于雾计算。 2。3。1 车联网 雾计算的一个典型用例是车联网中一个智能交通灯系统,它可以改变其信号的基础上传入的交通监控,以防止事故或减少拥塞.数据也可以被发送到云计算的长期分析。这个系统把交通灯作为网络节点,可以和传感器一起进行互动.传感器可以探测出行人或骑自行车人的出现情况,测量出正在接近的汽车的距离和车速。通过雾计算,这些智能交通灯可以与邻近的智能交通灯进行协调,可以对接近的汽车发出警告,甚至可以改变红绿灯亮的周期,以避免可能出现的交通意外.最后,雾计算服务器里的智能交通系统数据,将传到“云"里,再进行全
23、局数据分析,如图3所示[31]。在道路沿线路边的单位和智能交通灯部署各种无线接入点如WiFi、3G和4G。车辆到车辆,车辆到访问点,和访问点间的相互作用,都是雾计算在这方面的应用。 图3 雾计算在智能交通灯和关联交通中应用 Fig. 3 Fog Computing in smart traffic lights and connected vehicles [31] 2。3.2 无线传感器和执行器 传统的无线传感器网络在应用中存在传感和跟踪不足问题,即使超出了传感和跟踪应用,但仍需要执行器施加相应物理动作,如打开,关闭或甚至携带传感器[31].在这种情况下,作为雾设备的执行器可以自行控
24、制测量过程,通过创建一个闭环系统来保证其稳定性和振荡行为。例如,自维护列车情况,列车的球轴承的传感器监测可以检测到热水平,允许应用程序发送一个自动报警信号给火车操作员在下一站停下来进行紧急维修,从而避免可能存在的脱轨发生.在采矿的救生通风口情形中,矿山传感器在通风口监测空气的流入和流出情况,如果空气条件变得对矿工危险,则系统自动改变空气流量。因此,上述情况下的控制测量过程中都需要雾设备的执行器。 2。3.3智能分散系统控制 该情况下,在建筑物环境中使用传感器测量温度、湿度和各级不种气体情况,这些传感器可以和放置在不同位置的雾设备之间进行信息交换。然后,合并这些可靠测量收集到的信息,执行器根
25、据其结果做出相应的反应. 同样,在列车上,自我维持的传感器能检测每个车厢的空气水平,系统可以协同工作调节温度,打开窗户放入新鲜空气.传感器也可以跟踪和对不同运动做出反应(例如,打开或关闭灯)。雾装置可以被分配在每一层,并可以和更高级别的驱动合作。随着雾计算应用在这种情况下,智能建筑可以维护自身材料、外部和内部环境,以达到节约能源、水和其它资源目的.有雾计算的场景驱动可以实现对智能建筑外部和内部结构的节能。这种情况下的应用提供了便利的无线传感器部署测量建筑物空气中的温度、湿度或各种气体的水平。信息可以在地板上的所有传感器之间交换,它们的参数可以综合起来以形成可靠的测量数据。传感器将使用分布式决
26、策和雾设备执行器对数据做出反应. 2。3。4 软件定义网络 (SDN) 由于在网络和计算机的所有新兴技术中雾计算越来越受到欢迎,另一个有用的概念即软件定义网络(SDN)也在车联网新兴领域得到广泛应用.在集中的服务器上进行控制,并通过服务器建议的路径在所有的节点之间进行通信.通信和路由不涉及多跳的概念,即使在无线传感器,无线局域网和网格中。 图4 车载网SDN中雾计算 Fig. 4 Fog computing in SDN in vehicular networks[32] 如图4所示,雾计算框架可以应用于车载网络的SDN(software defined network)理念。车载
27、网络SDN的概念最早是在文献[32]中提出。SDN是一种新兴的计算和网络范式,并成为IT业最流行的话题之一。它分离控制和数据通信层。控件是在一个中央集中服务器上完成的,节点遵循通信路径由服务器决定。集中式服务器需要分布式实现。SDN的概念,研究了无线局域网,无线传感网的网络,但他们不涉及无线通信、多跳路由。此外,在这种情况下,没有同层之间的沟通。SDN的理念与雾计算将解决车载网络,主要问题有间歇性的连接,碰撞和高丢包率等,可通过增加车辆和车辆到基础设施的通信和集中控制来解决。这样,提高了同行之间、车辆与车辆之间的通信差距。但随着雾计算与SDN的出现缩小了车载网络之间的差距,并降低了丢包率[33
28、]. 其它应用领域如农业、气象行业。农业包括但不限于肉类和奶制品的生产、养殖、蔬菜、水稻、玉米栽培、作物、生物(包括藻类)等,在许多地区,农业是优化和收益是由大中型企业农场的最大化来体现。这些农场已经进行了一场技术革命,以确保他们有正确的作物,适用正确的除草剂和农药,并最大限度地利用水资源,以最大限度地提高农作物利润和产量.也就是说,进行本地化的雾计算,对于农业领域仍然是一个巨大的机会,可为农业发展做出了积极的作用。气象领域同样也大有作为,在各种艰苦和复杂的环境下,各类气象传感网络设备等可以通过雾计算进行互联互通,完成本地化计算再传输到气象云计算服务中心进行集中处理,这样大大降低气象网络传输
29、处理和维护成本。表1归纳总结了目前雾计算在各个领域中的应用情况. 表1 雾计算主要应用 Table 1 Fog computing applications 应用领域 主要内容 1、车联网(Connected Vehicles) 车联网分布显示了交通连接和交叉网络情况:小汽车到小汽车,小汽车到访问点(Wi-Fi,3G,智能交通灯)和访问点到访问点。 2、无线传感网和执行器网络 真的无线传感网结点(WSNs)为了扩展电池使用寿命或降低能耗则能工作在低电源情况。大多数WSNs包括大量低带宽,低能耗,低处理电源,微内存,通过一个收集器以单向方式工作。 3、物联网和信息物理系统(
30、Cyber—Physical Systems) 雾系统正成为物联网和信息物理系统重要的分支.物联网能够通过网络的识别地址来连接普通物理对象。信息物理系统也能组织企业电脑和数据中心的物理和工程系统。 4、软件定义网络(SDN) 软件定义网络(SDN)沿着雾平台决定交通网络、非正常连接、冲突和高丢包通过设施间通讯和一致控制来满足车辆到车辆间控制。 5、非集中控制的智能楼宇控制 开发的应用可以通过无线传感器定位、监测温度、湿度和建筑物环境中各种气体情况。这种情况下,信息可以通过各层所有传感器结点进行交换,分析合并成持久的测量结果. 2.4 雾计算安全问题 雾计算环境下,同样存在着安全
31、性和隐私问题.目前,智能电网和设备之间通信,已有一些云计算的安全解决方案。然而,现有方法可能不适合雾计算,因为雾设备工作在网络的边缘。雾装置的工作环境将面临许多威胁,和良好管理的云计算中情况不太一样。主要的安全问题是在不同层次的网关认证,如在智能电网的情况下,智能电表安装在消费者家里,每个智能电表和智能设备都有一个IP地址。一个恶意的用户可以篡改自己的智能仪表,报告错误的读数,或使用虚假的IP地址.现有一些解决方案如认证问题.文献[34]阐述了公钥基础设施(PKI)为基础的解决方案,包括组播认证.一些使用的身份验证技术Diffie—Hellman密钥交换技术[35]。入侵检测技术也可以应用于雾
32、计算[36]。在智能电网的入侵中可以使用基于签名的检测方法,在该方法中,观察和检查现有的数据库来判断可能的越轨行为.入侵也可以使用基于异常的方法进行捕获,观察行为与预期的行为可有偏差来识别。 在隐私问题上,如智能电网中,隐私问题处理隐藏的细节,如什么设备在什么时候使用,同时允许正确的精确充电汇总信息。现有一些采用超递增序列结构的多维数据和结构化数据的加密同态密码技术.同态函数需要从智能电表的输入并产生一个加密的加密数据汇总结果。雾装置无法解密智能电表的读数并篡改他们,这样保证了智能电表收集到的数据的隐私,但不保证雾装置能传输正确报告到其它网关。数据通信从用户到智能电网操作中心,在无需解密的本
33、地网关上直接对加密文本进行数据聚合。认证成本可通过批量验证技术降低。 综上所述,雾计算的本质是,采用一种分散的方法在边缘设备处进行计算。雾计算正好与分布式计算,甚至有一定的弹性计算能力的计算相吻合。当配置资源的需求,一个可以做最有效地的本地化处理方式,是雾计算不可或缺的优势,尤其是当这些资源包括不断将物联网、云计算应用程序数据流和其他方面的大数据量的巨大数据传输量。可以说,在这方面,雾计算是云计算(而不是替代)的一个重要和有益的补充。 3 与雾计算相关计算范式 随着云计算、物联网技术的进一步发展壮大,互联网中出现一些新兴物联网的网络部署和应用问题,具有对位置感知和低延迟要求,最明显的就是
34、对移动性的支持以及地理位置分布情况需求,这就需要一些新兴的计算平台来满足.如前述的雾计算,原位计算、传输计算(in-transit computing)以及边缘计算等。下面就对与雾计算范式相似主流的原位计算和边缘计算加以介绍. 3.1 原位计算(In—Situ Computing) 近年来,已经看到海量分布式数据源的数据量急剧爆炸,如无处不在的摄像头和各种传感器。对这些地理上分散的数据集进行分析的主要挑战是由于数据传输开销明显,数据聚合过程耗时,以及对能源需求的不断增加等。而不应将大量的原始数据不断地传输到远程大规模数据仓库的计算系统来处理,这可利用原位服务器系统(In-Situ Serv
35、er Systems)有助于预处理这些数据,例如,把计算留在数据所在的位置。据维基百科定义,原位计算(In-Situ Computing):它的意思是“局部”、“现场"、“现场”或“到位”来描述一个事件在何处发生,并在许多不同的环境中使用.例如,在物理,化学或生物学等领域,在原位可以描述测量的方式,即,在同一个地方的现象发生,而不与其他系统隔离,或改变测试的原始条件。原位计算的概念已经在高性能计算和系统研究界为解决I/O开销问题上被提出。几项研究提出在科学应用产生数据的同时执行数据分析 [36,37,38]或从计算节点到存储服务器的移动计算[39]。然而,它们只看到数据中心内原位计算情况.它们
36、既不能解决了大容量数据移动问题,也不能解决当今数据中心面临的超大电源预算挑战问题。一些网络研究还尝试在接近数据源的网络边缘进行计算。但是,这些方法受限于传感器节点和网络路由器,缺乏用于处理海量数据的必要存储容量和计算能力. 原位计算与雾计算数据处理模式非常相似,都能有效防止云系统过载情况,但它与雾计算最大区别目前主要是因为思科雾计算只能使用自己公司的路由器设备来处理网络流量,通用性上还存在不足。原位计算的核心思想是提供非侵入性的、环保型数据处理,尽量减少大数据时代传递数据到计算资源的开销.一个典型的原位计算系统如图5所示[39]。 图5: 作为将来云中辅助的In-situ服务器系统 Fi
37、gure 5: In-situ server system as an ancillary to future cloud[39] 根据系统中数据流的处理方式可以分为:间断性批处理作业和持续数据流方式.原位计算主要应用场景如下: 油气勘探(间断性批处理作业方式):石油和天然气工业中,大量的地震数据收集和分析用于指导站点选择和钻井.一个石油勘探工程可能涉及数以万计的微地震测试而每个测试可以生成多个TB级数据.传统上,这些在远程高性能计算集群处理实验数据,通常依赖于昂贵的通信传输设备(例如通过商业卫星)或通过便携式存储设备花费大量时间进行传送。 视频监控(持续数据流方式):监视相机通常部署在
38、很难触及或危险区域提供野外生活、火山活动和地方流行病的来源等行为的理解,这些项目中大部分需要大量远远超出传统的视频监控系统性能的实时和高保真数据。传统的解决方案导致巨大的人力(例如,手动数据检索)和研究人员暴露在危险之中。它也会带来显着的数据存储开销和耗时的数据聚合过程。 物理地理和地球科学(间断性批处理作业和持续数据流方式):在原位通常描述的自然材料或过程之前,运输。例如,在原位使用的风化和侵蚀之间的区别,不同的是,侵蚀需要一个传输介质(如风,冰,或水),而在原位发生风化.地球化学过程也经常被描述为发生在原位的材料.在大气科学中,原位是指通过与各自的主题直接取得联系,如无线电探空仪测量包裹
39、空气或风速仪测量风速,而遥感如天气雷达或卫星。 3。2 边缘计算(Edge computing) IBM也在开发类似功能产品,他们将计算推到边界(to the edge).即所谓的边缘计算或边界计算(edge computing),就是在互联网与现实世界的边界进行计算.数据中心是网络的中心,PC、手机、监控照相机则处在网络的边界上。随着对高品质内容的期望日益增长,物联网的成长将帮助终端用户更加贴近边缘计算节点。根据维基百科定义,边缘计算是推动前沿的计算应用程序,数据和服务,远离集中式节点的逻辑终端的网络[40]。它分析处理发生在数据源端产生的数据。该方法不需要持续不断连接网络资源,如笔记
40、本电脑、智能手机、平板电脑和传感器[41].边缘计算涵盖了众多现有网络技术如无线传感器网络、移动数据采集、移动特征分析,协同分布式对等网络与处理、本地云/雾计算和网格/网格计算、露计算[42],移动边缘计算[43][44]、微云、分布式数据存储和检索、自主自愈网络、远程云服务和增强现实等[45].目标用户是任何互联网客户端使用的商业互联网应用服务。边缘计算带来了一定的限制,技术平台,应用程序或服务的选择,所有这些都需要专门开发或配置的边缘计算. 边缘计算推动应用程序、数据和计算能力(服务)远离集中的服务器而指向网络的逻辑终端.边缘计算复制的信息跨分布式网络的Web服务器,包括许多网络的片段,
41、可能这些数据量是巨大的。作为一种拓扑模式,边缘计算也被称为网格计算、对等计算、自主(自愈)计算、网格计算等非集中、无节点的名字。为了确保广泛分散的分布式服务的可接受的性能,大型组织通常实施边缘计算,通过部署Web服务器与聚类。以前只提供给非常大的企业和政府组织使用,随着技术进步和成本降低的大规模实现从而使小型和中型企业也能使用该项技术. 边缘计算有许多优点: 1、边缘应用服务显着减少必须移动的数据量,以及远程数据的传输,从而降低传输成本,缩短延迟时间,提高服务质量(QoS). 2、边缘计算有助于限制或消除一些中心服务器存在的主要瓶颈和潜在的故障点。 3、随着加密数据的进一步移动向网络核
42、心延伸,其安全性也要提高。当它接近企业时,数据须被检查,因为它通过受保护的防火墙和设置的安全点,所以其中的病毒、威胁性数据和主动性黑客可以在早期被系统捕获。 4、虚拟化能力(如CPU逻辑组性能可根据需要实时延伸扩展)。边缘计算市场一般是基于付费的网络服务模型,典型的客户的边缘服务是渴望组织规模的业务和应用性能之间以线性增长。 4 云计算与雾计算区别与联系 云计算存在一些诸如不能支持高移动性、不支持地理位置信息及高时延等等问题,而雾计算正好能够解决这些问题,同时又可带来大量新的应用和新的服务。雾计算提供了当地节点分布的地理位置信息,信息传递的时延非常低,而云计算则提供了中心化的全局信息。雾
43、计算有很多优点,但涉及到未来大规模部署雾计算设备,也同样会遇到各种问题,比如网络堵塞、软件架构、安全、隐私以及采用什么商业模式等等,不过这些问题在不久的将来一定能得到解决。与云计算相比,雾计算所采用的架构更呈分布式,更接近网络边缘。雾计算将数据、数据处理和应用程序集中在网络边缘的设备中,雾计算不像云计算那样,要求使用者连上远端的大型数据中心才能存取服务。数据的存储及处理更依赖本地设备,而非服务器。所以,云计算是新一代的集中式计算,而雾计算是新一代的分布式计算,符合互联网的“去中心化”特征。除了架构上的差异,云计算所能提供的应用,雾计算基本上都能提供,只是雾计算所采用的计算平台效能可能不如大型数
44、据中心。 雾计算与云计算之间对比情况如表2和表3所示. 表2 云计算与雾计算对比I Table 2 Comparison between cloud computing and fog computing I 要求 云计算 雾计算 地理上分布情况 集中式 分布式 服务器结点数 少量 巨量 移动支持 有限支持 支持 实时交互 支持 支持 最后英里连接类型 专线 无线 延迟性 高 低 时延抖动 高 低 服务器结点位置 网络中 网络边缘 客户端和服务器端距离 多跳 单跳 安全性 不可定义 可定义 数据路由攻击 高可靠性 极
45、低可靠性 位置敏感 无 有 表3 云计算与雾计算对比II Table3 Comparison between cloud computing and fog computing II 内容 云计算 雾计算 处理方式 数据和应用在云中处理,对于大数据处理是耗时的 不用在云中心进行处理,雾操作在网络边缘进行,这样消耗很少时间。 带宽要求 带宽问题,通过云通道传输每个字节数据 不太关注带宽问题,因为每个结点的数据都在相应访问点进行处理而不须通过云通道 响应时间与可伸缩性 因为依赖远程服务器,故存在低响应时间和可伸缩性问题 通过用户可见小型边缘服务器,雾计算
46、平台可避免响应时间和可伸缩性问题 云计算需要大量带宽,而无线网络带宽有限。雾计算可以使所需的带宽量大大降低,原则上可使传输的数据“旁路”,即从互联网边上绕过去,使这些数据尽可能本地化.最有价值的数据仍然可以通过“云”来传输,但是大部分的数据流量可以从这些网络中分流出去,从而大大减轻了云网络的流量负担。智能交通系统、智能电网、智能汽车甚至健康医疗系统等,如果都是本地处理数据,只把最重要的数据传到“云”的话,将变得非常高效,同时可节省大量运营成本。 5结论 随着网络技术的进一步发展,未来互联网上的人及各种设备都会智能连接在一个巨大的网络中,人、数据、物联网、智能云处在核心层、边缘和端点层中。
47、通过雾计算可以进一步扩展与云之间联系,与云计算优势互补.雾计算下一步发展,将优化雾计算结构,定义一种应用结构满足各种异构设备、资源、应用程序和系统之间相互操作以及提供应用镜像服务,形式相应的雾计算API,提供更广泛更智能的商业化服务,拓展云计算能力,在边缘存储和计算中起着决定性作用.可以说,雾计算的到来将提供了一个新的发展平台、一个新的应用程序和服务种类,为传感器供应商和应用程序开发者提供新的发展机遇与挑战。 参考文献 [1] J. Vlahos。 Surveillance Society: New High—Tech Cameras Are Watching You。 Popular
48、Mechanics, 2009 [2] Video Surveillance Storage: How Much Is Enough。 White Paper, Seagate Technology, 2012 [3] Information Optimization: Harness the Power of Big Data。 White Paper, Hewlett—Packard Company, 2012 [4] W。 Johnston, E。 Dart, M. Ernst, and B. Tierney. Enabling High Throughput in Wide
49、ly Distributed Data Management and Analysis Systems: Lessons from the LHC. Technical Report, Lawrence Berke-ley National Laboratory, 2013 [5] Gartner Says the Internet of Things Will Transform the Data Center. http:// [6] J. Gray, W. Chong, T。 Barclay, A。 Szalay, and J. Vandenberg。 TeraScale SneakerNet: Using Inexpensive Disks for Backup, Archiv-ing, and Data Exchange. Technical Report, Microsoft Research, 2002 [7] W。 Vogels。 Expanding the Cloud: Moving Large Data Sets into Ama-zon S3 with AWS Import/Export。 Technical Blog, 2009, http://www。allthingsdis






