1、存储解决方案: 存储网络容灾备份方案设计 随着数据的可用性成为区别公司能力的重要指标,公司正在将越来越多的资源用于保证业务的连续运营。思科提供的先进技术可以帮助公司以一种更加可扩展、更加安全、更加经济的方法,建设端到端的备份和恢复解决方案以及劫难恢复解决方案。 在服务器上存有关键任务型数据的跨国公司需要为它们的应用提供不间断的可用性。为了防止数据受损,这些数据至少应当定期备份到磁带。但是,不断增长的数据容量需要更大的存储容量、更快的服务器,也需要更长的备份时间。用户还必须考虑到,花几个小时进行备份意味着需要用相同的时间来进行恢复。用户往往无法接受这么长的恢复时间,由于它会导致停机时间的延长,从
2、而导致收入的损失。因此,在很多情况下,磁带备份被视为是劫难恢复(DR)计划的最低等级。 为了保证公司应用所需要的99.999%的正常运营时间,存储设计必须在每个级别考虑高可用性因素。所有公司都应制定一个劫难恢复计划,以便在发生大规模中断时无缝地将数据转移到某个备用站点。除了磁带备份以外,公司通常需要在它们的容灾备份计划中,使用复制技术来远程复制整个数据中心。因此,恢复计划现在除了从磁带恢复数据以外,还应当涉及在发生故障时将数据中心转移到一个远程地点。劫难也许由多种因素导致,并且很难预测。下面列出了也许导致劫难的重要因素:设备故障、应用故障、人为错误、自然和非自然灾害、 每个公司都必须找出所有需
3、要保存、以实现连续访问的关键性数据,为从劫难中恢复做好充足准备。因此,用户必须进行业务影响和风险分析,以拟定对公司最重要的地点、职能或者应用。一个远程数据中心即主数据中心的镜像,可以用于在发生大规模劫难之后继续提供完整的访问。很多容灾备份解决方案都需要在将数据备份到磁带的同时,保存数据的实时镜像。复制技术还可以提供合用于不同应用需求的选项。尽管复制技术可以帮助一个公司更快地从劫难性故障中恢复,但是它也存在一定的限制,例如它会将受损数据和有效数据一同复制。因此,公司仍然需要进行磁带备份,以存档有效数据。本文着重介绍作为整个容灾备份计划的一个组成部分的磁带备份的技术、架构和选项。 磁带备份 在今天
4、的公司环境中,大多数应用服务器都是通过并行SCSI直接连接到专用的磁带驱动器上。由于需要管理的磁带设备的数量与应用服务器的数量成正比,所以专用资源的部署和维护成本都很高。但是,直接连接的磁带驱动器可以保障性能,由于服务器是唯一使用驱动器的设备。成本因素促使公司转向网络备份模式,即磁带驱动器放置在一个LAN 上,供多个服务器共享。在一个典型的基于LAN的备份模式中,数据和备份流量都会通过相同的LAN传输。这种网络备份模式有助于提高磁带的运用率和可管理性,但是也会带来一些问题,下面将具体介绍这些问题。 一方面,需要备份的大量数据会增长LAN 上的流量,导致应用性能的减少。备份通常都在下班之后进行,
5、以便最大限度地减少相应用流量的影响。不断增长的数据量会导致备份时间的延长,有也许需要占用上班时间。随着公司业务的全球化,公司对247 正常运营的规定越来越高,可以用于备份的时间也越来越短。另一方面,让备份和应用流量都通过LAN 传输,就也许会导致备份中断,进而导致备份任务全都失败。第三,备份和数据应用共用同一个LAN 经常会导致很高的成本,由于一个环境的固件升级或者不稳定性也许会导致此外一个环境的中断。为了在一个共同的LAN 中消除这些潜在的冲突,管理员建议将应用和备份隔离开。在较新的部署中,客户正在向无需LAN 的架构转型,以便隔离备份流量和应用,下面将具体介绍这种架构。很多客户已经开始部署
6、专门用于备份的存储网络。 目前部署的备份流程都是手动的,需要投入很多人力,并且经常会碰到由于人为错误而导致的故障。发生故障的备份经常不会被发现,从而导致在故障之后丢失数据。磁带必须手动插入、轮换,并取出运送到异地,以保证可恢复性。由于手动管理的成本很高,公司必须提高自动化水平,即运用自动控制装置加强对磁带的管理。集中备份应用可以将多个磁带组织成磁带池,因而大量备份可以被合并到一个磁带上。当某个磁带装满之后,备份应用会继续使用磁带池中其他未被使用的磁带,从而可以大幅度地提高可管理性。需要管理的磁带驱动器的大幅度减少有助于减少成本。 备份需要增长应用服务器的活动,以便从磁盘获取数据和将其写入磁带。
7、应用服务器通常忙于解决大量对延时和性能非常敏感的数据。数据的移动和调度需要占用额外的CPU 周期,而进行备份通常会相应用自身导致严重的影响。无需服务器的解决方案可在应用服务器自身进行备份时,消除备份对于应用性能的影响。这种架构将移动数据和安排连接的任务交给了一个专门的备份服务器。一个强大的备份解决方案必须解决下列问题: 1. 优化备份资源的使用,涉及磁带、驱动器和工作时间; 2.最大限度地减少相应用流量的影响; 3. 隔离备份域,以减少应用服务器的CPU负载。 下面几节将具体地介绍新出现的几种备份解决方案。 无需LAN的备份 无需LAN 的备份让每个应用服务器都可以通过存储网络,直接将数据移动
8、到某个磁带设备,而不需要通过专门的备份服务器。运用通用的共享存储选项,每个应用服务器都可以充当一个介质服务器,由于它们可以直接将数据发送到磁带。每个服务器拟定一个专用的磁带驱动器,并在备份过程中独占该磁带驱动器。用户还可以运用对磁带库中磁带驱动器的专用访问权限相应用服务器进行配置,而不是使用共享选项。通过存储网络传输的数据流有助于减少LAN 流量。一个磁带也可以被多个应用共享,并且可将多个备份流合并到所管理的磁带库和驱动器中。LAN 仍然可以用于在备份服务器和客户端之间传输元数据和用以跟踪数据变化位置的环境表,但是实际的备份数据将通过存储网络传输。无需LAN 的备份可以隔离数据域和备份域,但是
9、不能减轻应用服务器的CPU 负载,由于它们仍然需要从磁盘读取备份数据。下面将要介绍的服务器承担较轻的备份方式可以解决这个问题。 服务器承担较轻的备份 服务器承担较轻(或者无需服务器)的备份需要在数据不通过应用服务器自身的情况下,将备份数据从磁盘发送到磁带。在服务器承担较轻的备份中,对所要备份数据的复制对服务器上的应用影响非常小,或者主线不会导致任何影响。数据的复本随后会智能地从磁盘发送到磁带,而不需要通过服务器。这个流量有助于减轻应用服务器的CPU 负载,由于它并不处在备份数据的传输途径上。直接在磁盘和磁带之间直接传输数据的机制被称为SCSI 扩展复制命令。执行扩展复制SCSI 命令的组件也许
10、位于SAN 互换阵列或者服务器软件中。目前所部署的服务器承担较轻的备份(例如Legato Celestra Power 和Veritas NetBackup)可以通过备份服务器管理整个流程。大部分客户目前都倾向于为备份部署专门的SAN,由于这样有助于隔离数据域和备份域。因此,他们也许不会部署这个解决方案,由于磁盘子系统和磁带驱动器必须位于同一个SAN上。 备份行业和产品概述 软件供应商推出了很多集中备份软件,例如Veritas Netbackup、Veritas BackupExec、Legato Networker和Computer Associates BrightStor ARCserv
11、e 2023 高级版。所有这些产品都采用了一种集中机制,备份都是通过一个专用备份服务器和直接连接的存储设备进行。一个集中备份系统也许还需要设计很多不同的软件和硬件模块。用户必须了解备份解决方案的这些不同组件,以及它们的功能和对性能的影响。 一方面,中央或者主服务器负责控制整个备份环境,涉及索引、备份调度、客户群组定义和硬件配置。主服务器还负责记录备份中的问题,并向系统管理员报告这些问题。这项功能有时被称为连接安排。集中备份系统中的此外一种服务器是介质服务器,也被称为存储节点。介质服务器被连接到某种类型的存储介质上进行备份,通常是通过光纤通道或者并行SCSI 连接到某个磁带设备上。介质服务器负责
12、真正地将数据发送到磁带。这种服务器需要从主服务器获取关于需要备份哪些文献和使用哪些特定介质的信息。介质服务器也被称为数据输送器。第三,也是最重要的组成部分是备份客户端,它事实上指的是被备份的服务器。客户端软件将安装在每个需要备份服务的系统中。即使是主服务器和介质服务器通常也会安装客户端软件,这样它们就可以对自己进行备份。 运用SAN 进行备份的重要优势 如前所述,公司已经开始部署基于专用光纤通道的存储网络,以解决共享LAN 的性能瓶颈问题。存储网络的其他优势涉及: 提高数据可用性 存储网络基础设施可认为存储子系统(涉及磁盘和磁带)提供多条途径,以提高可用性和可扩展性。客户可以部署通过改善的劫难
13、恢复解决方案,特别是在开放的系统环境中。在传统部署中,要在一个远程站点进行劫难恢复,通常需要采用LAN 上的服务器间通信。在网络模式中,数据可以在两个存储子系统之间建立镜像连接,而无需使用价格昂贵的服务器和LAN 资源。将备份流量移植到一个存储网络会减少每个域中也许出现的故障,并可以防止备份受到LAN 数据流量的影响,反之亦然。 减少TCO 存储整合让多个服务器可以共享相同的存储设备,减少数据中心所需要的磁带库的数量。整合还让用户可以更加方便地重新分派所有服务器中未被使用的容量,从而提高资源的运用率和使用效率。客户可以部署一个公司级备份/恢复解决方案,以减少由连接到服务器上的磁带驱动器所带来的
14、管理和维护成本,从而节约大量的资金。管理每个组件的成本会由于手动流程中经常出现的人为错误而大大增长。很多机制能减少这些错误,例如远程磁带库,即通过部署自动备份系统,避免在两地间手工运送磁带。由于不需要运送用于恢复的数据,这种机制可以避免由于操作不妥而导致的损坏,减少数据流失的也许性,以及提高数据的可用性,从而提高系统的可靠性。存储网络将备份资源整合到一起,供每个服务器使用,同时减少由于某一个备份设备发生故障而导致的影响。整体运营成本(TCO)还可以通过共享备份资源的增强可扩展性、可用性、性能和可管理性而得到大幅度的减少。 灵活的备份选项 现在,很多公司都延长了营业时间,并支持来自全球各地的客户
15、,这推动了全天候运营的备份需求。现有的两种备份选项是热备份和冷备份:冷备份是指在备份期间应用数据停止更新;而热备份是指在系统进行备份的过程中,应用仍然继续更新数据。 热备份技术(例如写时复制和分离镜像快照)运用在某个特定期刻创建的原始数据镜像,在不影响应用正常工作的情况下进行在线备份。写时复制和分离镜像选项都会将数据区块复制到未被使用的存储上,以创建某个时间点的副本,大多数数据库都支持这两种技术。写时复制和分离镜像选项可以管理物理数据区块的映射流程,以及它们与某个文献系统或者数据库的关联。支持这两个选项的存储子系统供应商涉及使用业务连续性卷(BCV )的EMC Timefinder,HDS S
16、hadowImage,以及IBM 公司存储服务器(ESS)或者模块化存储服务器(MSS)中的FlashCopy。 备份部署的设计目的是缩短备份所需要的时间,最大限度地减少对用户流量的影响(特别是对于冷备份)和提高性能。热备份可以运用镜像技术无论是在本地还是远程,来保证应用的连续可用性。下面将具体地介绍远程镜像技术。 远程数据镜像/数据复制 远程数据镜像(即远程复制)是迅速恢复应用和数据的最常用机制。顾名思义,这种技术是指在磁盘子系统中创建一个镜像卷,以提供保护。应用所使用的数据卷被视为主卷,镜像卷被视为从卷。目前采用的两种重要的远程复制技术是: 1.基于主机的远程复制软件; 2.基于存储控制器
17、的远程复制硬件和固件。 目前最知名的远程复制工具涉及EMC Symmetrix RemoteData Facility(SRDF)、IBM eXtended RemoteCopy (XRC)、IBM的Peer-to-Peer Remote Copy (PPRC)、HDS的TrueCopy、康柏的Data ReplicationManager (DRM)和Veritas Volume Replicator (VVR)。IBM XRC 和Veritas VVR 解决方案都是基于主机、软件辅助的数据镜像工具,而PPRC、SRDF、TrueCopy和CRM 都是基于硬件控制器的远程复制工具。必须要指出
18、的是,Veritas(VVR)通过一个IP 网络,而不是光纤通道和ESCON(公司串行连接)提供远程数据镜像。 思科的劫难恢复产品和解决方案 随着数据的可用性成为区别公司能力的重要指标,公司正在将越来越多的资源用于保证业务的连续运营。如前所述,专用网络可以保证备份应用的性能指标和安全性。智能化存储网络可认为备份和恢复提供一个新的发展方向。此外,远程数据复制解决方案能提供更高的可用性,并通过扩展规模,满足大型公司的需要。思科提供的先进技术可以帮助公司以一种更加可扩展、更加安全、更加经济的方法,建设端到端的备份和恢复解决方案以及劫难恢复解决方案。 Cisco MDS 9000系列多层控制器和光纤通
19、道互换机以大型公司和电信运营商的存储网络环境作为服务对象,可以提供更高的端口密度、互换带宽、性能、多协议功能和可靠性。Cisco MDS 9000系列产品还可以用于综合性存储局域网,这种网络的整个存储环境中包含多个运营商的产品。在这种环境中,Cisco MDS9000系列产品可以充当一个集中系统,提供互联和高级服务。 Cisco MDS 9000系列涉及MDS 9500 系列多层控制器和MDS 9216多层光纤通道互换机。Cisco MDS 9000系列产品都是模块化的系统,针对很高的端口密度和数据中心应用的性能进行了优化。对于那些用于备份和劫难恢复的远程数据中心,Cisco MDS 9216
20、多层光纤通道互换机是一款较小的产品,但是所有功能和服务都与MDS 9500系列控制器相同。 除了这些互换设备以外,Cisco MDS 9000系列多层控制器和光纤通道互换机还可以提供多种功能和服务,例如虚拟SAN、高级ISL链路集成、LUN分区、故障通报、高可用性和不中断固件升级。目前,困扰大多数用户的一个难题,是缺少足够的可管理性和工具来对存储网络提供足够的支持。Cisco MDS 9000系列产品涉及一个强大、内嵌互换陈列管理器应用,它可以配置、监控和诊断存储网络。 虚拟SAN(VSAN) 在很多现有的环境中,备份应用解决方案设计需要为备份流量建立一个单独的并行网络。从技术和运营的角度来说
21、,虽然提高了成本,但这个独立的网络会提供一个灵活、安全且高度可用的备份解决方案。磁带存储网络与磁盘存储网络的分离消除了故障(例如磁带库(TLU)的重启)对于应用的影响。这个独立的网络还可以防止由于设备重启导致的备份故障对于应用的影响。因此,这种做法事实上已经成为将磁带设备与磁盘子系统隔离的标准做法。通过这种隔离,互换阵列配置的变化所产生的影响将只限于本地,不会导致系统的中断,从而为独立SAN 的连续部署提供了有力的支持。 尽管这些独立的存储网络可以保障性能和防止整个互换阵列的中断,但是它是一个非常昂贵的解决方案,需要购买独立的互换机,并且增长了管理的复杂性。此外,这种解决方案经常会导致一些端口
22、被废弃,这对于那些部署此解决方案的客户来说也许意味着很大的损失。思科提供的先进技术运用了一种名为虚拟SAN(即VSAN)的功能,改革了存储网络的部署方式。VSAN提供了一种在同一个冗余物理基础设施上建设一个虚拟隔离互换阵列的方法。因此,VSAN可以按照这些设计的规定,保障SAN 域的安全性和独立性。Cisco MDS 9000系列多层控制器和光纤通道互换机可以在同一套物理基础设施中创建多达1024个独立的VSAN拓扑或者结构。这种部署有点类似于以太网中的VLAN。VSAN运用通过验证的技术和以太网在配置上的方便性,在SAN环境中提供了诸如流量隔离和安全等功能,从而彻底地改变了SAN部署的方式。
23、 VSAN运用一些在以太网中得到验证的技术,满足了光纤通道存储的性能和隔离规定,提供了一个业界最佳的解决方案。分区可以在边沿控制访问权限,因而在限制访问权限和互换阵列中不同设备间传输的流量方面非常有用。VSAN所提供的一项补充性的功能是,隔离互换阵列中提供的所有服务,并将它们“封装”到一个VSAN中,从而建立一个逻辑独立的互换阵列。 VSAN创建的存储网络域不仅可以支持现有的安全机制,还可以在多个虚拟环境中隔离一台互换机。不同的VSAN之间可以提供完全的隔离,并保证某一个设备的故障或者互换阵列不稳定性的影响将会只限制于某一个VSAN中,而不是导致整个互换阵列的中断。所有这些都不需要部署那些要使
24、用多个物理隔离的光纤通道互换机的解决方案。VSAN还可以通过最大限度地提高端口运用率和减少每个端口的成本,减少存储网络的TCO。这种部署非常有效,由于多个用户群体可以组织起来,从而让互换阵列基础设施可以用少得多的设备为这些用户提供服务。Cisco MDS 9000系列提供了先进的安全性和服务,同时减少了资本和运营开支。 这种架构不仅可以减少数据中心中部署的SAN或者互换阵列的总数,还可以保持现状,即将备份/恢复和恢复数据互换阵列域与应用SAN隔离开。考虑到数据中心的占地成本和客户所采用的存储整合模式,VSAN可认为公司提供一个TCO 较低的解决方案。 无需LAN的备份模式服务器承担较轻的备份模式带有VSAN的分散变换阵列典型的基于LAN的备份模式DWDM和FCIP在不同距离上提供远程服务传输