1、数据中心存储集中及容灾方案交换机网络设计FC SAN存储网络由2台XXIT厂商DS-5300B,激活48端口 SAN交换机构成高性 能的冗余存储区域网,链路故障时可自动切换,无单点故障。每台提供64个8Gb/s 的FC端口,2台总共提供96个8Gb/s的FC端口。可以满足服务器的连接需求, 其余端口用于连接8个FC端口的生产存储系统和虚拟带库的连接,并为未来的 存储扩展和备份系统准备。存储磁盘阵列设计存储磁盘阵列采用1套XXIT厂商VNX 7500高性能企业级存储系统构成。其磁 盘总容量500TB,其中200TB 为 15k rpm 600GB SAS 磁盘,300TB 为7. 2k rpm
2、2TB NL SAS磁盘,共提供16个8Gb/s前端磁盘端口,并且可以根据用户的需求在线 进行扩展到32个。为了满足磁盘阵列的I/O性能需求,1套企业级FC存储系统 配置了2个存储控制器负责FC SAN数据传输,提供8个6Gb/s后端端口(共32个 通道)。存储系统CACHE配置为48GB, CACHE可以根据应用需求灵活扩展到2000GB (通过FAST CACHE方式)。第四章工程一期数据迁移方案4.1 数据迁移的目的目前,XX应用系统在存储系统中存放的数据,本次工程中需要将原有数据平稳、平安的迁移到新增的VNX7500存储系统中。新增的存储系统无论扩展能 力、处理性能相比原有存储系统都将
3、有大幅度提升,为此,我们计划将现有存 储系统上的数据依次迁移到新增存储系统中,以满足未来业务扩展的需要。4.2 数据迁移的原那么确保数据平安性在技术允许的条件下,要绝对保证数据的平安性,要绝对防止数据损失、 丧失等风险。确保数据一致性由于XX应用系统目前运行的大多数应用系统都是基于数据库系统开发的, 所以在数据迁移的过程中要保证数据一致性,一定要防止数据迁移后系统无法 正常启动等风险的出现。确保现有主机正常工作在数据迁移过程中,要尽量防止给主机带来不必要的风险,造成业务系统 非计划宕机。确保停机时间最短在数据迁移过程中,业务系统停机是不可防止的,但是应该尽量缩短停机 时间。分步骤实施由于XX应
4、用系统主机数量较多,所以数据迁移必须分阶段实施,数据迁移 方案也应该给出不同阶段的工作量。由专业人员进行数据迁移由于XX应用系统设备众多,数据迁移时牵扯到主机、光纤交换机和存储系 统等不同厂家,为了确保数据迁移的平安、可靠并最终成功,所有数据迁移所 涉及的到设备厂商必须由原厂商工程师实际操作。4.3 数据迁移过程为了保证所有迁移能够有条不紊地进行,并且保证业务系统的平稳过渡, 我们把整个迁移分为5个阶段进行。 第一阶段:迁移评估 第二阶段:迁移规划和设计 第三阶段:变更控制 第四阶段:数据迁移实施 第五阶段:数据迁移后审查第一阶段:迁移评估数据迁移工程的第一阶段首先需要定义数据迁移的范围和确定
5、客户的详细 需求,并且对客户当前的环境进行初步的分析,以确定数据迁移的可行性和对 当前环境的支持程度。在这个阶段,还需要根据客户的业务需求选择适当的迁 移方法。在数据迁移工程中,客户的每套业务系统对于XXIT厂商来讲都是至关重要 的,需要努力花时间做好迁移评估阶段的工作。做完数据迁移工程第一阶段的 工作后,客户将能得到如下结果: 平安、平稳、风险最小的数据迁移解决方案 可重复和可预见的迁移结果 满足客户业务影响需求的数据迁移的具体要求 与客户一起建立有效实施、管理数据迁移工程的团队成员XXIT厂商在数据迁移方面有许多数据迁移技术和方法,其中大局部是基于 阵列或主机为基础的。客户的业务需求决定了
6、最适当的方法来部署具体的迁移 工程。要确定合适的方法,重要的是要进行初步分析,因此在迁移评估的阶段 需要收集当前环境的以下信息: 需要迁移的数据量收集客户环境中有关的具体的数据量和LUN的大小 客户应用系统的可用性根据需要数据迁移的应用系统数量和应用系统可以宕机的时间窗口往往能 够确定使用适当的数据迁移方法。在线的数据迁移会带来额外的风险,因此客 户需要对应用系统的可用性的影响进行权衡。 容量分配的要求数据迁移往往会提供一个重新构建LUN大小和存储分配保障计划的机会, 因此需要在评估阶段考虑未来容量规划的问题。 性能的影响数据迁移通常涉及大量数据移动从而影响到主机、阵列、网络性能和SAN 结构
7、,这种影响必须予以考虑。在数据迁移过程中实施数据流量控制的功能, 将减少相应的影响。 数据迁移的时间窗口根据客户业务系统的重要级别,可用于数据迁移的维护时间和宕机时间窗 口有所不同,某些关键业务可申请的维护时间窗口可能很小。对于不同要求的 业务系统选择不同的数据迁移技术是非常必要的,并且对不同的业务系统需要 计划好相应的停机时间和业务切割时间。 回退计划为了降低应用系统的风险,在数据迁移实施前必须有一套详细的、可执行 的回退操作计划。本工程中,回退计划可以采用两种技术来保证:本地备份系统XX应用系统原有其他厂商上,在数据迁移之前可以先对数据进行一次全备 份,确保数据的平安性,一旦数据迁移过程中
8、出现问题,可以及时使用备份系 统来进行数据恢复。第二阶段:迁移规划和设计在数据迁移工程的这个阶段,需要根据对在分析中确定的要求作出详细的 设计和实施时间表。为了完成这一阶段的规划和设计需要具备良好的操作变更 管理流程。这一阶段包括制定一个数据迁移实施计划,不仅包括该工程的具体细节, 也应该包括分析应用系统未来可能增长的需求。数据迁移解决方案的规划和设 计必须包含以确保能够到达满足客户业务迁移的需求的迁移方法和环境评估结 果。在此阶段,应该至少记录一下信息: 具体的源和目标卷 前端端口的连接 设备映射要求 光纤连接 光纤交换机Zoning 物理连线要求 软件版本和许可 缓存要求为了设计未来的增长
9、需求计划,重要的是要考虑存储利用率的趋势和未来 可能会影响容量的任何举措,并且分析性能和数据保护的要求,确保最正确的数 据布局分布和目标阵列的物理配置。从宏观的角度考虑数据迁移的复杂性,包括服务器负载、网络带宽和容 量、源和目标存储系统的性能、SAN流量和迁移时对业务系统的影响、业务的 宕机时间窗口,以及在特定的时间数据迁移时数据从一个平台复制到另一个平 台时可能出现的影响。妥善的解决方案的设计允许迁移时的流量控制,在计划 好的时间里完成期望复制的适当大小的数据,这是保证数据迁移成功的至关重 要因素。数据迁移成功的标准是指在规划阶段良好的设计到达客户的业务要求,并 且在实施阶段能够完全按照计划
10、进行并得到验证。验证的标准分为两类:数据 完整性和性能。显然,数据的完整性在何数据迁移工程是至关重要的,为了验 证数据完整性,必须首先定义一个测试计划。这个测试计划可能很简单,比方 MD5校验或者能够成功地启动应用系统,但是,用更全面的测试来验证应用系 统之间的相互关联的数据集的一致性更有必要。止匕外,在规划阶段还应该设定 数据迁移后的性能标准,并且在数据迁移后也应当到达要求并得到验证。采用 收集操作系统的iostat和vmstat数据来验证相关的性能指标,至少收集一天 的数据来比拟数据迁移前后的性能差异。如果采用的数据迁移技术是一种新的技术,应该在部署到生产环境之前, 现在非生产的测试环境中
11、得到验证。这样能够最大限度的减小风险,以到达客 户对业务系统数据迁移的要求。当数据迁移工程中采用较新的技术或者需要升级版本,额外必须注意以下 几个方面: 支持修订级别和互操作性方面的问题: 主机总线适配器(HBA)Fabric 存储子系统 主机操作系统版本 应用软件的版本级别XXIT厂商将在这个阶段通过数据收集并且查询验证XXIT厂商Support Matrix,查明并解决之前的数据迁移中上述所有问题,作为数据迁移实施的一 局部,减少现有环境数据迁移的复杂性,以降低数据迁移的风险。第三阶段:变更控制数据迁移工程必须符合变更管理流程。以下是变更管理涉及的内容: 风险评估变更管理的一个重要组成局部
12、是一个完整的风险评估。风险评估是从一个 失败的变更分析出可以出现什么问题,如何预防,以及如何减轻影响的变化。 这种分析应该包括一个文件记录和回退测试计划。 迁移计划这是一个在规划和设计阶段建立的审查实施迁移的计划。这个计划中包括 了当前和目标环境,以及逐步的操作过程。 先决条件和依赖对数据迁移实施方案的执行过程中所有OnSite的支持,以及相关的参与人 员,供应商、零部件供应等先决条件,应记录和计划。 时间线和时间表如果目前的行动是至关重要的,时间安排和时间表必须要明确,以满足有 限的业务系统维修或割接时限要求,并且确保备份计划进行准备。 资源计划该计划应包括相关人员的可用性,技能和责任。第四
13、阶段:数据迁移实施在这个阶段,按照设计阶段制定的计划实施。一般数据迁移执行的最正确做 法包括: 作为第一步,执行涉及的所有数据的完全备份。 审查的详细实施步骤。采用脚本的方法是首选的方法。 确保实施计划中定义的业务系统重要级别和业务停机时间窗口以及回 退计划是正确的,并且实施人员能够完全理解并执行。 进行试点迁移或实施尽可能高级的测试。预先计划一个迁移测试是非常 有价值的。 在迁移工程前期观察数据吞吐量。如果在迁移实施前期发现迁移的时间 段内某些吞吐量估计和实际吞吐量存在显着性差异,可能还有时间调整 时间表、减少性能影响或采用其它应急的数据迁移方法,以防止在工程 中超过计划的时间表。 一切操作
14、都严格按照测试计划和相关文档。在生产数据的在线迁移过程 中的最高风险无疑是不可控的数据完整性问题,如果这些因素都被列入 计划并记录和明确之后,这种风险通常可以缓解。关键是要按照与客户 协商好的计划按部就班的逐一应用系统实施、验证并得到客户业务的验 证。问题及时上报以及专业人员实施。在迁移过程中碰到问题及时寻求二线 专家的帮助是解决问题的更容易和快速的途径。在进行数据迁移时确保 专业的技术专家严格按照文档实施并且保证相关的支持系统畅通,是减 少风险的重要因素。如果实施人员行为不当,参与支持系统在有帮助需 要时得不到支持,甚至实施人员没有什么经验,将会给数据迁移带来非 常大的风险。第五阶段:数据迁
15、移后审查在这个阶段,确认没有技术人员、服务质量以及数据完整性的影响。执行 以下工作: 采集数据迁移后的性能数据并与计划中的定义去比拟,验证是否到达客 户的期望值 执行迁移过程中使用的迁移工具等工程的清理。 利旧或者清理数据迁移前原始的SAN系统和磁盘系统。 审查在迁移过程中发生问题的处理方式和结果。 提供迁移后数据环境最终状态的文档。例如包括地址、容量大小、存取 速度、以及发生变化的数据源和可能影响业务的数据源的名字。 更新SAN Switch Zoning和其他文件。44数据迁移方法在数据迁移过程中通常有两种途径来移动物理数据: 基于主机 基于阵列在选择适当的方法之前,重要的是先了解进行数据
16、迁移的范围。选择数据 迁移方法的过程应包括评估现有的数据迁移策略、相关的限制和制约。针对XX 应用系统本数据迁移的工程,推荐重点关注基于主机和阵列为基础的数据迁移 方法。基于主机的数据迁移XX应用系统可用主机的复制作为进行数据迁移的方法。主流的开放操作系 统都包含本地工具,用于实现基于主机的数据迁移。Windows/UNIX环境中可采 用本地逻辑磁盘管理器(Logical Disk Manager/LVM)的功能。基于主机的数据 迁移,通常是由服务器管理员,而不是存储管理员,因为它需要服务器的根 (root) /管理员级别的访问。基于阵列的数据迁移基于磁盘的数据迁移利用存储系统资源进行物理数据
17、的移动。这种方式的 好处是可以保存主机的资源,特别是在线迁移数据的时候。当然,基于磁盘的 迁移将消耗磁盘存储系统内部的资源。止匕外,基于磁盘的迁移可能需要专业人 员的技能和知识,特别是跨异构存储环境。第五章VNX存储功能和特性XXIT厂商存储系统可靠性XXIT厂商 存储产品业界最高的可靠性设计(由第三方评测可靠性99. 999%)XXIT厂商存储产品采用点对点的硬件设计、独有的软件功能和配置最正确做法结 合在一起,在所有存储平台中已经具有最高的可靠性和可用性一经评估,在客 户的应用程序环境中都已到达了 “五个9”(99.999%)的可用性。故障检测和隔离功能UltraPoint技术将FLARE
18、软件功能与点对点设计结合在一起,提供更精细的 端到端故障检测和隔离操作。存储系统对等故障记录可以让一个SP收集另一 个SP上的故障情况,并自报警,从而加快问题确定和解决的速度。电源中断和硬件故障保护在断电保护上,XXIT厂商采用的是业界最先进的Cache Destage技术,存储系 统内部采用UPS保护,当断电后,UPS能保持将CACHE内的数据写入磁盘内。而其他厂家那么采用电池保护,当断电后,容易发生内存钉死问题,进而造成数据 丢实;如72小时后电源不恢复,数据将丧失,存在数据丧失的平安隐患。主动预防性热备盘XXIT厂商可以做到将服务发生在故障出现以前,即根据故障发生前的系统报警 (如磁盘只
19、坏几个磁道时,磁盘本身仍然是可用的但该磁盘坏的概率很大,这时 系统就会报警),XXIT厂商将快要坏的部件在故障发生前更换掉。使系统一直处 于最平安的状态。XXIT厂商的服务是为用户着想的主动服务模式。其它存储系统虽然也有自动报警功能,但由于没有自我诊断、自我纠错和自我故 障隔离等功能,此报警属于故障报警,即在故障发生后再报警,然后再进行服务。XXIT厂商企业级硬盘特有的高可靠性技术扇区级的保护:XXIT厂商产品会被格式化成每扇区520字节:512字 节存用户数据另外8个字节存储确认信息.每个确认信息位置包括了一 个时钟标记,一个写标记,一个shed标记用于当控制器出现故障时能够 保证校验信息一
20、致性. 时钟标记和写标记:每当XXIT厂商 存储处理器翻开一个新的磁盘组时, 存储处理器将检查每个条带的时钟标记和写标记.如果发现不匹配, 它将重新计算校验信息. Shed标记:parity shedding 一般是直接应用在出现故障的磁盘驱动 器上的.它使用奇偶校验运算来在出现故障的磁盘驱动器上进行数据 的重建并使用重建的数据覆盖原来的数据.校验和技术:520位的扇区的正确位置包括了一个整个数据扇区的校验 和.当数据被从磁盘中读出后,控制器计算出来一个新的校验和并与 从数据扇区读出来的校验和进行比拟.如果控制器发现了一个问题, 它就拒绝这个数据并再次从磁盘中去读数据.校验和校验存储的数据是
21、不是被重建的数据。数据纠错回写:数据纠错回写,一个提前的数据保护功能.一般被使用 在更加高端的存储系统中,所有的XXIT厂商 产品只要通过一个称为 SNiiFFER的固件特性都可以实现.这个SNiiFFER程序持续不断的读数 据块检测这个读错误通过磁盘驱动器报告出来.这些错误可能是磁盘 恢复错误也也可能是介质错误.SNiiFFER通过在数据没有出现问题之 间将数据重新部署到新的区域来响应磁盘恢复错误.如果SNiiFFER 遇到了一个介质错误,它将通过使用从失效的阵列组中的冗余信息来 重建数据。第一章工程背景描述3第二章解决方案的设计42.1方案设计的原那么42. 2存储整合的阶段规划4第三章
22、工程一期存储整合技术方案73.1 方案设计的思路和架构73.2 数据集中方案建议8SAN交换机网络设计103.2.1 存储磁盘阵列设计10第四章 工程一期数据迁移方案104.1 数据迁移的目的104.2 数据迁移的原那么114.3 数据迁移过程114.4 数据迁移方法17第五章VNX存储功能和特性18第六章采用XXIT厂商VNX存储产品的优势错误!未定义书签。第七章工程一期数据保护系统整合技术方案267.1 主机房本地数据保护方案267.2 XX数据保护整合方案28第八章工程一期XX存储容灾与业务连续性方案建议298.1 业务连续性系统建设29容灾概述308.1.1 容灾技术简介368.2 X
23、X容灾系统方案架构设计448.3 建议的XX VPlex Metro方案的优势458.4 容灾工程实施与演练48第九章工程一期存储系统XXIT厂商设备清单错误!未定义书签。第十章XXIT厂商系列产品行业内/外成功应用案例错误!未定义书签。第十一章总结错误!未定义书签。第十二章XXIT厂商公司专业存储服务介绍错误!未定义书签。第十三章XXIT厂商公司专业培训介绍错误!未定义书签。第十四章设备介绍错误!未定义书签。14. 1 XXIT厂商VNX 7500统一存储系统错误!未定义书签。XXIT厂商存储系统可扩展性XXIT厂商存储系统采用灵活的存储体系结构,VNX存储系统拥有UltraFlex技术,提
24、供专门构建用于双协议(FC和iSCSI)环境的高性能和高可用性,同时成为了客户可充分利用未来 10技术的基础体系结构。新体系结构EMCwhere information lives,UltaFlex二双协议、川扩展,并支持未来技术的系统linn linn光纤通道模块光纤通道篌块光纤通道篌块光纤通道模块iSCSI模块iSCSI粳块10复合linn linn光纤通道模块光纤通道篌块光纤通道篌块光纤通道模块iSCSI模块iSCSI粳块10复合CPU模块多核处理器更多内存64 位 FLARE 最多960个驱动器=高达2倍的 性能和规模huh min光纤通道块光纤通道篌块光纤通道篌块光纤通道模块iSCS
25、I篌块iSCSI模块10复合X8CMI虚拟资源调配驱动器降速=容量优化Copyright 2008 EMC Corporation. /Ml rights reserved.在每个存储系统上都内置了 iSCSI和FC连接,从而让客户获得灵活性。该灵 活性表达在客户可以利用他们带iSCSI连接和光纤通道连接的现有LAN基础 架构,针对极高吞吐量要求获得最大性能。VNX可以根据用户应用性能的需求, 灵活配置cache容量大小,VNX5700可以根据需求,配置36GB cache到1.5TB cache (通过FAST cache技术)。VNX5700存储系统,最大可以支持到500块硬 盘,用户可以
26、在不停机的情况下,将硬盘容量扩展到L5PB。XXIT厂商存储系统可管理性XXIT厂商在提供简单易用的工具以实施和管理阵列方面进行了大量投资。易 于使用的功能可满足一系列要求,从而简化了日常管理、安装、维护和升级。在 虚拟资源调配中,存储系统已经将容量规划和资源调配活动的最正确做法编码化, 以便进一步简化信息存储专家的日常操作。Unisphere管理套件可以在单一界面管理多套存储系统(在本系统中可以通过 Unisphere单一管理界面统一管理多套存储系统),提供了简单的基于Web的 发现、监控、报告、配置和调整功能。另外,所有附加功能(包括虚拟资源调配、 MirrorView SnapView
27、Navisphere Analyzer 和 Navisphere Quality of Service Manager)都使用同一界面进行XXIT厂商的虚拟资源调配方法允许通 过虚拟资源调配创立的传统LUN和精简LUN由同一软件应用程序进行管理, 实现数据保护和数据迁移统一存储管理和监控方案示意图管理网络.统一监控XXIT厂商存储系统对复杂应用优化控制Navisphere QoS Manager (NQM)是一个通过在XXIT厂商阵列中相应地分配系统资源来优化应用程序性能的工具。NQM使客户能够确定哪个应用程序应该获取 更多的可用系统资源,以满足各个应用程序的服务级别。NQM是一个基于阵列的
28、工具,它在存储处理器内工作,对发送到系统的I/O请求进行测量、计算和控 制。它可以监控、限制或设置在XXIT厂商阵列上运行的应用程序的性能目标。 NQM使用内置监控和存档工具来提供阵列本身上应用程序性能的逻辑视图。NQM 设计拥有集成的计划器,以便随时可以到达系统中最关键应用程序的服务级别。 它可用于获得对您而言最重要应用程序的特定性能目标,或用于监控阵列上的应 用程序性能以确定可能的瓶颈。最终可以提供存储阵列性能的清晰视图,防止将 时间和金钱浪费在可能发生但不存在的存储问题上。XXIT厂商存储系统先进技术功能全自动存储分层技术VNX拥有最先进的全自动存储分层技术(FAST技术)。FAST这一
29、首字母缩写词表 示全自动存储分层,此功能可以根据不断变化的需求在各种存储资源间自动移动 和放置数据。例如:FAST技术可以与Navisphere Analyzer配合使用,以便 向用户提供其光纤通道驱动器环境的分析,针对不同的数据,将其移动闪存驱动 器以改进性能或移到高性能SATA驱动器以降低存储本钱。娴高活动量高活动性数据存储在闪存上以获得最快的响应速度随着数据年限的增加, 活动性会迅速降低,这 会触发自动向高容量硬 盘的移动,以便随着时间开展实现最低本钱闪存硬盘/p第一年第二年第四年第五年FAST VP (针对虚拟池的全自动存储分层)会以1 GB为增量,将数据从 高性能层分到高容量驱动器层
30、中,这样整体本钱较低,而且不用考虑应用程序 类型或数据过期问题。而最令人称道的是,这一切都是基于客户定义的策略自 动发生的,通过智能地执行与任务资源调配前后关联的工作,大大节省了应用 程序和存储管理员的时间与费用。XXIT厂商存储系统先进技术功能FAST缓存技术XXIT厂商存储系统对于性能要求很高的应用可以,采用配置FAST缓存的技术 提供高性能计算对于I/O性能的要求。FAST缓存通过使用闪存驱动器,可使控 制器缓存增加64倍,通过缓存的数据命中率提高了4. 5倍,大大增加了应用服 务器对存储系统访问性能的需求,从而解决存储系统自身缓存缺乏的问题。FAST 缓存具有持久性,即使在电源故障时也
31、能使数据保持缓存状态,不会造成数据丢 失。XXIT厂商存储系统数据压缩与重复数据删除功能VNX系列包含内置的功能,有助于确保冗余、非活动或预期数据不占用珍贵的存 储资源。数据块压缩功能(旨在处理相对不活动的LUN,例如备份副本和静态数 据存储库)会自动压缩数据,使客户可以重新捕获容量,并将数据的占用空间减 少高达50%o这些功能是作为后台任务XXIT厂商存储系统多路径负载均衡软件受功能上的限制,一般的主机操作系统软件并不能自动发现硬件I/O链路的冗余 配置情况,通常会把经过不同I/O链路访问到的同一块物理存储空间配置为两个 别离的逻辑存储单元。所以,单靠硬件链路的冗余配置,不能实现失效链路的自
32、 动切换,而且会提高数据存储空间管理的复杂性,增加因误操作损失数据的可能。因此,方案为接入SAN中的所有业务系统服务器均配置了专门的通道切换和动态 负载均衡的管理软件,以实现以下功能:- 自动识别冗余的链路配置;监视每个通道的状态,屏蔽错误或不稳定 的链路,自动切换系统数据I/O路径;屏蔽底层的复杂性,为经不同I/O通道访问的一块物理存储空间分配 统一的逻辑存储单元符,简化系统管理的复杂性;- 通过管理软件还能够在所有的通道上实现动态I/O负载均衡,可以 使系统在更短的时间内完成更多工作,全面提高主机的运行效率。从而充分发挥链路冗余配置的优势,提高各服务器应用的可靠性和整体业 务系统的连续性水
33、平。XXIT厂商存储系统对云计算及虚拟化的支持技术VNX系列是适合云计算及虚拟化应用程序环境的理想中端系统。无论客户 环境是基于VMware、Microsoft Hyper-V还是基于Xen, VNX都可通过所有支 持协议的完全认证,确保在实施的所有阶段都能够成功地部署虚拟化基础架 构。这样存储和服务器管理员就不会再盲目地执行操作。通过VAAI (用于阵列 集成的 vStorage APIs)将 Unisphere 与 VMware vCenter 紧密集成,管理 员可洞悉整个环境的情况(端到端)。每个人都可以使用其熟悉的管理界面查看 虚拟资源和物理资源,透明地对存储进行资源调配、集成复制、访
34、问所有存储 功能并将其卸载到阵列上。 只要单击两下,便可通过VMware vCenter对存储进行资源 调配。 针对VMware的XXIT厂商VNX插件利用最正确做法可确保存储与 VMware之间获得最正确利用率和恢复能力。 可加速硬件的Fast克隆能够在数秒内快速对新虚拟机进行 资源调配。 针对NFS数据存储区的按需VMDK压缩功能可将存储消耗量 减少高达50%o 与VMware联合开发的XXIT厂商Proven解决方案和参考体系结构可加快关键应用程序虚拟化的速度。XXIT厂商存储系统实现的数据保护VNX系列提供信息保护软件。例如,复制功能有point - in-time 的即时恢复功能,快
35、照,克隆和自动恢复来保护,以及可以配置 recover point连续数据保护功能。保护数据的逻辑和物理故障发 生。第六章工程一期数据保护系统整合技术方案6.1 主机房本地数据保护方案根据数据中心不同的业务系统对备份恢复的要求不同,XXIT厂商建议主机 房的备份平台建设规划按以下方式进行: 对客户的备份恢复服务要求进行服务等级划分,定义不同服务等级的 备份恢复服务要求;定义不同备份恢复服务等级的参考架构 根据业务的重要性等级进行备份恢复服务等级映射,并选择合适的参 考架构。EMC2where information lives 根据各业务系统的备份恢复现状制订改造计划。本地备份示意图(一)LA
36、N设计设计邮件ERPLanFree BackupEMC VNX7500应用服务器群 备份软件EMCNS480EMC虚拟 磁盘库DD一由一 ra 一的一阳-G38Gb SAN Switc DS5300B在主机房,XXIT厂商向用户推荐带有重复数据删除技术的高性能的 XXIT厂商虚拟磁盘库DD860 (裸容量56TB)的解决方案,同时配合客户现有的 备份软件和NetApp虚拟磁盘库,提供高效的不同服务等级备份恢复解决方案。选择重复数据删除虚拟带库的优势使用虚拟磁带库备份就像真实的、自动化的物理磁带库/机设备一样,仅仅 是将数据存储在磁盘上。虚拟带库是将磁盘仿真成磁带库,使备份服务器对此磁盘的操作如
37、同操作 一个磁带库一样,使磁盘代替磁带作为备份操作中存储数据的设备,而这种改 变对于用户来说完全是透明的,用户完全不对原有的备份脚本做任何改变来完 成备份作业。虚拟磁带库备份多基于SAN架构,和磁盘备份一样,虚拟带库备份也根据 是否占用生产主机CPU资源分为LAN-Free备份和Server-Free备份两种,两种 备份的架构和磁盘备份中LAN-Free和Server-Free中一样,数据流也是一样, 不同的就是备份终端设备由磁盘阵列换成了虚拟磁带库,此处不再赘述。虚拟磁带库利用SAN环境进行备份,除了能充分利用SAN环境高性能,不 增加额外网络开销的特点外,还具有如下优点: 采用虚拟磁带库可
38、以沿用原来基于磁带的备份架构,防止备份架构 改造的本钱和风险,同时具备备份到磁盘介质的风险。 虚拟磁带库把磁盘空间仿真成磁带使用,因而无需进行文件系统管 理,大大简化了管理要求。 数据备份到虚拟磁带后,该磁带可以由其它服务器读取,在需要进行 备份数据迁移到物理磁带上时,将无需原生产机参与,防止对生产的 影响。 一台虚拟带库设备可以模拟多台磁带库,因而对数据中心而言,可以 提供虚拟带库服务,使得不同客户有自己的磁带库,并且支持同一客 户多种备份软件平台。 虚拟磁带库容量可以初始分配一个较小容量,以后根据需要自动分 配实际空间,可以大大提高利用率。 利用虚拟磁带库缺省的重复数据删除技术(De-Du
39、p)可将除图片等多媒体数据外的数据库数据,文件等实现在线10-400倍的压缩。大大 减少虚拟磁带库的磁盘使用空间。例如:客户有10TB的数据库数据, 对于虚拟磁带库而言,第一次的全备份大约需要3TB的虚拟磁带库 空间,如果客户的备份策略是最终保存8份全备份。那么从第二次 全备份开始到第八次全备份,占用的虚拟磁带库空间为大约每次1TB (保守估计)。那么总共需要的虚拟磁带库磁盘配置在17TB左右。再根据未来业务的增长量,提供必要的扩展和预留空间即可。配置多台虚拟磁带库可以实现低带宽要求的数据异地备份,这是传 统物理磁带库无法实现的解决方案,配合XXIT厂商DataDomain的 多级复制架构,能
40、帮客户打造完整的企业级数据保护整合方案。6.2XX数据保护整合方案根据XX的实际,我们建议采用XXIT厂商的领先的解决方案DataDomain产 品搭建备份设备的容灾整合系统。具体如下:DataDomain备份设备容灾整合架构图IP ReplicatorIP Replicator主数据中心容灾数据中心主数据中心:采用备份设备,配置DD860,配置VTL和NAS协议支持,复制 软件:主数据中心DD860负责按照既定的备份策略备份数据中心的关键业务数 据,最关键的数据,再备份一份到NetApp虚拟带库上。XX容灾数据中心:采用备份设备配置DD860,配置VTL和NAS协议支持, 复制软件:DD86
41、0负责接收主数据中心DD860复制的关键业务数据的备份数 据。从而实现主数据中心和容灾中心备份数据的异地存放和数据的统一异地备 份。第七章工程一期XX存储容灾与业务连续性方案建议7.1业务连续性系统建设随着集中存储架构的完善,各级应用的基础数据将不断的汇总核心存储, 各业务系统也将更加依赖主机房存储平台来保障业务的正常运转。一旦主数据 中心发生较大的问题,将给各业务系统造成长期中断,甚至因基础数据无法找 回,造成无可弥补的损失。因此,在此阶段有必要通过容灾系统的建设来保证 个业务系统运行的连续性。工程的容灾系统的建设总体目标是:在整合的存储 系统基础上,充分利用现有资源的前提下,实现容灾系统的
42、建设,保障应用系 统的业务连续性。容灾系统建设容灾系统的建设,是本工程存储平台提供信息系统持续运行的有效手段, 如何高效、顺利的实现容灾系统的建设,必须通过一系列的前期分析,确定业 务类型、特点,规划一个完整的容灾体系架构;同时,需要制定必要的业务系 统应急计划(BCP和DRP),只有系统平台和业务应急计划充分的结合,才能最 终保证业务系统中“关键业务7X24小时不中断”运行。容灾方案设计原那么第一章工程背景描述XX信息化建设方面,系统建设已比拟全面,业务部门的信息化程度已比拟 成熟,拥有包括ERP系统、邮件,0A,设计等多个系统。众多内容丰富、功能强 大的应用软件逐渐成熟,成为XX信息技术的
43、核心。XX作为国内大型的研究,制 造军工单位,信息系统是一个数据量大,数据类型复杂和事务并发多的系统, 随着时间的推移,这些环境的数据越来越多,数据的价值也越来越大。如何管 理及保护好这些数据,是本次工程主要解决的问题。具体来说,工程一期实现的目标是: 存储整合:目前系统数据存储扩展能力有限,数据在多个应用之间,如何 高速、快捷地传递及统一的数据管理,存储成为一大瓶颈O针对这个问题, 本次方案将实现主要系统的存储整合。 备份整合:随着应用系统业务越来越多,数据量不断增加,数据价值的增 大,不能因为数据的丧失与损毁造成业务的中断。实现信息系统数据异地 备份及统一备份也刻不容缓,本次方案将实现数据
44、中心信息系统数据统一 备份,并实现数据异地备份。 异地容灾:随着XX业务飞速开展,对业务系统依赖性越来越强,不允许 业务系统有任何中断,为了保证信息系统的稳定性,在本次方案中实现主 机房信息系统同三十多公里外数据中心应用级异地容灾。方案本着技术先进性、可扩充性、高可靠性、高可用性、成熟性、可管理 性的设计原那么和总体设计思想,集合了 XXIT厂商公司优秀技术设计理念和产 品,借鉴了 XXIT厂商全球众多成功案例和实际经验,设计了整体的解决方案。技术先进性:系统设计应采用当前先进而成熟的技术,不仅可以满足本期 工程的需求,也应把握未来的开展方向。可扩充性:在系统设计时应充分考虑可扩充性,从而确保
45、新功能、新业务 的增加在原有的系统平台上扩展和实现。高可靠性:存储平台具有高可靠性,支持服务器平台的高可用性集群技 术;具备先进的容灾的设计;充分保证系统的高扩展能力和高容错能力,具有 通道负载自动均衡能力和存储系统性能调节能力,提供极为充分的可靠性各项 指标设计。高可用性:在不停机情况下,实现不停机扩容、维护、升级等服务,提高 性能以满足新的业务需求。具备7X24X365连续工作的能力,系统的可用性应 大于99.999%。在自动化管理软件支持下可以实现磁盘数据的在线(不停机) 备份。成熟性:应尽量选用经过大量运用、成熟可靠的系统。可实施性:选用成熟的技术,成熟的案例经验和设计方案,制定详细的
46、技 术实施方案。7.1.1 容灾概述自“9.11”之后,全球各组织均认识到灾难防范保护的重要性。某些大型 金融机构之所以能够在两天内恢复营业,其主要原因是它们不仅像一般公司那 样在内部进行数据备份,而且在数英里外的数据备份中心也保存着数据备份。 这些备份都是通过数据备份软件和数据复制软件进行的。采取了这种措施后, 一旦工作现场发生意外,企业就可以立即使用另一套数据。华尔街的金融机构 重新对灾难恢复的步骤做了评估,并认识到灾难恢复只是技术手段之一,它们 开始强调Business Continuity (业务连续性),而不仅仅是Disaster Recovery (灾难恢复)。因为过去的“灾难”恢
47、复计划并没有强调全局性影响,而如 何维持业务的连续运作将成为组织运营风险评估中至关重要的一环。事实证明,只有对数据存储藏份制定完备、持续且可执行的容灾计划,特别是业务连 续计划,才能为人们提供万无一失的数据平安保护。灾难恢复是业务连续性计划的一局部,其中还包括业务恢复计划。灾难基 本上可以说是无法预测的,其造成的损失也很难精确的估计,但是有一点可以 肯定,灾难的发生对于组织来讲往往是致命的,因此,组织必须有所准备。实施灾难恢复的计划首先对其应用系统进行评估,分清关键的系统,并对 其运行环境进行评估,判断发生灾难的可能性有多少。假设发生,关键系统中断 运行的时间有多长?中断后对组织的影响有多大?有多少?哪些资料会丧失, 有没有解决的方法和措施等。XXIT厂商公司的专业服务可以为您提供这些评估服务,这些咨询服务是根 据组织的关键系统、数据量、交易量、网络和数据保护情况等因素做出对业务 影响分析报告,进而做出解决方案,从而保证当灾难发生后对您业务和应用的 影响降至最低。风险与灾难风险主要是可能导致系统中止运行、业务中断并给组织和客户造成重大影 响的潜在事件或事故。本系统建设需要通过一系列手段来尽量防止