1、 /*客户公司项目名*/软件定义的容灾解决方案(VMware Site Recovery Manager 5.8)2024/7/2 文档信息文档信息与变更记录与变更记录 文档名称 软件定义的容灾解决方案(SRM5.8)作者 高园 邮箱 版本 V1.0 变更记录 目目 录录 1 概述概述.错误!未定义书签。1.1 劫难恢复的重要意义劫难恢复的重要意义.错误!未定义书签。1.2 XXX 公司容灾方案现状分析公司容灾方案现状分析.错误!未定义书签。2 劫难恢复解决方案劫难恢复解决方案.错误!未定义书签。2.1 vCenter Site Recovery Manager.错误!未定义书签。2.1.1
2、概述概述.错误!未定义书签。2.1.2 Site Recovery Manager 的重要功能特性的重要功能特性.错误!未定义书签。2.1.3 SRM 支持灵活的拓扑支持灵活的拓扑.错误!未定义书签。2.1.4 超越劫难恢复:劫难规避和计划内迁移超越劫难恢复:劫难规避和计划内迁移.错误!未定义书签。2.1.5 VMware Site Recovery 的工作方式的工作方式.错误!未定义书签。2.1.6 劫难恢复自动化和运用软件定义的存储劫难恢复自动化和运用软件定义的存储.错误!未定义书签。2.2 vSphere Replication.错误!未定义书签。2.2.1 概览概览.错误!未定义书签。
3、2.2.2 运用运用 vSphere Replication 来扩大劫难恢复的覆盖范围来扩大劫难恢复的覆盖范围.错误!未定义书签。2.2.3 实现原理与工作机制实现原理与工作机制.错误!未定义书签。2.2.4 vSphere Replication 的优势的优势.错误!未定义书签。3 方案架构设计方案架构设计.错误!未定义书签。3.1 客户容灾设计规定客户容灾设计规定.错误!未定义书签。3.2 实行方案选择实行方案选择.错误!未定义书签。3.2.1 将基于阵列的复制与将基于阵列的复制与 SRM 结合使用结合使用.错误!未定义书签。3.2.2 将将 vSphere Replication 与与
4、SRM 结合使用结合使用 .错误!未定义书签。3.2.3 将基于阵列的复制和将基于阵列的复制和 vSphere Replication 与与 SRM 结合使用结合使用.错误!未定义书签。3.3 网络设计网络设计.错误!未定义书签。3.3.1 在恢复站点配置相同或不同的在恢复站点配置相同或不同的 IP 地址地址.错误!未定义书签。3.3.2 SRM 通通讯端口设立讯端口设立.错误!未定义书签。3.4 存储设计存储设计.错误!未定义书签。3.4.1 存储复制存储复制.错误!未定义书签。3.4.2 占位虚拟机占位虚拟机.错误!未定义书签。3.4.3 快照空间快照空间.错误!未定义书签。4 配置清单及
5、说明配置清单及说明.错误!未定义书签。4.1 硬件配置需求硬件配置需求.错误!未定义书签。4.2 虚拟化软件配置需求虚拟化软件配置需求.错误!未定义书签。5 方案总结方案总结.错误!未定义书签。5.1 方案要点方案要点.错误!未定义书签。5.2 方案优势方案优势.错误!未定义书签。6 专业服务专业服务.错误!未定义书签。6.1 VMware 专业服务介绍专业服务介绍.错误!未定义书签。6.2 专业征询服务内容专业征询服务内容.错误!未定义书签。6.2.1 VMware Accelerate 征询服务征询服务.错误!未定义书签。6.2.2 技术征询服务技术征询服务.错误!未定义书签。6.2.3
6、技术客户经理技术客户经理(TAM)服务服务.错误!未定义书签。6.3 专业服务实行流程专业服务实行流程.错误!未定义书签。6.3.1 评估评估.错误!未定义书签。6.3.2 规划与设计规划与设计.错误!未定义书签。6.3.3 实行实行.错误!未定义书签。6.3.4 运维运维.错误!未定义书签。7 支持服务概述支持服务概述.错误!未定义书签。7.1 VMware 支持的角色和职责支持的角色和职责.错误!未定义书签。7.2 全球技术支持服务全球技术支持服务.错误!未定义书签。7.3 自助服务支持自助服务支持.错误!未定义书签。7.3.1 社会支持社会支持.错误!未定义书签。7.3.2 其他资源其他
7、资源.错误!未定义书签。8 缩略语解释缩略语解释.错误!未定义书签。1 概述 1.1 劫难恢复的重要意义劫难恢复的重要意义 记录数据表白:93%的公司,一旦发生数据中心失效达 10 天的情况,通常在一年内就会破产。图:业务可用性与劫难恢复对公司的影响 来自 Forrestor 在 2023 年第二季度的征询报告表白,正常运营时间和数据保护对业务而言非常关键,劫难带来的员工工作效率下降、士气低落、收入下降、声誉受损和影响合规性将对公司产生巨大的悲观影响。图:中断导致的不良影响 劫难的发生往往是出乎人们意料的,当忽然发生大的劫难,平常建立的控制措施已不再有效时,组织如何才干保护核心业务不被中断,使
8、劫难的导致的风险降到最低呢?这正是劫难恢复需要考虑的问题。数据中心的劫难会以不同形式发生,比如电力中断、硬件故障、人为操作失误、以及自然灾害。大量的事例表白,业务中断不是“假如”的问题,而是“何时”的问题。因此,只要是拥有 IT 信息系统的组织,都应为随时也许发生的中断作好准备。保证业务连续性也就是保证业务连续运作,不管发生什么情况,重要的系统和网络必须具有不间断的可用性。事实上,劫难恢复的影响不仅仅局限于上面提到的金融领域,政府、公安、医疗、教育等诸多行业都需要使用业务可用性解决方案来保证其业务的可用性,对于这些公司,机关,单位而言,当 IT 基础设施忽然停运,不仅公司内部的业务流转、办公等
9、面临瘫痪,更重要的是,对外与客户或合作伙伴的所有业务交流都不得不陷入停滞。1.2 XXX 公司容灾方案现状分析公司容灾方案现状分析 在国内,很多公司都不具有劫难恢复能力,甚至是一些金融相关的公司都没有真正意义的劫难演练过。重要是设备成本、技术复杂度已经人员 IT 技能等多方面因素导致的。XXX 公司的采用传统灾备解决方案,并有了数年的积累和发展,但是传统的解决方案还是存在如下诸多问题的。一方面,传统的可用性解决方案是运用特定于应用的解决方案(如:Oracle RAC、MS SQL 集群、Exchange Database Access Groups(DAG)等)在应用级别实行业务可用性。虽然这
10、种方法通常可以提供不错的可用性,但是由于每一组应用都有自己的解决方案,因此这种方法有如下弊端:复杂且昂贵 对管理员的技术规定较高 犯错的风险大 许可证较贵(如 RAC)专用的备份架构 另一方面,虽然有一些基础架构层的解决方案可以比应用级解决方案更加经济高效,但是这些解决方案往往在正常运营时间和 RTO(恢复时间目的)方面表现得比较差。除此之外,传统的劫难恢复解决方案很难在现有的物理 X86 环境中实现,这是由于:传统的劫难恢复计划依赖于一套非常复杂的流程和基础架构:复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。由于劫难恢复也许非常复
11、杂,因此各个公司经常发现他们只能为少数几个重要的生产工作负载提供良好的保护,而其他的工作负载(如文献/打印服务器、内部 Web 服务器、部门级应用)则得不到保护或者保护的不充足。由于劫难恢复计划和基础架构非常复杂,所以各个公司都极为依赖大量的人员培训、准确且完整的恢复纪录,以及发生停机时恢复流程的准确执行。除此之外,由于恢复计划的测试过程会导致中断,并且成本非常高昂,所以各个公司无法保证所有培训、文档和执行过程都切实可行并且可以成功恢复 IT 服务。图:传统的劫难恢复解决方案所面临的挑战 上图描述了传统的劫难恢复解决方案所面临的挑战,由于存在这些挑战,该方案往往会产生如下的后果:恢复计划的测试
12、往往会失败 关键工作负载的基本恢复(如能成功)通常要花费数天或数周的时间 管理和维护恢复计划要花费 IT 人员大量的时间和资源 简言之,当前的灾备解决方案还无法满足其公司所设定的业务可用性规定。由此,XXX 公司提出重新设计和实行中心总部应用到北京 IDC 的异地远程灾备的需求。XXX 总部应用虚拟化改造完毕后,目前服务器虚拟化比例已经达成大约 XX%,XX%的应用已经由虚拟化承载,其中涉及 XX%的关键应用。需结合应用系统架构给出中心总部应用到北京 IDC 的异地远程灾备方案及实行日程表,按照日程表完毕异地远程灾备。2 劫难恢复解决方案 VMware 提出的基于虚拟化环境的软件定义的可用性解
13、决方案,该方案不仅可以提供与应用级别可用性方案相类似的 RTO 与 RPO(恢复点目的),同时,它还可以提供基础架构层解决方案所具有的简易性和成本效益。同时,由于该方案充足运用了虚拟化环境的优势,因此它可以达成传统的非软件定义解决方案无法达成的效果。VMware 劫难恢复解决方案涉及 vCenter Site Recovery Manager 和全新的vSphere Replication。2.1 vCenter Site Recovery Manager 如今,公司发现越来越难以提供符合规定的劫难恢复解决方案。而 Site Recovery Manager 可以帮助公司应对传统劫难恢复方法的
14、各种挑战,满足他们的恢复时间目的(RTO)、恢复点目的(RPO)以及法规遵从性规定。运用 Site Recovery Manager,公司可以管理从生产数据中心到劫难恢复站点的故障切换,同时,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。2.1.1 概述概述 VMware 的劫难恢复解决方案分为三个大的模块,如下图不同颜色模块所示:其中劫难恢复编排属于自动化解决方案;复制、备份和恢复属于数据保护解决方案;计算存储属于基础架构解决方案。图:VMware 劫难恢复解决方案 Site Recovery Manager 可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数
15、据中心故障切换(如数据中心迁移)变得更加顺畅。它是一款领先的劫难恢复管理和自动化解决方案,它通过自动执行恢复过程来加快恢复的速度,并将劫难恢复作为 VMware 虚拟基础架构管理的集成要素,从而简化劫难恢复计划的管理工作。SRM 省去了复杂的手动恢复环节,支持无中断的恢复计划测试,保证恢复过程的安全可靠。它密切集成 vSphere 及其他领先存储供应商提供的存储复制软件,使故障切换和恢复变得快捷、可靠、经济,并且便于管理。因此,公司不仅无需紧张劫难恢复的风险,还可将所有重要的系统和应用程序纳入到保护范围。自从 2023 年面世以来,SRM 已得到长足发展。到目前为止,VMware 已向一万五千
16、多家客户售出 12.5 万个许可证,并且该产品还在以每年 50%60%的速度继续增长。SRM 为 vSphere 平台上的劫难恢复计划增长的巨大价值推动了这种增长,而所增长的成本却相对较低。VMware 的许多客户已运用 SRM 从实际劫难(例如最近在日本发生的海啸和在美国发生的飓风)中快速恢复。下图是一些重要的客户以及 SRM 的相关市场数据。图:Site Recovery Manager 的发展趋势与部分客户 SRM 需要若干个组件。一方面,受保护的站点和故障切换站点都需要一个 SRM实例。SRM实例可通过与 vSphere 和 vCenter 紧密集成来提供管理和自动化功能。SRM 还需
17、要底层复制产品来将虚拟机复制到故障切换站点。借助 SRM,客户可以选择使用 vSphere Replication 或者使用基于存储的复制。由于 vSphere Replication与 SRM 捆绑在一起,所以无需支付额外费用。基于存储的复制由第三方存储供应商提供,并通过 Storage Replication Adapater(SRA)与 SRM 紧密集成,以使 SRM 可以运用该存储层协调复制和恢复活动。最后,SRM在这两个站点上都需要配置 vSphere 集群和单独的 vCenter 实例。图:SRM 的重要功能组件 2.1.2 Site Recovery Manager 的重要功能特
18、性的重要功能特性 VMware vCenter Site Recovery Manager 可提供先进的复制、劫难恢复管理、无中断测试、自动故障切换和故障恢复以及计划内迁移功能。它可以管理从生产数据中心到劫难恢复站点的故障切换,以及两个具有活动工作负载的站点之间的故障切换,甚至还可以将多个站点恢复为一个共享的恢复站点。Site Recovery Manager 经常用于计划内迁移和防止性故障切换以避免发生劫难,它的重要功能特性如下:集中式恢复计划集中式恢复计划 直接从 vCenter Server 中创建并管理恢复计划。自动发现并显示由 vSphere Replication 或基于阵列的复制
19、保护的虚拟机。将虚拟机映射到故障切换站点上的相应资源(资源池、虚拟 互换机和虚拟机文献夹)。指定虚拟机引导顺序。自定义虚拟机 IP 地址。自定义故障切换站点上的低优先级虚拟机的关机。运用自定义脚本扩展恢复计划。运用基于角色的访问控制来控制对恢复计划的访问。将多个站点恢复至一个共享的恢复站点。自服务,基于策略的调配自服务,基于策略的调配 可认为Site Recovery Manager 安装了VMware vCenter Orchestrator插件 多租户可以根据需求通过vRealize Automation Center中的蓝图(blueprints)预定义的各自的劫难恢复策略 自动执行故障
20、切换自动执行故障切换 接受关于也许的站点故障的自动警报。只需单击一次鼠标,即可在 vCenter Server 中开始执行恢复计划。自动停止用于恢复的复制数据存储的复制和升级。关闭故障切换站点上的低优先级虚拟机。按照预先指定的引导顺序自动启动受保护的虚拟机。在恢复过程中执行用户定义的脚本和暂停。在故障切换站点上自动重新配置虚拟机 IP 地址。从 vCenter Server 中管理和监控恢复计划的执行。自动故障恢复 自动故障恢复到原始生产站点。通过自动反向复制到原始站点来重新保护虚拟机。反向执行原始恢复计划。运用 vSphere Replication 中的自动故障恢复功能。计划内迁移 使用计
21、划内迁移工作流保证数据零损失和应用一致性迁移。在原始站点正常关闭受保护的虚拟机。执行数据同步以强制将关闭的虚拟机完整复制到故障切换 站点。执行运用应用一致性虚拟机的恢复计划。无中断测试 自动执行恢复测试。运用存储快照功能执行恢复测试,而不会中断复制。在隔离网络中恢复虚拟机,以免对生产应用程序导致任何 影响。针对测试方案自定义恢复计划的执行。完毕测试后自动清理测试环境。在 vCenter Server 中存储、查看和导出测试结果及故障切换 执行情况。支持 vSphere Replication 运用专为 vSphere 和 vCenter Site Recovery Manager 设计的唯一真
22、正基于虚拟化管理程序的复制产品。通过 vCenter 以精细灵活的虚拟机级别直接管理复制。使用与存储无关的复制支持使用低端存储,涉及直连存储。执行具有灵活 RPO(介于 15 分钟到 24 小时之间)的异步 复制。仅复制发生变更的数据块以提高网络效率。扩展到数百个虚拟机。运用对文献和应用一致性的支持。使用多时间点(MPIT)恢复来回到以前的已知状态。支持第三方基于阵列的复制 可在重要供应商提供的大量兼容性存储阵列和复制产品中进 行选择。使用基于 iSCSI、光纤通道或 NFS 存储的基于阵列的复制解 决方案。通过 SRA 保证与 vCenter Site Recovery Manager 紧密
23、集成。自动执行复制和数据同步操作,以实现协调一致的劫难恢复 故障切换和计划内迁移。2.1.3 SRM 支持灵活的拓扑支持灵活的拓扑 Site Recovery Manager 可用于多种不同的故障切换情形,特别是 SRM 能帮助客户更好地运用对辅助站点的投资,即,当客户没有处在劫难恢复情形中时,可将辅助站点用于其他工作负载而不是使其处在闲置状态,SRM 可用于如下四种不同的故障切换情形:积极-被动:Site Recovery Manager 完全支持传统的积极-被动型劫难恢复情形,即运营应用的生产站点将在故障切换之前一直处在闲置状态的辅助站点中恢复。尽管这是最常见的配置,但此情形也意味着您需要
24、为大部分时间都处在闲置状态的劫难恢复站点投入大量资金。积极-积极:为了更好地运用恢复站点,Site Recovery Manager 还可以使用户在不使用该恢复站点进行劫难恢复时将其用于其他工作负载。用户可以将Site Recovery Manager 配置为在故障切换过程中自动关闭或挂起位于恢复站点的虚拟机,这样就可以方便地释放计算容量以用于需要恢复的工作负载。双向切换:Site Recovery Manager 还可以提供双向故障切换保护,这样,您可以同时在这两个站点上运营活动的生产工作负载,并以任一方向对另一站点进行故障切换。另一站点上的备用容量将用于运营需要故障切换的虚拟机。本地故障切
25、换:尽管这不是常见情形,但有一些客户需要可以在指定的“站点”或园区中进行故障切换,例如,当存储阵列发生故障或者大楼维修迫使您将工作负载移动到其他园区大楼时。这些客户将运用 Site Recovery Manager 执行此类故障切换。图:SRM 支持灵活的拓扑 2.1.4 超越劫难恢复:劫难规避和计划内迁移超越劫难恢复:劫难规避和计划内迁移 SRM 不仅限于进行劫难故障切换,它更常用于平常迁移,例如用于劫难规避和计划内迁移。当然,劫难故障切换是最重要的使用情形,也就是当一个站点停止工作并且需要尽快将虚拟机迁移到辅助站点的时候使用。在这种情况下,SRM可支持完全或局部站点恢复,并将尽快执行故障切
26、换以恢复业务服务。其他两种使用情形尽管不是那么重要,但却更为常用。劫难规避在公司事先了解劫难将要发生的时候使用,例如,预测到飓风或洪水将要来袭时。在这种情况下,公司一般可在劫难实际来袭之前提早至少几个小时得到告知。公司也经常执行计划内迁移,例如,避免因计划内维护或全局负载平衡而导致停机。对于劫难规避和计划内迁移,现在公司可运用“计划内迁移”工作流程和自动故障恢复来简化迁移流程。图:三种典型的 SRM 使用情形 2.1.5 VMware Site Recovery 的工作方式的工作方式 Site Recovery Manager 可认为用户提供创建、管理和执行劫难恢复计划的重要环节。该解决方案已
27、经集成到 VMware vCenter 管理界面中,可以统一管理虚拟基础架构及该架构的劫难恢复计划。SRM可以简化并自动执行设立、测试和执行恢复计划的重要环节:设立恢复基础架构:Site Recovery Manager 会指导用户完毕连接远程站点并连接使用的存储复制软件的操作。还可让用户轻松地将生产资源(涉及计算资源和网络资源)映射到恢复站点上相应的资源。创建恢复计划:Site Recovery Manager 具有直观的界面,可以协助用户创建合用于不同故障切换情况和基础架构不同部分的恢复计划。用户可以指定一些虚拟机暂停或关闭,从而释放可用资源以供恢复使用。还可以指定虚拟机启动的顺序、设立用
28、户定义的脚本自动执行,以及必要时决定暂停恢复过程的时间点。测试恢复计划:Site Recovery Manager 可以运用存储阵列的快照功能,在恢复站点上自动创建无中断的、隔离的测试环境,然后将虚拟机连接到用户的隔离测试网络中。它将自动执行在实际故障切换中将使用的恢复计划,并在测试结束后清除测试环境。测试结果会被保存,以便随时查看和导出。自动执行故障切换:管理员从 VMware vCenter 启动恢复计划之后,Site Recovery Manager 会自动执行恢复计划中的所有环节,保证恢复完全按照预期执行。管理员通过 vCenter 可以看到恢复计划的执行情况,并可以随时暂停或停止执行
29、。随着环境的变化,用户也可以通过 vCenter 随时更新和修改恢复计划。2.1.6 劫难恢复自动化和运用软件定义的存储劫难恢复自动化和运用软件定义的存储 Site Recovery Manager 可安装 VMware vCenter Orchestrator 插件,以实现劫难恢复编排过程中每个工作流的自动化。涉及无中断测试、自动执行故障切换、自动执行故障恢复以及计划内迁移。图:工作流自动化 通过 vRealize Automation Center 中的蓝图(blueprints)预定义劫难恢复策略,租户可以实现针相应用的自助式劫难恢复。图:自助式劫难恢复计划 在 SRM 的最新版本中,支
30、持使用软件定义的存储 Virtual SAN 实现劫难恢复计划,提高了灵活度,简化了管理,同时减少了硬件成本。图:软件定义的存储实现劫难恢复计划 2.2 vSphere Replication 通过使用内置的 vSphere Replication,用户可以消除第三方复制成本,并制定更灵活的劫难恢复计划。2.2.1 概览概览 vSphere Replication 无需采用基于存储阵列的本机复制,即可通过网络在vSphere 主机之间复制处在启动状态的虚拟机,该技术具有许多独特的优势:减少带宽需求 消除存储局限性 构建灵活的劫难恢复配置 减少带宽需求减少带宽需求 vSphere Replica
31、tion 是 VMware 的专有复制引擎,它仅会将发生变更的数据块复制到恢复站点,与手动复制完整的虚拟机系统副本相比,可保证实现更低的带宽运用率和更高的恢复点目的。在初始同步期间,运用虚拟机数据的“种子副本”通过跟踪发生变更的磁盘区域并仅复制增量数据,保证高效运用网络 图:vSphere Replication 消除存储局限性 vSphere Replication 在各个虚拟机磁盘(VMDK)级别运营,因而可以在任何存储上托管的数据存储之间进行复制,它可以:在保护站点重新改变旧存储的用途 对非同类站点采用不同的存储技术(例如 SAN 相对于 NAS、FC 相对于iSCSI 等)仅将辅助存储
32、用于受保护的虚拟机,而不是整个环境 构建灵活的劫难恢复配置 在配置要复制的虚拟机时,只需简朴单击一下,即可将 vSphere Replication 配置为保证应用数据和虚拟机数据保持一致,它可以:与 Microsoft 的卷影复制服务(VSS)自动集成,可保证恢复副本一致 支持灵活的恢复点目的,可从 15 分钟至 24 小时不等 在虚拟机级别通过 vCenter Server 控制复制 每个集群可扩展为数百个虚拟机 2.2.2 运用运用 vSphere Replication 来扩大劫难恢复来扩大劫难恢复的的覆盖范围覆盖范围 当前,劫难恢复的覆盖范围通常只限于大型数据中心的第一层应用,也就是
33、关键的业务应用。在许多情况下,第二或第三层等非关键应用和小型站点没有真正的劫难恢复保护,而只是使用备份进行保护。这是由于,传统劫难恢复保护不仅成本高昂并且过于复杂,因而无法广泛应用于所有应用和站点。图:劫难恢复覆盖范围通常受高额保护成本的限制 不幸的是,由于平常活动仍然广泛依赖于第二或第三层应用和小型站点,因此这样的劫难恢复保护会导致大量的业务风险。在抱负情况下,各公司应当准备一个经济高效且简朴可靠的劫难恢复计划,以满足其所有应用和站点的需要。而 VMware Site Recovery Manager 可以提供两种复制选择来供用户使用,它们分别是:基于存储的传统复制,在许多情况下,它仍将是大
34、型关键业务环境青睐的选择 vSphere Replication(VR),它为复制虚拟机提供了另一种选择。VR 是一种经济高效的简朴机制,可用于在两个站点之间进行复制,在很多情况下,是第二或第三层应用和小型站点的更好选择 图:SRM 可提供广泛的复制选择 由于 vSphere Replication 的引入,客户现在拥有更多的选择,从而使复制解决方案可以更好地符合业务需求。VR 和基于存储的复制可在相同的集群中配合使用,以便为更复杂的环境提供最佳灵活性。图:VR 可提供经济高效且简朴的复制 vSphere Replication 和基于存储的复制都非常有用,客户可以根据实际情况将两者结合起来使
35、用。vSphere Replication 由 VMware 直接提供,与基于存储的复制相比,它更为经济高效且更简朴。基于存储的复制依赖于第三方存储供应商,它更昂贵、复杂,难以管理,但是功能相对强大。下图是两种复制技术在复制提供方,成本,管理以及性能方面的比较。图:vSphere Replication 是基于存储的复制的补充功能 vSphere Replication 是将劫难恢复保护扩展至第二或第三层应用和小型站点的极佳方法。图:将劫难恢复保护扩展至第二、三层应用和小型站点 基于存储的劫难恢复相称昂贵,第一层存储阵列上的存储容量和额外的复制许可证使其成本居高不下。存储、复制和 SRM的成本
36、通常在每个虚拟机 2023 美元左右。尽管与物理劫难恢复相比已经便宜很多,但对于不太关键的业务环境而言,其成本仍然相称高并且也许成为成本障碍。vSphere Replication 更为经济高效。通过支持使用较低端存储阵列、消除对专用复制许可证的需求和提供成本较低的 SRM Standard 版本许可证,VR 可将每个虚拟机的成本减少 3 倍,即每个虚拟机大约 600 美元。由于每个虚拟机的成本更低,因此各公司可以将其劫难恢复保护扩展至更多应用和站点。vSphere Replication 不仅经济高效,简朴,它还可以简化复制管理,它在本质上比基于存储的复制更容易管理。在新的 SRM部署中使用
37、基于存储的复制来设立复制是一项复杂的任务。vSphere管理员必须与存储管理员同步才干保证将适当的 LUN 复制到包含对的复制计划的其他站点。图:借助 vSphere Replication 简化复制管理 借助 vSphere Replication,一切都将简朴许多。vSphere 管理员可以从 vCenter直接管理复制,从而消除对存储管理员的依赖。此外,管理员可以在虚拟机级别管理复制,因而再也无需进行复杂的虚拟机分组以及将虚拟机映射到 LUN。VR 的这一特性使得它对于简易性至关重要的情形(例如对于第二和第三层应用的保护)格外具有吸引力。2.2.3 实现原理与工作机制实现原理与工作机制
38、vSphere Replication 是深度集成在 vSphere 平台中的组件,也是当今市场上唯一一款真正的“虚拟化管理程序级”复制引擎。在主站点上,正在运营的虚拟机所用的虚拟机磁盘中假如有数据块发生了变更,这些数据块将发送到辅助站点,并在该处应用于虚拟机磁盘,以制作虚拟机的离线(保护)副本。图:复制虚拟机中发生变更的数据块 图:vSphere Replication 体系结构 vSphere Replication 是一款全新设计的产品,专门用于在 vSphere 集群之间进行复制并支持 SRM部署。它依赖在 ESXi 中嵌入的 vSphere Replication 代理,该 VSR
39、代理可跟踪已更改的磁盘区域并将最新增量数据发送至受保护的站点。所复制的数据将会被 vSphere Replication 服务器捕获。每个 vSphere Replication 服务器实例可以管理大约 100 个虚拟机。它可捕获最新的磁盘更改并将这些更改应用到已复制的数据。vSphere Replication 可通过与 vCenter 和 SRM 紧密集成的 vSphere Replication管理服务器进行管理。这两个站点都需要 vSphere Replication 管理服务器。所有 vCenter 操作都通过同一个管理界面完毕,使用该界面可以非常轻松地为最多 500 个虚拟机配置复
40、制:只需右键单击某个虚拟机,并为其副本选择目的位置即可。此过程有一步是选择“恢复点目的”,此环节将告知 vSphere Replication 可以获取多久以前的虚拟机副本,然后它将时时尝试复制数据以满足恢复点目的。图:为多个虚拟机选择一个恢复点目的 vSphere Replication 将会对源虚拟机及其副本执行一次初始完全同步,管理员可以在目的位置放置数据的种子副本,以减少初始复制所需的时间和带宽。虚拟机的种子副本中包含一个虚拟机磁盘文献,管理员可以通过任何途径将该文献放置到目的位置。放置种子并不是一个必需的过程,无论目的位置是否有种子,vSphere Replication 都会创建一
41、个初始副本。假如用户获得了一个用于复制的种子,即可使用其中的数据来减少初始同步主磁盘及其副本所需的复制量。种子可以手动创建,也可以通过管理员选择的任何途径复制到相应位置,如采用脱机复制、FTP、“人工传输网络”,甚至使用 ISO 或虚拟机的克隆。在完毕基准同步之后,vSphere Replication 将切换为仅传输已变更的数据块。这种做法可以保证通过网络向目的发送最少量的数据,并实现更高的恢复点目的。在发送唯一性数据之后,无需再次发送。系统仅复制发生变更的数据,这些数据块将发送到目的位置的 vSphere Replication 设备中。从受保护的虚拟机的角度看,整个过程是完全透明的,不需
42、要对配置或平常管理进行任何更改。这种复制方式采用的是非侵入形式,与虚拟机中的操作系统无关。2.2.4 vSphere Replication 的优势的优势 vSphere Replication 可以提供非常经济高效、简朴而又功能强大的复制。经济高效 VR 可以减少存储成本和复制成本,所以更为经济高效。它可以在存储层消除这两个站点对较高端存储阵列的需求。客户可以跨站点使用其他较低端的存储,涉及直连存储。例如,一种普遍的选择是将第一层存储放在生产站点,而在故障切换站点使用较低端的存储,例如较旧或较便宜的阵列。此外,vSphere Replication 也与 SRM 捆绑在一起,因而无需花费额外
43、成本,从而消除了基于存储的复制许可证所需的额外成本。简朴 从本质上而言,vSphere Replication 也比基于存储的复制更为简朴。用户可以从vCenter 直接管理复制,从而消除对存储团队的依赖。此外,管理员可在单个虚拟机级别进行管理,从而大幅简化 SRM 的设立。功能强大 尽管 vSphere Replication 简朴且经济高效,但仍然是稳健且功能强大的复制解决方案。它可提供 15 分钟的 RPO,并且使用户可以灵活地将 RPO 设定在 15 分钟到 24小时之间。它可跟踪已更改的磁盘区域并且仅复制最新的增量数据以提高网络效率,还可扩展至最多 500 个虚拟机。3 方案架构设计
44、 VMware vCenter Site Recovery Manager(SRM)是一个业务连续性和劫难恢复解决方案,可帮助用户计划、测试 和执行受保护 vCenter Server 站点与恢复 vCenter Server 站点之间的虚拟机恢复。通过配置基于阵列的复制,管理员可将 SRM 配置为支持若干第三方磁盘复制机制。管理员也可以使用基于主机的复制,方法是配置 SRM 以使用VMware vSphere Replication 来保护虚拟机工作负载。除此之外,SRM 还可以与基于阵列和基于主机的复制同时结合使用。3.1 客户容灾设计规定客户容灾设计规定 设计特性 描述 可靠性 表达设计
45、选择相应的技术能力和相关基础设施的高度可用性。关键指标:XX.XXX的正常运营时间。(99.9%)可管理性 表达设计选择对环境的灵活性和操作的方便限度的影响,涉及可扩展性和灵活性。关键指标:每个管理员的服务器。每个 IT 人员的客户。时间部署新的技术。性能表现 表达的设计选择对环境的性能的影响。这并不必然反映在对基础设施中其他技术的影响。关键指标:响应时间 吞吐量 恢复能力 表达设计选择对从突发事件恢复的能力的影响。关键指标:RTO-恢复时间目的。RPO-恢复点目的。(其中 RTO 规定为 5 分钟内,RPO 规定为 2 小时内)安全 表达设计选择对整体的基础设施安全能力的正面或负面影响。也可
46、以表达设计是否满足业务到达一定的合规性政策的能力。关键指标:未经授权访问的防止 数据的完整性和保密性 在折衷情况下的辨析能力 3.2 实行方案选择实行方案选择 VMware vCenter Site Recovery Manager(SRM)是一个业务连续性和劫难恢复解决方案,可帮助用户计划、测试 和执行受保护 vCenter Server 站点与恢复 vCenter Server 站点之间的虚拟机恢复。SRM 对硬件的规定如下表所示,我们在对 SRM 进行规划时,必须严格遵循下表中指定的最小或者最佳配置。表:SRM 的硬件规定 通过配置基于阵列的复制,管理员可将 SRM 配置为支持若干第三方
47、磁盘复制机制。管理员也可以使用基于主机的复制,方法是配置 SRM 以使用VMware vSphere Replication 来保护虚拟机工作负载。除此之外,SRM 还可以与基于阵列和基于主机的复制同时结合使用。3.2.1 将基于阵列的复制与将基于阵列的复制与 SRM 结合使用结合使用 使用基于阵列的复制时,受保护站点中的一个或多个存储阵列会将数据复制到恢复站点中的对等阵列。通过存储复制适配器(SRA),管理员可以将 SRM 与各种阵列集成。要将基于阵列的复制与 SRM 配合使用,必须先配置复制,然后才干配置使用该复制的 SRM。假如存储阵列支持一致性组,SRM 将与 vSphere Stor
48、age DRS 和 vSphere Storage vMotion 兼容,则可以使 用 Storage DRS 和 Storage vMotion 移动 SRM 保护的一致性组内的虚拟机文献。假如存储阵列不支持一 致性组,则无法将 Storage DRS 和 Storage vMotion 与 SRM 结合使用。这种部署方式的示意图如下所示。图:将基于阵列的复制与 SRM 结合使用 3.2.2 将将 vSphere Replication 与与 SRM 结合使用结合使用 SRM 可使用 vSphere Replication 将数据复制到恢复站点中的服务器。管理员可以将 vSphere Rep
49、lication 作为虚拟设备进行部署,vSphere Replication 设备包含两个组件。1)vSphere Replication 管理服务器管理服务器:在恢复站点上配置 vSphere Replication 服务器 从受保护站点启用复制 对用户进行身份验证,并检查用户执行 vSphere Replication 操作的权限 管理和监视复制基础架构 2)vSphere Replication 服务器服务器:侦听受保护站点上的 vSphere Replication 主机代理的虚拟机更新 将更新应用到恢复站点上的虚拟磁盘 假如需要,可以在一个站点上部署多个 vSphere Repli
50、cation 服务器,以平衡虚拟架构中的复制负载。这种部署方式的示意图如下所示。图:将 vSphere Replication 与 SRM 结合使用 3.2.3 将基于阵列的复制和将基于阵列的复制和 vSphere Replication 与与 SRM 结合使结合使用用 管理员可以在 SRM 部署中结合使用基于阵列的复制和 vSphere Replication。要创建使用基于阵列的复制和 vSphere Replication 的混合 SRM 部署,必须为这两种类型的复制配置受保护站 点和恢复站点。设立并连接存储阵列,然后在这两个站点上安装合用的存储复制适配器(SRA)。在这两个站点上部署
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100