SRM容灾解决专项方案.docx_咨信网zixin.com.cn

资源描述

软件定义的容灾解决方案(VMware Site Recovery Manager) 2024/5/27 目录 1 概述 3 1.1 灾难恢复关键意义 3 1.2 XXX企业容灾方案现实状况分析 4 2 灾难恢复处理方案 6 2.1 vCenter Site Recovery Manager 6 2.1.1 概述 6 2.1.2 Site Recovery Manager关键功效特征 8 2.1.3 SRM支持灵活拓扑 10 2.1.4 超越灾难恢复：灾难规避和计划内迁移 11 2.1.5 VMware Site Recovery 工作方法 11 2.1.6 灾难恢复自动化和利用软件定义存放 12 2.2 vSphere Replication 13 2.2.1 概览 13 2.2.2 利用vSphere Replication来扩大灾难恢复覆盖范围 14 2.2.3 实现原理和工作机制 18 2.2.4 vSphere Replication优势 20 3 方案架构设计 22 3.1 用户容灾设计要求 22 3.2 实施方案选择 23 3.2.1 将基于阵列复制和 SRM 结合使用 23 3.2.2 将 vSphere Replication 和 SRM 结合使用  24 3.2.3 将基于阵列复制和 vSphere Replication 和 SRM 结合使用 25 3.3 网络设计 26 3.3.1 在恢复站点配置相同或不一样IP地址 26 3.3.2 SRM通讯端口设置 28 3.4 存放设计 30 3.4.1 存放复制 30 3.4.2 占位虚拟机 31 3.4.3 快照空间 31 4 配置清单及说明 32 4.1 硬件配置需求 32 4.2 虚拟化软件配置需求 32 5 方案总结 34 5.1 方案关键点 34 5.2 方案优势 34 6 专业服务 36 6.1 VMware专业服务介绍 36 6.2 专业咨询服务内容 36 6.2.1 VMware Accelerate咨询服务 36 6.2.2 技术咨询服务 37 6.2.3 技术用户经理(TAM)服务 37 6.3 专业服务实施步骤 38 6.3.1 评定 39 6.3.2 计划和设计 39 6.3.3 实施 39 6.3.4 运维 40 7 支持服务概述 41 7.1 VMware支持角色和职责 41 7.2 全球技术支持服务 41 7.3 自助服务支持 42 7.3.1 社会支持 42 7.3.2 其它资源 43 8 缩略语解释 44 1 概述 1.1 灾难恢复关键意义统计数据表明：93%企业，一旦发生数据中心失效达 10 天情况，通常在十二个月内就会破产。图：业务可用性和灾难恢复对企业影响来自Forrestor在第二季度咨询汇报表明，正常运行时间和数据保护对业务而言很关键，灾难带来职员工作效率下降、士气低落、收入下降、声誉受损和影响合规性将对企业产生巨大消极影响。图：中止造成不良影响灾难发生往往是出乎大家意料，当忽然发生大灾难，日常建立控制方法已不再有效时，组织怎样才能保护关键业务不被中止，使灾难造成风险降到最低呢？这正是灾难恢复需要考虑问题。数据中心灾难会以不一样形式发生，比如电力中止、硬件故障、人为操作失误、和自然灾难。大量事例表明，业务中止不是“假如”问题,而是“何时”问题。所以，只要是拥有IT信息系统组织，全部应为随时可能发生中止作好准备。确保业务连续性也就是确保业务连续运作，不管发生什么情况，关键系统和网络必需含有不间断可用性。实际上，灾难恢复影响不仅仅局限于上面提到金融领域，政府、公安、医疗、教育等很多行业全部需要使用业务可用性处理方案来确保其业务可用性，对于这些企业，机关，单位而言，当IT基础设施忽然停运，不仅企业内部业务流转、办公等面临瘫痪，更关键是，对外和用户或合作伙伴全部业务交流全部不得不陷入停滞。 1.2 XXX企业容灾方案现实状况分析在中国，很多企业全部不含有灾难恢复能力，甚至是部分金融相关企业全部没有真正意义灾难演练过。关键是设备成本、技术复杂度已经人员IT技能等多方面原因造成。 XXX企业采取传统灾备处理方案，并有了多年积累和发展，不过传统处理方案还是存在以下很多问题。首先，传统可用性处理方案是利用特定于应用处理方案（如：Oracle RAC、MS SQL集群、Exchange Database Access Groups (DAG)等）在应用等级实施业务可用性。即使这种方法通常能够提供不错可用性，不过因为每一组应用全部有自己处理方案，所以这种方法有以下弊端： · 复杂且昂贵 · 对管理员技术要求较高 · 犯错风险大 · 许可证较贵(如RAC) · 专用备份架构其次，即使有部分基础架构层处理方案能够比应用级处理方案愈加经济高效，不过这些处理方案往往在正常运行时间和RTO（恢复时间目标）方面表现得比较差。除此之外，传统灾难恢复处理方案极难在现有物理X86环境中实现，这是因为：传统灾难恢复计划依靠于一套很复杂步骤和基础架构：复制数据中心、复制服务器基础架构、将数据转移到恢复站点步骤、重启服务器步骤、重新安装操作系统步骤等等。因为灾难恢复可能很复杂，所以各个企业常常发觉她们只能为少数多个关键生产工作负载提供良好保护，而其它工作负载（如文件/打印服务器、内部Web服务器、部门级应用）则得不到保护或保护不充足。因为灾难恢复计划和基础架构很复杂，所以各个企业全部极为依靠大量人员培训、正确且完整恢复纪录，和发生停机时恢复步骤正确实施。除此之外，因为恢复计划测试过程会造成中止，而且成本很高昂，所以各个企业无法确保全部培训、文档和实施过程全部切实可行而且能够成功恢复IT服务。图：传统灾难恢复处理方案所面临挑战上图描述了传统灾难恢复处理方案所面临挑战，因为存在这些挑战，该方案往往会产生以下后果： · 恢复计划测试往往会失败 · 关键工作负载基础恢复（如能成功）通常要花费数天或数周时间 · 管理和维护恢复计划要花费IT人员大量时间和资源简言之，目前灾备处理方案还无法满足其企业所设定业务可用性要求。由此，XXX企业提出重新设计和实施中心总部应用到北京IDC异地远程灾备需求。 XXX总部应用虚拟化改造完成后，现在服务器虚拟化百分比已经达成大约XX%，XX%应用已经由虚拟化承载，其中包含XX%关键应用。需结合应用系统架构给出中心总部应用到北京IDC异地远程灾备方案及实施日程表，根据日程表完成异地远程灾备。 2 灾难恢复处理方案 VMware提出基于虚拟化环境软件定义可用性处理方案，该方案不仅能够提供和应用等级可用性方案相类似RTO和RPO（恢复点目标），同时，它还能够提供基础架构层处理方案所含有简易性和成本效益。同时，因为该方案充足利用了虚拟化环境优势，所以它能够达成传统非软件定义处理方案无法达成效果。 VMware灾难恢复处理方案包含vCenter Site Recovery Manager和全新vSphere Replication。 2.1 vCenter Site Recovery Manager 现在，企业发觉越来越难以提供符合要求灾难恢复处理方案。而Site Recovery Manager能够帮助企业应对传统灾难恢复方法多种挑战，满足她们恢复时间目标（RTO）、恢复点目标（RPO）和法规遵从性要求。利用Site Recovery Manager，企业能够管理从生产数据中心到灾难恢复站点故障切换，同时，还能够管理两个互为恢复站点且含有活动工作负载站点之间故障切换。 2.1.1 概述 VMware灾难恢复处理方案分为三个大模块，以下图不一样颜色模块所表示：其中灾难恢复编排属于自动化处理方案；复制、备份和恢复属于数据保护处理方案；计算存放属于基础架构处理方案。图：VMware灾难恢复处理方案 Site Recovery Manager能够自动实施及简化故障切换至新数据中心过程，从而让所计划数据中心故障切换（如数据中心迁移）变得愈加顺畅。它是一款领先灾难恢复管理和自动化处理方案，它经过自动实施恢复过程来加紧恢复速度，并将灾难恢复作为VMware虚拟基础架构管理集成要素，从而简化灾难恢复计划管理工作。 SRM省去了复杂手动恢复步骤，支持无中止恢复计划测试，确保恢复过程安全可靠。它亲密集成vSphere及其它领先存放供给商提供存放复制软件，使故障切换和恢复变得快捷、可靠、经济，而且便于管理。所以，企业不仅无需担心灾难恢复风险，还可将全部关键系统和应用程序纳入到保护范围。自从面世以来，SRM已得到长足发展。到现在为止，VMware已向一万五千多家用户售出12.5万个许可证，而且该产品还在以每十二个月50%～60%速度继续增加。 SRM为vSphere平台上灾难恢复计划增加巨大价值推进了这种增加，而所增加成本却相对较低。VMware很多用户已利用SRM从实际灾难（比如最近在日本发生海啸和在美国发生飓风）中快速恢复。下图是部分关键用户和SRM相关市场数据。图：Site Recovery Manager 发展趋势和部分用户 SRM需要若干个组件。首先，受保护站点和故障切换站点全部需要一个SRM实例。SRM实例可经过和vSphere和vCenter紧密集成来提供管理和自动化功效。 SRM还需要底层复制产品来将虚拟机复制到故障切换站点。借助SRM，用户能够选择使用vSphere Replication或使用基于存放复制。因为vSphere Replication和SRM捆绑在一起，所以无需支付额外费用。基于存放复制由第三方存放供给商提供，并经过Storage Replication Adapater (SRA)和SRM紧密集成，以使SRM能够利用该存放层协调复制和恢复活动。最终，SRM在这两个站点上全部需要配置vSphere集群和单独vCenter实例。图：SRM关键功效组件 2.1.2 Site Recovery Manager关键功效特征 VMware vCenter Site Recovery Manager可提供优异复制、灾难恢复管理、无中止测试、自动故障切换和故障恢复和计划内迁移功效。它能够管理从生产数据中心到灾难恢复站点故障切换，和两个含有活动工作负载站点之间故障切换，甚至还能够将多个站点恢复为一个共享恢复站点。 Site Recovery Manager常常见于计划内迁移和预防性故障切换以避免发生灾难，它关键功效特征以下：集中式恢复计划 · 直接从 vCenter Server 中创建并管理恢复计划。 ·  自动发觉并显示由 vSphere Replication 或基于阵列复制保护虚拟机。 · 将虚拟机映射到故障切换站点上对应资源(资源池、虚拟交换机和虚拟机文件夹)。 · 指定虚拟机引导次序。  · 自定义虚拟机 IP 地址。  · 自定义故障切换站点上低优先级虚拟机关机。  · 利用自定义脚本扩展恢复计划。  · 利用基于角色访问控制来控制对恢复计划访问。 · 将多个站点恢复至一个共享恢复站点。自服务，基于策略调配 · 能够为Site Recovery Manager 安装了VMware vCenter Orchestrator插件 · 多租户能够依据需求经过vRealize Automation Center中蓝图（blueprints）预定义各自灾难恢复策略自动实施故障切换 · 接收相关可能站点故障自动警报。  · 只需单击一次鼠标，即可在 vCenter Server 中开始实施恢复计划。  · 自动停止用于恢复复制数据存放复制和升级。  · 关闭故障切换站点上低优先级虚拟机。  · 根据预先指定引导次序自动开启受保护虚拟机。 · 在恢复过程中实施用户定义脚本和暂停。  · 在故障切换站点上自动重新配置虚拟机 IP 地址。  · 从 vCenter Server 中管理和监控恢复计划实施。自动故障恢复 · 自动故障恢复到原始生产站点。 · 经过自动反向复制到原始站点来重新保护虚拟机。 · 反向实施原始恢复计划。  · 利用 vSphere Replication 中自动故障恢复功效。计划内迁移 · 使用计划内迁移工作流确保数据零损失和应用一致性迁移。 · 在原始站点正常关闭受保护虚拟机。 · 实施数据同时以强制将关闭虚拟机完整复制到故障切换站点。 · 实施利用应用一致性虚拟机恢复计划。无中止测试 · 自动实施恢复测试。 · 利用存放快照功效实施恢复测试,而不会中止复制。 · 在隔离网络中恢复虚拟机,以免对生产应用程序造成任何影响。 · 针对测试方案自定义恢复计划实施。 · 完成测试后自动清理测试环境。 · 在 vCenter Server 中存放、查看和导出测试结果及故障切换实施情况。   支持 vSphere Replication · 利用专为 vSphere 和 vCenter Site Recovery Manager 设计唯一真正基于虚拟化管理程序复制产品。 · 经过 vCenter 以精细灵活虚拟机等级直接管理复制。 · 使用和存放无关复制支持使用低端存放,包含直连存放。 · 实施含有灵活 RPO(介于 15 分钟到 24 小时之间)异步复制。 · 仅复制发生变更数据块以提升网络效率。 · 扩展到数百个虚拟机。 · 利用对文件和应用一致性支持。 · 使用多时间点 (MPIT) 恢复往返到以前已知状态。  支持第三方基于阵列复制 · 可在关键供给商提供大量兼容性存放阵列和复制产品中进行选择。 · 使用基于 iSCSI、光纤通道或 NFS 存放基于阵列复制解决方案。 · 经过 SRA 确保和 vCenter Site Recovery Manager 紧密集成。 · 自动实施复制和数据同时操作,以实现协调一致灾难恢复  故障切换和计划内迁移。   2.1.3 SRM支持灵活拓扑 Site Recovery Manager可用于多个不一样故障切换情形，尤其是SRM能帮助用户愈加好地利用对辅助站点投资，即，当用户没有处于灾难恢复情形中时，可将辅助站点用于其它工作负载而不是使其处于闲置状态，SRM可用于以下四种不一样故障切换情形： u 主动-被动：Site Recovery Manager完全支持传统主动-被动型灾难恢复情形，即运行应用生产站点将在故障切换之前一直处于闲置状态辅助站点中恢复。尽管这是最常见配置，但此情形也意味着您需要为大部分时间全部处于闲置状态灾难恢复站点投入大量资金。 u 主动-主动：为了愈加好地利用恢复站点，Site Recovery Manager还能够使用户在不使用该恢复站点进行灾难恢复时将其用于其它工作负载。用户能够将Site Recovery Manager配置为在故障切换过程中自动关闭或挂起在恢复站点虚拟机，这么就能够方便地释放计算容量以用于需要恢复工作负载。 u 双向切换：Site Recovery Manager还能够提供双向故障切换保护，这么，您能够同时在这两个站点上运行活动生产工作负载，并以任一方向对另一站点进行故障切换。另一站点上备用容量将用于运行需要故障切换虚拟机。 u 当地故障切换：尽管这不是常见情形，但有部分用户需要能够在指定“站点”或园区中进行故障切换，比如，当存放阵列发生故障或大楼维修迫使您将工作负载移动到其它园区大楼时。这些用户将利用Site Recovery Manager实施这类故障切换。图：SRM支持灵活拓扑 2.1.4 超越灾难恢复：灾难规避和计划内迁移 SRM不仅限于进行灾难故障切换，它更常见于日常迁移，比如用于灾难规避和计划内迁移。当然，灾难故障切换是最关键使用情形，也就是当一个站点停止工作而且需要立即将虚拟机迁移到辅助站点时候使用。在这种情况下，SRM可支持完全或局部站点恢复，并将立即实施故障切换以恢复业务服务。其它两种使用情形尽管不是那么关键，但却更为常见。灾难规避在企业事先了解灾难将要发生时候使用，比如，估计到飓风或洪水将要来袭时。在这种情况下，企业通常可在灾难实际来袭之前提早最少多个小时得到通知。企业也常常实施计划内迁移，比如，避免因计划内维护或全局负载平衡而造成停机。对于灾难规避和计划内迁移，现在企业可利用“计划内迁移”工作步骤和自动故障恢复来简化迁移步骤。图：三种经典SRM使用情形 2.1.5 VMware Site Recovery 工作方法 Site Recovery Manager能够为用户提供创建、管理和实施灾难恢复计划关键步骤。该处理方案已经集成到VMware vCenter管理界面中，能够统一管理虚拟基础架构及该架构灾难恢复计划。SRM能够简化并自动实施设置、测试和实施恢复计划关键步骤： u 设置恢复基础架构：Site Recovery Manager会指导用户完成连接远程站点并连接使用存放复制软件操作。还可让用户轻松地将生产资源（包含计算资源和网络资源）映射到恢复站点上对应资源。 u 创建恢复计划：Site Recovery Manager含有直观界面，能够帮助用户创建适适用于不一样故障切换情况和基础架构不一样部分恢复计划。用户能够指定部分虚拟机暂停或关闭，从而释放可用资源以供恢复使用。还能够指定虚拟机开启次序、设置用户定义脚本自动实施，和必需时决定暂停恢复过程时间点。 u 测试恢复计划：Site Recovery Manager能够利用存放阵列快照功效，在恢复站点上自动创建无中止、隔离测试环境，然后将虚拟机连接到用户隔离测试网络中。它将自动实施在实际故障切换中将使用恢复计划，并在测试结束后清除测试环境。测试结果会被保留，方便随时查看和导出。 u 自动实施故障切换：管理员从VMware vCenter开启恢复计划以后，Site Recovery Manager会自动实施恢复计划中全部步骤，确保恢复完全根据预期实施。管理员经过vCenter能够看到恢复计划实施情况，并能够随时暂停或停止实施。伴随环境改变，用户也能够经过vCenter随时更新和修改恢复计划。 2.1.6 灾难恢复自动化和利用软件定义存放 Site Recovery Manager 可安装VMware vCenter Orchestrator插件，以实现灾难恢复编排过程中每个工作流自动化。包含无中止测试、自动实施故障切换、自动实施故障恢复和计划内迁移。图：工作流自动化经过vRealize Automation Center中蓝图（blueprints）预定义灾难恢复策略，租户能够实现针对应用自助式灾难恢复。图：自助式灾难恢复计划在SRM最新版本中，支持使用软件定义存放Virtual SAN实现灾难恢复计划，提升了灵活度，简化了管理，同时降低了硬件成本。图：软件定义存放实现灾难恢复计划 2.2 vSphere Replication 经过使用内置vSphere Replication，用户能够消除第三方复制成本，并制订更灵活灾难恢复计划。 2.2.1 概览 vSphere Replication无需采取基于存放阵列本机复制，即可经过网络在vSphere主机之间复制处于开启状态虚拟机，该技术含有很多独特优势： · 降低带宽需求 · 消除存放不足 · 构建灵活灾难恢复配置降低带宽需求 vSphere Replication是VMware专有复制引擎，它仅会将发生变更数据块复制到恢复站点，和手动复制完整虚拟机系统副本相比，可确保实现更低带宽利用率和更高恢复点目标。 · 在初始同时期间，利用虚拟机数据“种子副本” · 经过跟踪发生变更磁盘区域并仅复制增量数据，确保高效利用网络图：vSphere Replication 消除存放不足 vSphere Replication在各个虚拟机磁盘(VMDK)等级运行，所以能够在任何存放上托管数据存放之间进行复制，它能够： · 在保护站点重新改变旧存放用途 · 对非同类站点采取不一样存放技术（比如SAN相对于NAS、FC相对于iSCSI等） · 仅将辅助存放用于受保护虚拟机，而不是整个环境构建灵活灾难恢复配置在配置要复制虚拟机时，只需简单单击一下，即可将vSphere Replication配置为确保应用数据和虚拟机数据保持一致，它能够： · 和Microsoft卷影复制服务(VSS)自动集成，可确保恢复副本一致 · 支持灵活恢复点目标，可从15分钟至二十四小时不等 · 在虚拟机等级经过vCenter Server控制复制 · 每个集群可扩展为数百个虚拟机 2.2.2 利用vSphere Replication来扩大灾难恢复覆盖范围目前，灾难恢复覆盖范围通常只限于大型数据中心第一层应用，也就是关键业务应用。在很多情况下，第二或第三层等非关键应用和小型站点没有真正灾难恢复保护，而只是使用备份进行保护。这是因为，传统灾难恢复保护不仅成本高昂而且过于复杂，所以无法广泛应用于全部应用和站点。图：灾难恢复覆盖范围通常受高额保护成本限制不幸是，因为日常活动仍然广泛依靠于第二或第三层应用和小型站点，所以这么灾难恢复保护会造成大量业务风险。在理想情况下，各企业应该准备一个经济高效且简单可靠灾难恢复计划，以满足其全部应用和站点需要。而VMware Site Recovery Manager能够提供两种复制选择来供用户使用，它们分别是： · 基于存放传统复制，在很多情况下，它仍将是大型关键业务环境青睐选择 · vSphere Replication (VR)，它为复制虚拟机提供了另一个选择。VR是一个经济高效简单机制，可用于在两个站点之间进行复制，在很多情况下，是第二或第三层应用和小型站点愈加好选择图：SRM可提供广泛复制选择因为vSphere Replication引入，用户现在拥有更多选择，从而使复制处理方案能够愈加好地符合业务需求。VR和基于存放复制可在相同集群中配合使用，方便为更复杂环境提供最好灵活性。图：VR可提供经济高效且简单复制 vSphere Replication和基于存放复制全部很有用，用户能够依据实际情况将二者结合起来使用。vSphere Replication由VMware直接提供，和基于存放复制相比，它更为经济高效且更简单。基于存放复制依靠于第三方存放供给商，它更昂贵、复杂，难以管理，不过功效相对强大。下图是两种复制技术在复制提供方，成本，管理和性能方面比较。图：vSphere Replication是基于存放复制补充功效 vSphere Replication是将灾难恢复保护扩展至第二或第三层应用和小型站点极佳方法。图：将灾难恢复保护扩展至第二、三层应用和小型站点基于存放灾难恢复相当昂贵，第一层存放阵列上存放容量和额外复制许可证使其成本居高不下。存放、复制和SRM成本通常在每个虚拟机美元左右。尽管和物理灾难恢复相比已经廉价很多，但对于不太关键业务环境而言，其成本仍然相当高而且可能成为成本障碍。 vSphere Replication更为经济高效。经过支持使用较低端存放阵列、消除对专用复制许可证需求和提供成本较低SRM Standard版本许可证，VR可将每个虚拟机成本降低3倍，即每个虚拟机大约600美元。因为每个虚拟机成本更低，所以各企业能够将其灾难恢复保护扩展至更多应用和站点。 vSphere Replication不仅经济高效，简单，它还能够简化复制管理，它在本质上比基于存放复制更轻易管理。在新SRM布署中使用基于存放复制来设置复制是一项复杂任务。vSphere管理员必需和存放管理员同时才能确保将合适LUN复制到包含正确复制计划其它站点。图：借助vSphere Replication简化复制管理借助vSphere Replication，一切全部将简单很多。vSphere管理员能够从vCenter直接管理复制，从而消除对存放管理员依靠。另外，管理员能够在虚拟机等级管理复制，所以再也无需进行复杂虚拟机分组和将虚拟机映射到LUN。 VR这一特征使得它对于简易性至关关键情形（比如对于第二和第三层应用保护）格外含有吸引力。 2.2.3 实现原理和工作机制 vSphere Replication是深度集成在vSphere平台中组件，也是当今市场上唯一一款真正“虚拟化管理程序级”复制引擎。在主站点上，正在运行虚拟机所用虚拟机磁盘中假如有数据块发生了变更，这些数据块将发送到辅助站点，并在该处应用于虚拟机磁盘，以制作虚拟机离线（保护）副本。图：复制虚拟机中发生变更数据块图：vSphere Replication体系结构 vSphere Replication是一款全新设计产品，专门用于在vSphere集群之间进行复制并支持SRM布署。它依靠在ESXi中嵌入vSphere Replication代理，该VSR代理可跟踪已更改磁盘区域并将最新增量数据发送至受保护站点。所复制数据将会被vSphere Replication服务器捕捉。每个vSphere Replication服务器实例能够管理大约100个虚拟机。它可捕捉最新磁盘更改并将这些更改应用到已复制数据。 vSphere Replication可经过和vCenter和SRM紧密集成vSphere Replication管理服务器进行管理。这两个站点全部需要vSphere Replication管理服务器。全部vCenter操作全部经过同一个管理界面完成，使用该界面能够很轻松地为最多500个虚拟机配置复制：只需右键单击某个虚拟机，并为其副本选择目标位置即可。此过程有一步是选择“恢复点目标”，此步骤将通知vSphere Replication能够获取多久以前虚拟机副本，然后它将时时尝试复制数据以满足恢复点目标。图：为多个虚拟机选择一个恢复点目标 vSphere Replication将会对源虚拟机及其副本实施一次初始完全同时，管理员能够在目标位置放置数据种子副本，以降低初始复制所需时间和带宽。虚拟机种子副本中包含一个虚拟机磁盘文件，管理员能够经过任何路径将该文件放置到目标位置。放置种子并不是一个必需过程，不管目标位置是否有种子，vSphere Replication全部会创建一个初始副本。假如用户取得了一个用于复制种子，即可使用其中数据来降低初始同时主磁盘及其副本所需复制量。种子能够手动创建，也能够经过管理员选择任何路径复制到对应位置，如采取脱机复制、FTP、“人工传输网络”，甚至使用ISO或虚拟机克隆。在完成基准同时以后，vSphere Replication将切换为仅传输已变更数据块。这种做法能够确保经过网络向目标发送最少许数据，并实现更高恢复点目标。在发送唯一性数据以后，无需再次发送。系统仅复制发生变更数据，这些数据块将发送到目标位置vSphere Replication设备中。从受保护虚拟机角度看，整个过程是完全透明，不需要对配置或日常管理进行任何更改。这种复制方法采取是非侵入形式，和虚拟机中操作系统无关。 2.2.4 vSphere Replication优势 vSphere Replication能够提供很经济高效、简单而又功效强大复制。经济高效 VR能够降低存放成本和复制成本，所以更为经济高效。它能够在存放层消除这两个站点对较高端存放阵列需求。用户能够跨站点使用其它较低端存放，包含直连存放。比如，一个普遍选择是将第一层存放放在生产站点，而在故障切换站点使用较低端存放，比如较旧或较廉价阵列。另外，vSphere Replication也和SRM捆绑在一起，所以无需花费额外成本，从而消除了基于存放复制许可证所需额外成本。简单从本质上而言，vSphere Replication也比基于存放复制更为简单。用户能够从vCenter直接管理复制，从而消除对存放团体依靠。另外，管理员可在单个虚拟机等级进行管理，从而大幅简化SRM设置。功效强大尽管vSphere Replication简单且经济高效，但仍然是稳健且功效强大复制处理方案。它可提供15分钟RPO，而且使用户能够灵活地将RPO设定在15分钟到二十四小时之间。它可跟踪已更改磁盘区域而且仅复制最新增量数据以提升网络效率，还可扩展至最多500个虚拟机。 3 方案架构设计 VMware vCenter Site Recovery Manager (SRM) 是一个业务连续性和灾难恢复处理方案，可帮助用户计划、测试和实施受保护 vCenter Server 站点和恢复 vCenter Server 站点之间虚拟机恢复。经过配置基于阵列复制，管理员可将 SRM 配置为支持若干第三方磁盘复制机制。管理员也能够使用基于主机复制，方法是配置 SRM 以使用 VMware vSphere Replication 来保护虚拟机工作负载。除此之外，SRM还能够和基于阵列和基于主机复制同时结合使用。 3.1 用户容灾设计要求设计特征描述可靠性表示设计选择对应技术能力和相关基础设施高度可用性。关键指标：XX.XXX％正常运行时间。 (99.9%) 可管理性表示设计选择对环境灵活性和操作方便程度影响，包含可扩展性和灵活性。关键指标：每个管理员服务器。每个IT人员用户。时间布署新技术。性能表现表示设计选择对环境性能影响。这并无须定反应在对基础设施中其它技术影响。关键指标：响应时间吞吐量恢复能力表示设计选择对从突发事件恢复能力影响。关键指标： RTO - 恢复时间目标。 RPO - 恢复点目标。（其中RTO要求为5分钟内，RPO要求为2小时内）安全表示设计选择对整体基础设施安全能力正面或负面影响。也能够表示设计是否满足业务抵达一定合规性政策能力。关键指标：未经授权访问预防数据完整性和保密性在折衷情况下辨析能力 3.2 实施方案选择 VMware vCenter Site Recovery Manager (SRM) 是一个业务连续性和灾难恢复处理方案，可帮助用户计划、测试和实施受保护 vCenter Server 站点和恢复 vCenter Server 站点之间虚拟机恢复。 SRM对硬件要求以下表所表示，我们在对SRM进行计划时，必需严格遵照下表中指定最小或最好配置。表：SRM硬件要求经过配置基于阵列复制，管理员可将 SRM 配置为支持若干第三方磁盘复制机制。管理员也能够使用基于主机复制，方法是配置 SRM 以使用 VMware vSphere Replication 来保护虚拟机工作负载。除此之外，SRM还能够和基于阵列和基于主机复制同时结合使用。 3.2.1 将基于阵列复制和 SRM 结合使用使用基于阵列复制时，受保护站点中一个或多个存放阵列会将数据复制到恢复站点中对等阵列。经过存放复制适配器 (SRA) ，管理员能够将 SRM 和多种阵列集成。要将基于阵列复制和 SRM 配合使用，必需先配置复制，然后才能配置使用该复制 SRM。假如存放阵列支持一致性组，SRM 将和 vSphere Storage DRS 和 vSphere Storage vMotion 兼容，则能够使用 Storage DRS 和 Storage vMotion 移动 SRM 保护一致性组内虚拟机文件。假如存放阵列不支持一致性组，则无法将 Storage DRS 和 Storage vMotion 和 SRM 结合使用。这种布署方法示意图以下所表示。图：将基于阵列复制和 SRM 结合使用 3.2.2 将 vSphere Replication 和 SRM 结合使用  SRM 可使用 vSphere Replication 将数据复制到恢复站点中服务器。管理员能够将 vSphere Replication 作为虚拟设备进行布署，vSphere Replication 设备包含两个组件。 1) vSphere Replication 管理服务器: u 在恢复站点上配置 vSphere Replication 服务器 u 从受保护站点启用复制 u 对用户进行身份验证,并检验用户实施 vSphere Replication 操作权限 u 管理和监视复制基础架构 2) vSphere Replication 服务器: u 侦听受保护站点上 vSphere Replication 主机代理虚拟机更新 u 将更新应用到恢复站点上虚拟磁盘假如需要，能够在一个站点上布署多个 vSphere Replication 服务器，以平衡虚拟架构中复制负载。这种布署方法示意图以下所表示。图：将 vSphere Replication 和 SRM 结合使用  3.2.3 将基于阵列复制和 vSphere Replication 和 SRM 结合使用管理员能够在SRM 布署中结合使用基于阵列复制和 vSphere Replication。要创建使用基于阵列复制和 vSphere Replication 混合 SRM 布署，必需为这两种类型复制配置受保护站点和恢复站点。 · 设置并连接存放阵列,然后在这两个站点上安装适用存放复制适配器(SRA)。 · 在这两个站点上布署 vSphere Replication 设备,然后在这些设备之间配置连接。 · 依据需要使用基于阵列复制或 vSphere Replication 配置要复制虚拟机。这种布署方法示意图以下所表示。图：将基于阵列复制和 vSphere Replication 和 SRM 结合使用依据XXX用户生产环境实际情况，我们提议采取将vSphere Replication和SRM 结合使用布署方法。 3.3 网络设计把服务从一个物理站点转移到另一个站点对网络无疑是一个挑战，尤其对应那些应用和IP地址绑定情况。网络地址空间和IP地址分配是设计中需要考虑原因，可选择在恢复站点使用相同IP地址或IP地址不一样。 3.3.1 在恢复站点配置相同或不一样IP地址用户现有网络基础设施，网络地址空间，用于故障切换测试和故障切换可用基础设施，在恢复站点基础实施服务，虚拟机承载服务等原因是影响计划考虑原因。 3.3.1.1 选择1: 相同 IP 地址在恢复站点使用相同IP地址好处是： · 易于实施，假如有两个站点之间有拉伸VLAN（stretch VLAN），或恢复站点完全不和被保护站点共享。 · 故障切换测试或在故障切换过程中无须改变IP地址。 · 隔离网络采取物理交换机提供所需隔离和灵活性来进行测试，而不会影响生产网络。相同IP地址缺点是： · 没有拉伸VLAN（stretch VLAN）时，可采取一个移动VLAN处理方案。这就要求其中一个站点有可用VLAN，但两个站点不能同时使用。这限制了故障切换粒度。它也限制了实施测试能力，因为在实施测试要求从生产环境剥离出来活跃VLAN。 · 需要确保流量在故障切换测试过程或故障切换中不泄露到生产网络。（建立一个独立网络。） · 在故障切换测试过程中，有必需以验证用户能够访问独立测试网络以实施用户测试权限。这能够用一个带

展开阅读全文