1、 微软私有云解决方案 客户组织Microsoft EPG文档修订吴柯2023/12/20目录1.IT发展趋势42.云计算解决之道-Cloud OS53.功能设计93.1设计原则93.2设计目标93.3功能描述104.详细设计144.1总体架构设计144.2资源池设计154.3节点容量设计164.4CPU174.5存储设计184.6网络设计194.7活动目录设计214.8系统管理设计224.9监控设计234.10灾备设计284.11安全设计304.12性能优化设计335.软硬件配置及报价35 1. IT发展趋势IT 世界的发展速度不久,传统IT不断面临挑战。整个产业正在受到几个重要 IT 趋势的
2、影响,不仅发明出新的机遇,并且受到公司与服务供应商组织的驱动:新的应用程序:业务创新与灵敏度推动着部署、系统,以及集成工作对灵活性提出了更多规定。这样的灵活性规定以组件式应用程序架构为特点的全新应用程序与服务架构具有更好的连接性,以新的应用程序框架为基础构建而来,能提供更丰富的通用服务集,可快速充足地运用熟悉的生产力、协作,以及社交网络工具所提供的优势。设备的扩张:消费类计算设备领域的创新为公司提供了新的机遇,通过让用户以新的方式工作,例如在家或者在路上工作,可进一步提高生产力。移动设备领域的各项创新随时在线,通过 Wi-Fi 和蜂窝网络进行连接的能力,触摸屏、摄像头,以及 GPS 等强大的功
3、能缔造了更丰富的用户体验偏好,这些需求与预期逐渐进入到公司环境中。这种“IT 消费化”趋势为公司提供了新的机遇,通过为这些体验与设备提供支持,可改善员工生产力,促成新的工作场景,例如在客户现场更方便地访问数据与应用,以及与具体设备的特性关联更紧密的应用程序。数据大爆炸:数据量以指数形式增长的趋势也为 IT 导致了极大的挑战。这些数据来自多种内外部来源,而业务与个人计算设备使用量的增长产生了大量结构化与非结构化格式的数据,更是令这一情况日益严重。数据之间的关联以及有用的洞察力往往分散隐藏在不同来源数据的组合结果中。在很多情况下,分散的大量数据使得组织很难使用传统方法进行捕获和分析,例如存储在数据
4、库中供查询和分析。在某些情况下,数据流的生成速度和容量使得任何捕获或解决方法的速度都无法赶上新数据的生成速度。云计算:为了解决有关新式应用程序、设备的扩张,以及数据大爆炸导致的挑战,组织需要采用新的方式,在聚合的数据中心基础架构内更高效有效地运用最新 IT 创新。将资源从不同硬件组件中剥离出来并创建资源池,同时仍然将不同负载进行隔离,这样组织即可实现更高灵敏度的负载供应,获得连续可用性,以及适应性更强的扩展能力,同时还能进一步优化资源的运用率。这种“云计算”交付模型已经演变为新的 IT 服务交付模型,通过呈现并管理这样的能力即可充足发挥资源的所有潜能。很多公司 IT 部门已经将自己的数据中心服
5、务重塑为“私有云”计算模型,并通过自助服务供应和管理门户对交付模型实现了自动化,同时还能根据资源的用量进行收费。数据中心服务供应商也已将自己的服务交付方式转变为云计算模型,由于 IT 服务的成熟度更高,这种做法往往能提供更具吸引力的资源池化经济效益。正是由于私有云、服务供应商云,以及公共云环境之间存在着这样的一致性,不同规模的 IT 组织才干充足运用云计算的优势,将数据中心的边界进一步扩展,改善服务扩展能力、适应性,以及可用性。今天快节奏的业务创新与经济全球化发展趋势一起产生了更进一步,多样化的市场环境,潜在业务合作伙伴与竞争对手都对底层业务能力的改善提出了迫切的规定。与此同时业务需求与技术创
6、新也开始汇聚在一起,为 IT 专业人员提供了独一无二的机遇,充足运用新的创新满足业务需求。请考虑业务需求的这几个趋势: 灵敏。公司中的数据中心专业人员需要更灵活,更快速地响应应用程序所有者对业务需求的变动,同时托管供应商也必须开发创新的新服务,以便吸引并维系客户。 效率。无论用户就职于小公司,政府部门,托管供应商,或大公司,每个人都必须用更高效,更具成本效益的方式完毕自己的工作。 合规。公司与托管供应商必须保护客户个人身份信息,对制度的变化作出响应,遵守业界与政府策略。 访问。员工需要访问数据与信息,但不需要考虑提供这些内容的基础架构、网络、设备,或应用程序。公司与托管供应商必须可以提供可以随
7、时随地访问的 IT 服务,这样才干让员工满意,并符合客户预期。为了支持这些业务需求,IT 专业人员需要具有适应性,能根据业务需求的变化快速扩展并收缩的基础架构,必须 将停机时间与故障降到最低,同时获得最大化成本效益。好在一些重要的技术创新已经使得这些规定变得也许: 虚拟化。IT 部门可以更快速响应业务单元的请求,减少部署基础架构与服务所需的时间。并且虚拟化技术可极大减少为业务提供支持所需物理服务器的数量。 安全与身份管理。这些关键技术通过进化已经可以提供更高安全性与合规性的环境,保护重要资产,为公司与个人身份提供保护。 基于云的应用程序。随时随地访问重要应用程序有助于提高工作效率,改善交流,改
8、善与客户的接触,让公司改善固定的业务节奏,更快速对市场变化与商机做出响应。 多租户与跨边界集成。这些创新可以帮助 IT 部门与托管服务供应商充足运用现有基础架构投资,同时尝试新的服务,改善管理能力,获得更高可用性。2. 云计算解决之道-Cloud OS 数年来,微软在构建与运维全球最大规模云应用程序方面已经积累了大量经验。微软将这些经验与体验融会贯通,通过市面上最领先的公司操作系统、平台,以及应用程序提供应用户,供用户用新的方式开拓现代化 IT 领域。这就是:Cloud OS。微软 Cloud OS 提供了一个由产品与服务组成的现代化平台,可以帮助组织将当前的服务器基础架构转换为高适应性,可扩
9、展,更可靠的云基础架构;跨平台、位置,以及设备快速灵活地构建并管理现代化应用;通过大量现有和新增数据释放洞察力;为身处任何地点,使用任何设备的用户提供生产力支持。微软 Cloud OS 为公司提供了连续可用,始终在线的基础架构与解决方案。自动化管理,强大的多租户支持,以及自助服务供应可帮助公司转换自己的数据中心,在整个数据中心层面上对共享的池化资源集的协调与管理提供支持,借此取代针对每个服务器节点进行的碎片化管理。微软 Cloud OS 使得公司可以快速灵活地构建并管理现代化应用,与使用各种平台与语言开发的其他应用程序进行交互,互换数据,这些程序可以位于内部环境或云端。这种现代化的应用必须可以
10、支持多种类型的设备,能与社交数据进行集成,或促进用户之间的社交联系。通过捕获并分析海量数据,微软 Cloud OS 使得公司可以帮助用户做出更快更好的业务决策,这样的系统必须能支持非结构化数据、数据流,和/或海量数据 数据可以来自现有或新的来源,并且需要能在 IT 的有效监管下尽量将数据提供应更多用户。最终,微软 Cloud OS 可以帮助公司让用户通过惯用的设备获得生产力,无论使用什么设备都能用更轻松的额方式实现设备管理,并用安全的方式将应用程序与数据交付到可扩展的移动环境中。微软 Cloud OS微软 Cloud OS 的核心是 Windows Server 2023 R2,该产品符合现代
11、化数据中心、现代化应用,以及以人为中心的 IT 所需的一切特性,这一切令 Windows Server 2023 R2 从竞争对手的产品中脱颖而出。这些特性涉及: 公司级:Windows Server 2023 R2 提供了一套公司级的数据中心与云平台,可通过扩展运营最大规模的负载,同时通过强大的恢复选项保护防范服务中断。无论内部环境或云端,该产品都提供了自动化的资产保护与恢复,能用品有成本效益的方式提供业务连续性,让用户在改善负载 SLA 的同时减少停机风险。由于很多客户环境通常是异构的,Windows Server 2023 R2 还通过跨平台技术提供了高级互操作性。 简朴且具有成本效益:
12、Windows Server 2023 R2 为用户提供了适应性强,支持多租户环境的存储与网络功能,适合不同类型的负载。通过使用品有成本效益,符合业界标准的硬件,该产品可以用其他解决方案价格的零头提供类似的功能。通过对内建的大量管理任务实现自动化,Windows Server 2023 R2 简化了大部分负载的部署工作,并可提高运维效率。 专注于应用:Windows Server 2023 R2 可以帮用户更快速构建、部署,以及扩展应用程序与网站,并且能获得以往无法想象的灵活性。通过与 Windows Azure 以及 System Center 2023 R2 配合使用,还能在内部环境和公共
13、云,以及服务供应商云之间提供更好的应用可移植性,借此可改善用户 IT 服务的灵活度与适应性。Windows Server 2023 R2 可支持关键业务应用,对开放式标准,开源应用,以及不同的开发语言提供了更好的支持。 以用户为中心:Windows Server 2023 R2 可供用户帮助最终用户使用自己惯用的设备访问公司资源,同时仍然为信息提供必要的保护。用户可以跨越不同数据中心管理用户身份,并将其与云端联合,提供更安全的远程访问,根据用户身份,要访问的目的,以及所用设备定义资源与访问级别。通过统一的基础架构用户可以同时管理公司与个人拥有的设备,使其更易于被发现,并保证满足合规性规定。微软
14、System Center 2023 R2 为Windows Server 2023 R2 提供了统一管理与开发运维。这些功能的一致性使得公司所需的私有与公共云可以无缝并且灵敏的集成在一起,并能进一步改善服务的扩展性、适应性,以及可用性: 统一的运维与管理:微软 Cloud OS 支持统一的开发运维及统一的应用程序生命周期管理,针对开发与运维提供了通用应用程序框架。通过将 Microsoft System Center 与开发环境,例如 Visual Studio 集成在一起,公司可以快速开发解决方案,轻松进行应用程序排错与管理工作。 通用身份:微软 Cloud OS 将 Active Dir
15、ectory 作为一种强大的跨环境资产,可帮助公司使用单一身份用安全的方式通过互联网扩展到云端,并能安全地将应用程序和数据扩展到设备。 集成式虚拟化:为了帮助公司获得现代化数据中心,微软 Cloud OS 包含的基础架构具有划时代的灵敏度,可充足运用虚拟化技术提供更高扩展性与适应性的基础架构,通过共享的资源提供连续可用,始终在线的服务,并能通过更加自动化的管理与自助服务供应支持云服务的交付模型。 完善的数据平台:微软 Cloud OS 完整支持各类海量数据,高级分析,以及公司 BI 生命周期管理,并提供了一套完善的技术,可用于云端的数 PB 数据,大部分关键业务应用的数百万笔事务,并支持对最终
16、用户的数十亿行数据进行预测与即席分析。 灵敏的开发平台:微软 Cloud OS 使得公司可以使用已经熟悉的工具,涉及 Microsoft Visual Studio 与 .NET,或其他开源技术和语言,例如 REST、JSON、PHP 以及 Java 开发所需应用程序。为了在全球经济环境中获胜,跟上创新的步伐,IT 组织在对不断变化的业务需求做出响应时,必须改善自己的灵敏度,并要改善运作效率,更好的管理成本,同时帮助业务与用户连续获得高水平的生产力。数年来,微软在构建与运维全球最大规模云应用程序方面已经积累了大量经验。微软将这些经验与体验融会贯通,通过市面上最领先的公司操作系统、平台,以及应用
17、程序提供应用户。微软将这一愿景叫做“Cloud OS”。微软 Cloud OS 提供了一个由产品与服务组成的现代化平台,可以帮助组织将当前的服务器基础架构转换为高适应性,可扩展,更可靠的云基础架构;跨平台、位置,以及设备快速灵活地构建并管理现代化应用;通过大量现有和新增数据释放洞察力;为身处任何地点,使用任何设备的用户提供生产力支持。微软是唯一一家能同时涵盖公司私有云数据中心,以及公共云数据中心,例如 Windows Azure 或服务供应商的公共云产品,并提供 Cloud OS 这个包含一致且完善功能的产品。公司可借此改善 IT 服务的扩展性、适应性,以及可用性。System Center
18、2023 R2 为 Cloud OS 提供了统一管理机制,能有效帮助客户兑现现代化数据中心的承诺。System Center 2023 R2 为希望构建私有云(或管理 Windows Azure 服务)的公司,以及希望提供更大规模云服务的服务供应商提供了下列独一无二的功能: 公司级:System Center 2023 R2 的管理功能是公司级的,并且目前已经投入实用。System Center 能在 Windows Server 与微软负载(例如 Exchange、SharePoint 以及 SQL)环境中提供最佳管理性能与规模。此外还能支持管理多租户环境中基于 SAN 的存储技术与虚拟网络
19、。System Center 还对异构数据中心提供了强大的管理功能。 简化,具有成本效益:System Center 2023 R2 一直以来都致力于减少客户数据中心环境的复杂度。服务模板与运营手册功能使得 System Center 组件的部署更简朴,通过基于 Web 的界面访问 System Center 的功能,使其可以快速与客户的现有投资,例如门户集成在一起。System Center 还支持管理使用了符合业界标准硬件的大规模 Windows Server 文献存储技术。 专注于应用:System Center 特别专注于优化客户的应用与负载,提供丰富的洞察力,这有助于实现可预测的应用
20、程序 SLA。System Center 还能帮助应用所有者获得标准化的应用程序供应。 混合 IT 管理:与 Cloud OS 类似,混合这一观念是 System Center 的核心。System Center 能提供涵盖 Windows Server 与 Windows Azure 环境的一致管理体验,无论是供应、自助服务,或监控,都能保持一致。Windows Server 2023 R2 + SystemCenter2023提供了强大的新技术,有助于实现到现代化数据中心的转换。这些技术可供用户为现有的和新增的数据中心提供更高级别的支持,减少硬件成本,提供私有云服务,更轻松地将私有云扩展为
21、混合云架构,改善对远程及移动员工和设备的支持。借此公司与服务供应商的 IT 组织将能简化 IT 服务的推出与管理工作,更快速地部署流程与负载,改善应用程序的可用性与访问能力,同时减少成本、初始投资,以及风险。通过采用Windows Server 2023 R2 + SystemCenter2023,公司与服务供应商的 IT 人员可以更好地为业务灵敏度、效率,以及创新提供支持,用云计算技术最终为业务带来更有利的竞争优势3. 功能设计3.1 设计原则本方案设计中将遵循如下原则:n 借鉴与创新:本次项目在设计过程中需要借鉴全球范围内其它类似案例,同时也应当充足了解客户需求的前提下,对解决方案进行最大
22、限度优化。n 先进性:坚持采用目前的主流产品,满足客户业务服务平台3-5 年之内的发展趋势。n 高可用性:在设计中充足考虑系统的可用性,摒除系统设计上的单点故障。n 可扩展性:系统设计满足客户的业务发展,因此系统良好的扩展性能保证系统很好的适应用户数的增长、公司架构的变化等需求。n 高安全性:作为公司的基础管理系统,设计中需要从多个方面考虑系统的安全性;n 可继承性:鉴于公司内各系统之间越来越多的关联需求,新的系统必须提供对已有系统的高度可集成性,尽也许地避免反复建设,增长维护成本。n 可扩展性:系统的设计要考虑到业务未来发展的需要,架构应满足横向和纵向扩展的需求,在架构简明的基础上,减少各功
23、能模块和组件的耦合度,并充足考虑到兼容性,实现快速高效的扩展方案。n 适应性:系统需充足考虑到已有的IT资源投入,适应网络、系统和应用架构,避免在构建过程中的大范围系统改造,减少系统复杂度和建设成本。3.2 设计目的本方案设计目的如下:提供一个安全、稳定并且易于监管和动态扩展的私有云平台。建立一整套系统管理平台,对私有云架构进行全面的管理。管理重点涉及:n 虚拟资源池的平台的搭建,支持异构的虚拟化平台n 虚拟资源池管理(包含虚拟机、虚拟存储、虚拟网络)通过系统管理平台可以让虚拟机共享后端资源池中的资源,保证在Hyper-V群集中的主机均能有效支撑在这之上运营的虚拟机,假如主机资源有限或者出现故
24、障,上面运营的虚拟机就会迁移至有充足计算资源的主机上。同时通过服务管理平台和门户对用户进行快速服务交付。n 云平台运营状态监控系统管理平台可以在第一时间帮助管理员了解到虚拟终机资源耗用及监控状况,除了可以提供积极预警服务之外,也可以在出现问题之后快速诊断问题,并可提供远程支持。n 私有云的安全性除了存在信息安全泄露的遗患之外,尚有也许出现病毒及恶意代码问题,会影响整个私有云平台及IT基础架构。虽然本次项目中采用集中式虚拟机部署方式,但是仍然会存在上述安全问题,因此对这些虚拟机采用集中的安全管理手段重要,比如说,统一部署防病毒软件、制定统一的补丁及应用程序分发策略、制定统一的密码策略和IT安全策
25、略等。通过系统管理平台的搭建,可以帮助私有云平台的管理员可以更高效的对该平台进行管理及运维,在保证安全的前提下,实现私有云平台的高可用性。3.3 功能描述3.3.1 用户身份认证私有云环境需要通过不同的用户账户拟定其所拥有的操作权限。例如哪些用户是整个私有云管理员,拥有对整个环境的管理权限;哪些用户是某个服务器的用户,只能登录被授权的虚拟机进行相关操作;哪些用户是私有云维护人员,负责对管理维护分派给自己所属应用系统虚拟机的运营状态。所有人员必须通过准确的身份验证才干拟定其获得哪种权限,用户身份认证模块就是用来实现有关身份验证方面的工作。微软是使用活动目录(Active Directory)来实
26、现的。3.3.2 服务器集群本模块中的宿主服务器将会构建出一个可靠的、高效的物理资源环境,用以承载对物理资源规定更多,更加重大的应用系统环境。本模块中的宿主服务器间将会构建成一个高可用群集环境,为部署在其上每个虚拟机实例提供良好的高可用基础环境。换句话说,即使由于某种因素宿主服务器出现宕机现象时,运营在其上的虚拟机实例也会自动、迅速的漂移到高可用群集的其它正常运营的宿主服务器上。为了提供更高的存盘性能,所有的虚拟机硬盘文献建议统一保存在高效的SAN网络存储之上。3.3.3 虚拟机管理为了可以更加有效的管理整个私有云中的所有虚拟机实例,管理员最需要通过一个统一的界面,对所有虚拟机进行集中化管理。
27、本模块中使用了微软的System Center Virtual Machine Manager实现集中化的管理所有虚拟机实例。Virtual Machine Manager用于对虚拟机的规划、部署、管理和优化虚拟基础结构。它可以帮助管理人员拟定重要的整合项目,同时通过成熟的算法改善了虚拟机工作负载的调配,还可以快速可靠的进行物理机到虚拟机的转换 (P2V),这些特性大大简化了整合多个物理服务器过程中的管理任务。特别对目前已经存在的开发测试用物理PC机,P2V功能可以大大节省迁移工作量。System Center VirtualMachine Manager为 IT 管理员提供了高效的管理工具,
28、涉及 Windows PowerShell 脚本、管理控制台、虚拟机资产集中库等,并可以让获得授权的最终用户可以自助的、快速的配置虚拟机,进而使得虚拟数据中心更加易于管理。3.3.4 状态监控虚拟机运营状态是否健康?宿主服务器的自身状态是否出现了问题?出现的问题是否会影响应用系统环境的正常运营? 上述的一系列问题都是私有云解决方案必须要对的面对的。本模块通过使用微软的System Center Operations Manager实现对私有云解决方案中,虚拟机运营状态和宿主物理服务器运营状态的统一监控和维护管理。通过本模块可以轻松监控成千上万台服务器(涉及宿主服务器与虚拟机)、应用程序和客户端
29、,它提供了一个 IT 环境运营状况的完整视图,可以快速对破坏活动做出反映。 IT环境包含很多不同的组件:客户端和服务器计算机、操作系统、数据库、邮件服务器等等。Operations Manager 依赖于管理包 (MP) 解决这种多样性。每个 MP 都包具有关如何管理特定组件的知识。通过安装相应的 MP,组织可以运用创建者的知识更有效地管理其环境。 Operations Manager 依赖于在其管理的每台计算机上运营的代理,因此每台计算机(物理机或虚拟机)都有一个 Operations Manager Client。从 Operations Manager 控制台操作员的角度来看,查看和管理
30、虚拟机和物理机的方式相同,都使用相同的用户界面和相同的 MP。Operations Manager 还包含用于管理虚拟化技术的特定 MP。例如,用于虚拟机的 MP 允许操作员枚举在特定物理机上运营的虚拟机、监控这些虚拟机的状态等等。 通过使用SCOM,管理员可以实现使用统一的管理手段同时管理物理机和虚拟机环境。本模块可以对私有云环境中的虚拟机进行性能与资源的自动优化,性能与资源优化(PRO)是SCVMM的一个功能,可以动态的对失效情况或配置不妥的模块进行响应。PRO可以对不健康的系统或应用程序状态向管理员发送警报并提供建议和更正行动,也可以创建系统响应以自动修复。PRO中提供了更多细化的级别,
31、PRO可以对更广泛的硬件、操作系统或应用程序采用纠正行动。3.3.5 环境配置不管是虚拟机中的开发测试环境还是宿主服务器,在运营了一段时间后,都会要对其进行相应的补丁安装工作。当然对于虚拟机中的开发测试环境还会存在软件的安装、升级工作。本模块使用了微软的System Center Configuration Manager为宿主服务器和虚拟机进行自动化的升级,管理员通过Configuration Manager可以监控到涉及该升级程序是如何安装到所管理的系统,在安装后,在每台宿主服务器上维护对的的配置(涉及任何须要的更新或修补程序),管理员可以跟踪每个系统上安装的软件。Configuratio
32、n Manager 服务器与运营在每台所管理宿主服务器/虚拟机上的Configuration Manager代理通信。服务器依赖一个包含策略的数据库。这些策略被下载到 Configuration Manager 代理,用于控制每个被管理的系统的与配置相关的行为。在所管理的系统上部署和更新软件是 Configuration Manager 最基本的职责。安装软件之后,Configuration Manager 就可以应用修补程序和其它类型的更新。所安装和更新的软件可以从 Microsoft 获得许可、由其它软件供应商提供或在组织内部创建。部署和软件更新的基本过程依赖于管理点 (MP)、分发点 (
33、DP) 和策略。Configuration Manager 代理从某个 MP 获得一个或多个策略,然后基于那些策略与该 MP 交互。此机制可以在被管理的系统的 CPU 繁忙时暂停,然后在 CPU 不忙时全速运营,从而努力避免干扰使用目的系统的用户。Configuration Manager 还涉及 “LAN 唤醒”(Wake on LAN) 的选项,允许休眠甚至关闭的系统通电启动,完毕更新,然后恢复其先前状态。通过这种方式,使得在夜间关闭的计算机仍然可以对它们应用新的软件更新,这样做可以帮助组织节省资金,并减少管理员在宿主服务器方面的维护工作量。Configuration Manager同时包
34、含集成的防病毒软件Endpoint Protect,为私有云中的物理主机和虚拟机提供安全保护。3.3.6 自服务门户私有云的使用者通过使用System Center Service Manager管理自服务门户网站来直接管理被分派的虚拟机实例。如申请虚拟资源,开/关虚拟机,暂停虚拟机,进行虚拟机快照等操作。同时可以通过此门户网站提供的ActiveX控件直接连接到特定的虚拟机实例上,从而在虚拟机环境中进行任意的操作。3.3.7 数据备份为各项目组提供的开发测试用虚拟机中保存着项目相关的大量有用信息,假如一旦丢失后果不堪设想。因此私有云解决方案中的备份方案是整个解决方案的一个重要环节。本模块中使用
35、微软的System Center Data Protection Manager来实现对宿主服务器和虚拟机的系统、数据的备份。使用 Integration Services Hyper-V VSS使得 DPM 备份数据而无需暂停或中断用户连接。Data Protection Manager 在文献更改时捕获每个更改。这些更改存储在本地文献服务器上,然后由 Data Protection Manager 代理按照管理员定义的计划发送到 Data Protection Manager 服务器,例如每小时一次。此方法有时称为“半连续数据保护”(near-continuous data protect
36、ion)。管理员还可以配置 Data Protection Manager 以其它间隔备份文献。对于长期的备份数据存储,可以将 Data Protection Manager 自身连接到磁带备份系统。DPM也可备份群集, 并且支持VMM的快速迁移。使用Hyper-V的虚拟机复制功能,还可以实现虚拟机的整机备份与快速恢复。4. 具体设计4.1 总体架构设计整个设计方案对于私有云架构进行具体说明,涉及服务器虚拟化资源池设计、服务器群集组设计、私有云平台管理功能设计、软硬件选择等,以及性能、安全性、高可用性等其它非功能因素。l 软件部分n 活动目录架构设计。n 私有云系统管理平台部分,微软Windo
37、ws Server Hyper-V 及系统管理套件SystemCenter来构建虚拟资源池,并进行全面的私有云系统管理。l 硬件部分n 在硬件选择方面重要会涉及以下三部分u 服务器:在架构设计中,会建设2个高可用群集,分别相应私有云系统管理平台和应用业务系统。Windows群集可以实现虚拟机的高可用性,一旦群集内的某台宿主服务器出现故障,可迅速的将虚拟机迁移到群集其他适宜的节点上。考虑到服务器虚拟化对高可用性的规定,建议在该群集中,专门预留一到两个节点作为专门的备机,以提供更高的高可用性。u 存储:考虑到要实现私有云平台的高可用性和高性能,在存储类型上建议使用SAN或IPSAN。具体所需可用空
38、间,需要对所有虚拟机所需空间计算后得出。u 网络:网络部分重要根据服务器所配网卡数量,进行物理或者逻辑网络类型的设计划分4.2 资源池设计私有云资源池由后端构成群集组的宿主服务器构成,形成计算资源的虚拟化池,提供应虚拟化管理平台,虚拟桌面和虚拟服务器使用。在本方案中,后端虚拟机池由Windows Server 2023 Hyper-V来实现,通过服务器虚拟化技术来支持上述虚拟机。Windows Server 2023 Hyper-V是构建虚拟机池的核心组件,可以充足运用硬件的虚拟化特性和减少虚拟化中的软件模拟过程,很大的提高和优化了虚拟服务器的性能特别是在IO方面的性能。在Hyper-V 的产
39、品体系结构组件中父分区负责资源分派和调度,以及客户机与物理硬件之间的输入/输出 (I/O) 访问。支持 Windows Hypervisor 的虚拟实例操作系统或“启发式”虚拟实例操作系统运用 VMBus 实现更高性能的 I/O,而不支持 Hypervisor 的虚拟实例操作系统则使用模拟的设备。设备模拟可为范围最广的一组虚拟实例操作系统提供支持,但性能会受到影响。虚拟机管理程序是非常精简的软件层,它充足运用了 Windows Server 驱动程序支持和硬件辅助的虚拟化技术。不包含第三方代码或驱动程序的最小代码库可帮助创建更加安全、更加强健的私有云解决方案平台,Hyper-V宿主服务器通过内
40、置在Windows Server 2023上的集群服务来构建一个虚拟资源池,不同于单台的Hyper-V宿主服务器,Hyper-V宿主服务器群集可以实现:n 可以将多台宿主服务器的资源进行整合,可以按照宿主服务器资源运用情况合理分派虚拟机;n 良好的扩展性,假如原有数量的宿主服务器已经存在性能瓶颈,计算资源已经不能满足规定,可以非常方便的添加新的宿主服务器到群集组中,从而扩展虚拟机的支持数量;n 可有效提高虚拟机的高可用性,一旦群集组中某一台宿主服务器出现故障或需要进行定期运营维护的时候,运营在该宿主服务器上的虚拟机会平滑迁移到群集内的其它宿主服务器上宿主机服务器池架构为虚拟桌面系统提供了更高的
41、可用性,以及对硬件的更好运用。实际项目中建议分为至少2个群集组,分别相应应用系统和管理系统。一旦某一台在线宿主服务器发生故障或需要进行平常维护,则该服务器上的虚拟机就会迁移到本群集中的其它宿主服务器中。:n 管理平台群集:2个节点的宿主服务器群集组;n 应用业务系统群集:n个节点的宿主服务器群集组。4.3 节点容量设计使用如下计算公式汇总所有需要整合的服务器总资源量。l 宿主机服务器可提供资源每台宿主服务器可以提供应虚拟机使用的物理资源计算公式:4.4 CPU微软推荐的CPU虚拟化比例是4:1,比如一个8核CPU的宿主机,能支持最多32个虚拟CPU。虽然CPU比例在架构上没有明确的限制,但是微
42、软建议在设计和规划虚拟机时遵循这一比例。在此项目中根据预计虚拟机实例的数量,建议采用宿主机采用内核数在12核或以上的CPU。4.4.1 内存宿主机有充足的物理内存是保证虚拟机运营性能的最基本因素之一。这是由于虚拟机实例必须使用非页面内存。由于非页面内存不能以页面文献的方式存储在硬盘上,所以宿主机必须有足够的的物理内存来支撑虚拟机实例的运营,宿主机物理内存的需求总量除分派给每台虚拟机实例使用之外还需要按照以下因素保存给宿主机系统:n Hypervisor需要300MBn 被分派给每个虚拟机的第一个1GB内存需要32MB保存给宿主服务器n 运营在根分区的宿主机操作系统需要至少2G对于虚拟服务器群集
43、中的宿主机,预估每个群集节点运营的虚拟机的平均数量是4台,按照每台虚拟服务器内存设立16G计算,宿主机所需内存数量具体计算如下:所需内存=0.3 + 2 + 16*4 + 0.032*4 = 66.428G建议在每台宿主机上至少配置96G内存。考虑到此后扩展,建议每台服务器配置128G内存。4.4.2 磁盘由于所有的虚拟桌面均放置在后端存储上,由于对于宿主服务器上本地硬盘容量规定不高,重要为了满足本地Windows Server 2023安装的空间规定。服务器本地磁盘可用容量建议大于120G。4.4.3 网卡Windows Server 2023提供了一系列网络优化特性,如TCP载荷转移(TC
44、P Offload)虚拟机队列VMQ和巨型帧(Jumbo Frame),上述功能较大地改善了网络性能,同时提高了CPU使用率,进而提高了系统整体的性能。对于Hyper-V群集,所有的节点必须具有相同数量的网卡,同时这些网卡必须连接到相同的网络。Hyper-V群集的运营涉及到5个网络,以下是每个网络的标准配置:n 网络1:承载SCVMM和Hyper-V的管理通讯n 网络2:承载Live Migration通讯流量n 网络3:承载群集心跳通讯n 网络4:承载宿主机和虚拟实例的外部通讯n 网络5:承载后端存储流量其中,网络1和网络2可以合并,为了最大限度的提高虚拟机的访问效率及实现网络冗余,建议每台
45、服务器上配置4块万兆以太网卡。同时配置万兆以太网互换机。4.5 存储设计4.5.1 RAID类型选择 对于顺序读写并且写性能规定高的应用,可选择RAID 1,或RAID 1/0。假如是顺序写规定高的数据,应单独在一个RAID组中,避免磁头来回移动。典型的有Oracle的 redo log,Exchange的Transaction log等日记型的数据。 对于有备份,没有容错规定,读写性能规定高的用RAID 0,比如实时数据采集。 对于读规定高于写规定,容量上有考虑的,随机写规定不高的都可以使用选择RAID 5。如数据库文献。 在本方案中,我们设计Raid5为磁盘阵列方式4.5.2 IOPS计算
46、 存储IOPS由三个因素组成,磁盘数量,磁盘转速和RAID类型。 以下是磁盘不同转速的IOPS经验值列表:RPMIOPSSSD6000SAS 15K175SAS 10K125SATA 720075SATA 540050 不同RAID类型的Write Penalty值如下RAIDWrite PenaltyRAID-00RAID-12RAID-102RAID-54RAID-66即为实现阵列的高可用性,除了RAID 0之外,每块raid的磁盘都牺牲了部分写性能。折损的比例公式为 %Read+%Write*(IO Penalty),为了简化计算我们假定读写各为50%,则折损比系数=0.5*(1+IO
47、Penalty).不同类型RAID的折损系数为:RAIDPenaltyRAID-01RAID-11.5RAID-101.5RAID-52.5RAID-63.5 综上所述,RAID的IOPS估算方法为(磁盘数量*磁盘IOPS)/折损系数。 假如每台服务器需要运营4个虚拟服务器实例,按照每个虚拟服务器需要100 IOPS,则总的IOPS为400。假如选用15k转的SAS硬盘,使用RAID 5,则阵列中最低硬盘数=400*2.5/175=6 块4.5.3 LUN划分所有虚拟机的镜像文献均会放置在后端存储中,对于后端存储中划分LUN建议如下: 每个服务器群集组,划分一个容量为1G 的Quorum LUN充当Windows群集的仲裁卷。 为每个服务器群集组,划分多个LUN,分别放置该群集的虚拟机以下根据每个群集的虚拟机负载建议的LUN的划分 应用系统群集n 群集仲裁卷 1个LUN 容量1GBn 群集共享卷4个LUN 容量为4TB 管理系统群集n 群集仲裁卷: 1个LUN 容量1GBn 群集共享卷:2个LUN 容量为2TB4.6 网络设计4.6.1 网络性能规定需视具体应用对于网络流量的规定来拟定网络设计,重要涉及以下3方面:n 网卡:建议采用万兆网卡,需要具体分
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100