资源描述
柳州东城投资开发有限公司
信息化基础平台建设方案
北京时代凌宇科技股份有限公司
2015年4月
目录
1 项目概述和需求分析 3
1.1 项目概述 3
1.2 总体规划要求 3
1.3 未来服务器需求估算 4
2 服务器资源需求测算 5
2.1 tpmC硬件测算方法论 5
2.2 tpmC方法论测算CPU资源 6
2.3 内存及存储资源测算方法 9
2.4 服务器资源需求结论 12
3 技术选型方案 12
3.1 技术概要 12
3.2 技术体系架构 13
3.3 系统拓扑图 14
3.4 具体方案描述 15
3.4.1 服务器设计 15
3.4.2 存储设计 16
3.4.3 网络设计 16
3.4.4 备份设计 17
3.4.5 容灾规划 18
3.4.6 VMware功能设计 19
3.4.7 软硬件清单 19
3.5 方案优势 20
3.5.1 从最小规模起步 20
3.5.2 横向扩展优势 20
3.5.3 性能优势 21
3.5.4 数据保护和可靠性 22
3.5.5 与传统架构的对比 22
3.5.6 P2V迁移的优势 23
4 附录:Nutanix产品介绍 25
4.1 Nutanix的发展历程 25
4.2 Nutanix架构和软件定义存储 26
4.3 Nutanix与传统架构的差别 27
4.4 Nutanix区块和Nutanix节点 28
4.5 Nutanix的支持 29
1 项目概述和需求分析
1.1 项目概述
柳州东城投资开发有限公司(以下简称“东城公司”)信息化建设应符合东城公司 “产业化发展”、“专业化运营”的发展模式的目标。为此,东城公司整体信息化规划的长期愿景为:以公司“服务于政府的市场化开发运营主体”的转型为出发点,打造“数字化、信息化和智能化”的东城公司,使信息化能力成为东城公司核心竞争能力的重要组成部分。具体而言,通过制定公司信息化建设的规划和全公司的信息标准,同时要对公司现有的系统进行整合集成和优化,并在此基础上开发一些适合公司业务开展和公司管理的特色应用,为集团公司提供高效、便捷、丰富的一站式信息服务,为公司领导提供实时有效的各类数据,使公司各部门实现协同化办公,让信息化真正为公司核心竞争力提供强有力的支撑。结合东城公司战略及业务的目标,以及信息化建设的愿景、目标及原则,未来东城公司信息化建设的总体架构如下图所示,简称为“1368”,即通过一套信息化管控体系,构筑三大基础平台,支撑六类应用,服务八大板块。
而随着东城未来电子业务应用和服务在不断增加,集团和员工对业务应用信息化内容的多样化需求,导致其IT基础设施平台的规模后续会日益庞大,这也带来了相应的运行维护和管理上的挑战。同事,海量数据的大量涌现,对IT基础设施平台要求越来越高。多数单位一直都在追求低成本高效率的IT服务运营。IT团队在被要求提高生产力和灵活性以应对多变的商业需求的同时,也要不断降低投入。IT部门向公司高层展示优化的预算管理时,节约成本和资源整合也始终是最先摆出的问题。为了能在保证业务可靠性和连续性得到提升的同事节约成本和资源整合、同时降低IT部门的运维工作量,东城公司决定采用服务器虚拟化作为整个信息化系统的基础支撑平台。
1.2 总体规划要求
为保证实施效果,东城公司信息化建设采用分步推进的策略进行。信息化业务系统初步规划通过三阶段建设,在五年内逐步建立集团化的信息体系。
1.3 未来服务器需求估算
根据咨询调研结果,东城公司对未来各应用系统数据量及对服务器需求进行了预估,避免盲目投资造成损失。该预估数据将是整个技术体系和方案制订的方向和依据,具体见下表:
表:未来各应用系统数据量及服务器需求预估
项目名称
系统用户数
高峰并发用户数
预计数据总量(GB/每年)
预计服务器需求
C.总部应用建设
ERP(工程/物资/合同/财务/资产/主数据)
200
40
900
2*高配
资金管理
20
5
50
利旧
土地管理
20
5
200
中配
人力资源管理
300
30
200
中配
战略绩效管理
20
5
8
低配
全面计划和预算
20
5
20
低配
投资管理
20
5
5
低配
招商管理
20
5
10
外部门户
2000
200
50
2*低配
电子商务
200
20
40
报销管理
500
100
100
中配
决策支持
50
10
300
2*高配
综合管理(内部门户/移动办公)
300
60
50
低配
综合管理(OA/督办/档案/情报/审计/法务)
300
30
300
D.分子公司应用建设
客户关系管理
100
30
200
低配
产品管理
20
5
10
低配
物业及租赁管理
50
5
20
利旧
交投公司系统建设(综合运营及客户管理)
20
5
100
低配
交投公司系统建设(港口作业系统)
50
20
1200
中配
小贷担保系统建设
50
10
600
中配
会展管理平台
50
10
200
中配
建开公司系统建设
20
5
100
低配
2 服务器资源需求测算
2.1 tpmC硬件测算方法论
本项目根据之前预估的服务器需求,建议采取tpmC硬件选型法,估算出每个应用对服务器CPU、内存和硬盘的需求量。以便为进一步技术方案选型提供帮助和参考。
借用IBM公司在金融综合业务系统的实际应用中总结的经验方法论,采用以下公式:
TPM=TASK x 80% x S x F / (T x C),其中:
TASK:为每日业务统计峰值交易量
T:为每日峰值交易时间,假设每日80%交易量集中在每天的4小时,即240分钟内完成:T=240
S:为实际银行业务交易操作相对于标准TPC-C测试基准环境交易的复杂程度比例。由于实际的金融业务交易的复杂程度与TPC-C标准测试中的交易存在较大的差异,须设定一个合理的对应值。以普通储蓄业务交易为例,一笔交易往往需要同时打开大量数据库表,取出其相关数据进行操作,相对于TPC-C标准交易的复杂度,要复杂很多;根据科学的统计结果,每笔交易操作相比较于TPC标准测试中的每笔交易的复杂度此值可设定为10~20。
C:为主机CPU处理余量。实际应用经验表明,一台主机服务器的CPU利用率高于80%则表明CPU的利用率过高会产生系统瓶颈,而利用率处于75%时,是处于利用率最佳状态。因此,在推算主机性能指标时,必须考虑CPU的冗余,设定C=70%。
F:为系统未来3~5年的业务量发展冗余预留。
综上所述,为保障联机业务处理性能要求,我们可推算得出主机所需的处理能力,据此得出相应的机型和配置。
tpmC计算公式:
tpmC=峰值在线用户数*每分钟每个用户数请求*每个请求事务数(增删查)/(操作系统冗余系数*CPU冗余系数)
2.2 tpmC方法论测算CPU资源
以ERP应用系统为例:
l 用户数:200
l 高峰并发用户:40
l 数据增长量:900GB/年
根据以上条件,我们做出如下假设:
l 用户每分钟提出6个请求,每个请求产生20个事务,操作系统预留30%冗余、CPU预留30%冗余。
则系统的tpmC值=40×6×20÷((1-0.3)*(1-0.3))≈9800
如果选择物理服务器,只需要参考事务处理性能委员会(Transaction Processing Performance Council)于2014年12月22日发布的结果(TPC-C BENCHMARK RESULTS)选择tpmC值大于9800的服务器便可。
通过查询得到tpmC大于9800的服务器为IBM eServer xSeries 220 c/s,服务器CPU为一颗Intel Pentium III 1.4GHz。由于这是老服务器CPU型号,我们建议采用一颗大于该性能需求的CPU便可,如E5-2620 2.0GHz。
根据测算所有应用系统得出结论:需要26颗CPU。(具体应用测算数据见下页表单)
29
表:CPU测算建议配置单
项目名称
预计服务器需求
tpmC值
参考服务器
CPU
C.总部应用建设
需求
实际
品牌型号
实际配置
选型配置
ERP(工程/物资/合同/财务/资产/主数据)
2*高配
9,796
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
2*E5-2620 2.0GHz
资金管理
利旧
土地管理
中配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
人力资源管理
中配
7,347
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
战略绩效管理
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
全面计划和预算
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
投资管理
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
招商管理
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
外部门户
2*低配
48,980
52,587
IBM eServer xSeries 360/2.0GHz/4p
Intel Xeon MP 2.00 GHz*4
4*E5-2620 2.0GHz
电子商务
4,898
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
报销管理
中配
24,490
31,910
IBM eServer xSeries 235/3.2GHz/1P
Intel Xeon - 3.2 GHz
2*E5-2620 2.0GHz
决策支持
2*高配
2,449
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
2*E5-2620 2.0GHz
综合管理(内部门户/移动办公)
低配
14,694
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
综合管理(OA/督办/档案/情报/审计/法务)
7,347
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
D.分子公司应用建设
客户关系管理
低配
7,347
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
产品管理
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
物业及租赁管理
利旧
交投公司系统建设(综合运营及客户管理)
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
交投公司系统建设(港口作业系统)
中配
4,898
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
小贷担保系统建设
中配
2,449
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
会展管理平台
中配
2,449
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
建开公司系统建设
低配
1,224
9,112
IBM eServer xSeries 220 c/s
Intel Pentium III 1.4GHz*1
E5-2620 2.0GHz
2.3 内存及存储资源测算方法
以ERP应用系统为例:
l 用户数:200
l 高峰并发用户:40
l 数据增长量:900GB/年
根据以上条件,我们对内存使用做出如下假设:
l 每个并发占用内存0.03GB
l 操作系统占用内存2GB
l 其他应用软件占用内存0.5GB
l 合理内存利用率70%
由此计算得出所需内存为:(40*0.03+2+0.5)/0.70=5.29GB,根据实际情况,该服务器内存配置建议值为6GB
根据以上条件,我们对存储使用做出如下假设:
l 操作系统占用150GB空间
l 合理存储占用率70%
由此计算得出5年存储数据量为(900*5+150)/0.70≈6643GB
根据测算得出结论:
应用系统内存需求为144GB
5年存储需求为37451GB
表:内存及存储测算建议配置单
项目名称
预计服务器需求
内存(GB)
存储(GB)
C.总部应用建设
测算数值
建议数值
测算数值
ERP(工程/物资/合同/财务/资产/主数据)
2*高配
5.29
2*6
6643
资金管理
利旧
土地管理
中配
3.79
4
1643
人力资源管理
中配
4.86
6
1643
战略绩效管理
低配
3.79
4
271
全面计划和预算
低配
3.79
4
357
投资管理
低配
3.79
4
250
招商管理
3.79
4
286
外部门户
2*低配
12.14
2*16
571
电子商务
4.43
2*6
500
报销管理
中配
7.86
8
929
决策支持
2*高配
4.00
2*4
2357
综合管理(内部门户/移动办公)
低配
6.14
8
571
综合管理(OA/督办/档案/情报/审计/法务)
4.86
6
2357
D.分子公司应用建设
客户关系管理
低配
4.86
6
1643
产品管理
低配
3.79
4
286
物业及租赁管理
利旧
357
交投公司系统建设(综合运营及客户管理)
低配
3.79
4
929
交投公司系统建设(港口作业系统)
中配
4.43
6
8786
小贷担保系统建设
中配
4.00
4
4500
会展管理平台
中配
4.00
4
1643
建开公司系统建设
低配
3.79
4
929
2.4 服务器资源需求结论
经过之前详细计算,获得硬件总需求如下:
l CPU:26颗
l 内存:144GB
l 存储:37451GB
3 技术选型方案
3.1 技术概要
在机房空间、辅助设施等进行扩容相对成本较高且施工困难的情况下,要解决有限资源与日益增长的业务需求的矛盾,就需要通过提高现有资源的利用率,降低单系统资源投入,提高单设备的负载能力实现。通过对业界相关技术的了解与比较,针对东城公司的技术解决方案为采用服务器虚拟化技术。
虚拟化技术改变在以往的单服务器上直接安装操作系统并进行应用系统等安装,直接提供单一操作系统平台、业务平台使用的模式,而是利用支持硬件虚拟化的服务器硬件安装底层虚拟机系统,在虚拟机系统之上安装多个操作系统,将服务器物理资源抽象成逻辑资源,让一台服务器变成几台甚至上百台相互隔离的虚拟服务器,不再受限于物理上的界限,而是让CPU、内存、磁盘、I/O等硬件变成可以动态管理的“资源池”。使用该技术避免了单一操作系统环境下布署不同应用系统可能造成的互相影响,也避免了单物理服务器仅用于单个应用系统形成的资源浪费,能够更合理的统筹分配物理设备的资源,提高资源的利用率,简化系统管理,实现服务器整合,让IT对业务的变化更具适应力。
3.2 技术体系架构
为了更好的满足上述要求,全球虚拟化产品领先厂商VMware公司与融合基础架构厂商路坦力公司通力合作,共同为用户推荐了采用VMware虚拟架构软件的服务器虚拟架构解决方案,该方案将极大的提供服务器整合的效率,大幅度简化了服务器群管理的复杂性,提高了整体系统的可用性,同时还明显的减少了投资成本,具有很好的技术领先性和性价比。
+
路坦力提供的“虚拟化计算平台”是采用内嵌企业级“存储”的可扩展的基础服务平台,可以为VM提供最优化的运行环境。
l 真正融合:无缝的将计算、存储资源进行整合,提供真正的一体化设备;
l 线性扩展:每次增加一个节点,实现性能、容量的线性扩展;
l 软件定义:基于通用的X86硬件,由软件提供所有服务;
l 混合资源:在单一的架构中,为企业内的所有虚拟机、云提供统一的资源调配;
该方案包括VMware以下组件:
l VMware vSphere 企业版
l VMware vCenter Server
3.3 系统拓扑图
在系统建设中,对于基础硬件设施选择的主要考虑是可靠性、可用性,以及高性能、安全性和可管理性,还要考虑可扩展性和开放性。因此,我们强烈建议客户方融合计算资源、存储资源以及虚拟化平台于一体路坦力系列产品,完美的实现正真意义上的整合的虚拟化架构。
拓扑图如下:
内部逻辑架构如下:
3.4 具体方案描述
3.4.1 服务器设计
按照服务器资源需求结论中得出,东城公司5年的硬件资源需求如下:
l CPU:26颗
l 内存:144GB
l 存储:37451GB
由于路坦力设备的技术特性,至少需要有3台节点构成,为确保整体系统的高可用性和稳定性,建议采取N+1做冗余,所以选择4台NX-1050-64GB节点作为基础架构。
考虑到项目投资保护,我们采取首阶段满足基本架构功能和前期部分性能要求,后期根据应用的扩展和东城公司自身要求,可逐步单独增加节点服务器的服务器设计方案。预估资源需求状况对应的设备清单如下表:
阶段
型号
数量
总资源
可用资源
CPU(core)
内存(GB)
存储
CPU(core)
内存(GB)
存储TB
基础架构
(必备)
NX-1050-64GB
4
48
256
1600G SSD
16TB HDD
16
176
7.59
二期增加
(预估)
NX-6020-64GB
1
12
64
800SSD
20TB
4
44
9.45
三期增加
(预估)
NX-6020-64GB
2
24
128
800SSD
20TB
8
88
18.91
总资源合计
28
308
35.95
由于自身分布式存储的特性,总资源并不是具体可用资源。
A.CPU可用资源计算公式
(CPU核数-2[分布式文件系统消耗])*节点台数
如:(12-8)*4=16
B.Cache可用资源计算公式
(节点内存容量-16G[分布式虚拟控制器消耗]-4G[虚拟化层预留])*节点台数
如:(64-16-4)*4=176
C.存储资源
由于路坦力采用多节点分布式存储,可以理解为网络Raid1的模式,可用存储基本上为硬件存储资源的一半。
具体见3.4.6软硬件配置清单章节。
3.4.2 存储设计
Nutanix分布式文件系统(NDFS)可以将一组节点组成一个统一的分布式存储平台。NDFS对于虚拟化平台软件而言就是一个集中存储,与任何其他集中式存储阵列一样工作,且提供更为简单便捷的存储管理,无需像传统集中存储那样再配置LUN、卷、或者Raid组。
虚拟化环境中所有的IO操作都将由本地节点上的Nutanix CVM接管,以提供极高的性能。下图显示的是Nutanix分布式系统逻辑示意图:
例如使用4个NX-1050系列节点,每台NX-1050系列节点本地配置1块400GB SSD磁盘、4块1TB SATA磁盘。总共磁盘裸容量为17.6TB。按照默认数据2副本方式保存,整个集群提供的实际可用容量为8TB左右。
存储性能需求
据以往经验及用户习惯分析,一般用户对IO性能要求在50 IOPS左右,以200个用户计算,共需要1000 IOPS。
单个Nutanix节点可提供12000的IOPS,3节点集群可提供将近36000的IOPS。完全可以满足需求。
3.4.3 网络设计
下图为Nutanix推荐的网络拓扑图:
网络设计考虑如下表:
类型
设计
备注
物理服务器之间的通讯网络
10Gb以太网
双链路冗余
每个节点通过两条万兆链路分别连接两台万兆交换机,保证网络设备和链路的冗余度。
Nutanix建议用户使用万兆网络互联物理节点,当发生密集的写IO时,万兆网络能保证提供足够带宽满足节点之间的IO同步流量。
客户端与虚拟服务器之间的通讯网络、虚拟服务器对外服务网络
1Gb以太网
双链路冗余
每个节点通过两条千兆链路分别连接两台千兆交换机,保证网络设备和链路的冗余度。
用户访问桌面,或者虚拟服务器对外提供服务时,通过千兆链路可以实现与后端存储流量隔离。
硬件管理网络
(IPMI)
100Mb以太网
每个节点都有独立的百兆链路,用于连接专门的管理网络,实现管理网络与业务网络、存储网络分离。可以最大限度保证管理的灵活性和安全性。
3.4.4 备份设计
Time Stream备份是Nutanix平台自带的存储层面、基于虚拟机粒度的备份恢复功能。用户可以针对每个虚拟机设置不同的备份策略,包括备份计划和备份保留周期,Time Stream会自动通过存储快照方式对虚拟机进行备份。所有Time Stream的快照均是基于存储层面的,与虚拟化层面(例如vSphere)的快照不同,存储层面的快照不会影响虚拟机的性能,对于虚拟化软件是完全透明的。
传统的备份方式通过网络传输备份数据,需要特定的备份窗口以免影响业务正常运行。TimeStream备份可以与传统的备份策略互补,既能保证对于重要的虚拟机进行高频度备份又不会占用额外的网络带宽。例如:
l 对于普通应用虚拟机可以使用传统的备份方式每周进行全备,将备份数据保留在外部存储(例如磁带库中);同时使用Time Stream备份进行每天甚至每12小时的备份,数据直接保留在存储上以便快速恢复。
l 对于比较重要的应用虚拟机可以使用传统备份每周全备、每天增量的方式,将备份数据保留在外部存储(例如磁带库中);同时使用Time Stream备份进行每2小时甚至每小时的备份,数据直接保留在存储上以便快速恢复。
3.4.5 容灾规划
Nutanix容灾功能,分为两个级别:Metro DR和DR。都是基于虚拟机快照的方式将更新数据异步复制到远程的Nutnaix集群中。Metro DR可以实现RPO接近于“零”(需要裸光纤支持),即便是标准DR也能实现RPO为1小时(基于网络带宽和更新数据量),满足绝大多数异地容灾的业务需求。Nutanix容灾支持双向、一对多、多对一各种不同的复制模式。并且可以通过Nutanix自带的管理界面激活容灾中心的虚拟机进行容灾演练。不再需要额外繁琐的灾难恢复计划,基于鼠标点击即可完成容灾切换。
下图显示的是多个数据中心之间使用Nutanix容灾方案的全局拓扑:
使用Nutanix解决方案可以在项目初始即确定今后的容灾规划,而无需在今后专门立项重复设计整体容灾架构。依据用户规模和分支机构数量,通过简单灵活的软件配置,将已有分支机构的虚拟化环境远程容灾到总部数据中心,逐步形成星型的容灾架构。
3.4.6 VMware功能设计
本方案中,选择VMware vSphere企业版和VMware vCenter Server。其主要功能参考下图:
3.4.7 软硬件清单
考虑到本项目的实际情况,从投资保护的角度来考虑,我们仅提供基础架构所需要的设备软硬件清单,今后根据实际情况,由东城公司自行选择增加服务器节点和VMware授权便可。
根据上述需求,选择4节点NX-1050-64GB,每节点包含CPU 12核,64G内存,1*400GB SSD,4*1TB HDDs。
产品和配置
数量
NX-1050(4个节点)
1台
每节点配置:
CPU:2颗6核E5-2620 / 2.0GHz
MEM:64GB
DISK:1块400GB SSD + 4块1TB HDD
NET:2个10GbE + 2个1GbE + 1个10/100 BASE-T
Arista系列万兆以太网交换机
2台
Arista 7050-52万兆以太网交换机,支持52个10G Base-X SFP+端口
VMware软件费用
vSphere Enterprise Edition 6 CPU + 1 vCenter
1套
3.5 方案优势
3.5.1 从最小规模起步
Nutanix集群可以从3个节点起步,并最终扩展至上百个节点。3个节点的入门包就位之后,集群能够以一次添加一个节点的方式逐步进行扩展。给集群添加节点是一个完全动态的过程,无须停机,并可在2次点击之后完成。
Nutanix产品手册上针对每个型号的节点都明确标注了可以容纳的虚拟机数量,用户可以以此为参考非常轻松地预测虚拟化环境的投入规模。例如,入门级产品每个节点支持15个虚拟机,最小集群规模可以支持45个虚拟机;中端产品每个节点支持100-115个虚拟机,最小集群规模可以支持300-345个虚拟机。并且Nutanix产品支持在同一集群中混合不同型号节点,使得用户能灵活掌握并轻松规划整个虚拟化环境的基础架构。
3.5.2 横向扩展优势
Nutanix给虚拟化环境带来的重要差异化因素之一就是,基础设施在进行扩展时其性能仍然保持不变。在大多数传统的存储环境中,最佳性能仅出现在第一天,因为应用程序或工作负载越来越多,导致性能随着时间的推移不断下降,直至需要进行叉车式升级,采用全新的存储阵列。
下图说明了Nutanix的横向扩展的优势,当集群中桌面数量从300个扩展到3000个时,应用程序的打开时间保持不变:
3.5.3 性能优势
Nutanix解决方案在数据中心虚拟化环境中的主要优势之一就是性能,而性能优势是通过传统的服务器和存储架构实现的。在传统的架构中,时延是因为每次访问存储都需要通过网络而造成的。通过NFS和iSCSI等协议提供存储本身没有问题,但网络会增加时延。Nutanix可提供NFS协议的优势及其易用性,而通过所谓的“无网络NFS”消除了网络时延。Nutanix分布式文件系统直接对虚拟机进行检测,然后将特定虚拟机的所有数据存放到本地物理服务器上。因此,虚拟机不是通过网络、而是通过高速内部总线访问其数据。并且所有节点标配SSD磁盘,提供极高的IOPS以满足虚拟化环境各种类型应用需求,无论是虚拟桌面还是服务器虚拟化场景。
更为重要的是,每个节点的SSD磁盘并非有每个节点单独使用,而是在整个集群范围内作为一个整体使用。言下之意,不会由于单个节点本地的SSD耗尽而导致其性能急剧下降。当出现这种极端情况时,节点会使用集群中其他节点的SSD空间。因为即使跨网络访问其他节点SSD磁盘也会比访问本地SATA磁盘快很多。因此极端最差情况时性能也与使用传统集中存储架构时服务器通过网络访问数据的场景相当。其实不会出现这种极端情况,因为当SSD利用率超过一定阈值后,Nutanix的CVM会自动发现并将最少访问的数据从SSD迁移到SATA上,以保证SSD有足够容量满足突发的IO请求。这一自动热分层技术对虚拟化主机而言完全透明。用户无需关心数据保存在哪里,这完全由CVM依据数据访问频度而自动调度。
新西兰塔拉那基(Taranaki District Council of New Zealand)利用这种技术对传统的服务器和存储基础设施进行改造,创建起了自己的虚拟化环境,极大地提高了性能。
3.5.4 数据保护和可靠性
Nutanix平台使用复制因子(RF - Replication Factor)和校验和(checksum)来保证当节点或者磁盘失效时,数据的冗余度和可用性。当数据写入SSD时,会被“同步”复制到另1个或者2个Nutanix CVM的SSD之中(依赖RF设置为2或者3),当这个操作完成之后,此次写操作才被确认(Ack)。这样能确保数据至少存在于2个或者3个独立的节点上,保证数据的冗余度。
所有节点都参与数据的复制操作,这样能消除“热点节点”,并保证线性的性能扩展。当数据被写入时,同时计算该数据块的校验和,并且作为数据块元数据中的一部分进行存储。随后数据块在保证满足RF的前提下,被“异步”推送到HDD中。当发生节点或者磁盘失效,数据块会重新在所有节点间进行复制以满足复制因子的设置。任何时候,读取数据块并同时计算其校验和以确保数据块有效。当数据块检查结果不匹配校验和时,副本数据将会覆盖该无效数据块。
在Nutanix分布式文件系统中(NDFS),我们使用了一些关键技术来确保:数据在100%时间内都是可用的(即“强一致性”),并且保证NDFS扩展到超大规模数据量时依然可靠。这就是文件系统元数据强一致性的Paxos 算法 。NDFS使用一种“环状”的Key-Value结构的分布式数据库来保存重要的元数据。为了确保元数据的可用性和冗余度,也同样引入了复制因子(RF)。一旦一条Metadata记录被写或者更新后,这条记录将同时写到“环”中的另一个节点,然后被复制到n个其他节点(n决定与集群的大小)。集群中大多数(majority)节点必须同意才能commit一条记录,这就是强一致性的Paxos 算法。这确保了Nutanix平台数据的“可靠性”。
3.5.5 与传统架构的对比
使用Nutanix计算存储融合的一体化平台,替代了传统的服务器加集中存储的架构,使得整个架构更清晰简单。
下表列举了使用Nutanix产品和传统集中式存储架构的对比:
Nutanix计算存储融合平台
传统集中存储架构
性能
尽可能提供本地吞吐,并使用SSD保证应用IO需求。不存在性能瓶颈
随着访问集中存储的服务器越来越多,性能瓶颈将日益凸显
横向扩展
可以简单的在集群中增加节点以扩展集群规模和性能
由于架构限制,无法实现横向扩展
高可用性
可以通过三副本的方式容忍最多两个节点同时故障,并且硬件故障时数据重建速度快,性能几乎不受影响
通过raid技术实现高可用性,但面对硬件故障时,性能下降严重。
安装配置
开箱即用的部署方式,只需20分钟即可完成安装配置
需要准备大量安装实施前的信息收集和整理工作,并且由专人进行安装部署,最少需要2天时间
管理维护
统一WEB界面管理,维护方便
无需配置LUN、卷、Raid组
需要专门存储管理软件,配置复杂。需要厂商支持。
空间占用
使用Nutanix架构:4台NX-1050,包含4节点(包含服务器和存储)
总共占用空间2U
使用传统架构:4台2路服务器至少占用4U,存储至少需要3U
总共占用空间7U
耗电
使用Nutanix架构:4台NX-3050,耗电 1150W
电费:0.8元/千瓦时
运行五年电费支出约:4万元
使用传统架构:4台服务器平均每台服务器耗电800W计算,存储耗电1500w,总共耗电4700W
电费:0.8元/千瓦时
运行五年电费支出约为:16万元
3.5.6 P2V迁移的优势
VMware vCenter Converter 可将物理机转换为虚拟机。借助这种P2V转换软件,可以将基于Windows 和 Linux 的物理机及第三方映像格式自动转换为VMware 虚拟机。
对于本项目中的NC服务器及其他服务器的迁移,可以采用该工具软件进行P2V转换。使用转换向导设置转换任务,使用 Converter Standalone 组件执行所有克隆任务。以下工作流程是远程热克隆的流程,在此流程中克隆的物理机不会停机。
第一步:Converter Standalone 为转换准备源计算机。Converter Standalone 在源计算机上安装代理,该代理创建源卷的快照。
第二步:Converter Standalone 在目标计算机上准备虚拟机。Converter Standalone 在目标计算机上创建了一个虚拟机,然后代理将源计算机中的卷复制到目标计算机中。
第三步:Converter Standalone 完成转换过程。代理会安装所需的驱动程序来允许操作系统在虚拟机中引导,并且会对虚拟机进行自定义(例如,更改 IP信息)。
第四步:Converter Standalone 从源计算机卸载该代理(可选)。虚拟机准备在目标服务器上运行。
4 附录:Nutanix产品介绍
4.1 Nutanix的发展历程
Nutanix的创始人正是创建谷歌分布式系统的那些人,该公司为企业数据中心提供云环境中常见的可扩展性、可用性、简单性和高性能。下图显示了传统数据中心与谷歌数据中心的外观差异。大多数云提供商实施的是所谓的软件定义数据中心。在传统的数据中心,当管理员需要更多存储器时,便购买存储器;当需要更多计算能力时,便购买服务器;当需要安全性时,便购买防火墙;诸如此类。而在软件定义数据中心,你只有服务器:当你需要更多存储容量时,便调用存储服务;当你需要更多计算能力时,同样的服务器便为你调出各种应用程序;当你需要其它基础设施服务时,便可按照自己的需要调用和停用各种服务。因此,在软件定义数据中心,硬件不再是至关重要的组件,数据中心的所有事项均在软件层进行控制和界定,因此能够实现前所未有的简便性、可扩展性和自动化。
图1:传统数据中心对比谷歌数据
展开阅读全文