GPUHPC集群专项方案专业资料.doc

资源描述

XXXX大学 XXXX系统仿真平台建设方案 XXXX科技有限公司 .2 目录第一章概述 3 1.1 高性能计算环境发展趋势 3 1.1.1 更高、更全面性能规定 3 1.1.2 向通用化方向发展 4 1.1.3 更加严格预算约束 4 1.1.4 使用商品化部件 5 1.2 高性能计算应用特点 5 1.3 高性能计算主机性能评价体系 6 第二章设计方案 7 2.1系统设计原则 7 2.2总体方案构造 8 2.3 计算服务器方案 9 2.3.1 GPU计算节点服务器型号及配备 10 2.3.2 基于KEPLERnvidia芯片GPU加速技术 11 2.3.3 高性能计算环境 11 2.3.4 计算任务提交及管理 12 2.4 Cluster计算集群方案 12 2.4.1 宝德 Cluster计算集群构造 12 2.4.2 Cluster节点系统配备 15 2.4.3 节点互连、管理和顾客网络 16 2.4.4 Cluster计算集群节点管理 17 2.4.5 Cluster计算集群作业管理 18 2.4.6 宝德 Cluster计算集群特点和优势 19 2.5高性能计算外接存储需求分析 19 2.6方案优势 20 第三章产品清单 21 第一章概述 XXXX非常荣幸能为XXXX系统仿真平台系统建设提出建议。我公司推荐了先进系统建设方案，考虑了系统实用性、高可用性、安全性、可管理性以及灵活扩展能力。 XXXX凭借先进技术和出众支持服务，相信通过双方合伙，可使中华人民共和国XXXX大脑初级视觉系统仿真平台系统建设项目顺利实行，从而为顾客提供一种健壮、安全、高可用运营环境，并进一步建立长期和谐合伙关系。高性能计算系统是提高一种科研机构研究水平重要基本设施，也是一种国家科技与经济实力标志。它不但是一种高速解决计算机系统、更重要是在其之上运营各种应用对科学领域产生非常深远影响。20世纪90年代中后期以来，许多高性能计算应用领域越来越多地但愿运用半导体和计算机技术发展新成果通过更大规模、更精准数值模仿和数字计算来进行新产品设计和科学研究，提高科学研究水平、厂商市场竞争力以至国家综合国力。另一方面，人们也规定运用工业原则芯片等开放性技术减少投资、加速开发，在规定经费预算和时间框架内完毕规模越来越大计算任务。高性能和高经济效益相结合已经成为高性能计算领域最引人注目发展趋势。 1.1 高性能计算环境发展趋势 1.1.1 更高、更全面性能规定高性能技术计算是运用数值模仿和数字技术办法摸索和预测未知世界技术。这一技术广泛应用于核武器研究和核材料储存仿真、生物信息技术、医疗和新药研究、计算化学、GIS、CAE、全球性长期气象、天气和灾害预报、工艺过程改进和环保等许多领域。近年来，随着研究进一步和竞争加剧，各个领域越来越多地使用模仿办法来解决科研和生产中实际问题。模仿模型越来越大、计算精度越来越高、对超级计算机性能规定也越来越高。例如，在一种3维模型中，如果把从每个方向取100个分点增长取到1000个分点，对计算机资源需求将增长1000倍以上。高性能计算应用不但规模越来越大，并且往往必要在规定期间内完毕任务否则就失去了计算价值（如天气预报、传染病防治）。这就对计算机系记录算能力、系统带宽、内存容量、存储设备和I/O吞吐能力以及应用软件开发技术都提出了更高、更全面规定。 1.1.2 向通用化方向发展过去人们普通把计算机应用分为科学计算、信息解决和自动控制等类型。其中，以信息解决为主应用统称公司应用，是市场容量最大应用领域。初期公司应用与高性能计算应用有很大差别，涉及计算比较简朴、使用数据量也不大，对计算机系统重要规定是可以支持大量顾客（涉及网上顾客）进行事务解决如信息输入、查询和记录等，而对于计算能力、存储容量规定也不高。因而，高性能计算应用往往使用与公司应用不同系统，影响了产品批量扩大。当前，人类正在从工业化社会进入信息社会，技术持续创新、市场需求瞬息万变、竞争空间迅速扩大，规定公司采用Internet、电子商务、电子商务公司等当代化手段，来适应时代发展。许多新型公司应用对计算能力、存储容量和系统带宽规定都越来越高、越来越迫切，高性能计算应用和其她类型应用界限也日益淡化。当前，几乎所有应用领域都需要使用可以提供高计算能力、系统带宽和存储容量计算机系统，促使顾客选取相似系统满足各种类型需求，为运用大批量、低成本通用产品满足高性能计算应用需求创造了有利条件。 1.1.3 更加严格预算约束随着竞争加剧和应用普及，高性能计算不再是一种不惜工本应用领域，许多项目预算约束越来越严格。这就规定厂商生产全系列产品满足不同规模应用需求、更加可靠地保护顾客原有投资、加速IT投资回报，并且也规定实现资源按需供应和更大范畴资源共享，推动了网格和公用服务等新计算模式发展。 1.1.4 使用商品化部件为了增进高性能计算广泛应用必要减少成本，否则很难为更多顾客所接受。由于高品位高性能计算系统（特别是超级计算机）需要使用许多计算节点和互联设备等部件，因而必要保持每个部件低成本。初期超级计算机系统使用专门定制解决器和互联设备等部件价格非常昂贵。后来，Cray Research 公司T3D 和 CRAY T3E 开始使用商品化 Alpha 解决器。当前商品化解决器和服务器性能日益提高、价格也日趋下降，为运用它们建立高品位和超级计算机系统提供了良好基本。为此，美国政府还推出了ASCI 筹划，力图减少超级计算机系统成本，其重要途径是尽量采用商品化市售(COTS)硬件和软件部件，把力量集中在发展主流计算机工业不能有效地提供专门技术。当前已经很少再有厂商使用专门部件如向量解决器来建立超级计算机系统。此后发展趋势是在高品位和超级计算机系统中尽量普遍地采用商品化和大批量工业原则部件，涉及解决器、互联设备、I/O、存储、操作系统、语言、编译程序、编程工具和应用软件。人们注意到，基于开放性IA－32体系构造Xeon和Pentium 4解决器超级计算机已经在TOP500占有重要地位。新兴Itanium解决器系列（IPF）必将以其开放性、大批量和64位寻址和解决能力，对超级计算机水平提高产生划时代影响，以远比32位体系构造时代高性能和性价比来满足日益增长需求。咱们深信，通过采用HP高性能计算系统，必将加速×××在高性能计算领域获得更加丰硕科研成果。 1.2 高性能计算应用特点在老式意义上高性能计算应用是属于CPU和内存密集型应用,它对所运营计算机体系构造(超级计算机体系构造)提出了几种重要规定：浮点计算能力(特别是64位双精度浮点运算),内存带宽和内存容量及体系框架。所有这些因素都是互有关联。高性能计算普通运用各种数学方程式来建立模型和模仿物理现象。随着各种模型越来越大，越来越复杂，数据集规模也急剧增长。例如，一种100*100*100栅格包括100万个元素，该模型仅占用32MB内存，如果此栅格辨别率提高10倍，这一模型就变为1000*1000*1000，包括10亿个元素，此模型原始数据将占用32GB内存！因而无论是分布式内存还是共享式内存，要将此数据传播至内存中，由CPU解决，就需要高带宽，高容量，低延迟体系构造，固然还需要强大CPU进行计算。而超级计算机重要用来解决这样庞大工作负载。这样负载所规定超级计算机一定是采用迅速CPU，高性能内存和I/O子系统，旨在实现最高运算速度。同样这样负载所规定超级计算机还必要采用多级别并行解决技术，可以运用几十个甚至几千个解决器来解决一项任务；这样并行解决技术也需要超级计算机要采用高性能互连设备和系统设计，以较高成本去换取最高性能。 1.3 高性能计算主机性能评价体系衡量主机系统或解决器计算解决能力测试体系(BenchMark)也有各种，如SPEC、Linpack等，特别是通过Linpack值更可以衡量一种主机系统或一种解决器芯片实际运算能力，而不但仅是虚理论峰值能力。过去，人们使用系统可以达到执行指令最大速率如每秒执行百万指令数/浮点操作数(MIPS/MFLOPS)来量度计算机硬件性能。但是，这些量度指标实用价值十分有限，它们只能给出理论上最大性能，并没有全面反映计算机系统实际性能如内存带宽、内存延迟和I/O性能等。此外，硬件性能量度和系统体系构造都是非原则，使得人们很难使用它们作为服务器选型性能指标。因而，浮现了计算机系统性能基准测试概念，即由某些中立非赚钱机构开发出一组通过精心统筹设计和组合程序，来量度计算机系统运营这组程序性能指标。此类程序普通称为基准测试程序。不同计算机系统都运营同一组基准测试程序，就可以相对客观地比较计算机系统性能。当前有许多专门设计基准测试程序和管理各种计算机系统基准测试指标机构，其中最知名是SPEC和TPC。第二章设计方案 2.1系统设计原则协助顾客建立一套既能最大限度地满足顾客实际需要且技术又处在领先地位高性能计算环境是我公司为高性能计算顾客设计方案基本出发点。咱们以为，中华人民共和国XXXX大脑初级视觉系统仿真平台系统应具备解决大规模复杂运算，特别是浮点运算及图像解决能力。它将为图形化分析提供优化工程设计、分析、验证手段，最后实现提高设计质量、缩短计算周期、减少开发成本。方案设计以顾客现场测试成果为基本，依照XXXX对将来应用模式及业务量需求预测为前提，强调高性能以及可行、合理和低风险。架构设计和系统选型遵循如下原则： 1．先进性本系统方案所采用技术既要符合业界发展方向,又要在将来几年内仍具备很高技术先进性，保持在同类系统中领先地位。这样有助于提高整个系记录算与解决能力。 2. 有限投资获取最大计算性能在有限投资前提下，高性能计算系统应具备先进解决能力，它不但具备符合规定峰值性能 (Peak Performance)，更重要是应具备稳定应用性能（sustained performance）。各种复杂研究课题在本系统中可以得到精确，迅速计算成果。 3. 可扩展性系统应具备很强扩展能力。随着对计算机系统性能规定不断提高，该计算机系统应具备扩展能力，并且容易实现。 4. 开放性和兼容性本计算机系统应符合公认工业原则，涉及体系构造，硬件，I/O，网络，操作系统，开发环境和开发工具等。这样，便于和其她平台上系统互操作。 5．应用软件丰富本系统平台上应具备丰富软件资源，可以提供研究课题解决方案和相应软件系统。我公司与高性能计算方面独立软件开发商紧密合伙，例如：Fluent,ANSYS等专业工程软件商,Red Hat,Etnus,Pallas,Platform等专业平台软件商，不但提供解决节点间协调和通信中间件，使整个系统节点可以真正实现合伙，负载均衡，还能针对不同应用需求，提供一系列并行计算应用。 6. 良好技术支持由于本系统是比较复杂计算机环境，在使用过程中不可避免会遇到某些技术问题。当遇到这些问题时可以得到有效支持，使问题得以圆满解决。 7．性能价格比优越由于本系统比较庞大，价格因素也比较重要。本系统在性能价格比喻面在同类系统中应具备明显优势，对于三院三部来说在采购大型系统中应当考虑重要因素。 8．管理简朴尽量减少数据中心设备管理难度。 2.2总体方案构造针对中华人民共和国XXXX大脑初级视觉系统仿真平台系统高性能计算应用特点,结合与有关业务处室沟通。从满足应用需求角度出发，咱们建议建立一种高可扩展、易管理混合SMP与Cluster构造高性能计算环境，整体方案架构如下：咱们推荐采用1台宝德服务器PR4768GW作为GPU计算节点，重要运营并行计算、图形分析等应用。GPU计算节点服务器采用高性能计算操作系统环境，并运营动态资源管理工具对任务资源分派进行管理和调度。高性能计算集群配备1个管理节点及2个存储节点，并通过顾客网络和管理网络进行互联。管理节点运营管理软件实现Cluster中所有节点集中管理、配备、激活/关闭等，并通过软件对顾客提交任务进行作业管理。 GPU节点服务器和集群管理节点通过1000Base-T千兆以太网连接到三部骨干网中，各室工作组通过该网络申请计算资源和提交任务。 GPU节点服务器和存储节点可通过扩展IB光纤通道卡连接到SAN中，满足高性能计算环境对存储性能和空间巨大需求。 2.3 计算服务器方案 2.3.1 GPU计算节点服务器型号及配备依照以上分析，咱们配备两台宝德PR4768GW作为GPU计算节点服务器。宝德PR4768GW具备两颗E5-2690V3 12核CPU，256GBDDR4内存和8块NVIDIA TESLA K80 GPU加速卡，非常适合做高性能计算服务器，并最多可支持32核CPU及扩展至1.5TB内存。宝德PR4768GW如下图所示：宝德PR4768GW 计算服务器配备如下：服务器型号宝德PR4768GW 解决器 2 X Intel Xeon Processor E5-2690V3 内存 16 X 16GB/DDR4/2133/MHz/ECC/REG 硬盘 2TB/SATA/6Gb/128M/7200rpm/2.5寸/公司级 1.2TB/2.5in/SATA/6Gb/s/16nm/MLC GPU加速卡 8 X NVIDIA/TESLA/K80/4992C/24GB 网络接口（内置） Mellanox/56GB/40GB/单口IB卡 X520-SR2/双口/万兆网卡/双多模SFP+模块扩展网卡 1*10/100/1000Base-T DVD-ROM 1*DVD+RW 机柜 42U，PDU 电源电扇 N+1热拔插电源电扇 2.3.2 基于KEPLERnvidia芯片GPU加速技术 Tesla K80目的领域涉及数据分析和科学计算。它单精度计算性能最高可以达到每秒9万亿次浮点运算，而消费级GeForce GTX 980很难超过每秒5万亿次。这款显卡由2个Kepler GK210 GPU所构成，每个图形解决单元可支持最高12GB GDDR5闪存（共计24GB）。除此之外，Tesla K80还支持480GB/s带宽，4992个CUDA并行解决核心，Dynamic Nvidia GPU Boost等定制技术，以及动态并行（Dynamic Parallelism）。依照Nvidia说法，这些配备让K80大幅超越了既有最佳硬件。她们还声称，Tesla K80比最先进CPU还要快10倍。依照Nvidia在网站上挂出一张图表，Tesla K80对比前任K40拥有大幅提高。跑提成绩也显示出，K80也同样领跑全局，无论是化学、物理还是机器学习领域。 GPU解决器提供寄存器资源 2.3.3 高性能计算环境宝德PR4768GW 采用CENTOS操作系统，提供高性能计算环境基本,并配合相应系统管理软件、语言编译器、并行模式、有关数学库,还可支持当前流行各种第三方高性能计算商业软件包和应用软件包,例如PlatformLSF(负载平衡软件)和checkpoint，EtnusTotalView，PallasVampir及Gaussian等等,这些可依照实际规定灵活配备，以运营高性能计算应用程序和商业软件(含数据库软件)。在此系统下C,C++和Fortran编译器展示出卓越实际应用性能，操作系统库充分运用了此架构先进技术,其中涉及: MLIB。一系列子程序，为科学和技术计算提供了惯用数学软件，并针对Itanium2架构进行了优化; MPI。实现对集群架构信息传递接口高性能，为开发人员提供了API和软件库来支持下有效,可移植并行信息传递应用，是分布式计算抱负选取。 2.3.4 计算任务提交及管理所有向宝德PR4768GW计算服务器提交任务其所需CPU内存等系统资源是通过动态资源管理工具来进行管理。动态资源管理是一种非常简朴、高效、易用资源分区和管理工具，通过它，系统管理员可依照计算服务器资源状况及提交任务优先级给使用顾客灵活分派和调度CPU、内存及I/O等系统资源，当更高优先级任务提交后，HP WLM可动态调节系统资源分派，保证高优先级任务获得所需资源。动态资源管理可通过本地或远程终端进行管理。 2.4 Cluster计算集群方案 2.4.1 宝德 Cluster计算集群构造宝德公司作为高性能科学计算集群技术领导者，可提供最强大、易于管理一系列既有Linux集群解决方案。宝德结合了Linux优势、最佳软件、内部互连、工业原则计算机平台、宝德集群技术专家、支持和服务向顾客提供具备增长容量和能力Linux集群系统。 Linux集群系统也叫做Beowulf Cluster集群系统。宝德 Beowulf 集群逻辑架构如下：硬件某些应涉及： n 计算节点 n 管理节点 n I/O节点 n 互连系统软件某些应涉及： n 操作系统 n 集群管理软件 n 开发环境 n 数学库、并行库 n 作业管理系统 n 文献系统和 n 客户应用软件 n 原则应用软件依照顾客需求分析，按HP Beowulf 集群逻辑架构，咱们为本项目设计Cluster计算集群方案如下：上述Cluster高性能集群重要为Fluent、Fastran等流体类应用提供计算环境，此外，依照现场测试成果，LS-Dyna应用在此SMP和Cluster架构上均有非常出众体现，顾客也可选取在此Cluster计算集群中来运营此类应用。 2.4.2 Cluster节点系统配备依照顾客需求，配备高性能 n 管理节点配备配备如下：服务器型号宝德PR2750G 解决器 2 X Intel Xeon Processor E5-2640V3 内存 8 X 8GB/DDR4/2133/MHz/ECC/REG 硬盘 2 X 240GB/2.5in/SATA/6Gb/s/16nm/MLC 网络接口（内置） Mellanox/56GB/40GB/单口IB卡 X520-SR2/双口/万兆网卡/双多模SFP+模块扩展网卡 1*10/100/1000Base-T DVD-ROM 1*DVD+RW 机柜 42U，PDU 电源电扇 N+1热拔插电源电扇 n 存储节点配备配备1台存储节点，配备如下：服务器型号宝德PR4036GS 解决器 2 X Intel Xeon Processor E5-2640V3 内存 8 X 8GB/DDR4/2133/MHz/ECC/REG 硬盘 28 X 4TB/SATA/7200PRM/3.5寸/公司级 480GB/2.5in/SATA/6Gb/s/16nm/MLC 网络接口（内置） Mellanox/56GB/40GB/单口IB卡 1 X LR382B/8口/SAS 12Gb 扩展网卡 1*10/100/1000Base-T DVD-ROM 1*DVD+RW 机柜 42U，PDU 电源电扇 N+1热拔插电源电扇管理节点通过集群控制管理计算节点，并进行作业调度管理。 2.4.3 节点互连、管理和顾客网络宝德高性能集群系记录算节点通过高速Infiniband互连技术实现互联，高速Infiniband互连网络重要用于计算节点之间进行MPI通讯，互换节点应用进程信息和计算数据。Infiniband互连采用36端口Infiniband互换机。整个高性能集群每个节点连接分别连接到两个网络，管理网络和顾客网络。管理网络重要用于节点管理信息传播，顾客网络又称存储网络，重要用于各节点与I/O节点之间数据传播，涉及应用程序和数据装载、计算成果保存等等。管理网络和顾客网络均采用中兴以太网络产品搭建。管理网络采用千兆以太网互换机，顾客网络（存储网络）采用万兆系列以太网互换机。网络互换机配备如下：互连互换机（Infiniband） 32端口Infiniband互换机，以太网互换机（顾客网络） - 24*10GBase-T SFP+ - 4*10/100/1000Base-T或mini-GBIC（双功能定制端口）以太网互换机（管理网络） - 24*10/100Base-T 4*10/100/1000Base-T或mini-GBIC（双功能定制端口）所有Cluster集群计算节点、I/O节点和管理节点及上述互连互换机和以太网互换机均被分别安装在1个2米高42U机柜中（含PDU），安装位置进行恰当调节，以优化机柜配线。 2.4.4 Cluster计算集群节点管理为了有效管理计算集群系统，管理节点配备了管理能力很强管理软件。管理系统是一种非常出众Beowulf 集群系统环境下管理软件，它负责系统诊断、软件安装、性能监控、系统克隆(Cloning)和事件分析与管理。通过使用和谐顾客界面，集群管理将变得更加高效。也将通过减少有关管理任务，使Cluster计算集群成为一种经济高效解决方案。集群管理软件，使得所有计算节点远程文本控制台在服务器所有状态下（设立、启动、OS或暂停）均可使用。并借助独立WEB浏览器，远程访问任何活动节点图形控制台。通过管理程序，Cluster集群系统管理员可以远程控制服务器电源，而无论服务器处在何种状态（虽然服务器关机）。此外，还可进行远程BIOS设立。集群管理软件还具备将一种系统配备向集群中所有计算节点传播功能。CMU可以通过网络将一种映像服务器磁盘分区内容克隆到计算节点本地磁盘中。这可用于计算节点初次安装，以及向核心或当前系统配备传播更新内容等。在目的分区与初始映像不同状况下，则会重点考虑目的磁盘分区。在克隆阶段对目的磁盘进行分区，避免了在初次安装期间对各个计算节点进行分区。集群管理实用程序可以有效地管理大量计算节点。带有图形顾客界面（GUI），可以依照需要和集群中任意数量节点进行定制。借助集群管理，只需在单一显示屏上单击鼠标即可访问所有计算节点控制台。软件主窗口可通过访问配备显示界面来设立控制台服务器硬件。通过集群管理，可以监控、暂停、启动、重启或关闭选定任何节点。还可以连接到集群中各种节点，并通过一次键盘输入以广播方式向其发出命令。也可以管理来自集群事件，如节点增长或减少等。 2.4.5 Cluster计算集群作业管理高性能计算顾客通过登录管理节点进行作业提交，作业提交后，由管理节点上作业管理软件进行管理和分发。作业管理为生产环境设计，它可提供了图形和命令行两种顾客界面来提交批解决、交互式作业，并提供查询作业、队列、系统状态和跟踪作业解决。在作业运营之前，顾客可将需要文献拷贝到执行节点上，和将这些指定文献在作业执行完之后，拷贝出来。只有在所有文献成功传播之后，作业将会被列入调度表。提交任务顾客可以指定作业优先级，可以向队列和系统层提供默认值。作业管理支持单队列或多队列方式。并选取原则 first-in，first out 调度，或者改进调度算法。作业管理可以使顾客定义广泛批解决作业内部有关性。这些有关性涉及：执行顺序、同步执行和依照指定作业成功或失败成果条件执行。 2.4.6 宝德 Cluster计算集群特点和优势宝德Cluster计算集群具备如下特点和优势： 1) 具备很高性能价格比。采用先进Beowulf架构，扩展性好即可扩充到几百上千个节点，从而获得很高性能和比较低总体成本。 2) 方案采用惠普公司高性能、高可靠性产品。高节点内存带宽，高性能网络互换产品，集群管理软件。 3) 方案采用工业原则设备和顺应高新技术发展趋势。如INTEL CPU，Linux 技术，集群并行计算技术，开放代码程序。 4) 由宝德公司提供专业服务支持。 2.5高性能计算外接存储需求分析本次方案涉及存储区域网络设计，给计算服务器和集群存储节点配备24个4TB硬盘考虑暂时应用需要，高性能计算对存储空间巨大需求是显而易见。在这里，咱们依照现场测试成果，分析存储容量规定，供XXXX在规划存储区域网（SAN）设计时参照。假设以三个月作为顾客活跃生产数据迁移到近线存储空间（作为非频繁访问数据）周期，以一年作为非频繁访问数据迁移到离线备份设备（作为离线备份数据）周期，因而顾客SAN总存储空间需求为高性能磁盘空间加上近线磁盘空间：高性能磁盘空间 = 生产数据空间+20%冗余+预留30% 近线存储磁盘空间 = 4x生产数据空间+20%冗余+预留15% 而生产数据空间与计算任务量有关。以ANSYS为例，按SMP计算服务器配备中分析，顾客有10人，假设每月每人要计算2个600万单元系统级任务，5个200万单元部件级任务。每个系统级任务和部件级任务均产生3份计算成果（不同参数和条件，但不包括中间成果数据）。此外，进行实际估算时应依照顾客实际工作模式、任务量预测、考虑数据迁移方略等作相应调节和计算。 2.6方案优势咱们所提供上述方案是通过深思熟虑，从架构设计、选型配备等方面均通过专业分析并以顾客现场测试成果为基本，可行、恰当、低风险和高性价比，是较好选取。在如下方面，具备明显优势： 1）HP提供方案是真正可行、低风险方案提供计算环境系统架构与已被证明架构可行、对各种应用品有良好合用性、高性能、易管理现场测试系统方案相一致，不但可以保证顾客可获得所盼望性能，还避免了由于采用未经测试系统架构所带来风险。本方案采用各种原则工业架构及各种高性能计算应用软件。在顾客现场测试中，分别在该架构上测试了顾客样题和原则题，不但证明了成果精确无误，计算性能也非常抱负，并且测试过程中从未发生操作系统与应用不能匹配而暂时对操作系统打补丁问题，或测试题目运算异常现象。证明了方案架构是稳定、相应用支持可靠。 2）提供方案具备非常高性能价格比本次方案中，整个计算环境配备计算CPU数共达28个，内存总数共达1TB以上。可支持超过3000万单元任务运算，计算性能非凡。可以同步图形媒体和构造计算最大规定。由于采用了Cluster混合高性能计算体系架构，能充分运用高价格高性能和高性能低成本Cluster优势，使得整体构建成本仍较低，而使顾客获得了非常高性能价格比高性能计算环境。 3）提供方案所采用架构是合理、高性能和高可扩展方案中采用与顾客现场测试时一致SMP+Cluster架构，针对了不同类型应用对不同架构计算平台具备不同适应性特点，为各类应用任务计算都提供了最优支持和性能体现，同步也给顾客提供更加灵活选取。测试成果已经验证了该架构是合理、高性能。 4）方案给顾客提供了低成本、易管理高性能计算环境 SMP单机运营构造题目，Cluster 运营流体题目，是系统管理简朴并且性能高。此外，顾客可以通过管理工具和简易管理界面即可进行计算节点管理及计算任务更为精细调度和资源分派，大大简化了任务管理复杂性及减少了管理成本。第三章产品清单名称品牌型号数量 GPU计算节点宝德PR4768GW 2 管理节点宝德PR2750G 1 存储节点宝德PR4036GS 1 工作站1 宝德PR4764GW 4 工作站2 宝德PR4764GW 6 千兆网络互换机中兴ZXR10 3928A 1 千兆网络互换机中兴ZXR10 5960-32DL 1 光互换机宝德 QDR-36PORT 1 KVM 力登 DL1708 1 机柜科创KC-WT 1

展开阅读全文