资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,超,级计算中心的建设和运营模式,曙光信息产业,(,北京,)有限公司,2009年10月,报告人:聂华,建设超算中心成为国家,/,地区战略任务,超算中心,规划和建设方式,云计算中心的运营服务模式探讨,机遇与挑战,主题,3/9/2025,2,2,3/9/2025,3,“,战略计算”一词首次出现在,1995,年美国为了确保核库存的性能、安全性、可靠性而实施的“加速战略计算创新(,ASCI,)计划”。,ASCI,共投资,10,亿美元,主要参与者有,Sandia,、,Los Alamos,、,Lawrence,三个国家实验室和,Stanford,、,Chicago,等五所大学,在工业界选择了,IBM,、,Intel,、,SGI,和,Cray,四个合作伙伴。,ASCI,计划为,DOE,提供了,5,台,10-100TFlops,的超级计算机,其中包括我们熟悉的,Intel ASCI Red,、,IBM ASC Purple,等。,20,年来,美国最大的超级计算机全部部署于,DOE,的国家实验室。,“超级计算”是美国的“国家战略”,3,超级计算保障科技和技术领先,活跃的经济创造超级计算需求,超算中心是计算能力主要载体,过去,18,个月美国利用超级计算机获得的主要科技突破:,解密蛋白质表面结构的特殊作用,为新药研制提供用力的帮助,理解火焰中气体,/,热能,/,化学反应燃烧三者关系,促进清洁能源研究,高温超导材料获得一系列理论突破,上述成果将对生物、制药、新能源、新材料等工业领域产生深远影响,是美国未来竞争力的主要保障,“计算科学利用先进计算能力去理解和解决复杂问题,是确保科学领导地位、经济竞争力和国家安全的关键。”,美国总统信息咨询委员会,报告,中国的,“两弹一星”、“载人航天”,、科技进步、经济腾飞也,都离不开“超级计算机”的支,撑,。,发达国家垄断超级计算机资源,超级计算是国家/地区核心竞争力的重要标志,4,3/9/2025,5,主要国家均有由政府投资兴建营运超级计算中心,保障计算资源先进性,保障计算资源使用的合理性,保障技术服务的专业性,韩国超算中心,30,万亿次,芬兰超算中心,86,万亿次,美国圣地亚哥超算中心,42,万亿次,美国国家超算应用中心,164,万亿次,西班牙巴塞罗那超算中心,94,万亿次,美国德州超算中心,580,万亿次,德国尤利希研究中心,1000,万亿次,美国新墨西哥超算中心,170,万亿次,中科院超级计算中心,140,万亿次,上海超级计算中心,200,万亿次,日本东京工业大学,GSIC,170,万亿次,国内外超算中心的建设和发展,5,3/9/2025,6,“,超级计算,机,”的“中国力量”:,曙光,、,银河、神威,1983,年,国防科大研制成功每秒,1,亿次,“银河”,巨型机。,1992,年,,国防科大,研制成功,每秒,10,亿次,“银河,II”,巨型机。,1995,年,中科院计算所研制成功每秒,25,亿次,MPP,计算机,-,曙光,1000,。,1997,年,,国防科大,研制成功“银河,III”,百亿次巨型机。,1999,年,国家并行机工程中心研制成功,每秒,3840,亿次,的,“,神威,I”,。,2004,年,每秒,10,万亿次,“,曙光,4000A,”超级计算机,研制成功,,列,Top500,第,10,位,标志中国继,美、日,后,进入世界超算领域,前,列,。,2008,年,,每秒,230,万亿次,“,曙光,5000A,”,超级计算机研制成功,再次入围全球,TOP500,前,10,名,。,2009,年,,,国防,科大研制成功每秒,1.2,千万亿次的“天河,一,号”,,受到国人瞩目。,“超级计算机”在中国的发展,6,3/9/2025,7,超级计算,工业创新,科学研究,商业金融,社会与,公众服务,国家和,社会安全,超级计算日益成为现代社会运行的基柱,7,3/9/2025,8,超级计算,工业创新,科学研究,商业金融,社会与,公众服务,国家和,社会安全,广泛应用于汽车、飞机、船舶、钢铁、石油、新能源、集成电路等众多领域。,增加材料产品率,25%,降低工程技术成本,13%30%,降低人工成本,5%20%,增加设备利用率,30%60%,缩短产品研发周期,30%60%,美国国家科学院工程技术委员会报告,工业创新,超级计算日益成为现代社会运行的基柱,8,3/9/2025,9,超级计算,工业创新,科学研究,商业金融,社会与,公众服务,国家和,社会安全,物理,化学,天文,新材料,生物医药等众多领域的,主要研究途径,之一;,宇宙行星、微观粒子、高温高压等难以实验领域进行,创新研究的唯一途径,。,科学研究,超级计算日益成为现代社会运行的基柱,9,3/9/2025,10,超级计算,工业创新,科学研究,商业金融,国家和,社会安全,社会与,公众服务,交易实时处理,金融模拟分析,商业数据挖掘,物流与生产排程规划等。,在发达国家,金融是超级计算最重要的应用领域之一;美国有超过,10%,的超级计算机部署在各大金融机构。,商业金融,超级计算日益成为现代社会运行的基柱,10,3/9/2025,11,超级计算,工业创新,科学研究,商业金融,社会与,公众服务,国家和,社会安全,天气预报、传染病扩散、大型集会安全分析、社会动力学、宏观经济学等。,基于数学模型使用超级计算机进行数值模拟是上述领域从,定性到定量,,获得更可信结果的,唯一手段,。,社会与公众服务,超级计算日益成为现代社会运行的基柱,11,3/9/2025,12,超级计算,工业创新,科学研究,商业金融,社会学,国家和,社会安全,先进武器设计与测试,核物理模拟,密码情报分析,信号与图像处理等。,国家安全和社会稳定的,重要保障,。,国家与社会安全,超级计算日益成为现代社会运行的基柱,12,3/9/2025,13,计算模拟,与传统的,理论分析,和,观察实验,是当今进行科研创新的三大支柱,计算,创造未来,13,3/9/2025,14,超算中心的建设,因为技术含量高,、,功能强,能够承载高端的科技应用,聚集高水平的人才,必将提升超算,中心,所在,城市,地方科技实力。,超级计算中心建设一般规模较大,应用可以辐射周边区域,相邻区域重复建设,难度大,,所以抢占,超算中心,建设先机,争夺区域科技发展的引领地位、争取高端产业聚集,对建设中心城市,至关重要。,高性能的超,级计,算中心建设,可以,吸引,聚集需要高性能,计算,平台的高端应用,提升区域科研水平,增强企业的核心竞争力,进而推动,城市,地方经济建设。,超算中心所完成的关键性高端科研项目提升城市显示度和美誉度。,具有高性能的超级计算平台,可以作为吸引、引进高端人才的硬件条件,提升,城市,的教育、科研水平和质量。,高性能的超级计算机作为,IT,基础设施,可以改善区域投资环境,促进,城市,招商引资。,超算中心建设因何成为城市争夺的热点,14,3/9/2025,15,曙光,5000,5,个中科院超算分中心,曙光,5000A,上海超算中心,已完成,2,期、,3,期,曙光,6000,华南,(,深圳,)超算中心,曙光,5000A,成都超算中心,曙光,4000A,甘肃超算中心,已完成,1,期、,2,期,曙光,5000,北京市计算中心,互联网,其他:广州超算中心、沈阳超算中心等建设规划已进行立项论证,曙光机在国内超算中心中全面部署,15,建设超算中心成为国家,/,地区战略任务,超算中心,规划和建设方式,云计算中心的运营服务模式探讨,机遇与挑战,主题,3/9/2025,16,16,3/9/2025,17,第一阶段:前期调研,成立,筹备,组,本地高性能计算需求分析,厂商技术方案及案例调研,第二阶段:可行性研究,编写项目建议书,,组织,评审,编写可行性研究报告及评审,第三阶段:立项,编写项目建设方案及评审,政府批准立项,第四阶段:土建及,选型,设备,选型,及签订,合同,土建招投标及施工(若有),第五阶段:安装调试,机房基础设施准备,超级计算机软硬件系统集成,技术培训,第六阶段:交付运行,试运行,正式交付,超算中心的建设流程,17,3/9/2025,18,面向教育、科研、企业以及政府等单位提供随需应变的计算资源、存储资源和软件资源,技术支持服务,并行编程,程序移植,高性能计算相关软件的应用,高性能计算系统环境的使用(作业管理系统、开发环境),高级技术咨询服务和共性技术开发,并行软件、专用软件、共享或商业软件的用户定制开发,提供高级数学建模、算法设计服务,提供虚拟产品设计中以,CAE,应用(结构分析,流体分析,热分析,电磁场分析,或多场耦合分析)为核心的工程咨询服务,培训服务:系统技术,并行编程,计算方法,软件使用,网格计算等,为高性能计算机硬件厂商、应用软件厂商提供演示体验中心、用户测试等外包服务,为各类欲购置或自行搭建高性能计算平台的用户提供第三方技术咨询,软件传播、交流和共享服务。,超算中心的核心业务规划,18,3/9/2025,19,建设超级计算中心绝不等同于购置一台高性能计算机,还需要做多方面的系统、业务建设以确保服务质量和使用效率,土建、,基础设施建设,、改造,超级计算机系统,软件,、应用支持,人员队伍建设,服务运营机制,超算中心建设的“复杂性”,19,商业软件资源,需求举例,3/9/2025,20,序号,软件名称,描述,1,FLUENT,通用计算流体力学分析软件,2,LS-DYNA,瞬态响应动力学分析软件,3,PAM-CRASH,瞬态响应动力学分析软件,4,ANSYS.Multiphysics,多物理场耦合分析软件,5,NASTRAN,通用有限元分析软件,6,MARC,非线性有限元分析软件,7,FEKO,高频电磁场分析软件,8,STAR-CD,通用计算流体力学分析软件,9,CFX,通用计算流体力学分析软件,10,OPTIMUS,过程集成与优化设计软件,11,HyperWorks,有限元前后处理和优化设计软件,序号,软件名称,描述,12,ABAQUS,非线性有限元分析软件,13,IDEAS,有限元分析及前后处理软件,14,ICEM-CFD,CFD前后处理软件,15,AI*ENVIRONMENT,CAE前后处理软件,16,GAMBIT,FLUENT配套前处理软件,17,MasterFEM,有限元前后处理软件,18,Medina,有限元前后处理软件,19,Oracle,数据库软件,20,GEFEP-P,汽车碰撞并行仿真软件,21,CADEM-P,汽车覆盖件冲压并行仿真软件,20,3/9/2025,21,序号,软件名称,描述,1,QCHEM,量子化学计算软件,2,NWCHEM,量子化学计算软件,3,GAUSSIAN,量子化学计算软件,4,MOLPRO,量子化学计算软件,5,GAMESS,量子化学计算软件,6,CPMD,分子动力学从头计算程序,7,ABINIT,电子结构计算程序,8,VASP,分子动力学模拟,9,SIESTA,分子和固体的电子结构计算,10,WIEN2K,固体电子结构计算,11,ESPRESSO,分子动力学模拟,序号,软件名称,描述,12,SMEAGOL,分子动力学模拟,13,NAMD,分子动力学计算程序,14,EGO,分子动力学程序,15,GROMACS,分子动力学通用软件包,16,DOCK,分子对接程序,17,BLAST,序列相似性检索程序,18,MM5,中尺度数值模式的计算程序,19,GRAPES,全球和区域气象分析预报系统,20,FDS,火灾模拟程序,21,COSMOMC,天体物理计算,科学软件资源需求举例,21,3/9/2025,22,建设保障超算中心业务正常运行的服务和运营团队,外派技术和管理人员培训学习,掌握管理与应用的相关技术。,招聘高性能计算领域博、硕士研究生到中心工作,以保证超级计算中心拥有较强的技术实力,可以进行多种业务的开展。,超级计算中心,财务部,公共关系部,人力资源部,技术支持部,研究开发部,科学计算部,办公室,工程计算部,人员队伍建设举例,22,3/9/2025,23,政府投资建设和运营,服务于”长三角“地区制造业、高新技术企业以及教育科研等用户,在气象预报、药物设计、生命科学、汽车、新材料、土木工程、物理、化学、航空、航天、船舶等十个应用领域取得了一批重大成果,全程保障,ARJ,支线飞机全机外形、气动阻力、气动升力的设计,支持大飞机公司完成翼型、机翼、翼身组合体、发动机吊挂等设计任务,支持荣威,750,、,550,、奇瑞,A3,、,A01D,虚拟设计,,A3,获,CNCAP,五星安全大奖,上海外环隧道、崇明过江隧道、过江大桥的安全评估和设计仿真,对蛋白质,-,蛋白质相互作用准确预测,完成世界影响力的新药设计和研究,船舶水动力特性的数值模拟,支线飞机空气动力学,设计分析,船尾组合浆区域压力发布,飞行器优化设计,汽车碰撞与安全性评估,金属催化过程,药分子设计,地质构造与抗震性能评估,以上海超算为例分析典型超算中心运营模式,23,3/9/2025,24,服务于,350,家机构的,2500,名科技工作者,支持各类国家和地方科研项目,3000,个,孕育,1000,篇世界一流水平学术论文,保障数百个企业新产品研发和工艺革新,催生数十个国家级科技奖项,上海超算中心对区域科技创新的巨大作用,24,3/9/2025,25,超算中心需要,成功地,运营,,创造,出,效益,,得到,投资者,认可,才,能,获得进一步发展的机会,,以上海超算中心为例:,超算中心的分期建设原则,25,3/9/2025,26,传统的,超算中心主要作为公共计算平台,旨在提升区域科研能力和企业核心竞争力,通常需要财政补贴以,维持,正常运营。,超算中心的收入来源,计算资源按需服务,高级技术咨询服务,企业赞助,超算中心的主要支出,IT,设施电力消耗,人员工资等成本,物业管理及其他费用,超算中心的运营成本,26,3/9/2025,27,全面采用,“,绿色计算”方案,采用高效能服务器系统,采用刀片式服务器,采用虚拟化技术,采用电源管理技术,采用水冷散热技术,实际效果,电费得到了有效控制,管理运营人员没有扩编,面临的主要问题和难题,基础设施的分期改造带来的混乱,服务器,淘汰,更新过快,仍然“吓人”的电费账单,仍然依赖政府的财政拨款,曙光5000A高度关注运营成本,27,探索适合超算中心应用的新技术和新平台,已投入大规模运行的,GPGPU,机群,安装于中科院过程控制研究所,业界首款全兼容,SSI,标准的,TC3600,2009,年旧金山,IDF,大会上正式发布,PHPC,推动,HPC,的普及,基于龙芯,CPU,的主板设计,PowerConf,节能软件,28,3/9/2025,29,政府划拨,2000,年一期,3.5,年,3000,万元,2004,年二期,3,年,4500,万元,2009,年三,期,3,年,9000,万元,近几年情况,2005,年,2006,年,2007,年,2008,年,2009,年,2010,年,总运营费用,1800,2000,2200,2700,5000,5000,财政拨款,1500,1500,1500,0,3000,3000,自筹经费,300,500,700,2700,2000,2000,上海超算中心运维资金情况,29,3/9/2025,30,超级计算中心,建成时间,人员,规模,设备更新,费用来源,日常运营费用及来源,(美元,/,每年),美国圣地亚哥,超级计算中心,1985,400,联邦机构,6000,万,其中,2000,万来自,NSF,;其余主要来自联邦机构、州政府的各个研究项目,美国国家超级计算,应用中心,1986,500,联邦机构,超过,2000,万美元,主要来自,NSF,,部分来自于州政府(,700,万)、大学及其他联邦机构,芬兰科学计算中心,1970,140,中央政府机构,5000,万,其中,65%,来自教育部,,20%,来自合作项目,,15%,来自其他方面,瑞士国家,超级计算中心,1991,40,联邦机构,900,万,其中,850,万来自联邦机构;仅有,50,万来自第三方,韩国,KISTI,超级计算中心,1988,中央政府机构,3000,万,其中,1000,万来自韩国政府直接拨款;,1000,万来自与政府部门、高校的研究项目;另外,1000,万来自其他项目,国际上超级计算中心维资金情况,30,3/9/2025,31,基础设施一次规划,避免分期改造,广泛调研,全面设计,一次投入(总计投入超过,7,亿),设备分批入场,快速投入运营,一期设备快速入场,在,2010,年直接服务于深交会,二期、三期设备按业务需要规模入场,追求综合效益最大 化,先科学计算,再城市信息服务,以现有的科学计算为先导,快速提供服务,快速出成果,数字城市、电子政务是华南超算中心未来的主要方向,注重公共基础设施服务属性,以政府支持为主,强调超算平台对地方科技的强大支撑作用,重点发挥超算平台的公益效应,华南(深圳)超算中心的建设方式,31,建设超算中心成为国家,/,地区战略任务,超算中心规划和建设方式,云计算中心的运营服务模式探讨,机遇与挑战,主题,3/9/2025,32,32,3/9/2025,33,支持方观点:超算中心建设是一种先进的模式,优化、集中,IT,软硬件资源,本身就是一种节约行为,反对方观点:超算中心运营是政府的财政负担,经济不足够发达地区,持续的财政拨款需求的确让政府头疼,到底谁错了?,如果没有超算中心,政府每年分散的,IT,投资浪费触目惊心,虽然有了超算中心,大多数政府并没有改变原有的,IT,投资方式,原有的投资没有减少,又有了新的需求,自然就产生财政负担!,问题解决途径:集中投资后,分散投资必须得到有效控制,按现有的政府财政申请和拨款模式,很难有效操作,从超算中心的自我经营模式寻找突破点,新模式的探讨:分散的,IT,投资,改由政府统一向超算中心采购服务,超算中心运营模式引发的矛盾,33,3/9/2025,34,成立事业单位编制超算中心运营团队负责后期运营,主要资金来源为财政拨款,对外服务收入作为有益补充。,政府及共建单位成立股份制合资公司进行企业化运营,并由政府提供基础运营费用补贴。,政府设定基本运营指标外包第三方企业运营并提供税收减免等优惠政策,企业自负盈亏。在保证运营指标的前提条件下,企业可以利用超算中心进行相关的商业运作,以补充运营费用、提升运营水平。,进一步的大胆设想:,厂商投资建设超算中心并负责运营,政府定期、定量采购超算中心软硬件服务,以补贴厂商建设投资和,超算中心,运营费用。,新型超算中心的运营模式探索,34,3/9/2025,35,全新建设运营模式:,曙光,投资建设超算中心并负责运营,政府定期、定量采购超算中心软硬件服务,以,补偿,建设投资和运营,成本,。,用户收益,政府消除了对未来不确定性的担忧。,超算中心面向政府信息化应用,将大大提高政府信息系统的集中度,可节约大量经费。,政府获得了招商引资的,效果,。,超算中心,亦,成为城市的科技名片,有较强显示度。,成都超算中心的大胆尝试,35,将日常,IT,投入,转化为服务采购,3/9/2025,36,利益模型分析,超算中心,厂商,政府,服务提供,定期定量的,服务采购承诺,分期回报,再投资,服务提升,优质的呈现,达成战略合作协议,将日常,IT,投入,转化为服务采购,分期回报,36,3/9/2025,37,基于硬件的租赁服务,基于人力的技术服务,基于平台的服务,?,网络和安全技术,HPC,系统运维技术,HPC,应用运维技术,网格计算技术并行编程技术数据处理及可视化,HPC,系统技术应用领域技术,基于平台的服务呈现?云计算模式!,对成都超算中心建设模式的解读,37,3/9/2025,38,政府主导的新型超算中心建设将进入快速发展阶段,超算中心是政府基础设施建设的一部分,“,公共服务”是未来超算中心的基本属性,超算中心应用模式将不断拓展,科研类:面向教育和科研领域用户的科学计算应用,企业类:提供计算、存储和软件资源,对企业用户提供服务,按需付费,政务类:,IT,投资集中化,建设成政务信息共享、交换中心,金融类:面向金融、证券等行业的海量数据挖掘,灾备类:面向政府或大型企业提供数据和应用的灾难备份与恢复服务。,电子商务类:线上交易平台与商务智能,数据处理类:海量互联网数据的处理和分析。,超算中心的发展要求,38,超,算中心的兴起是,IT产业的发展趋势,IT资源由分布趋于集中,大型超算中心,(乃至未来的,云计算中心,)的建设将进入快速发展时期,资源整合提高使用效率并易于管理和更低的,TCO,保证最佳的应用水平和服务支持,IT资源将以“按需服务On-Demand-Service”模式展现给用户,以超算中心为平台支撑的“云计算中心”的呈现,软件即服务,Software as a service,基础架构即服务 Infrastructure as a Service,平台即服务 Platform as a service,云计算,中心,超算中心,3/9/2025,39,39,利用企业、品牌优势进行广泛联合合作,关注云计算技术趋势,VMware,战略合作关系,开展云计算虚拟化技术领域探索,Microsoft,战略合作关系,在云计算系统平台技术领域探索,INTEL,、,AMD,战略合作关系,在云计算硬件芯片级支持技术方面探索,EMC,战略合作关系,在云计算数据服务领域探索,NOVELL,战略合作关系,共同投资建设云计算展示平台,SGI,战略合作关系,提供大型主机、数据中心与计算解决方案级体验,曙光应用体验中心对用户提供免费的云计算体验服务,曙光具有云计算平台、云计算技术科研开发力量,曙光具有提供多样化云计算硬件平台的优势,曙光具有强大的云计算应用支持领域工程师队伍,曙光具有提供云计算服务模式的基础,曙光具有国内最成功的实战案例,曙光迎接云计算时代的到来,3/9/2025,40,40,建设超算中心成为国家,/,地区战略任务,超算中心规划和建设方式,云计算中心的运营服务模式探讨,机遇与挑战,主题,3/9/2025,41,41,3/9/2025,42,不同于其他大型科研创新基础设施的特点,设备更新周期短,日常运维投入大,技术要求高,对尖端人才的依赖程度大,覆盖面广,需要跨多个学科、产业领域的结合,现有投资渠道和投资方式的不足,重硬件,轻软件,重建设,轻运维,国家层面缺乏统筹和规划,愿意做,但不敢做;越不做,越不知如何做,“起大早,赶晚集”的困惑,超算中心建设面临的挑战,42,3/9/2025,43,时代发展带来的机遇,高速发展的中国经济牵引着超级计算的发展,世界经济的复苏为超级计算的发展提供强大动力,中国综合国力的增强为超级计算发展,提供最强有力,的支持,国家、政府,越来越重视超级计算,不断加大投入,,创造,产业,环境,高性能计算的普及推动了产业技术发展,超级计算得到教育行业的重视,培养出一批高水平人才,超级计算日益与工业、产业发展相融合,并创造巨大效益,新技术变革带来的产业变革和跨越 发展的难得机遇,云计算、虚拟化技术,GPGPU,计算为代表的,高效能,计算,绿色计算催生出的技术变革,43,3/9/2025,44,曙光与,中国高性能计算,普及,“,领导者”,从曙光,1,号到曙光,5000,代表,着,中国高性能计算,发展,的最高水平,以推动,中国高性能计算,的发展为己任,努力推动中国高性能计算的普及,曙光与,中国超算中心,建设,发展,“,先行者”,与中国运营最成功的上海超算中心成为“战略合作伙伴”,参与,支持,上海超算,中心的,建设,,获得,宝贵经验。,推出,中国,“宏计划”战略,以推动区域经济、科技发展为己任,陆续在,深圳、兰州、,成都、广州、沈阳等地掀起,国家,/,区域,超算中心建设热潮,曙光与中国“云计算”业务模式,“,探索,者”,由研制,超,级计算机系统,转型到提供超算计算应用解决方案,乃至探索成为以信息服务提供为核心的云计算运营者,曙光超级计算机的研制和技术变革,为云计算提供平台和技术支撑,由传统的科学计算的科研方向,到信息服务、电子商务服务、数据服务需求的强大牵引,以“服务”为核心的,曙光,用户应用体验中心的有效转型,为云计算提供应用解决方案,以成都超算中心为代表的经营服务的模式,是中国云计算服务商业运营的最有效实践,总,结,44,3/9/2025,45,谢谢!,nh,2009,年,10,月,29,日,The END,45,
展开阅读全文