1、目 录CONTENS一、云智一体,促进数字化转型与智能化升级一步到位1.1产业智能化,数字经济发展新阶段1.2百度智能云战略升级1.3云智一体的百度智能云架构2.0,加速产业智能化二、构建适应未来发展趋势的AI开发平台2.1场景先行2.2自主创新2.3效能为要三、云智一体的AI开发全栈模式 四、适合跑AI的云:AI开发基础设施4.1AI计算层4.2AI存储层4.3AI容器层五、飞桨企业版:AI开发双平台5.1零门槛AI开发平台:EasyDL5.2全功能AI开发平台:BML六、企业AI能力生产与集中化管理平台:AI中台 七、云智一体AI开发全栈模式的行业实践7.1打造国网人工智能平台,推动电网智
2、能化应用7.2为陕西汉中插上翅膀,AI助力打赢精准脱贫战7.3更多行业案例参考八、关于本报告020303040506060708 12141719202435414950566061云智一体,促进数字化转型与智能化升级一步到位 1.1 产业智能化,数字经济发展新阶段当前,我们正处在科技创新和产业发展最好的时代,以人工智能、大数据、云计算、5G等为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革。在产业应用新兴技术和数据资源转型升级的过程中,数字化是基础;而随着人工智能等新一代信息技术的发展,以及数据的爆发式增长,产业加快应用智能技术,从海量数据中发现规律、训练模型、提炼知识,促进产出
3、增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。因此,数字经济既包括数字化转型,也包括智能化升级,产业智能化是数字经济发展的新阶段。1.2 百度智能云战略升级百度是拥有强大互联网基础的领先AI公司。从成立的第一天起,百度搜索引擎就与人工智能、云计算等技术息息相关。经过多年的技术积累和产业实践,百度已形成了全面布局,从基础的算力和数据技术、深度学习算法及框架,到语音、视觉、自然语言处理等感知、认知技术,以及飞桨深度学习开源开放平台等,具备云智一体的独特优势。基于百度的技术优势和对产业发展的洞察,经过跟合作伙伴的共同成长与产业实践,百度智能云的战略升级为:以“云计算为基础”
4、支撑企业数字化转型,以“人工智能为引擎”加速产业智能化升级,云智一体“赋能千行百业”,促进经济高质量发展。云智一体的“云”为数字化转型提供安全、稳定、灵活的数字化底座,“智能化引擎”为智能化升级提供领先的创新技术和平台。我们推荐客户数字化转型与智能化升级一起做,一步到位,这样效率更高,效果更好。同时,如果客户只做数字化转型,我们有丰富的云计算产品可以支持;或者客户已经有了数字化基础,我们的智能化引擎也可以助力智能化应用。百度智能云的“云”,不仅为数字化转型提供安全稳定、弹性灵活的云计算服务,同时也是适合跑AI的云,我们称之为“AI原生云”,继承云原生的优势,面向AI场景,提供极致弹性的高性能异
5、构算力,打造简洁、高效的AI应用开发架构。“云智一体”的智,是百度将深耕十余年的AI技术,以及AI赋能产业的实践经验,沉淀为助力产业智能化升级的技术、平台及方法论,是以加速产业智能化升级为己任、懂场景的AI。“云智一体”技术与应用解析 企业AI开发篇020302“云智一体”技术与应用解析企业AI开发篇云智一体,促进数字化转型与智能化升级一步到位 1.1 产业智能化,数字经济发展新阶段当前,我们正处在科技创新和产业发展最好的时代,以人工智能、大数据、云计算、5G等为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革。在产业应用新兴技术和数据资源转型升级的过程中,数字化是基础;而随着人工智
6、能等新一代信息技术的发展,以及数据的爆发式增长,产业加快应用智能技术,从海量数据中发现规律、训练模型、提炼知识,促进产出增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。因此,数字经济既包括数字化转型,也包括智能化升级,产业智能化是数字经济发展的新阶段。1.2 百度智能云战略升级百度是拥有强大互联网基础的领先AI公司。从成立的第一天起,百度搜索引擎就与人工智能、云计算等技术息息相关。经过多年的技术积累和产业实践,百度已形成了全面布局,从基础的算力和数据技术、深度学习算法及框架,到语音、视觉、自然语言处理等感知、认知技术,以及飞桨深度学习开源开放平台等,具备云智一体的独特优
7、势。基于百度的技术优势和对产业发展的洞察,经过跟合作伙伴的共同成长与产业实践,百度智能云的战略升级为:以“云计算为基础”支撑企业数字化转型,以“人工智能为引擎”加速产业智能化升级,云智一体“赋能千行百业”,促进经济高质量发展。云智一体的“云”为数字化转型提供安全、稳定、灵活的数字化底座,“智能化引擎”为智能化升级提供领先的创新技术和平台。我们推荐客户数字化转型与智能化升级一起做,一步到位,这样效率更高,效果更好。同时,如果客户只做数字化转型,我们有丰富的云计算产品可以支持;或者客户已经有了数字化基础,我们的智能化引擎也可以助力智能化应用。百度智能云的“云”,不仅为数字化转型提供安全稳定、弹性灵
8、活的云计算服务,同时也是适合跑AI的云,我们称之为“AI原生云”,继承云原生的优势,面向AI场景,提供极致弹性的高性能异构算力,打造简洁、高效的AI应用开发架构。“云智一体”的智,是百度将深耕十余年的AI技术,以及AI赋能产业的实践经验,沉淀为助力产业智能化升级的技术、平台及方法论,是以加速产业智能化升级为己任、懂场景的AI。“云智一体”技术与应用解析 企业AI开发篇020302“云智一体”技术与应用解析企业AI开发篇1.3 云智一体的百度智能云架构2.0,加速产业智能化基于百度智能云的战略升级,云智一体的百度智能云架构2.0同时发布,包含数字化底座、智能化引擎和全场景应用(如图1.3-1所示
9、)。数字化底座,包括基础云、数据库、物联网、边缘计算、区块链等基础平台,以及视频云、大数据、云原生开发和地图服务等;同时还有安全模块,为技术创新和产业转型升级保驾护航。在数字化底座之上是智能化引擎,百度自主研发的飞桨深度学习平台为核心,软硬一体AI大生产平台-百度大脑为支撑,包括AI中台和知识中台等。智能化引擎与行业深度融合,帮助企业建设自己的智能化中台,助力智能化升级。基于数字化底座和智能化引擎,百度智能云深入行业场景,打造智能应用,同时与生态伙伴一起,在制造、能源、城市、金融、医疗、媒体等领域,助力数字化转型和智能化升级一步到位。构建适应未来发展趋势的AI开发平台 我们希望以百度智能云为纽
10、带,联合技术和产业生态伙伴,通过开源开放平台降低AI开发的门槛,加快人工智能融入传统产业,帮助越来越多的行业大步快跑,加入产业智能化的大潮。百度智能云:全新发布架构2.0(图1.3-1)智能化引擎全场景应用智能客服企业搜索智能办公智能推荐工业质检智能创作智慧城市智慧交通智慧金融智能制造智慧能源智慧媒体智慧医疗数字化底座云为底座 飞桨为核 生态为翼AI中台知识中台软硬一体AI大生产平台产业级深度学习开源开放平台存储网络大数据服务视频云云原生开发服务区块链数据库物联网边缘计算基础云安全地图服务计算“云智一体”技术与应用解析 企业AI开发篇04051.3 云智一体的百度智能云架构2.0,加速产业智能
11、化基于百度智能云的战略升级,云智一体的百度智能云架构2.0同时发布,包含数字化底座、智能化引擎和全场景应用(如图1.3-1所示)。数字化底座,包括基础云、数据库、物联网、边缘计算、区块链等基础平台,以及视频云、大数据、云原生开发和地图服务等;同时还有安全模块,为技术创新和产业转型升级保驾护航。在数字化底座之上是智能化引擎,百度自主研发的飞桨深度学习平台为核心,软硬一体AI大生产平台-百度大脑为支撑,包括AI中台和知识中台等。智能化引擎与行业深度融合,帮助企业建设自己的智能化中台,助力智能化升级。基于数字化底座和智能化引擎,百度智能云深入行业场景,打造智能应用,同时与生态伙伴一起,在制造、能源、
12、城市、金融、医疗、媒体等领域,助力数字化转型和智能化升级一步到位。构建适应未来发展趋势的AI开发平台 我们希望以百度智能云为纽带,联合技术和产业生态伙伴,通过开源开放平台降低AI开发的门槛,加快人工智能融入传统产业,帮助越来越多的行业大步快跑,加入产业智能化的大潮。百度智能云:全新发布架构2.0(图1.3-1)智能化引擎全场景应用智能客服企业搜索智能办公智能推荐工业质检智能创作智慧城市智慧交通智慧金融智能制造智慧能源智慧媒体智慧医疗数字化底座云为底座 飞桨为核 生态为翼AI中台知识中台软硬一体AI大生产平台产业级深度学习开源开放平台存储网络大数据服务视频云云原生开发服务区块链数据库物联网边缘计
13、算基础云安全地图服务计算“云智一体”技术与应用解析 企业AI开发篇0405随着数据量的激增、算法的突破、算力的爆发,人工智能技术进入了快速发展期,迎来了与产业应用场景广泛结合的新阶段。因此,在企业数字化和智能化的转型过程中,亟需构建一套与应用场景相结合、灵活易用、效能为先的适应未来发展趋势的AI开发平台。在业务需求的牵引下,通过十余年的技术积累,百度自研深度学习框架、构建人工智能平台、结合对集群和算力的管理与调度,逐渐形成了业内领先的云智一体的AI开发全栈模式。因此,百度不仅是资深的AI开发平台使用者,同时也是AI开发平台的提供者。在企业使用人工智能赋能业务场景的过程中,相信大多数企业和开发者
14、都在思考自己到底需要一个什么样的AI开发平台,如何有效地开展AI开发工作?我们认为可以从如下三个方面分析:2.1 场景先行使人工智能充分发挥价值和作用的前提,是要与实际的应用场景相结合。根据业务场景对需求进行定义,是成功进行AI算法模型开发的基础。百度在过去多年为企业提供服务的过程中发现,超过80%的需求都需要根据实际应用场景进行定制。同时,在AI开发过程中,使用与应用场景相配套的流程工具是提高AI算法模型开发效率的关键。例如,百度的AI开发平台,面向质检、巡检、OCR、遥感图像分析、文本分类、文本处理、情感分析、商品检测等系列场景,都建设了一系列配套的组件、算法和工具,有效地帮助企业建立以场
15、景导向、业务应用为前提的AI开发基础。2.2 自主创新AI开发是一个动态进化的过程,是在与应用场景持续交互的过程中,通过不断获得反馈、获取动态新数据,持续进行迭代优化的过程。同时,人工智能的应用场景非常分散,并且需要与业务逻辑紧密结合。因此,对于企业和开发者而言,需要有足够灵活、易用的平台进行自主创新。在灵活性方面,适应未来发展趋势的AI开发平台,需要广泛地适配各类主流硬件,充分发挥各种硬件的能力且具有足够灵活性。百度飞桨企业版是业内芯片适配最广泛的AI开发平台,广泛适配包括飞腾、华为、百度昆仑等在内的国产芯片和服务器,这使得人工智能的创新应用可以建立在充分的灵活性基础之上。在易用性方面,适应
16、未来发展趋势的AI开发平台,应该不仅能够支持算法工程师、数据科学家等专业开发人员进行便捷的模型开发和训练,也应该能够支持业务一线人员等零基础的开发者参与到AI开发过程中来。百度飞桨企业版,面向不同的使用者,既提供全功能开发模式满足资深研发人员的开发需求,也提供适合一线业务人员的零门槛模式,使得专业AI开发的部分更极致,同时又能充分发挥更多的创造力。2.3 效能为要AI开发相较于传统的软件开发而言,从数据获取、数据标注、数据增强、模型开发、模型训练、模型评估到模型部署各个环节更加的复杂和多维。适应未来发展趋势的AI开发平台,应该具备从多个层面优化资源调度、提升开发效能的能力。在开发层面,除了全流
17、程端到端的开发支持,更重要的是在每个环节中贴心为开发人员打造的细节。在百度飞桨企业版中,例如数据标注环节的智能清洗和自动标注能力,大幅降低标注成本;又如预置的大规模预训练模型和迁移学习能力,使得更少数据更好效果成为可能;再如基于数据闭环实现模型的持续迭代优化等能力,在各个环节中提升AI开发的效率、缩短开发周期。在算力层面,纵向从AI芯片、AI服务器、AI容器到AI开发平台,应该做到全方位、集中式的AI算力管理。百度AI开发全栈模式,提供高密度的算力集中管理、多样的AI计算套餐、先进的调度系统、开放的算力生态,可实现对算力成本的极致优化。综上所述,人工智能技术从理论创新、技术突破、到工程实现,还
18、有很多想象空间与未知领域可探索,企业在选择并建设适应未来发展趋势的AI开发平台方面,建议关注“场景先行、自主创新、效能为要“三个关键要素,进行统一规划和建设。这样不仅可以保障数据与模型资产的统一积累、沉淀和复用,更重要的是,还可以系统性的获得算法、工程等方面的最新成果,使企业能够在更高的基座上进行创新实践。“云智一体”技术与应用解析 企业AI开发篇0607随着数据量的激增、算法的突破、算力的爆发,人工智能技术进入了快速发展期,迎来了与产业应用场景广泛结合的新阶段。因此,在企业数字化和智能化的转型过程中,亟需构建一套与应用场景相结合、灵活易用、效能为先的适应未来发展趋势的AI开发平台。在业务需求
19、的牵引下,通过十余年的技术积累,百度自研深度学习框架、构建人工智能平台、结合对集群和算力的管理与调度,逐渐形成了业内领先的云智一体的AI开发全栈模式。因此,百度不仅是资深的AI开发平台使用者,同时也是AI开发平台的提供者。在企业使用人工智能赋能业务场景的过程中,相信大多数企业和开发者都在思考自己到底需要一个什么样的AI开发平台,如何有效地开展AI开发工作?我们认为可以从如下三个方面分析:2.1 场景先行使人工智能充分发挥价值和作用的前提,是要与实际的应用场景相结合。根据业务场景对需求进行定义,是成功进行AI算法模型开发的基础。百度在过去多年为企业提供服务的过程中发现,超过80%的需求都需要根据
20、实际应用场景进行定制。同时,在AI开发过程中,使用与应用场景相配套的流程工具是提高AI算法模型开发效率的关键。例如,百度的AI开发平台,面向质检、巡检、OCR、遥感图像分析、文本分类、文本处理、情感分析、商品检测等系列场景,都建设了一系列配套的组件、算法和工具,有效地帮助企业建立以场景导向、业务应用为前提的AI开发基础。2.2 自主创新AI开发是一个动态进化的过程,是在与应用场景持续交互的过程中,通过不断获得反馈、获取动态新数据,持续进行迭代优化的过程。同时,人工智能的应用场景非常分散,并且需要与业务逻辑紧密结合。因此,对于企业和开发者而言,需要有足够灵活、易用的平台进行自主创新。在灵活性方面
21、,适应未来发展趋势的AI开发平台,需要广泛地适配各类主流硬件,充分发挥各种硬件的能力且具有足够灵活性。百度飞桨企业版是业内芯片适配最广泛的AI开发平台,广泛适配包括飞腾、华为、百度昆仑等在内的国产芯片和服务器,这使得人工智能的创新应用可以建立在充分的灵活性基础之上。在易用性方面,适应未来发展趋势的AI开发平台,应该不仅能够支持算法工程师、数据科学家等专业开发人员进行便捷的模型开发和训练,也应该能够支持业务一线人员等零基础的开发者参与到AI开发过程中来。百度飞桨企业版,面向不同的使用者,既提供全功能开发模式满足资深研发人员的开发需求,也提供适合一线业务人员的零门槛模式,使得专业AI开发的部分更极
22、致,同时又能充分发挥更多的创造力。2.3 效能为要AI开发相较于传统的软件开发而言,从数据获取、数据标注、数据增强、模型开发、模型训练、模型评估到模型部署各个环节更加的复杂和多维。适应未来发展趋势的AI开发平台,应该具备从多个层面优化资源调度、提升开发效能的能力。在开发层面,除了全流程端到端的开发支持,更重要的是在每个环节中贴心为开发人员打造的细节。在百度飞桨企业版中,例如数据标注环节的智能清洗和自动标注能力,大幅降低标注成本;又如预置的大规模预训练模型和迁移学习能力,使得更少数据更好效果成为可能;再如基于数据闭环实现模型的持续迭代优化等能力,在各个环节中提升AI开发的效率、缩短开发周期。在算
23、力层面,纵向从AI芯片、AI服务器、AI容器到AI开发平台,应该做到全方位、集中式的AI算力管理。百度AI开发全栈模式,提供高密度的算力集中管理、多样的AI计算套餐、先进的调度系统、开放的算力生态,可实现对算力成本的极致优化。综上所述,人工智能技术从理论创新、技术突破、到工程实现,还有很多想象空间与未知领域可探索,企业在选择并建设适应未来发展趋势的AI开发平台方面,建议关注“场景先行、自主创新、效能为要“三个关键要素,进行统一规划和建设。这样不仅可以保障数据与模型资产的统一积累、沉淀和复用,更重要的是,还可以系统性的获得算法、工程等方面的最新成果,使企业能够在更高的基座上进行创新实践。“云智一
24、体”技术与应用解析 企业AI开发篇0607云智一体的AI开发全栈模式 08企业数字化、产业智能化需要与云计算、人工智能等技术进行深度结合。由于各类企业的智能化需求都是多种多样的,很多需求需要定制,很难用通用的AI模型去满足所有需求。根据2018年百度与波士顿咨询公司的联合调研,市场上86%的需求为定制AI需求。定制模型的数量从2017年至2020年激增了6倍之多(如图3-1所示)。因此,对企业而言,需要根据自己的需求进行模型开发。市场上的需求为定制AI需求2017至2020年定制模型数量非定制AI需求定制AI需求2017201820192020数据来源:2018年百度与波士顿咨询公司的联合调研
25、数据来源:百度AI开放平台(图3-1)86%翻6倍产业智能化正与AI技术深度结合86%14%09“云智一体”技术与应用解析企业AI开发篇云智一体的AI开发全栈模式 08企业数字化、产业智能化需要与云计算、人工智能等技术进行深度结合。由于各类企业的智能化需求都是多种多样的,很多需求需要定制,很难用通用的AI模型去满足所有需求。根据2018年百度与波士顿咨询公司的联合调研,市场上86%的需求为定制AI需求。定制模型的数量从2017年至2020年激增了6倍之多(如图3-1所示)。因此,对企业而言,需要根据自己的需求进行模型开发。市场上的需求为定制AI需求2017至2020年定制模型数量非定制AI需求
26、定制AI需求2017201820192020数据来源:2018年百度与波士顿咨询公司的联合调研数据来源:百度AI开放平台(图3-1)86%翻6倍产业智能化正与AI技术深度结合86%14%09“云智一体”技术与应用解析企业AI开发篇正是因为AI模型定制需求的激增,企业对自己的AI开发能力也提出了更高的要求(如图3-2所示)。一方面,对AI模型精度和AI开发效率有了更高的要求;另一方面,对AI算力资源的需求也呈现爆发式的增长。AI开发是一个非常消耗资源和能源的过程,企业亟需一套高性价比、高性能、高利用率的AI开发基础设施硬件,从而在AI开发过程中达到效能和成本的最佳平衡点。(图3-2)高质量数据高
27、精度效果高易用工具高性能高性价比高利用率效能成本对精度与开发效率的高要求对AI算力资源的爆发需求智能应用需求爆发,对AI开发提出了更高要求在AI开发过程中,涉及从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务。在这一系列过程中,不仅需要对所有流程调优、最大化提升开发人员的研发效率。而且,AI模型的训练和推理都需要大量的算力资源支持、并且要合理高效地利用这些庞大的算力资源来提升机器资源利用效率。这些都需要一套高性能、高效能、适应未来发展趋势的AI开发平台来提供。具体来说,在智能时代,适应未来发展趋势的AI开发平台需要提供如下能力:在算力资源方面,要对接和管理好性能、高利
28、用率、高性价比的AI算力资源在研发效率方面,要提供全流程的优化和开发效率的调优针对企业的实际业务场景和定制需求,提供整体的解决方案对此,百度智能云“云智一体的AI开发全栈模式”(如图3-3所示),能够很好的满足上述需求。百度作为AI原生公司,基于百度全球领先的 AI 技术和生态优势,从基础硬件、存储、容器、开发平台,到上层AI模型和应用的每个环节都融入了“云智一体”,为企业提供满足实际业务场景需求的、低成本高效率、全流程AI开发支持的全栈解决方案,加速产业智能化升级。在全栈产品架构设计方面,百度智能云“云智一体”将“AI基础设施”和“AI开发双平台”紧密结(图3-3)百度“云智一体”AI开发全
29、栈产品架构AI开发框架PaddlePaddle、TensorFlow、PyTorch等主流深度学习和机器学习开发框架AI开发平台数据处理零门槛AI开发平台EasyDL全功能AI开发平台BML模型训练模型管理模型部署AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库智能应用工业能源金融互联网智能硬件零售合在一起:百度智能云“AI开发基础设施”,是针对AI开发过程进行AI优化和AI加速等特
30、殊调优后的AI计算、AI存储、AI容器等基础设施。调优后的“AI开发基础设施“使“AI开发平台”的训练速度更快、精确度更高、模型效果更优。是业内适合跑AI的云。百度智能云“AI开发双平台”,是基于百度飞桨(PaddlePaddle)深度学习开源平台,推出的企业版AI开发平台,包括面向各类开发者的零门槛开发平台EasyDL和全功能开发平台BML。百度“AI开发双平台”可帮助各类用户实现数据处理、模型训练、模型管理、模型部署全流程全栈式的开发和部署。同时,百度智能云“AI中台”,是为企业构建的一套AI能力的生产和集中化管理的平台。AI中台的核心包括了AI服务运行平台、AI开发平台、AI样本中心、A
31、I模型中心和AI资产共享平台五大产品模块,结合与之配套的完善的计算资源管理、数据资源接入等运维管理体系,帮助企业实现集约化的AI能力的生产和管理、实现统筹的企业智能化升级。“云智一体”技术与应用解析 企业AI开发篇1011正是因为AI模型定制需求的激增,企业对自己的AI开发能力也提出了更高的要求(如图3-2所示)。一方面,对AI模型精度和AI开发效率有了更高的要求;另一方面,对AI算力资源的需求也呈现爆发式的增长。AI开发是一个非常消耗资源和能源的过程,企业亟需一套高性价比、高性能、高利用率的AI开发基础设施硬件,从而在AI开发过程中达到效能和成本的最佳平衡点。(图3-2)高质量数据高精度效果
32、高易用工具高性能高性价比高利用率效能成本对精度与开发效率的高要求对AI算力资源的爆发需求智能应用需求爆发,对AI开发提出了更高要求在AI开发过程中,涉及从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务。在这一系列过程中,不仅需要对所有流程调优、最大化提升开发人员的研发效率。而且,AI模型的训练和推理都需要大量的算力资源支持、并且要合理高效地利用这些庞大的算力资源来提升机器资源利用效率。这些都需要一套高性能、高效能、适应未来发展趋势的AI开发平台来提供。具体来说,在智能时代,适应未来发展趋势的AI开发平台需要提供如下能力:在算力资源方面,要对接和管理好性能、高利用率、高
33、性价比的AI算力资源在研发效率方面,要提供全流程的优化和开发效率的调优针对企业的实际业务场景和定制需求,提供整体的解决方案对此,百度智能云“云智一体的AI开发全栈模式”(如图3-3所示),能够很好的满足上述需求。百度作为AI原生公司,基于百度全球领先的 AI 技术和生态优势,从基础硬件、存储、容器、开发平台,到上层AI模型和应用的每个环节都融入了“云智一体”,为企业提供满足实际业务场景需求的、低成本高效率、全流程AI开发支持的全栈解决方案,加速产业智能化升级。在全栈产品架构设计方面,百度智能云“云智一体”将“AI基础设施”和“AI开发双平台”紧密结(图3-3)百度“云智一体”AI开发全栈产品架
34、构AI开发框架PaddlePaddle、TensorFlow、PyTorch等主流深度学习和机器学习开发框架AI开发平台数据处理零门槛AI开发平台EasyDL全功能AI开发平台BML模型训练模型管理模型部署AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库智能应用工业能源金融互联网智能硬件零售合在一起:百度智能云“AI开发基础设施”,是针对AI开发过程进行AI优化和AI加速等特殊调优后
35、的AI计算、AI存储、AI容器等基础设施。调优后的“AI开发基础设施“使“AI开发平台”的训练速度更快、精确度更高、模型效果更优。是业内适合跑AI的云。百度智能云“AI开发双平台”,是基于百度飞桨(PaddlePaddle)深度学习开源平台,推出的企业版AI开发平台,包括面向各类开发者的零门槛开发平台EasyDL和全功能开发平台BML。百度“AI开发双平台”可帮助各类用户实现数据处理、模型训练、模型管理、模型部署全流程全栈式的开发和部署。同时,百度智能云“AI中台”,是为企业构建的一套AI能力的生产和集中化管理的平台。AI中台的核心包括了AI服务运行平台、AI开发平台、AI样本中心、AI模型中
36、心和AI资产共享平台五大产品模块,结合与之配套的完善的计算资源管理、数据资源接入等运维管理体系,帮助企业实现集约化的AI能力的生产和管理、实现统筹的企业智能化升级。“云智一体”技术与应用解析 企业AI开发篇1011适合跑AI的云:AI开发基础设施 在企业数字化的过程中,“数据上云”已成为企业和行业的共识。企业的智能化和数字化是一项系统性工程,包括构建算力、存储、网络等基础设施,这些都是AI开发及应用必不可少的重要环节。得益于近年来算法、算力、数据等多方面的突破性进展,AI技术在各行业的应用越来越广泛。AI开发工程的发展也趋于追求更大的数据和模型、更快的训练速度,这也意味着需要投入更多的资金(如
37、图4-1所示)。(图4-1)AI开发工程领域的发展趋势如何选择高性能、高性价比、高利用率的“云”,是企业智能化和业务创新过程中需要考虑的重要因素(如图4-2所示)。对此,百度智能云的AI开发基础设施,作为业内适合跑AI的云,系统化的满足企业在AI开发过程中对AI开发基础设施的高性能、高性价比、高利用率的需求。行业对AI开发基础设施的诉求(图4-2)高性能更大的数据和模型高性价比更快的训练高利用率更高的投入13“云智一体”技术与应用解析企业AI开发篇12适合跑AI的云:AI开发基础设施 在企业数字化的过程中,“数据上云”已成为企业和行业的共识。企业的智能化和数字化是一项系统性工程,包括构建算力、
38、存储、网络等基础设施,这些都是AI开发及应用必不可少的重要环节。得益于近年来算法、算力、数据等多方面的突破性进展,AI技术在各行业的应用越来越广泛。AI开发工程的发展也趋于追求更大的数据和模型、更快的训练速度,这也意味着需要投入更多的资金(如图4-1所示)。(图4-1)AI开发工程领域的发展趋势如何选择高性能、高性价比、高利用率的“云”,是企业智能化和业务创新过程中需要考虑的重要因素(如图4-2所示)。对此,百度智能云的AI开发基础设施,作为业内适合跑AI的云,系统化的满足企业在AI开发过程中对AI开发基础设施的高性能、高性价比、高利用率的需求。行业对AI开发基础设施的诉求(图4-2)高性能更
39、大的数据和模型高性价比更快的训练高利用率更高的投入13“云智一体”技术与应用解析企业AI开发篇12百度昆仑AI芯片,算力进一步提升百度智能云AI高性能计算服务(如图4.1-1所示),主要包含以下三个特点:(图4.1-2)AI高性能计算服务(图4.1-1)丰富AI芯片类型X-MAN AI超级服务器百度太行.弹性裸金属自研百度昆仑AI芯片多规格商业GPU/FPGA第一款四路AI服务器CPU性能提升50%+GPU多卡NVLink高速通信统一新一代百度太行计算架构云产品无缝接入零损耗高性能百度昆仑1百度昆仑2已量产在百度搜索引擎全量部署相比T4GPU性能在不同模型下提升1.53x2021年量产采用7n
40、m先进工艺性能比昆仑1提升3x百度智能云通过AI计算、AI存储、AI容器三层设施,构建的软硬一体、高性价比的“AI开发基础设施”(如图4-3所示):AI计算层:为AI开发过程提供高性能、高性价比的算力支撑AI存储层:在AI开发过程中提供对数据的快速处理、高速存储、极速分析等能力AI容器层:对AI开发工程中的资源配置和任务进行统一管理百度智能云软硬一体高性价比AI开发基础设施(图4-3)AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作
41、业调度容器网络弹性训练容器存储AI加速引擎镜像仓库4.1 AI计算层百度智能云AI高性能计算服务,是基于百度自主研发的硬件虚拟化技术,重构的百度智能云的算力基础设施,同时拥有云服务器的资源弹性和物理机的高性能体验,满足AI原生时代对海量算力的需求。搭配百度自研百度昆仑AI芯片、以及英伟达TelsaGPU等,满足AI应用各场景需求、提供高性价比的算力支持。特点一 支持丰富的AI芯片类型:包括百度自研的百度昆仑芯片以及行业多规格的主流数据中心级GPU,以满足不同场景、不同性价比的AI算力需求。在芯片领域,百度自研的百度昆仑芯片目前已发布两代产品(如图4.1-2所示)。其中百度昆仑1已经到了大规模部
42、署阶段,已在智慧城市、计算中心等领域得到了大规模应用。2021年量产的百度昆仑2,采用7nm先进工艺,较百度昆仑1性能提升约3倍。“云智一体”技术与应用解析 企业AI开发篇1415百度昆仑AI芯片,算力进一步提升百度智能云AI高性能计算服务(如图4.1-1所示),主要包含以下三个特点:(图4.1-2)AI高性能计算服务(图4.1-1)丰富AI芯片类型X-MAN AI超级服务器百度太行.弹性裸金属自研百度昆仑AI芯片多规格商业GPU/FPGA第一款四路AI服务器CPU性能提升50%+GPU多卡NVLink高速通信统一新一代百度太行计算架构云产品无缝接入零损耗高性能百度昆仑1百度昆仑2已量产在百度
43、搜索引擎全量部署相比T4GPU性能在不同模型下提升1.53x2021年量产采用7nm先进工艺性能比昆仑1提升3x百度智能云通过AI计算、AI存储、AI容器三层设施,构建的软硬一体、高性价比的“AI开发基础设施”(如图4-3所示):AI计算层:为AI开发过程提供高性能、高性价比的算力支撑AI存储层:在AI开发过程中提供对数据的快速处理、高速存储、极速分析等能力AI容器层:对AI开发工程中的资源配置和任务进行统一管理百度智能云软硬一体高性价比AI开发基础设施(图4-3)AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGP
44、U百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库4.1 AI计算层百度智能云AI高性能计算服务,是基于百度自主研发的硬件虚拟化技术,重构的百度智能云的算力基础设施,同时拥有云服务器的资源弹性和物理机的高性能体验,满足AI原生时代对海量算力的需求。搭配百度自研百度昆仑AI芯片、以及英伟达TelsaGPU等,满足AI应用各场景需求、提供高性价比的算力支持。特点一 支持丰富的AI芯片类型:包括百度自研的百度昆仑芯片以及行业多规格的主流数据中心级GPU,以满足不同场景、不同性价比的AI算力需求。在芯片领域,百度自研的百
45、度昆仑芯片目前已发布两代产品(如图4.1-2所示)。其中百度昆仑1已经到了大规模部署阶段,已在智慧城市、计算中心等领域得到了大规模应用。2021年量产的百度昆仑2,采用7nm先进工艺,较百度昆仑1性能提升约3倍。“云智一体”技术与应用解析 企业AI开发篇1415特点二支持X-MAN架构超级服务器:百度自研X-MAN架构服务器,支持Intel/AMD旗舰CPU以及高速异构加速卡专属总线通信。除了标准的2路服务器配置,X-MAN是第一款能够搭配4路CPU的超级AI计算机。在CPU高负载业务中,能更好的释放GPU能力,让CPU不再成为GPU利用率的约束。特点三搭配百度太行智能网卡:高性能计算实例的服
46、务器资源百分百服务于业务本身,实现云上零损耗的高性能实例,给予客户物理机级别的性能体验。并且,实例能无缝衔接云存储、云网络、大数据,充分发挥AI超级服务器的算力和能力,为企业提供高性能、多规格、高性价比的算力服务。在AI超级计算机领域,百度自研的“百度太行”弹性裸金属服务器,将百度云存储、云网络、云大数据产品无缝融合,充分发挥AI超级服务器的算力和能力,其算力能力在云上的结构和形态(如图4.1-3所示):NVSwitchGPU0GPU1GPU2GPU3GPU4GPU5GPU6300GB NVLink100Gb IB/RoCE25Gb/100Gb VPC接入GPU7云服务器高速对象存储弹性裸金属
47、服务器RDMAVPC百度太行-高性能计算实例云上架构图(图4.1-3)面向AI计算的存储服务(图4.2-1)4.2 AI存储层AI存储层的核心是基于百度的对象存储服务以及面向AI场景的加速和处理能力,解决客户AI开发过程中的数据存储和分析问题。为此,百度智能云特别提出了面向AI计算的存储服务架构,并分为如下几个层面(如图4.2-1所示)数据上云:帮助客户数据快速高效上云,百度既提供面向离线传输的磁盘传输方式,也提供面向在线的CloudFlow产品,支持客户创建各种模型的在线传输任务。离线传输支持单台百TB的数据迁移能力,在线数据流转CloudFlow兼容业界7种对象存储接口。数据存储:百度以对
48、象存储为核心提供高性价比的存储服务。百度对象存储提供业界最全的4级数据存储,并提供智能的生命周期管理和业界领先的读写性能,满足客户在大数据场景下的性价比需求(如图4.2-2所示)。智能高速处理数据安全流转上云离线传输BOSCloudFlow百度智能云A云T云私有云大规模数据对象存储BOS高速Cache标准存储低频存储冷存储归档存储高性价比低OPEXRegionBRegionNRegionA高速介质元数据加速智能处理AI处理图片音视频文档数据预加载缓存管理AI 加速智能处理数据存储数据上云如上图所示,左侧为基于X-MAN的AI服务器单机多卡内部结构,单台服务器可支持八路GPU板卡的统一管理与资源
49、调度,GPU之间通过NVLINK、NVSwitch进行高速专属总线数据交互。右图为多节点高性能计算实例拓扑,这些计算节点之间,通过100G/200G RDMA网络高速互联,完成高速计算任务,以及通过25G/100GVPC虚拟网络与云上其他服务器实例和BOS存储进行通信。不论是单机多卡通信、跨节点多机多卡通信以及与云的上其他产品通信,百度太行弹性高性能计算实例均构建了整套高速AI基础设施,满足大模型通讯需求。“云智一体”技术与应用解析 企业AI开发篇1617特点二支持X-MAN架构超级服务器:百度自研X-MAN架构服务器,支持Intel/AMD旗舰CPU以及高速异构加速卡专属总线通信。除了标准的
50、2路服务器配置,X-MAN是第一款能够搭配4路CPU的超级AI计算机。在CPU高负载业务中,能更好的释放GPU能力,让CPU不再成为GPU利用率的约束。特点三搭配百度太行智能网卡:高性能计算实例的服务器资源百分百服务于业务本身,实现云上零损耗的高性能实例,给予客户物理机级别的性能体验。并且,实例能无缝衔接云存储、云网络、大数据,充分发挥AI超级服务器的算力和能力,为企业提供高性能、多规格、高性价比的算力服务。在AI超级计算机领域,百度自研的“百度太行”弹性裸金属服务器,将百度云存储、云网络、云大数据产品无缝融合,充分发挥AI超级服务器的算力和能力,其算力能力在云上的结构和形态(如图4.1-3所