收藏 分销(赏)

人工智能驱动的研发新范式.pdf

上传人:宇*** 文档编号:4273474 上传时间:2024-09-02 格式:PDF 页数:29 大小:654.36KB
下载 相关 举报
人工智能驱动的研发新范式.pdf_第1页
第1页 / 共29页
人工智能驱动的研发新范式.pdf_第2页
第2页 / 共29页
人工智能驱动的研发新范式.pdf_第3页
第3页 / 共29页
人工智能驱动的研发新范式.pdf_第4页
第4页 / 共29页
人工智能驱动的研发新范式.pdf_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、 科研智能(科研智能(AI4R&D)人工智能驱动的研发新范式人工智能驱动的研发新范式 中国人工智能产业发展联盟(中国人工智能产业发展联盟(AIIA)科学智能(科学智能(AI4S)工作组)工作组 20242024 年年 7 7 月月 编制说明编制说明 本报告主要是在中国人工智能产业发展联盟指导和组织下起草编写,主要参编单位包括中国信息通信研究院、华为技术有限公司、北京百度网讯科技有限公司、北京深势科技有限公司、之江实验室、阿里云计算有限公司、北京航空航天大学、国网智能电网研究院有限公司、中冶京诚数字科技(北京)有限公司、中国科学院沈阳自动化研究所、中国华能集团清洁能源技术研究院有限公司、深圳华大

2、生命科学研究院、同方知网数字出版技术股份有限公司、上海和今信息科技有限公司、北京科技大学、北京市商汤科技开发有限公司、东方财富信息股份有限公司、北京新数科技有限公司。核心编制人员为张玮婷、董昊、丁欣卉、曹峰、周景才、王紫东、胡晓光、孙佩源、刘会师、刘大鹏、贡金鹏、李振廷、王忠新、蒙贵云、张艳博、周原野、杨康、王锦海。目目 录录 一、科研智能发展态势.1 二、科研智能产业发展情况.2(一)科研算力赋能科研智能高效运行.2(二)科研数据驱动科研智能创新发现.4(三)开发工具链全链路打造科研智能开发工具.7 三、科研智能应用发展情况.15(一)基础科学研究开展前沿探索,推动科学边界拓展.16(二)产

3、业研发创新构建核心驱动力,加速产业升级变革.18 四、科研智能生态建设情况.19(一)产业组织.19(二)社区建设.19(三)科研赛事.20(四)会议交流.21(五)教学培训.21(六)标准布局.21 五、总结与展望.22 附录一.23 表表 目目 录录 表 1 国外科研领域主要公开数据集.5 表 2 国内外典型科研智能算法库.10 表 3 我国代表性科学套件.12 表 4 2019 年至 2023 年 Science 杂志评选的十大科学突破.17 表 5 科研智能典型领域模型.23 科研智能(AI4R&D)人工智能驱动的研发新范式 1 一、科研智能发展态势 科研智能(AI for Resea

4、rch and Development,以下简称 AI4R&D,人工智能赋能科学研究及产业研发)是科学智能(AI for Science,AI4S)概念的延伸和扩展,主要包括两方面内涵,一是聚焦人工智能加速基础科学研究,拓展研究思路,加速研究进程;二是强调人工智能在应用研究和产业研发中的重要作用,全面提升工程技术创新的效率。科研智能代表了科技创新的新范式和新动能,有望全面加速基础研究和产业研发的进程,并缩短两者之间的转化周期,推动科技成果在工业界的产业化和规模应用。科研智能正在全球范围内加速发展。,各国相继发布政策构筑科研智能发展环境。2023 年 12 月,欧盟委员会发布政策简报人工智能在科

5、学中的应用,倡导为欧洲量身制定一项政策,促进人工智能在科学领域的应用。2023 年 5 月,美国新建 7 家国家人工智能研究所,推动人工智能在气候、脑科学、社会决策、教育等领域的应用研究。2022年 8 月,我国发布关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见,支持探索人工智能技术用于重大科学研究和技术开发的应用场景。AI 持续拓展科学领域问题解决的能力,围绕生命科学、物理等领域,形成了如Alphafold3 等代表性成果。另一方面 AI 不断加速产业研发进程,在材料研发、气象预测、工业设计等领域相继取得技术突破。科研智能作为一个新兴的交叉领域,目前尚处于发展的早期阶段,但

6、已经展现出巨大的发展潜力和广阔的应用场景,中国信息通科研智能(AI4R&D)人工智能驱动的研发新范式 2 信研究院(以下简称“中国信通院”)持续跟踪科研智能技术和产业动态,于 2024 年发布报告科研智能(AI4R&D)人工智能驱动的研发新范式,旨在描绘科研智能领域的生态全景,为政府部门制定产业政策、指导项目布局提供参考,为研究机构、科技企业把握技术方向、开拓应用场景提供借鉴,加速该领域的技术创新和应用实践,为我国在该领域抢占发展先机提供助力。未来,中国信通院将关注全球科研智能发展动向,深化对关键技术和产业趋势的研判,加强与科研机构、高校、企业等产学研各界的交流合作,共同推进科研智能生态体系建

7、设,为科技强国和创新型国家建设提供有力支撑。二、科研智能产业发展情况 科研算力与科研数据的深度融合为 AI4R&D 奠定了坚实基础。由 AI 框架、算法库、开发套件及领域模型组成的开发工具链极大提升了科研效率,促进了跨学科、跨领域的协同创新与融合,深刻改变了科学研究范式。(一)科研(一)科研算力算力赋能赋能科科研研智能智能高效运行高效运行 科研算力是指结合智能算力与超算算力的计算能力,通过异构计算架构满足高精度计算和 AI 模型训练推理需求。智能算力基于GPU(图形处理器)、TPU(张量处理单元)、NPU(神经网络处理单元)等 AI 芯片,提供高度并行计算能力,适用于人工智能的训练和推理计算。

8、超算算力依托超级计算机集群,实现大规模科学计算和模拟,能够处理复杂的科学计算问题,广泛应用于如行星模拟、科研智能(AI4R&D)人工智能驱动的研发新范式 3 药物分子设计、基因分析等场景。而科研智能算力整合了 AI 计算和科学计算两种方式,采用异构计算架构,结合多种计算单元,以满足高精度科学计算和人工智能模型训练、推理的双重需求。科研智能的研究涉及大量复杂的计算任务,包括大规模数据处理、深度学习模型训练和高精度科学模拟等,这些任务均需要充足的算力支撑。在多数场景下,为满足科学研究和工程应用的需求,如蛋白质结构预测模型 AlphaFold 2 取得了突破性进展,能够以原子级精度预测蛋白质的三维结

9、构,其预测效果可以与实验结果媲美,解决了生物学界长达 50 年的重大挑战,该成就被 Science 杂志评为2021 年度十大科学突破成果的第一位。这一进展也在很大程度上依赖于大规模的计算资源支持,在 AlphaFold 2 的研发过程中,DeepMind 团队投入了大量的算力资源,训练阶段使用了约 128 个TPU v3,历时 11 天才能完成1。以公有云模式提供智能算力服务。云服务企业以智能算力平台的形式提供计算资源,如阿里云灵骏智算平台、百度智能云 AI Studio、华为昇腾云等,面向基础科研、新药研发、工程仿真等场景提供一站式算力服务。政府、企业建设并对外提供服务的人工智能算力中心。

10、西安的未来人工智能计算中心已成功孵化出多个智能科研领域的大模型,如全球首个面向雷达遥感场景的“秦岭西电遥感脑大模型”,以及全球首个面向计算流体力学场景的“秦岭翱 1 数据来源:Highly accurate protein structure prediction with AlphaFold 科研智能(AI4R&D)人工智能驱动的研发新范式 4 翔大模型”。三是以一体机形式交付的科研智能算力。一体机通过将专用硬件、软件和服务集成在一个系统中,打造便捷、高性能的科研智能系统。如深势盒子是面向分子动力学模拟设计场景推出一体机,硬件层面以定制加速卡与 CPU 结合的方式提供计算能力,软件层面预装分

11、子动力学专业模拟软件。一是高端 AI 芯片的生产和购买受限,影响算力供给。二是国内智能算力的技术产业生态较弱,应用门槛高。三是智能算力资源主要集中于头部科技类企业,高校、科研机构和大量行业企业算力储备相对有限。建议层面,一是建立针对高校、科研机构和行业企业的算力资源保障机制,实现算力资源的合理供给、动态分配与高效利用,保障科研智能领域计算需求。二是构建跨地区、跨机构的科研算力资源共享平台,促进科研机构与产业界的协同创新。三是实施科研算力成本效益评估,优化资源投入与产出,加速科技成果的产业转化。(二)(二)科研数据科研数据驱动驱动科科研研智能智能创新发现创新发现 科研数据是指科学研究和产业研发活

12、动产生的原始数据、中间数据、结果数据和分析数据等,主要包括观测数据、实验数据、记录数据、调查数据、模拟数据及科研文献等内容。高质量的科研数据是科研智能的基础,规范的科研数据管理是科研智能开展的前提。科研智能数据相较于传统的行业数据,有如下特点。一是数据来源和类型更加多样。数据来自仪器设备、传感器、仿真模拟、文献等,科研智能(AI4R&D)人工智能驱动的研发新范式 5 数据格式和语义差别较大。二是数据质量要求高。数据的客观性、准确性、完备性、分辨率等质量要求很高,这会直接影响到计算结果的可信度。三是数据量更大。实验观测数据、仿真模拟数据等不仅规模巨大且增长快速,远超普通商业化数据。四是维度更高。

13、例如气象、地理、生物数据涉及时间、空间、物种等多个维度,结构更加复杂。在科研数据领域,公开数据集对于推动科研创新具有重要意义。国外方面,公开数据集资源丰富、体系成熟,已成为全球科研工作者开展研究的重要基础设施。美国通过一系列项目推动科研领域公共数据集的建设、共享及应用,如美国国家生物信息中心(NCBI)成为全球医疗 AI 研究人员的首选数据源,其数据可在亚马逊云平台和谷歌云平台上便捷访问。在气象领域,美国国家海洋和大气管理局(NOAA)的数据是气象大模型研发的重要支撑。材料科学方面,“材料项目”(The Materials Project)经过三十年发展,已成为该领域的标杆性数据库。数据资源的

14、长期积累为科技突破奠定了重要基础,如 AlphaFold2 在蛋白质结构预测领域的成功很大程度上得益于蛋白质数据库(PDB)的长期数据积累。我国方面,近年来在科研数据建设及共享方面也取得了显著进展。全国已建成 50 多个国家级行业科技数据中心和 200 多个地方科技数据中心,形成覆盖多领域的科学数据中心体系。在材料、天文、电磁、流体、气象、生命科学等领域已具备一定规模的公开数据集。表 1 国外科研领域主要公开数据集(中国信通院根据公开资料收集整理)科研智能(AI4R&D)人工智能驱动的研发新范式 6 领域领域 数据数据 持有单位持有单位 生命科学 全球蛋白质结构库(PDB)Worldwide

15、Protein Data Bank(wwPDB)人类基因库(EMBL)欧洲分子生物学实验室(EMBL)蛋白质数据库(UniProt)欧洲生物信息研究所(EBI)、瑞士生物信息研究所(SIB)及 美国国家生物医学研究基金会(NBRF)成立的蛋白质信息资源(PIR)DNA 序列数据库(Genbank)美国国家医学图书馆生物信息技术信息中心(NCBI)DNA 数据库(DDBJ)日本国立遗传学研究所 生物医学文献书目数据库(PubMed)美国国家医学图书馆生物信息技术信息中心(NCBI)材料科学 高通量材料计算数据库(AFLOW)美国杜克大学 剑桥结构数据库(CSD)英国剑桥晶体数据中(CCDC)开放

16、量子材料数据库(OQMD)美国西北大学 无极晶体结构数据库(ICSD)德国波恩大学 材料计算数据库(Materials Project)美国加州伯克利大学 金属和合金晶体数据库(CRYSTMET)加拿大渥太华大学 国际衍射数据中心的粉晶数据库(JCPDS)国际衍射数据中心 开放晶体结构数据库(COD)英国剑桥大学 密度泛函理论的材料数据集(JARVIS-DFT)美国国家标准与技术研究院(NIST)地球科学 ERA5 大气再分析数据集 欧洲中期天气预报中心(ECMWF)海洋再分析数据集(HYCOM)美国海军研究实验室(NRL)海洋生物化学数据集 美国航天局 GLORYS12 再分析数据 法国麦卡

17、托 SST 卫星观测数据 英国气象局 历史气候观测和模拟(ICAR-ENSO)气候与应用前沿研究院 ICAR 地球表面气候预测数据(EarthNet)/汽车 SAE 国际自动机工程师学会 ShapeNet 斯坦福大学 Ahmed Body Aerodynamics 英伟达 流体 周期山(PH-RANS、ERCOFTAC)慕尼黑工业大学 圆柱绕流数据集(Cylinder in Crossflow)/科研智能(AI4R&D)人工智能驱动的研发新范式 7 顶盖驱动方腔流动(CFDBench)/我国公开数据集建设不足,优质领域数据未能得到有效利用。一方面领域覆盖度有限,数据集建设不完善且质量有待提升。

18、例如,盘古、风乌、伏羲等国内气象大模型的研发均依赖国外公开数据集,而非国内数据集。另一方面在科研机构与行业企业中已积累的大量领域数据公开意愿不高,导致大量的优质数据资源处于“静默”状态。我国需加强数据集建设与共享,推动科研智能产业高效发展。我国需建立自己的科研数据战略,系统规划科研领域数据建设计划,推动以国家重点实验室、重点行业企业为代表的机构,积极开放共享数据。一是围绕公开数据集建设进行战略布局。建立健全科研领域公开数据集体系,在时空、区域气象等新兴和特色领域进行系统布局。二是建立科研数据共享激励机制,让数据贡献成为研究贡献的一部分。通过合理的措施,鼓励机构以及个人将共享数据,持续丰富公开数

19、据集的资源。同时加强对数据的安全保护,避免滥用。三是构建统一的科研数据空间,汇聚数据促进数据共享。促进跨机构、跨领域的数据整合与优化,为科研工作者和技术开发者提供更加便捷、高效的数据服务。(三)开发工具链(三)开发工具链全链路打造全链路打造科研智能开发工具科研智能开发工具 从人工智能框架的构建到算法的集成,再到开发套件与领域模型的推出,科研智能开发工具链的逐步完善,为科研人员提供了全流程支持。这些工具不仅降低科研门槛,提高研发效率,还加速科研成果的转化与应用。通过持续优化与创新,科研智能开发工具链科研智能(AI4R&D)人工智能驱动的研发新范式 8 正逐步成为推动该领域发展的核心引擎。1.AI

20、 框架构建核心架构,支撑高效算法实现 AI 框架是一组用于开发、训练和部署人工智能模型的工具、库和接口,它提供了一个结构化的环境,使开发者能够更加高效地构建、测试和优化 AI 算法和应用,当前主流的 AI 框架主要有TensorFlow、PyTorch、PaddlePaddle 和 MindSpore。为更有效地支持科研智能(AI4R&D),传统 AI 框架需要具备高效求解科学计算任务的基础能力。一是支持科研智能算子库,通过提供标准化接口和高度优化共性数学运算单元,如高阶微分、傅里叶变换、分数阶微分、积分、线性代数、复数运算等科研智能专用算子,降低科研计算程序的复杂度。二是提供科研智能计算库,

21、通过实现跨领域共性基础计算库,如微分方程求解计算库、几何形状定义计算库、方程符号化定义计算库、物理信息神经网络 PINN 求解方法计算库等,提升跨学科多领域典型数理方程求解效率。三是面向科研智能的作业调度优化,通过高阶自动微分变换和编译优化技术,实现异构混合架构灵活高效计算,整体提升科研计算任务计算速度。当前PyTorch和TensorFlow已经成为全球范围最主流的AI框架。PyTorch 基于动态计算图且接口简洁易用,适合科研探索的快速原型开发及频繁迭代,在学术界广受欢迎。TensorFlow 具备强大的分布式计算能力和完善的工具生态系统,当前在工业界广泛应用,支持成熟的部署解决方案。两者

22、均提供科研智能算子库、科研智能计算库和科研智能计算加速等相关能力。此外,谷歌推出的 JAX 框架具科研智能(AI4R&D)人工智能驱动的研发新范式 9 备自动矢量化和即时编译等先进特性,计算性能出色,适用于科学计算和机器学习任务,且支持高阶自动微分,有利于科研智能领域的模型开发。国内 PaddlePaddle 和 MindSpore 作为领先的人工智能框架,均将科研智能作为重点方向进行了适配和优化,目前已具备丰富的算子库和高阶自动微分等能力。现有 AI 框架未能完全适配科研智能需求。PyTorch 在大规模部署时运行效率相对较低,工业级部署支持相对较弱。TensorFlow 缺少基础算子体系,

23、科学计算所需的高阶自动微分功能可扩展性不足。JAX 处于发展初期,尚未形成成熟生态。国内框架对算子支持不完全,尚无法满足科研智能发展的需求。为推动科研智能的深入发展,我国需构建更高效、统一的科研智能 AI 框架。一是高性能计算优化。框架需要兼容不同类型的国产化硬件资源,如 GPU、NPU 等不同类型的 AI 芯片,提供高效计算解决方案。同时,提升分布式计算能力以支持大规模计算任务。二是支持跨领域算法和应用。框架应支持特定领域(如地球科学、材料科学等)的算法库和开发工具,为各领域科研人员提供通用的开发和应用环境,提供灵活的接口和扩展能力,支持跨学科的协同研究及应用。三是丰富生态系统建设。扩展生态

24、系统,提供第三方库和工具,以及融合已有科学计算领域的算法库和工具,满足更广泛的科研需求。建设活跃的社区,促进科研工作者交流分享,推动技术创新和进步。科研智能(AI4R&D)人工智能驱动的研发新范式 10 2.算法库汇聚智慧结晶,赋能科研创新突破 科研智能算法库是指面向特定领域科学计算问题,基于 AI 框架算子能力开发的一系列高效、稳定的算法集合。算法库注重易用性、性能及可拓展性,其核心价值主要体现在以下两方面:一是聚焦对领域单点问题的改进和固化。使用算法库中经过优化的算法,科研人员能够更加高效地解决复杂科学计算问题,推动科研成果的产出。二是强调提供最优算法选择。通过收录该领域最顶尖的算法,强调

25、提供最优的算法选择,为科研人员提供便捷、高效的工具,助力科研工作的深入开展。高校、科研院所及企业纷纷推出面向多个各领域的科研智能算法库。国外方面,布朗大学、麻省理工学院纷纷推出算法库支持科研智能底层算法的实现。如 DeepXDE 充分利用数据和物理知识双驱动,解决传统方法难以求解的复杂问题,支持物理信息神经网络(PINN)和深度算子网络(DeepONet)等方法。国内方面,深势科技、之江实验室等研究机构专注于算法库的研发,聚焦分子动力学、量子力学、空气动力学等特定领域的研究,解决该领域计算求解问题。如 DeePMD 基于神经网络拟合第一原理数据的多体势能表示和分子动力学深度学习,支持 Deep

26、 Potential(DP)系列模型,可用于多体势能表示和分子动力学模拟。表 2 国内外典型科研智能算法库(中国信通院根据公开资料收集整理)算法库算法库 介绍介绍 开发者开发者 DeePMD-kit 基于深度学习的原子尺度模拟算法库。适深势科技 科研智能(AI4R&D)人工智能驱动的研发新范式 11 用于大规模原子及分子动力学模拟。DeePKS-kit 基于机器学习对于低精度的 DFT 泛函进行优化。支持 DeePHF、DeePKS 方法。北京科学智能研究院 NeuralUQ 神经微分方程和运算符不确定性量化的算法库。支持算法不确定性 PINN(如贝叶斯 PINN 等),不确定性 DeepON

27、et 等 布朗大学、华中科技大学 DeepXDE 用于求解微分方程的深度学习算法库。支持多种数据驱动和物理信息融合的算法,包括 PINN、DeepONet 和 PI-DeepONet等。布朗大学 NeuralPDE 基于物理信息神经网络(PINNs)的偏微分方程求解的算法库。麻省理工学院、都灵大学、渥太华大学、卡耐基梅隆大学等 SCiANN 使用人工神经网络进行科学计算和物理信息约束的算法库。支持 PINN 算法进行科学计算以及偏微分方程(PDE)的求解和发现。麻省理工学院 我国在科研智能算法库领域也面临着原创不足等挑战。我国在基础理论创新方面存在不足,物理信息神经网络(PINN)、傅里叶神经

28、算子(FNO)和深度算子网络(DeepONet)等经典的底层算法多由国外研究机构提出。我国算法库的数量较少且影响力不足,国内深势科技、之江实验室等机构在特定领域(如分子动力学、量子力学、空气动力学等)积极开展研究,并开发出 DeePMD、NeuralUQ等算法库,但与国际先进水平相比仍有明显差距。因此,我国仍需进一步鼓励算法原始创新,提升我国科研智能算法库的自主性和核心竞争力。3.开发套件简化科研流程,推动智能化进程 科研智能开发套件是指针对特定科研领域,基于 AI 框架开发的端到端工具集。开发套件提供标准化接口和用户界面,覆盖模型开科研智能(AI4R&D)人工智能驱动的研发新范式 12 发全

29、流程,能够快速用于解决科研问题。相较于科研智能算法库,开发套件的产品化程度更高。一方面,开发套件通过全流程整合有效提升了科研效率。科研人员无需在多个工具间切换,使用开发套件可一站式完成数据处理、模型开发、评估及部署等工作,缩短研发周期,加速成果产出。另一方面,开发套件降低了科研人员对计算机专业知识的依赖。开发套件提供操作界面及案例资源,降低了非计算机背景科研人员的使用门槛。科研人员可以更加聚焦科研问题本身,无需花费大量时间精力在人工智能模型调参等技术环节。国内外已形成一系列成熟的科研开发套件。国外方面,形成了相对活跃的开源社区生态。高校、研究机构及企业以 PyTorch 为基础,贡献了针对特定

30、科学领域的开源套件,如英伟达推出用于流体仿真的 Modulus 和用于气象预测 Earth2Studio,上述工具成熟度较高且已被广泛应用。国内方面,形成了相对自给自足的生态系统。国内开发套件通常由 AI 框架企业提供,如百度和华为基于自身 AI 框架能力,向各领域延伸形成工具套件,已覆盖生物计算、量子计算、流体仿真、地球科学、电磁仿真、化学仿真等领域。表 3 我国代表性科学套件(中国信通院根据公开资料收集整理)领域领域 套件名称套件名称 公司公司 功能描述功能描述 地球科学、材料科学、流体仿真 PaddleScience 百度 基于飞桨深度学习框架的科学计算工具库,提供了丰富的物理模型和 A

31、I 方法,支持流体力学、电磁学等领域的仿真与优化。地球科学 MindEarth 华为 支持短临、中期、长期天气以及海科研智能(AI4R&D)人工智能驱动的研发新范式 13 洋领域的各类预报。流体仿真 MindFlow 华为 支持航空航天、船舶制造以及能源电力等行业领域的 AI 流场模拟。电磁仿真 MindElec 华为 支持数据建构及转换、仿真计算、结果可视化以及端到端的 AI 电磁仿真。量子计算 PaddleQuantum 百度 提供量子线路设计、量子算法实现和量子经典混合优化等功能,支持多种量子模拟器后端,助力量子计算研究与应用开发。MindQuantum 华为 生物计算 MindSPON

32、GE 华为 面向生物计算,支持蛋白质结构预测和分子动力学模拟,为药物研发提供高效工具,加速新药筛选和设计过程。PaddleHelix 百度 化学 MindChemistry 华为 支持多体系(有机/无机/复合材料化学)、多尺度任务(微观分子生成/预测、宏观反应优化)的化学仿真。开发套件存在易用性低、功能覆盖不全等问题。一是使用门槛仍旧较高,用户需要具备较强的领域知识和编程能力,进而限制了套件的广泛使用。二是功能覆盖不全面。一方面覆盖场景有限,开发套件处于发展初期,往往针对具体科学问题设计,支持的场景较为有限。另一方面覆盖环节不足,存在功能欠缺。如针对高温合金材料研发的套件,仅提供合金成分设计与

33、性能预测环节,缺少特定工艺条件下的合金行为模拟、疲劳寿命预测等能力,这会限制套件在实际工程项目的使用。三是标准化程度低,开发套件之间缺乏统科研智能(AI4R&D)人工智能驱动的研发新范式 14 一的接口和数据格式标准,增加了用户迁移和比较的成本,不利于科研工作的连续性和数据共享。4.领域模型AI 融合知识,加速应用实践落地 领域的模型主要分为两大类,一类是领域专用模型,针对特定科学问题设计和优化;另一类是基于大语言模型(LLM)的科研模型,利用自然语言处理能力辅助科研工作、完善自动化流程。产学界已经研发出面向多个领域解决特定问题的专用模型。材料科学领域,AI 技术结合高通量计算,打破尺度和计算

34、模拟限制,加速材料筛选,促进靶向设计新材料,完成材料和器件的全链条优化,为新能源、环境保护、信息技术等产业提供了强大的材料基础。气象领域,通过 AI 技术对大量气象观测和模拟数据进行分析,识别复杂大气模式,提升天气预报精度与效率,加强对台风、暴雨等极端天气事件的预测能力,辅助气候变化研究。流体仿真领域,AI 提升了复杂流体动力学问题的模拟和求解效率,对湍流、液体混合等复杂流体进行流动模拟优化、实时仿真,广泛应用于航空航天、汽车制造等领域。电磁仿真领域,AI 模型能够快速模拟和优化复杂电磁场分布,提升仿真和设计效率。以电磁兼容性分析为例,AI 能够预测和识别潜在干扰问题,优化电路设计,确保电磁设

35、备的性能和可靠性。生命科学领域,AI 模型能够分析复杂的生物数据,如蛋白质结构预测、基因组分析等,加速新药发现和个性化医疗方案的制定,解决传统方法耗时长、成本高的问题。业内典型领域专业模型详见附录一。科研智能(AI4R&D)人工智能驱动的研发新范式 15 大语言模型为科研领域带来新的辅助手段。大语言模型与科研相融合正在成为新方向,目前大语言模型主要应用于科研助手和流程自动化。科研助手方面,大语言模型结合领域知识,不仅可以提供研究假设、科研方向供科研人员参考,还可以作为科研知识助手,为科研人员提供即时的信息查询和解答。流程自动化方面,大语言模型可以帮助提高实验效率、减少人为误差,实现更精准、可重

36、复的实验管理。典型场景包括辅助决策和实验设计、任务调度智能加速和实验室管理等。大语言模型与领域专业模型的深度融合正推动科研领域实现重大突破。大型语言模型擅长发现并整理科学领域的难点问题,领域专业模型则负责完成复杂的计算任务,两者结合可有效提升人机交互能力,加速科学研究的进程,有望在特定领域取得突破性进展。例如,卡耐基梅隆大学研发的 AI 系统 Coscientist 能够自主完成从信息检索到实验执行和数据分析的整个流程,该系统成功设计并合成了阿司匹林、对乙酰氨基酚和布洛芬等常见药物分子。同时,Coscientist 在不到四分钟内成功设计钯催化交叉偶联反应的实验方案,并成功复现了这一重要的复杂

37、化学反应,该研究曾获诺贝尔化学奖。三、科研智能应用发展情况 基础科学研究领域,AI 技术的应用促进了新理论、新算法的发现与验证,逐步拓展科学研究的边界。产业研发创新领域,AI 技术通过加速新药研发、优化材料筛选、提升工业设计效率等方式,提科研智能(AI4R&D)人工智能驱动的研发新范式 16 升产品研发效率为产业升级与变革提供强有力的技术支撑。(一)(一)基础科学研究基础科学研究开展开展前沿探索,推动科学边界前沿探索,推动科学边界拓展拓展 科研智能在基础科学领域展现出广阔的应用前景。目前,国内外高校和科研机构都在积极探索 AI 与科学研究的深度融合,在过去5 年,AI+科学研究的相关成果连续入

38、选Science杂志评选的十大突破。AI 赋能科学研究主要体现在以下四个方面:一是 AI 辅助科学文献研究。科研人员借助 AI 能够高效地分析和挖掘海量的科学文献,提取关键信息,识别研究趋势。例如,北京国际科技创新中心使用知网华知大模型打造了开放科学平台,集成了知网智研助手、学术问答、智能写作三大 AI 工具,为学术和技术创新人员提供了全方位的知识服务。二是 AI 指导和加速科学实验。通过数据分析和机器学习,AI 能够优化实验设计,减少不必要的实验次数,显著提高实验效率。如 DeepMind 通过深度强化学习技术对托卡马克等离子体进行精准磁控,将等离子体控制精度提升至 65%,为核聚变研究带来

39、了重要突破。三是 AI 启发新理论和算法发现。AI 的模式识别和预测能力有助于科研人员发现新的科学规律,提出创新性的理论。如物理学家利用神经网络发现了质子中隐性内含粲夸克的存在证据,这一发现可能会引发量子色动力学理论的重大更新。四是 AI 优化和加速科学计算。传统数据处理海量数据时会遭遇“维度灾难”问题,AI 技术可以提高复杂科学计算的效率,解决传统方法难以处理的问题。如 DeepMind 发布的 AlphaFold 3 可预测地球所有生物分子结构,科研智能(AI4R&D)人工智能驱动的研发新范式 17 准确率比现有方法高 50%,成为首个在生物分子结构预测方面超越基于物理工具方法的 AI 系

40、统。表 4 2019 年至 2023 年 Science 杂志评选的十大科学突破 2023 2022 2021 2020 2019 减肥药 GLP-1有望战胜肥胖 詹姆斯韦伯太空望远镜 人工智能预测蛋白质结构 新冠疫苗点亮希望之光 人类历史上首张黑洞照片问世 抗体疗法在减缓阿尔茨海默病方面取得进展 发现可能导致多发性硬化的病毒 抗新冠强效药出现 CRISPR 首次成功治愈两种遗传性血液病 与丹尼索瓦人“面对面”寻找天然氢源的热潮 黑死病如何改变欧洲人基因的新见解 迷幻药物可治疗创伤后应激障碍“精英控制员”控制艾滋病病毒 谷歌宣布实现“量子霸权”在全球机构中系统性改变职业早期科学家的待遇 惊人的

41、巨型细菌 单克隆抗体治疗传染性疾病 AI首次精准预测蛋白质三维结构 肠道微生物对抗营养不良 接近美洲远古人类定居的历史真相 200万年前环境DNA 重现古老生态系统 基因编辑工具 CRISPR首次获得临床胜利 科学家反对种族歧视,支持多样性 小行星撞击地球及其带来的影响 地球的碳泵正在减速运行 更易于耕种的多年生稻 体外胚胎培养为早期发育研究打开新窗户 全球变暖趋势加剧 最遥远天体的特写 巨型黑洞合并产生的星际信号在无声轰鸣 人类首次行星防御实验成功 首次在土壤中提取到古人类 DNA 发现快速射电暴来源“缺失环节”的微生物?AI辅助天气预报的发展 RSV 疫苗取得突破进展“洞察”号首次揭示火星

42、内部结构 世界最古老狩猎场景面世 第一次,有药物可以治疗大多数囊性纤维化病例 抗击疟疾的新希望 创造性人工智能的快速发展 粒子物理学的标准模型出现了“裂缝”首个室温超导体面世 埃博拉患者终于有了希望 百亿亿次超级计算时代的来美国通过具有里程碑意义的核聚变实现历史性突破 鸟类具有惊人的智力 AI战胜多人扑克 科研智能(AI4R&D)人工智能驱动的研发新范式 18 临 气候法(二)(二)产业研发创新产业研发创新构建核心构建核心驱动力,加速产业升驱动力,加速产业升级变革级变革 科研智能在多个产业领域中取得了显著成效。新药研发领域,AI 可加速药物发现和研发过程。如西安交通大学第一附属医院基于盘古药物

43、分子大模型,研发出超级抗菌药肉桂酰菌素。AI 减少了人工对小分子化合物的筛选计算量,加快了药物分子的筛选过程,突破了医药研发“双十定律”的瓶颈,使先导药的研发周期从数年缩短至数月,研发成本降低约 70%。电池材料研发领域,AI 可辅助筛选和预测高性能材料。通过多尺度模拟预测材料性能,优化实验设计,提升实验效率。如深势科技在电解液材料研发领域,通过正向设计与筛选优化的方法,有效提升金羽新能开发高能量密度电池电解液的效率,研发周期由原来的 14 个月缩短至 6 个月。航空航天仿真测试领域,AI 助力评估航空器设计方案的可行性和性能。如中国商飞上海飞机设计研究院基于昇腾 AI 开发了业界首个三维超临

44、界机翼流体仿真大模型“东方 翼风”,能高精度模拟大飞机全场景飞行状况,用时仅为原来的千分之一。电磁仿真领域,AI 可实现高效手机电磁仿真。如华为联合东南大学打造了金陵 电磁脑基础模型,基于AI 方法进行大规模阵列天线电磁仿真,将仿真效率平均提升 10 倍以上。工业设计领域,AI 可提升设计效率并降低成本。中国科学院沈阳自动化研究所与上汽大众合作开发了“基于 AI 和知识图谱的焊科研智能(AI4R&D)人工智能驱动的研发新范式 19 装夹具智能设计软件”,通过知识图谱和生成式AI提升设计效率80%以上,设计成本降低至原来的一半,实现需求到制造的一站式交付服务。工业制造领域,AI 可提升生产效率与

45、产品质量。如中冶京诚推出“钢智通”专家系统通过大语言模型提炼智能决策进行生产流程优化,能耗降低 1%,废品率降低 0.1%,整体管控效率提升 10%。四、科研智能生态建设情况 随着人工智能与科学研究、产业研发的深度融合,产业界与学术界也逐渐形成日益紧密的合作,逐步构建起多元化产业生态体系,为科研智能的健康发展提供了有力支撑。(一)(一)产业组织产业组织 中国人工智能产业发展联盟(AIIA)发起成立“科学智能(AI4S)工作组”,为产学研用各界搭建开放的交流合作平台,前期已组织案例征集、供需对接、报告编制等工作,后续会重点围绕新材料、地球科学等重点领域开展工作。(二)(二)社区建设社区建设 华为

46、在科研智能领域积极构建了一系列专业且富有活力的社区,旨在推动 AI 技术的广泛应用与深入发展。MindFlow SIG 社区专注于昇思 MindFlow 为科研人员、教师及学生提供了高效易用的 AI 计算流体仿真套件。MindEarth SIG 社区聚焦于昇思 MindEarth,为广大用户带来高效便捷的 AI 地球科学套件。MindElec SIG 社区紧密围绕实际生产中的各类电磁应用场景,在昇思 MindSpore 框架下积极科研智能(AI4R&D)人工智能驱动的研发新范式 20 探索和研究基于 AI 的电磁正问题及反问题,致力于开发高效精准的AI 电磁模型。MindSPONGE SIG

47、充分利用昇思 MindSpore 的优势。聚焦 AI 计算生物领域,在为科研人员、教师及学生提供高效易用的AI 计算生物软件。深势科技的 DeepModeling 开源社区提供开源的科学智能广场(AIS-Square)共创平台,支持科学计算、数据、软件模型和工作流的开发。百度飞桨星河社区汇集丰富的 AI 原生应用,提供零门槛的开发工具,促进全球科研人员的合作。中山大学牵头,北京航空航天大学、华为、百度等单位配合,共同建设 AI 科学智算群智协作社区,整合多方资源,建数据库与课程,促开放协作,为科学智算发展助力。(三)(三)科研科研赛事赛事 百度持续推出飞桨黑客松、AI4S 共创计划、大湾区杯百

48、度赛道等科学智能赛事,聚焦 AI4S 前沿模型复现,贡献 AI4S 模型或案例 50 余个。深势科技提供真实的科学场景和数据举办 AI4S Cup 系列比赛。华为举办“开源之夏”赛事聚焦科研智能,推出基于图像深度学习的无线电信号识别项目,旨在推动 AI 与无线电技术融合,培育科研智能创新人才。中山大学牵头举办了首届“大湾区杯”粤港澳AI4S 科技竞赛,北京航空航天大学、浙江大学、百度、华为等单位整体协同,针对人工智能科学计算问题设置 3 个赛道与 24 个赛题,赛题涉及 AI4S 的通用范式和模型,包括科学计算、流体、生物医药、分子、金融、社会学、电磁、化学、交通等多个领域的典型应用。和鲸科技

49、举办数字医疗算法应用创新大赛等 500 余场专业数据科学科研智能(AI4R&D)人工智能驱动的研发新范式 21 竞赛,覆盖气象、医疗等 20 余类行业。(四)(四)会议交流会议交流 北京科学智能研究院举办科学智能峰会,围绕 AI4S 基础设施共建、典型应用领域等话题进行深入探讨。百度联合高校举办全国智能流体力学研讨会等会议,与高校师生共同探索 AI4S 的未来。以“科学智算(AI4S):交叉与赋能”为主题的 CCF 秀湖会议在苏州举办,北京航空航天大学专家就多智能体科学智算模式进行学术报告,介绍了群体智能研究近期研究成果。首届“人工智能科学计算学术研讨会”上产学研各界对于人工智能推动科学计算剧

50、变式创新的高度关注,通过汇聚全球人工智能科学计算领域的专家和先行者,打造科学智算支撑基础科学探索和交叉前沿发现的新兴社区生态。中国计算机大会CNCC 2023举办的科学智算平台技术前沿探讨论坛会上北京航空航天大学、华为和百度等专家学者共同探讨科学智算的最新研究方向及产业动向。(五)(五)教学培训教学培训 深势科技支持举办 AI4S 系列主题的哥伦布训练营活动,提供20 余门课程资源、2000 余篇实训案例等国内外优质的 AI4S 教学资源。百度飞桨星河社区集成丰富的 AI 课程、深度学习样例项目,为学习者提供高质量的学习资源。(六)(六)标准布局标准布局 中国信通院联合之江实验室等多家企事业单

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服