收藏 分销(赏)

工业大模型应用报告.pdf

上传人:Stan****Shan 文档编号:1234690 上传时间:2024-04-19 格式:PDF 页数:34 大小:2.65MB
下载 相关 举报
工业大模型应用报告.pdf_第1页
第1页 / 共34页
工业大模型应用报告.pdf_第2页
第2页 / 共34页
工业大模型应用报告.pdf_第3页
第3页 / 共34页
工业大模型应用报告.pdf_第4页
第4页 / 共34页
工业大模型应用报告.pdf_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、 2024 年 3 月 参 参与单位 腾讯研究院 中国通信工业协会物联网应用分会 毕马威企业咨询(中国)有限公司 腾讯云智慧行业五部 指导单位:中国通信工业协会 撰写单位:1 工业大模型应用报告 目 录 1.大模型为工业智能化发展带来新机遇.1 1.1.大模型开启人工智能应用新时代.1 1.2.大模型有望成为驱动工业智能化的引擎.3 1.3.大模型应用落地需要深度适配工业场景.4 2.大模型和小模型在工业领域将长期并存且分别呈现 U 型和倒 U 型分布态势.6 2.1.以判别式 AI为主的小模型应用呈现倒 U 型分布.6 2.2.以生成式 AI为主的大模型应用呈现 U 型分布.7 2.3.大模

2、型与小模型将长期共存并相互融合.9 3.工业大模型应用的三种构建模式.11 3.1.模式一:预训练工业大模型.11 3.2.模式二:微调.12 3.3.模式三:检索增强生成.13 3.4.三种模式综合应用推动工业大模型落地.14 4.大模型应用探索覆盖工业全链条.16 4.1.大模型通过优化设计过程提高研发效率.16 4.2.大模型拓展生产制造智能化应用的边界.19 4.3.大模型基于助手模式提升经营管理水平.23 4.4.大模型基于交互能力推动产品和服务智能化.25 5.工业大模型的挑战与展望.28 5.1.工业大模型应用面临数据质量和安全、可靠性、成本三大挑战.28 5.2.工业大模型应用

3、将伴随技术演进持续加速和深化.30 1 工业大模型应用报告 1.大模型为工业智能化发展带来新机遇 1.1.大模型开启人工智能应用新时代 大模型引领人工智能技术创新和应用。自 1956 年达特茅斯会议(Dartmouth Conference)提出人工智能的概念以来,人工智能技术经历了多个发展高峰和低谷。在这一长期的发展过程中,人工智能技术不断演进,逐步朝着更高的智能水平和适应性发展。2022 年 11 月 30 日,OpenAI 发布了 ChatGPT,引发了行业热潮,直至今日,业界普遍认为,大模型时代已经到来,也象征着人工智能开启了迈向通用人工智能(AGI,Artificial Genera

4、l Intelligence)的新阶段。在大模型出现之前,人工智能通常需要针对特定的任务和场景设计专门的算法,这种方法虽然在特定领域有效,但人们对“智能”的期望是能够适应多种任务和场景的智能系统,单一任务的人工智能系统已经无法满足这些更广泛的需求。大模型能够跨越传统人工智能的局限性,理解和推理的能力有了极大的飞跃,同时也提高了复用的效率,为人工智能技术在更多领域的应用提供了坚实的基础,推动人类社会迈向通用人工智能(AGI)的新阶段。通用性和复用性是大模型的关键价值。2017 年,Google Brain(谷歌大脑)团队在其论文Attention Is All You Need中创造性地提出 T

5、ransformer 架构,凭借注意力机制,极大地改善了机器学习模型处理序列数据的能力,尤其是在自然语言处理(NLP)领域。Transformer 架构的出现,为后续的大模型如 ChatGPT 等奠定了技术基础。ChatGPT、Bert 等大模型通过海量数据和庞大的计算资源支持,使得模型具备了强大的通用性和复用性。大模型可以被广泛应用于自然语言处理、计算机视觉、语音识别等领域的各种任务,能够为各种应用和开发人员提供共享的基础架构,并进一步通过微调、零样本学习等方式,直接在一系列下游任务上使用,取得一定的性能表现,支持不同行业、不同场景的应用构建。2 工业大模型应用报告 大模型展现出三大基础特征

6、。目前大模型并没有明确的定义,狭义上指大语言模型,广义上则指包含了语言、声音、图像等多模态大模型。如李飞飞等人工智能学者所指出,这些模型也可以被称为基础模型(Foundation Model)。我们认为,大模型主要具备以下三大特征:参数规模大:大模型的参数规模远大于传统深度学习模型。大模型发展呈现“规模定律”(Scaling Law)特征,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系,通俗而言就是“大力出奇迹”。不过“大”并没有一个绝对的标准,而是一个相对概念。传统模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级以上,并已发展到过万亿级的规模。如 OpenA

7、I的 GPT-1到 GPT-3,参数量从 1.1 亿大幅拉升到 1750亿,GPT-4 非官方估计约达 1.8 万亿。泛化能力强:大模型能够有效处理多种未见过的数据或新任务。基于注意力机制(Attention),通过在大规模、多样化的无标注数据集上进行预训练,大模型能够学习掌握丰富的通用知识和方法,从而在广泛的场景和任务中使用,例如文本生成、自然语言理解、翻译、数学推导、逻辑推理和多轮对话等。大模型不需要、或者仅需少量特定任务的数据样本,即可显著提高在新任务上的表现能力。如 Open AI 曾用 GPT-4 参加了多种人类基准考试,结果显示其在多项考试中成绩都超过了大部分人类(80%以上),包

8、括法学、经济学、历史、数学、阅读和写作等。支持多模态:大模型可以实现多种模态数据的高效处理。传统深度学习模型大多只能处理单一数据类型(文本、语音或图像),大模型则可以通过扩展编/解码器、交叉注意力(Cross-Attention)、迁移学习(Transfer learning)等方式,实现跨模态数据的关联理解、检索和生成。多模态大模型(LMMs,Large Multimodal Models)能够提供更加全面的认知能力和丰富的交互体验,拓宽 AI 处理复杂任务的应用范围,成为业 3 工业大模型应用报告 界探索迈向通用人工智能的重要路径之一。典型如OpenAI的 Sora模型推出,掀起了全球多模

9、态大模型的发展新热潮。1.2.大模型有望成为驱动工业智能化的引擎 人工智能推动工业智能化发展进入新阶段。工业发展是一个逐步演进的过程,经历了机械化、电气化、自动化、信息化的阶段后,当前正处于从数字化向智能化迈进的阶段。每个阶段都是工业与各类创新技术的融合,对传统制造业进行升级和改造,提高生产效率、降低成本、提升产品质量。当前阶段,工业领域积累了大量的数据、基础能力和场景需求,为工业场景与人工智能技术的融合提供了基础条件。而人工智能逐渐展现出类似人的理解和分析能力,这些能力与工业场景的融合,将智能化带入到工业生产、运营、管理等领域,不断提升感知、认知和决策等多个环节,有望推动工业发展走向“自适应

10、、自决策、自执行”的智能化阶段。大模型为工业智能化提供新动力。尽管人工智能在智能制造、工业 4.0、工业互联网等方面有所应用,但这些应用往往受限于特定任务,难以实现跨领域、跨场景的融合创新。过去,人工智能在工业的应用主要聚焦于如质量检测、预测性维护等单一功能,这形成了人工智能应用上“一场景一训练一模型”的局限,尚未形成大规模的应用。然而,大模型的崛起有望带来“基础模型+各类应用”的新范式。大模型凭借其卓越的理解能力、生成能力和泛化能力,能够深度洞察工业领域的复杂问题,不仅可以理解并处理海量的数据,还能从中挖掘出隐藏在数据背后的规律和趋势。此外,区别于传统的人工智能模型只能根据已有数据进行预测和

11、推断,大模型则能够生成新的知识和见解。最后,大模型的泛化能力能够在更广泛的工业场景发挥作用。大模型为工业智能化拓展新空间。人工智能在工业领域的应用,尽管已经取得了一些显著的成果,但整体来看,其应用的普及率仍然处于相对较低的水平。据凯捷 4 工业大模型应用报告(Capgemini)统计数据显示,即便是欧洲顶级的制造企业,其AI应用的普及率也仅超过 30%,而日本和美国制造企业的 AI 应用率分别达到了 30%和 28%。相较于这些发达国家,中国制造企业 AI 普及率尚不足 11%,显示出这一领域巨大的发展潜力和广阔的空间。相较于以往的小模型,大模型有望挖掘工业领域人工智能应用的新场景,提升人工智

12、能应用的普及率。例如在研发设计领域,大模型能够深度挖掘和分析海量数据,为产品设计提供更为精准和创新的思路。在经营管理领域,大模型能够实现对生产流程、供应链管理等各个环节的监控和智能优化,从而提升企业的运营效率和市场竞争力。1.3.大模型应用落地需要深度适配工业场景 大模型的优势在于其强大的泛化能力,可以在不同的领域和任务上进行迁移学习,而无需重新训练。但无法充分捕捉到某个行业或领域的特征和规律,也无法满足某些特定的应用场景和需求,在真正融入行业的过程中,需要适配不同的工业场景,其核心就是要解决以下三个问题。不懂行业:大模型在处理特定行业任务时,往往表现出对行业知识、术语、规则等的不理解,导致生

13、成的解决方案与实际需求存在偏差,这主要是由于大模型在训练过程中缺乏特定行业的数据和知识,难以覆盖各个行业的专业细节。这种行业知识的匮乏使得大模型在应对工艺流程优化、设备故障预测等专业问题时有所缺陷,难以提供精确、可靠的解决方案,无法满足工业现场的个性化要求。不熟企业:当大模型接入企业系统时,往往难以全面理解企业的业务流程、数据结构和运营模式,导致生成的解决方案与企业实际需求不匹配。每个企业都有其独特的运营环境和业务需求,而大模型往往缺乏对企业特定环境的深入理解。此外,企业内部的数据孤岛和碎片化的信息系统也增加了大模型理解企业环境的难度。这种不熟 5 工业大模型应用报告 企业的问题使得大模型难以

14、真正融入企业的运营流程,无法平滑地嵌入到现有的各类系统中。存在幻觉:在某些情况下,大模型会产生与实际情况不符的错误输出,即“幻觉”现象。这主要是由于模型在训练过程中受到了噪声数据、偏差样本等因素的影响,或者由于模型的复杂性和数据维度过高导致过拟合。这种幻觉现象对工业领域的影响是全方位的,无论是生产过程中的质量控制、设备维护,还是供应链管理、市场预测等环节,错误的输出都可能导致严重的决策失误和经济损失。特别是在对安全性、可靠性要求极高的工业场景中,如航空航天、核能等领域,幻觉现象可能带来灾难性的后果。6 工业大模型应用报告 2.大模型和小模型在工业领域将长期并存且分别呈现 U 型和倒 U 型分布

15、态势 从工业智能化的发展历程可以看出,在大模型出现之前,人工智能技术在工业领域已有较多应用。在前期阶段,工业人工智能的应用主要是以专用的小模型为主,而大模型开启了工业智能化的新阶段。结合两者不同的技术特点和应用能力,目前在工业领域形成了不同的分布态势。图表 1 生成式AI(大模型)和判别式AI(小模型)在工业主要领域分布情况 1 2.1.以判别式 AI 为主的小模型应用呈现倒 U 型分布 根据中国信通院2对 507个 AI 小模型应用案例的统计分析,这些应用主要集中在生产制造领域,占比高达 57%,而在研发设计和经营管理领域的应用则相对较少。这种分布呈现出明显的倒 U型。小模型的核心特点是学习

16、输入与输出之间的关系。小模型通过学习数据中的条件概率分布,即一个样本归属于特定类别的概率,再对新的场景进行判断、分析和预测。它的优点是通常比大模型训练速度更快,而且可以产生更准确的预测结果,尤其适用 1 507 个小模型应用数据引用自中国信息通信研究院工业智能白皮书(2022),99 个大模型应用数据由本文编写组收集、整理、统计分析所得 2 中国信息通信研究院工业智能白皮书(2022)7 工业大模型应用报告 于对特定任务进行快速优化和部署的场景。以工业质检领域为例,小模型能够从海量的工业产品图片数据中,学习到产品的外观特征、质量标准和缺陷模式等关键信息。当面对新的样本时,小模型能够迅速判断样本

17、是否合格,从而实现对产品质量的快速检测。同样在设备预测性维护方面,小模型通过对设备运行数据的分析,能够学习到设备正常运行的模式和潜在的故障特征。一旦监测到异常情况,小模型能够及时发出预警,提醒工作人员进行检修或维护。小模型的能力更适合工业生产制造领域。首先,小模型能够基于有限数据支撑精准的判别和决策,而生产过程需要针对不同场景进行精准的分析和决策,这两者间的契合使得小模型在生产制造领域具有独特的优势。其次,生产制造过程对准确性和稳定性有着极高的要求,任何微小的误差都可能导致产品质量下降或生产线停工。小模型在训练过程中,能够针对具体场景进行精细化的调整和优化,从而确保模型的准确性和稳定性,这使得

18、小模型在生产制造领域的应用更为可靠和有效。最后,小模型在成本投入方面相对较低,使得其在生产制造现场的应用更具经济性,并在有限的硬件条件下,能够稳定运行。小模型的定制化需求制约了其进一步渗透。尽管小模型在生产制造领域表现出色,但其应用过程中也面临着一些挑战。以判别式 AI 为代表的小模型通常需要依靠个性化的业务逻辑进行数据采集、模型训练与调优,往往只能处理单一维度的数据。这一过程不仅消耗大量的算力和人力,而且训练后的模型往往无法在多行业通用。例如,工业缺陷检测领域的视觉模型往往需要针对一个产品或者一个设备训练一个模型,产品或设备不同,就要对模型进行重新训练,这种定制化的需求在一定程度上制约了小模

19、型在工业领域的进一步渗透。2.2.以生成式 AI 为主的大模型应用呈现 U 型分布 8 工业大模型应用报告 根据对 99 个工业大模型应用案例的统计分析,大模型在研发设计和经营管理领域的应用相对更多,整体上呈现出 U 型分布。这表明大模型当前的能力更适配于研发设计和经营管理,在生产制造环节的能力和性能还需进一步提升。大模型通过构建庞大的参数体系来深入理解现实世界的复杂关系。大模型的核心在于学习数据中的联合概率分布,即多个变量组成的向量在数据集中出现的概率分布,进而通过使用深度学习和强化学习等技术,能够生成全新的、富有创意的内容。与传统的数据处理方法不同,大模型并不简单地区分自变量与因变量,相反

20、,它致力于在庞大的知识数据库中提炼出更多的特征变量。这些特征变量不仅数量庞大,而且涵盖了多个维度和层面,从而更全面地反映现实世界的复杂关系。以自然语言处理为例,大模型通过学习大量的文本数据,能够掌握语言的规律和模式。当给定一个句子或段落时,大模型能够基于联合概率分布生成与之相关的新句子或段落。这些生成的内容不仅符合语法规则,而且能够保持语义上的连贯性和一致性。此外,大模型还能够根据上下文信息理解并回答复杂的问题,展现出强大的推理和创造能力。大模型更适合综合型和创造类的工业场景。在综合型工业场景中,由于涉及到多个系统、多个流程的协同工作,需要处理文档、表格、图片等多类数据,变量之间的关系往往错综

21、复杂,难以用传统的分析方法进行精确描述。大模型通过深度学习和复杂的网络结构,可以捕捉并模拟这些关系,从而实现对复杂系统的全面理解和优化。在创造类工业场景中,大模型的优势体现在其强大的内容生成能力上。例如,在产品外观设计方面,传统的设计方法往往依赖于设计师的经验和灵感,设计周期长且难以保证设计的创新性。而大模型通过学习大量的设计数据,能够掌握设计领域的规律和模式,进而生成符合要求的全新设计内容,提升产品设计的效率和质量。9 工业大模型应用报告 大模型在工业领域的应用潜力仍有待释放。首先,大模型技术本身正处于快速发展的阶段,尽管已取得了显著进步,但在成本、效率和可靠性等方面仍有待进一步提升,以适应

22、工业领域日益复杂的需求。其次,工业场景众多且各具特色,大模型作为新技术,需要逐步与各个工业场景紧密结合,在逐步提升技术渗透率的过程中,挖掘可利用的场景,并根据行业特定需求提供定制化的解决方案。最后,工业领域自身的数据分散且缺少高质量的工业数据集,同时在实际生产中如何确保工业数据的隐私和安全也是企业关注的重点,这些现实问题也限制了大模型的推广应用。2.3.大模型与小模型将长期共存并相互融合 目前大模型在工业领域还未呈现出对小模型的替代趋势。尽管以生成式 AI 为代表的大模型被视为当前 AI 的热点,但在工业领域的实际应用中,大模型的能力和成本问题导致其尚不能完全取代以判别式 AI 为代表的小模型

23、。一方面,小模型在工业领域具有深厚的应用基础和经验积累,其算法和模型结构相对简单,易于理解和实现,其稳定性和可靠性得到了验证。另一方面,大模型在成本收益比、稳定性和可靠性等方面存在问题,其在工业领域的探索还处在初级阶段。小模型以其高效、灵活的特点,在特定场景和资源受限的环境中发挥着重要作用;而大模型则以其强大的泛化能力和处理复杂任务的优势,在更广泛的领域展现着巨大潜力,两者将长期共存。大模型与小模型有望融合推动工业智能化发展。对于小模型而言,利用大模型的生成能力可以助力小模型的训练。小模型训练需要大量的标注数据,但现实工业生产过程可能缺少相关场景的数据,大模型凭借强大的生成能力,可以生成丰富多

24、样的数据、图像等。例如,在质检环节,大模型可以生成各种可能的产品缺陷图片,为小模型提供丰富的训练样本,从而使其能够更准确地识别缺陷和异常。此外,大模型可以通过Agent等方式调用小模型,以实现灵活性与效率的结合。例如,在某些场景下,大 10 工业大模型应用报告 模型可以负责全局的调度和决策,而小模型可以负责具体的执行和控制。这样既能保证系统的整体性能,又能提高响应速度和灵活性。11 工业大模型应用报告 3.工业大模型应用的三种构建模式 大模型的构建可以分为两个关键阶段,一个是预训练阶段,一个是微调阶段。预训练主要基于大量无标注的数据进行训练,微调是指已经预训练好的模型基础上,使用特定的数据集进

25、行进一步的训练,以使模型适应特定任务或领域。针对工业大模型,一是可以基于大量工业数据和通用数据打造预训练工业大模型,支持各类应用的开发。二是可以在基础大模型上通过工业数据进行微调,适配特定工业任务。三是可以在不改变模型参数的情况下,通过检索增强生成(RAG)为大模型提供额外的数据,支持工业知识的获取和生成。这三种模式并不独立应用,往往会共同发力。图表 2 工业大模型应用的三种构建模式对比 3.1.模式一:预训练工业大模型 无监督预训练主要利用大量无标注数据来训练模型,目的是学习数据的通用特征和知识,包括 GPT-3/GPT-4、LLaMA1/LLaMA2 等,都是通过收集大量无标注的通用数据集

26、,使用 Transformer 等架构进行预训练得到。预训练之后的模型已经足够强大,能够使用在广泛的任务领域。例如,当无监督预训练技术应用于 NLP 领域时,经过良好训练的语言模型可以捕捉到对下游任务有益的丰富知识,如长期依赖关系、层次关系等。然而,另一方面完全基于互联网等通用数据训练的大模型缺乏对行业知识的理解,在应对行业问题上表现出的性能较差,因此在预训练阶段可以使用通用数据加行业数据进行模型训练,使得在基础模型的层面就具备了一定的行业专有能力。12 工业大模型应用报告 无监督预训练工业大模型的优点是可以具备广泛的工业通用知识,最大程度地满足工业场景的需求,实现模型的最优性能与稳定性。但这

27、一模式的缺点是需要大量的高质量工业数据集,以及庞大的算力资源,对成本和能力的要求较高,面临技术和资源的巨大挑战。在最终应用前,无监督预训练工业大模型与 GPT3类似,同样需要通过适当的指令微调、奖励学习、强化学习等阶段,形成面向最终场景的应用能力。SymphonyAI 3推出了基于无监督预训练的工业大语言模型,该模型的训练数据包含 3 万亿个数据点,12 亿 token,能够支持机器状况诊断,并回答故障状况、测试程序、维护程序、制造工艺和工业标准相关的问题。制造流程管理平台提供商 Retrocausal4发布的 LeanGPT,也采用了无监督预训练的模式,是制造领域的专有基础模型。基于 Lea

28、nGPT这一基础模型,Retrocausal 还推出了 Kaizen Copilot的应用程序,可以帮助工业工程师设计和持续改进制造装配流程。3.2.模式二:微调 微调模式是在一个已经预训练完成的通用或专业大模型基础上,结合工业领域特定的标注数据集进行进一步的调整和优化,从而使模型能够适应具体的工业场景需求,更好地完成工业领域的特定任务。在微调期间,需要使用特定任务或领域量身定制的标记数据集来训练,与模型预训练所需的巨大数据集相比,微调数据集更小,单个任务的微调通常只需要几千条到上万条有标注数据即可。通过微调,大模型可以学习到工业细分领域的知识、语言模式等,有助于大模型在工业的特定任务上取得更

29、好的性能。在当前主流的行业大模型构建路线中,众多行业模型都是使用基础大模型+行业标注数据集来微调得到的。3 Industrial LLM-SymphonyAI with Microsoft 4 Kaizen Copilot Retrocausal 13 工业大模型应用报告 这一模式的优点是可以充分利用基础大模型的泛化能力,同时通过微调的方式,提升模型的适配性和精度,能够在特定的任务或领域上取得更好的效果,也可以针对具体行业或公司的语气、术语进行定制化。缺点在于需要收集和标注具体工业领域和场景的数据和知识,增加数据准备的成本和时间,若数据不足或嘈杂会降低模型的性能和可靠性,也可能会过度拟合,导致

30、性能下降,或者灾难性遗忘。Cohere5推出全面的微调套件,其中包括生成微调、聊天微调、重新排序微调和多标签分类微调等解决方案,可以满足企业在微调各种 AI 应用时的需求。基于微调,企业可以定制模型,在文本生成、摘要、聊天、分类和企业搜索等目标用例上获得更好的性能。3.3.模式三:检索增强生成 检索增强生成模式是指在不改变模型的基础上,结合行业领域的数据、知识库等,为工业场景提供知识问答、内容生成等能力。检索增强生成(Retrieval Augmented Generation,RAG)结合了检索(Retrieval)和生成(Generation)两种方法,基本思路是把私域知识文档进行切片,向

31、量化后续通过向量检索进行召回,再作为上下文输入到基础大模型进行归纳总结。具体而言,首先是将外部数据通过 Embedding 模型存储到向量数据库中。当用户输入查询内容时候,经过 Embedding 模型和向量数据库的内容匹配,得到 Top 排序的结果作为上下文信息一起输入给大模型,大模型再进行分析和回答。检索增强生成在私域知识问答方面可以很好的弥补通用大语言模型的一些短板,解决通用大语言模型在专业领域回答缺乏依据、存在幻觉等问题。这种模式的优点是可以快速利用现有的基础大模型,无需进行额外的训练,只需要构建和接入行业或企业私有的知识库,就可以实现对工业领域的知识理解和应用,5 Introduct

32、ion()14 工业大模型应用报告 也可以部分消除大模型的幻觉,减少数据泄露,提高信任度和访问控制。这种模式的缺点是基础大模型可能无法充分适应工业场景的特点和需求,导致效果不佳或不稳定。Cognite6利用检索增强生成(RAG)技术,将大模型与其工业 DataOps 平台 Cognite Data Fusion 结合起来,为工业客户提供基于数据的洞察和解决方案。通过将不同来源和类型的工业数据进行向量化,并存储在一个专门的向量数据库中,可以作为 RAG 的检索源,与用户的自然语言提示一起输入到大模型中,使模型能够提供更加精准的建议或解决方案。C3.AI7推出的 Generative AI 利用检

33、索增强技术,将制造企业知识库与大语言模型分开,从而生成准确、一致的结果,且能够追溯到源文件和数据,以确保信息的准确。另外,Generative AI 还通过嵌入相关性评分机制,在未达到相关性阈值时回答“我不知道”。例如在设备运维场景下,操作员可以利用简化的工作流程来诊断设备故障根因。当操作员发现生产问题时,可以直接进入 C3 Generative AI 搜索故障排除指南和教科书,以找出潜在原因。3.4.三种模式综合应用推动工业大模型落地 在工业大模型的训练模式中,我们可以看到三种主要的方法,每种方法都有其独特的优势和挑战。无监督预训练模式通过大量无标注数据来提升模型的泛化能力,适用于工业场景的

34、广泛需求,但需要巨大的资源投入。基础大模型加有监督微调模式则在保留通用能力的同时,通过特定领域的数据微调,提高了模型的适配性和精度,但需要高质量的标注数据。基础大模型结合检索增强生成(RAG)模式,通过利用预训练的基础大模型和行业知识库,为工业场景提供即时的知识问答和内容生成服务,这种方法的优势在于快速部署和利用现有资源,但可能在特定工业场景的适应性上存在 6 RAG is all the RAGe()7 C3 Generative AI Now Publicly Available on Google Cloud Marketplace-C3.ai,Inc.15 工业大模型应用报告 局限。总

35、结来说,这三种训练模式为工业大模型的开发提供了多样化的选择,在实际应用中,这三种模式并非只采取一种方式,往往企业最终发布的应用模型针对不同的应用场景,综合采用多种构建方式。以 NVIDIA8(英伟达)为例,开发了名为 ChipNeMo 的定制大模型,采用了无监督预训练、微调等多种模式。该模型训练收集了 Bug总结、设计源(Design Source)、文档以及维基百科等数据,训练的 token 超过 240 亿,在商用开源的 Llama2 基础上,采用领域自适应预训练、带有领域特定指令的监督微调(SFT),以及领域自适应检索等技术对模型进行优化,能够有效的支持芯片设计的一般问题问答、总结 Bu

36、g 文档和EDA脚本编写等功能。8 ChipNeMo:Domain-Adapted LLMs for Chip Design|Research()16 工业大模型应用报告 4.大模型应用探索覆盖工业全链条 从工业产品生命周期的角度,可以将工业场景概括为研发设计、生产制造、经营管理、产品服务等四个主要环节,根据整理的 99 个工业大模型的应用案例,对工业大模型的场景应用总结如下:图表 3 大模型在工业全链条的应用探索 4.1.大模型通过优化设计过程提高研发效率 4.1.1 产品外观设计 工业产品设计涵盖了外观设计与结构设计两大关键环节。在这两个环节,大模型都展现出了其独特的价值。在结构设计方面,

37、借助大模型的生成能力可以快速为工业产品或零件提供多种设计方案,缩短产品开发的时间并提供多种创造性的产品选项,让设计师专注于产品设计的核心工作。在外观设计方面,设计师只需提供简短的文字工业大模型的场景应用研发设计产品外观设计研发设计软件辅助生产制造工业代码生成车间和设备管理工业机器人控制经营管理管理软件辅助知识管理与问答助手产品服务智能产品智能客服与售后 17 工业大模型应用报告 描述或草图,大模型便能迅速生成多张高保真度的设计效果图。这些效果图不仅满足了设计师的个性化需求,还为他们提供了丰富的选择空间,方便进一步修改与优化。CALA9作为时装设计平台,将 OpenAI的 DALL E生成式设计

38、工具整合到其服务体系中,极大地促进了设计师创意的快速实现。通过输入相关的设计概念关键词,CALA能够迅速产生一系列的服装设计初稿,显著地缩短了设计周期,提高了工作效率。然而,CALA 并非一个完全自动化的设计工具,其使用过程依然依赖于设计师的专业技能和丰富经验。尽管如此,CALA 显著降低了新设计师的入门难度,并有效提升了资深设计师的工作效率。海尔设计10联合亚马逊云科技以及合作伙伴 Nolibox 共同开发的 AIGC 解决方案,将大模型图像生成技术成功应用于产品设计、用户界面设计、色彩材质设计以及品牌设计等多个领域。该解决方案全面覆盖了新品设计、产品改款升级、以及渠道定制化等工业设计业务场

39、景。其中,概念图的生成得益于 Nolibox 基于开源大模型 Stable Diffusion 的应用开发,有效地助力形成高效、精准的设计成果。丰田研究所11推出的“生成式人工智能工具”是一款专为车辆设计师打造的 AI 助手,旨在提供创新支持。这款工具能够根据文本提示生成精确的设计草图,并允许设计师通过调整定量性能指标来构建原型草图。工具融合了计算机辅助工程的优化理论与生成式 AI 技术,能够将工程约束自然地融入设计流程中。这意味着,在生成满足设计师风格要求的图像的同时,还能综合考虑并优化诸如风阻、底盘高度等关键工程参数。4.1.2 研发设计软件辅助 9 CALA AI-Powered Des

40、ign&Collaboration 10 亚马逊云科技联手 Nolibox,助力海尔创新设计中心打造 AIGC 工业设计解决方案()11 Human-Centered AI|Toyota Research Institute(tri.global)18 工业大模型应用报告 大模型可以与 CAD、CAE 等工业设计软件结合,通过连接相关数据库,更好地调用相关的设计模块,提升研发设计的效率。以 CAD 为例,现有的海量标准化素材库提供了大量工程制图、布局规划等数据,大模型可以利用这些数据,结合设计者的创意思路和特殊需求,生成多样化的设计方案,供设计者进行参考。另一方面,亦可对设计方案进行快速优化调

41、整,帮助工程师以更快的速度和更少的错误创建布局。Back2CAD12 基于 Elaine CAD Bot、ChatGPT 和 Amazon AWS 等的支持推出CADGPT,支持虚拟助手、智能推荐、文档生成、代码生产、CAD 项目辅助等各类功能。以虚拟助手为例,CADGPT 能够基于用户前期的设计和偏好,提出替代性的方案或者现有方案的改进意见,帮助用户短时间内能够获得更好的设计结果。在代码生成方面,CADGPT可基于用户输入的提示词生成适当的代码片段。Synopsys13(新思科技)推出了一款创新的芯片设计辅助工具Synopsys.ai Copilot。这款工具融合了先进的生成式人工智能技术,

42、旨在加速芯片设计的整个流程。新思科技与微软合作,整合了 Azure OpenAI平台的生成式 AI技术,使得设计工具具备了与工程师进行对话的智能能力。在日常工作中,工程师可以利用 Synopsys.ai Copilot来应对芯片设计过程中遇到的各种复杂挑战。通过与工具的智能对话,工程师能够更加高效地解决问题,优化设计方案,从而显著提高设计效率。Cadence14推出了 Cadence.AI LLM,这是业界首个针对芯片设计的大型语言模型(LLM)技术。该工具的核心功能在于加载和处理架构规范、设计规范、集成连接规范以及芯片设计本身,为用户提供了一个强大的交互平台。用户能够通过自然语言与工具进行互

43、动,提出各种指令,如要求列出芯片设计中的不规则网络名称、识别所有 12 CADGPT|Back2CAD()13 面向芯片设计和 AI 应用的 AI 驱动型 EDA 套件|Synopsys.ai 14 Cadence Creates Industrys First LLM Technology for Chip Design-Cadence Community 19 工业大模型应用报告 潜在的不规则引脚、自动化测试平台的连接设置、以及辅助完成工具脚本和 RTL 代码的编写。Ansys15推出 Ansys SimAI,一款将 Ansys仿真软件与生成式人工智能结合的云端应用,可以快速评估新设计的性

44、能。Ansys SimAI 并不依赖于几何参数来定义设计,而是以设计本身的形状作为输入,即使形状的结构在训练数据中的记录不一致,也能有助于更广泛的设计探索。对于需要进行海量计算的项目,该应用可将所有设计阶段的模型性能预测功能提高 10-100 倍。客户可以使用以前生成的 Ansys 或非 Ansys 的数据来训练 AI。雷诺集团利用 Ansys SimAI,加速了汽车零部件的设计和测试过程,Ansys SimAI 可以让雷诺集团的工程师在数分钟内测试一个设计,并迅速分析结果,从而在项目的上游阶段探索更多的技术可能性,并加快产品整体上市进程。4.2.大模型拓展生产制造智能化应用的边界 生产制造环

45、节是工业生产的核心场景,对安全性和稳定性的要求较高,目前大模型在该环节的渗透率整体不高,主要集中在代码生成、车间和设备管理和机器人控制等环节。4.2.1 工业代码生成 大模型在工业代码生成的应用领域广泛,涉及到自动化、机械加工等领域。将大模型应用于工业代码生成的优势在于可以提高工业代码的质量和效率,减少人工编程的时间和成本,提高了研发者的开发效率,特别是重复性高、逻辑简单的任务。同时,自动生成的代码还可以减少人为错误的发生,提高代码的可靠性和可维护性。现有的代码生成方法或工具在处理简单需求的场景时表现较好,如行级代码补全和初级的函 15 Ansys 宣布正式推出 Ansys SimAI| 20

46、 工业大模型应用报告 数级代码生成。在复杂的函数级代码生成、深入的问题分析和软件系统设计方面,还需要进一步改进和优化。Siemens16与微软合作推出了 Siemens Industrial Copilot,西门子 Industrial Copilot允许用户迅速生成、优化自动化代码并加速仿真流程,将原本需要数周的任务缩短至几分钟。该工具整合了西门子 Xcelerator 平台的自动化与仿真信息,并结合微软Azure OpenAI服务提升数据处理能力,同时确保客户对数据的完全控制,不用于 AI模型训练。Industrial Copilot 旨在提升整个工业生产周期的效率,通过自然语言交互,使维

47、修人员得到精确指导,工程师能迅速使用仿真工具,从而推动工业创新和生产力的提升。SprutCAM17结合 ChatGPT 推出 AI 产品 ncy。这款 AI 助手通过结合 OpenAI 的API 接口,能够理解和生成自然语言,帮助 CNC 工程师简化机械加工任务。ncy 能够执行多种任务,包括生成基于文本描述的代码,以及使用 Python 编写代码来创建.dxf或.stl 文件。此外,ncy 还能支持工程师操作机床,回答与 SprutCAM X 软件操作相关的任何问题。例如,当工程师给出指令“在点(100,25)处钻一个直径 10 毫米的孔”,ncy 即可生成相应的 CAM 执行代码。4.2.

48、2 车间和设备管理 在车间管理方面,大模型能够协助监控生产线,确保工艺流程的顺畅与高效;在设备管理领域,大模型通过支持预测性维护减少停机时间,并通过精准的数据分析指导维护决策,有望成为工业智能化转型的关键驱动力。16 Unlocking the Power of Generative AI:Siemens Industrial Copilot-Insights-Siemens Global Website 17 ncy-virtual AI assistant for SprutCAM X-SprutCAM X 21 工业大模型应用报告 Sight Machine18推出 Factory Co

49、Pilot,一款集成了 Microsoft Azure OpenAI Service的工业数据分析工具,它通过智能化分析简化了制造问题的解决和报告流程。Factory CoPilot 提供了一个直观的交互体验,用户可以像询问专家一样轻松获取分析结果。利用自然语言界面,Factory CoPilot 能够自动整理 Sight Machine平台上的上下文数据,生成易于理解的报告、邮件和图表。它还能引导用户进行根因分析,加快问题诊断。此外,通过持续分析,Factory CoPilot 有助于识别和解决非计划停机、设备效率低下和质量问题,推动制造流程的持续优化。Vanti19推出 Manufactu

50、ring COPILOT,目标是解决当前制造业专业人员在数据管理和分析方面面临的挑战。通过融合和整理来自 ERP 系统、制造执行系统(MES)、传感器以及历史记录器等多样化数据,该平台改变了数据处理方式。同时基于大模型能力,允许用户以自然语言询问并与数据互动,将复杂的数据分析过程转换为简单直观的对话。Manufacturing COPILOT 不仅能处理和分析原始数据,还能识别并解释复杂的生产行为,转化为易于理解的、可操作的洞察。借助数据可视化技术,它提供了数据的图形化叙述,增强数据的可解释性,帮助制造业专业人士进行数据驱动的决策。此外,它还简化了测试流程,使用户能够通过自然语言查询快速验证假

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服