1、编写说明综述一、大赛开放多维度场景及高质量数据,大模型企业奇招频出(一)政务领域.赛题情况.企业解决方案亮点(二)金融领域.赛题情况.企业解决方案亮点(三)产业升级领域.赛题情况.企业解决方案亮点(四)医疗领域.赛题情况.企业解决方案亮点(五)文化教育领域.赛题情况.企业解决方案亮点(六)智慧城市领域.赛题情况.企业解决方案亮点二、北京市人工智能大模型行业应用情况分析(一)应用特征-北京市人工智能大模型行业应用分析报告目 录目 录.由浅入深,大模型穿越边缘场景,向核心场景挺进.守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等 领域的落地步伐.百花齐放,大模型应用搭建难度下降,“动态行业
2、大数据”成为 落地新关键.量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明.保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障(二)应用挑战.算力需求持续增长,掣肘大模型落地应用.知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中.大模型幻觉问题有所改善,但距离规模落地尚有差距.部分大模型应用处于“可用阶段”,需求方和技术企业协同发力 让“可用”迈向“好用”.部分领域受监管影响,对大模型落地提出特殊要求(三)应用研判.政务领域.金融领域.产业升级领域.医疗领域.文化教育领域.智慧城市领域结语致谢声明附录-北京市人工智能大模型行业应用分析报告目 录北京市人工智能大模型行业应用分析
3、报告编写说明编 写 说 明大模型是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。大模型以其在模型精度和泛化能力等多个指标上超越传统AI模型的表现,以及赋能千行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向。大模型经过一年多的高速发展,已在政府、医院、学校、企业等各类需求群体中建立初步认知。其中一部分需求群体设立专项预算、开放业务场景,对大模型进行试点应用。通过试点应用,需求群体加深了对大模型能力和价值的认同感,进而普遍希望在未来继续增加相关预算,将大模型与实际业务进行更深入、更广泛的融合。在此背景下,北京市科学技术委员会、中关村科技园区管理委员会会同有关
4、部门和相关区举办了北京市人工智能行业大模型创新应用大赛,并依托大赛成果及前期工作积累编写本报告,致力于分析北京市大模型行业应用发展趋势,促进大模型价值传播和供需对接。限于编写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影响,内容或有疏漏,敬请指正。04北京市人工智能大模型行业应用分析报告综 述综 述人工智能大模型经过过去一年的发展,行业应用开始出现井喷式增长。作为发展新质生产力的重要引擎,人工智能正成为经济高质量发展的最大增量。北京市委市政府高度重视人工智能发展,年月,北京市政府印发 北京市加快建设具有全球影响力的人工智能创新策源地实施方案(-年),强调构建高效协同的大模型技术
5、产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发 北京市促进通用人工智能创新发展的若干措施,强调开展大模型创新算法及关键技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。近年来,北京市积极布局人工智能产业发展要素,通过部署智能算力平台、建设数据基础制度先行区、发布中文互联网语料库、设立产业投资基金、建设大模型产业集聚区等一系列举措,加速推动人工智能产业发展。截至目前,全市人工智能相关企业约家,约占全国四成;年人工智能产业核心产值突破亿元。北京人工智能领域创新和产业链条完整,在基础设施层面集聚了寒武
6、纪、摩尔线程、昆仑芯等国内头部企业;核心技术及算法层面拥有百度、智谱、百川智能、月之暗面、零一万物等代表性基础大模型,目前已备案上线大模型款,全国第一;应用层面拥有猿力科技、中科闻歌、瑞莱智慧等行业大模型技术企业,相关产品已在教育、金融、政务等领域率先应用。北京市积极布局人工智能,加速推动产业发展0506北京市人工智能大模型行业应用分析报告综 述为进一步加强重点领域大模型建设,根据市委市政府整体部署,在市人工智能专班的统筹调度下,北京市科委、中关村管委会会同相关单位,围绕重点行业领域,研究建立全市行业大模型应用推进工作机制,并于年月举办北京市人工智能行业大模型创新应用大赛,全力推动大模型技术应
7、用落地。以期通过大赛,挖掘一批典型的行业应用案例,启发一批潜在试点单位拥抱大模型技术,梳理一批核心业务场景,开放一批行业核心业务数据,发现一批有潜力有实力的大模型技术企业,推动一批大模型供需之间的交流与合作。大赛设置政务、金融、产业升级、医疗、文化教育、智慧城市个赛道,分初赛和复赛两个阶段。初赛阶段类似“自由创作”,针对参赛团队所申报的应用案例,围绕商业价值和社会效益进行综合评估;复赛阶段类似“命题作文”,结合试点单位真实业务需求,由试点单位出题,对通过初赛的大模型技术企业进行能力考核。历经数月,大赛从个赛道余家参赛单位中,征集应用案例余项,凝练应用场景个,开放高质量行业数据上万条。本报告以大
8、赛为切入点,展示了北京市大模型技术在各领域各行业的应用方向,根据不同领域对大模型应用趋势进行分析研判,并提出工作建议,力求向市场各类参与主体呈现北京市人工智能行业大模型创新应用发展态势,为未来决策提供参考。北京市以行业大模型创新应用大赛为抓手全力推动大模型技术应用落地07北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出一、大赛开放多维度场景及高质量数据大模型企业奇招频出方向一为基于多形态知识的政务认知智能体系研究,由北京市政务服务和数据管理局提出,以构建高质量政务数据知识体系为核心目标,需要参赛企业对全市海量政务数据的实时动态挖掘、清洗、标记、转换,并打造大
9、模型测试训练的统一平台接口。复赛所用训练及测试数据集由公积金、交管局等政务知识数据脱敏形成,可供参赛企业带回,进行部署调试。该方向将有助于进一步提升政务服务数字化、智能化水平,在政务整体场景布局中发挥大模型数据中台作用,从而支撑政务领域各项业务的大模型应用。方向二为基于依申请政务服务事项知识图谱的智能咨询,由北京市政务服务和数据管理局提出,以提升办事企业、群众在线政务咨询及申请办事的体验为核心目标,需要参赛企业针对用户提出的依申请办事相关咨询问题进行精准回答,并锁定服务事项。复赛所用训练及测试数据集由政务服务事项办事指南、事项说明等数据形成,可供参赛企业带回,进行部署调试。该场景从形式上属于大
10、模型智能问答,是市政务服务和数据管理局面向大众群体的重要场景,需要大模型精准把控生成内容的同时保障用户的良好体验。.赛题情况政务领域(一)08北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出方向三为面向政策分析场景的政策专业化标注,由北京市政务服务和数据管理局提出,以为政府办事人员提供政策分析问答、指导政策制定为核心目标,需要参赛企业对政策性文件进行条款拆解、理解并训练大模型,获得准确的问答效果。复赛所用训练及测试数据集由专精特新的政策原文数据形成,可供参赛企业带回,进行部署调试。该场景需要大模型深度理解政策原文对其拆解及标注,并在政策制定的过程中给出参考意
11、见,将有助于提升政策制定的效率及全面性。在提升回复准确率方面,参赛企业提出两个较为有效的解决方案。部分参赛企业通过外挂知识库的检索增强(RAG)方法来索引政策知识,从而提升大模型生成结果的准确性,并且可行性较强,但这种方案依赖知识库的知识储备和及时更新,在长期运维过程中不仅带来额外的人力成本,也可能生成大量重复、过期的知识。部分参赛企业利用大模型来对知识进行分析和存储,相比于外挂检索增强,这种通过大模型对知识进行管理的方案虽然在短期内可能会因为大模型幻觉等问题在答案精准性上有所欠缺,但长期看,随着基座大模型能力不断提升,这类方案能够真正的理解数据,从而更好的更新和利用知识,在开展垂直领域微调后
12、表现出更好的效果。参赛企业在提升用户体验方面也做出了多维度的尝试,从部署上,参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部署,为数据敏感的政务场景提供解决方案。在提升准确度的考虑上,参.企业解决方案亮点09北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出赛企业利用知识图谱辅助大模型精准定位知识,并通过主动多轮质询用户的方式提升答案质量。方向一为基于AIGC技术的智能审计合规研究,由北京银行提出,以提高审计工作效率和准确性为核心目标,需要参赛企业针对检查内容,利用大模型技术寻找并给出相关现象涉及的制度名称及相关原文,生成包含检查要点、检查方法等
13、内容的审计合规方案。复赛所用训练及测试数据集由北京银行制度、监管政策以及历史问题库等内部审计合规相关知识形成,仅允许本地私有化部署。金融审计场景作为北京银行的核心业务之一,对审计结果的正确性要求很高,对大模型的检索能力及溯源能力提出较高要求。方向二为基于金融行业的营销引导式智能员工,由北京首创融资担保有限公司提出,以帮助业务人员迅速生成风险报告,评估企业风险情况为核心目标,需要参赛企业对金融场景的数据进行理解并训练大模型,最终生成包含产品特征、贷款担保资质、项目方案(预估放款金额、担保费率)等问题的解决方案。复赛所用训练及测试数据集由企业画像、业务评审报告等文件数据形成,仅允许本地私有化部署。
14、金融担保同时具备金融性和中介性双重属性,为完成融资担保流程,担保公司不仅需要熟悉了解金融专业及法律规定,还需要具备一定的营销能力,因此本题目方向覆盖了金融领域的端到端需求,对大模型在金融领域的综合能力提出了较高的要求。.赛题情况金融领域(二)10北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出外挂知识库的检索增强技术(RAG)对于提升金融大模型的回答精准度效果明显。RAG在使用语言大模型回答问题之前,从外部知识库中检索相关信息,为大模型回答提供外部知识支撑。金融领域业务具有较强的专业性,RAG技术的运用可以让大模型更好的应对知识密集型任务,不同企业在RAG的
15、基础上可以对检索方式进行扩充,从而更准确的命中外部知识,提升回答的精准度。强化对齐技术在金融领域发挥重要作用。未经强化对齐的模型可能会输出不符合金融行业风格甚至计算错误的结果。金融领域对结果的合规性、专业性要求很高,利用强化对齐技术的参赛企业在本次比赛中表现更好。.企业解决方案亮点11北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出方向一为基于多形态、多维度、多场景数据的企业成本智能化分析及预测,由中都物流有限公司提出,该题目方向以提升物流服务领域企业成本分析和预测的智能化水平为核心目标,需要参赛企业基于企业成本相关的数据集、社会面的数据集开展大模型训练,形
16、成企业成本预测和分析的大模型智能工具。复赛所用训练及测试数据集由中都物流提供的线路成本、台账、运营成本等数据脱敏形成,可供参赛企业将数据带回,进行部署调试。该赛题以企业成本分析为核心目标,本身属于企业数字化转型的重要部分之一,大模型的分析及生成摘要能力,在此场景下有较好的应用空间,将有助于企业智能化决策,帮助企业把控成本。方向二为基于联通业务数据的运营商行业大模型研究,由联通(北京)产业互联网有限公司提出,该题目方向以实现运营商业务数字化、办公智能化升级,提升运营商企业服务能力和效率为核心目标,需要参赛企业针对用户提出的运营商领域相关咨询问题进行精准回答。复赛所用训练及测试数据集由与联通公司相
17、关的媒体报道、产品和方案介绍等内容组成,涉及大数据、云计算、物联网、区块链、安全、人工智能、产品介绍、解决方案、公司业务等方面,可供参赛企业将数据带回,进行部署调试。北京联通作为北京市的主导通信运营商之一,用户量庞大,每天有海量的用户咨询和业务服务,以大模型技术驱动的智能助手将有望在众多运营场景中辅助客户服务和业务合作,实现降本增效的效果。.赛题情况产业升级领域(三)12北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出.企业解决方案亮点参赛企业通过大模型与专有模型搭配解决复杂业务场景问题。产业升级领域的场景覆盖范围相比于其他领域更加广泛,更看重大模型产品的综
18、合能力,比如在成本预测方面,模型需要更为强大的计算能力来得到准确的结果,而在数字化转型方面则更看重模型的理解及生成能力,因此多家技术参赛企业根据不同细分业务的具体需求选择合适的模型进行处理,通过大模型与专有模型的合理搭配,形成大模型全产业链解决方案。13北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出方向一为基于大模型的重症医学领域多源知识体系搭建及临床辅助决策,由北京协和医院提出,该题目以提升重症医学领域科研效率和临床辅助决策能力为目标,需要参赛企业整合重症医学领域专有的指南、文献等数据,构建重症医疗领域高质量知识库,从文献知识问答、专业知识考试、重症患者
19、辅助诊断三个维度考察行业大模型能力。复赛所用训练数据集由重症医学领域知识文献、操作指南、专业试题库和入院病历样例四部分组成,不涉及患者临床信息,通过脱敏处理后,可供参赛企业带回,进行部署调试。该赛题倾向于将大模型作为辅助工具,利用大模型的理解和索引能力为医生的科研工作提供帮助,利用大模型的推理能力提供辅助诊断建议,因此该题目方向需要大模型全面无遗漏地生成内容,从而帮助医生进行判断。方向二为大模型驱动的疑难肝病可解释精准诊断平台构建及应用,由首都医科大学附属北京友谊医院提出,该题目以建设面向复杂肝病会诊场景的可解释智能诊疗系统为目标,研发能够实现医生和智能体多方、多轮辩论的会诊方法和平台。需要参
20、赛企业构建肝病诊疗智能体,实现对肝脏疾病的初步诊断;增强智能体的学习和辩论能力,实现人机联合诊疗最优决策,提升复杂肝病会诊决策准确率。复赛所用训练数据集由友谊医院提供的电子病历、实验室检查指标、腹腔影像数据报告的半结构化脱敏数据组成,因数据保密的相关要求,仅允许参赛企业在医院内部进行私有化部署调试。该赛题期待大模型能够作为一个专业的肝病医生,在复杂的医疗数据中自动化形成确诊,因.赛题情况医疗领域(四)14.企业解决方案亮点北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出数据是决定医疗领域大模型性能的关键要素。模型训练及测试过程中,面临不同程度的金标准数据匮乏
21、,少量错误数据对医疗大模型的不良影响难以评估。参赛企业充分利用经专家治理的互联网问诊、全流程诊疗、医学科研、医学知识图谱等高质量数据,构建超百亿Token的医学数据集,提升医学领域大模型能力。长期深耕医疗行业、积累丰富基础医学知识和深入了解医疗场景应用需求的企业研发的医疗领域大模型综合能力更强。辅助诊疗要求医疗领域大模型具备可解释和可溯源功能。不同疾病专科的诊疗思路和治疗方式差异大,但共同点是明确诊疗依据,加强诊断准确性。如重症医学诊疗需要大模型辅助提示尽可能多的诊断,帮助排查病因;肝病等专科疾病诊疗需要大模型提升诊断准确率,并具备可解释性和诊断溯源功能。部分参赛企业基于积累的通用医学知识预训
22、练大模型,采用多Agent+ReAct思维链跟随的结构,提升大模型诊断准确性,并补充发现和解释患者可能存在的疾病,得到医疗专家的认可。此对于大模型的专业性及精准性要求更高。15北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出方向一为大模型支持下的课堂师生行为精准分析,由北京市第二十中学提出,该题目方向需要参赛企业对海量课堂数据进行实时动态挖掘、清洗、标记、转换,并打造大模型测试训练的统一平台接口。精准分析课堂教学过程中的师生行为,获得定量的课堂观察数据,解读课堂教学过程,为指引老师改善教学方法提供数据依据。复赛所用训练数据集由第二十中学课堂录像数据脱敏形成,
23、数据包括学生、教师、交互大屏等相关视频文件,以及课堂音频文件,可供参赛企业将数据带回,进行部署调试。本题目看重企业对视频关键要素的识别与统计,不仅考察了大模型的多模态理解能力,也为后续大模型应用打下教育视频分析的基础,在当前教育行业大模型应用尚未成熟的阶段,该题目可发挥从智能化教育到大模型教育的关键过渡作用。方向二为基于大模型的数智图书馆员服务,由首都图书馆提出,该题目方向以提升首都图书馆对外交互式自助服务水平及读者借阅体验为核心目标,需要参赛企业针对读者提出的知识查询、智能问答、图书推荐等相关咨询问题进行精准回答。复赛所用训练及测试数据集由首都图书馆图书借阅信息等数据脱敏形成,包括读者卡号、
24、借还书时间、题名、责任者、出版社、出版年等信息和读者咨询相关问答知识库,可供参赛企业将数据带回,进行部署调试。该场景应用模式可以复刻于其他图书馆、博物馆等,开展.赛题情况文化教育领域(五)16北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出针对多模态资源的应答式咨询服务等延伸场景。数智图书馆员应用交互利用大模型快速准确的语义识别优势解决了图书馆读者咨询过程中问题泛化的问题,同时结合应用内容快速提供给读者正确方向的内容和知识,让读者互动更接近于人与人之间的交流,让回答更加贴近用户群体。方向三为面向运动员训练指导场景的大模型技术研究及应用,由北京市体育科学研究所
25、提出,以形成个人专属运动训练基础模型为目标,进一步提升运动员训练的数字化、智能化水平,需要参赛企业针对运动员的个人血液生化测试数据与体成分测试数据,应用大模型提供贴合运动员自身的饮食、营养、训练方案;根据个体特征和历史数据进行智能分析,提供个性化的健康建议,帮助运动员在训练和比赛场上保持最佳状态,预防潜在的健康风险。复赛所用训练数据集由运动员近三年的血液测试、体成分测试、血液报告、体成分报告等原始数据组成,经脱敏处理后,可供参赛企业将数据带回,进行部署调试。此外,北京市体育局为体育方向选题提供了多个方案,分别是运动员竞技状态监测及管理、运动员技术训练指导、基于人群和个体层面的体质监测评价和健身
26、指导,覆盖了市民、运动员、体育爱好者多种角色。17北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出改写/扩写+多路召回方案是提高大模型意图识别效果的关键。由于图书馆客服是面向大众的应用场景,因此多家公司加强了大模型的意图识别能力以应对不同客户的多样化问题。其中改写/扩写解决了对模糊提问的意图识别,多路召回则对意图进行了多维度的拆解,从而更准确的去对数据进行索引,两者结合最终提升了大模型的输出结果精准度。部分参赛企业在考核训练中利用基于AI反馈的强化学习技术(RLAIF),在原有人类反馈强化学习(RLHF)对齐技术提升主观行文质量的基础上,解决了原有方法数据标
27、注时间长、数据标注成本高、特定人群难以寻找的问题,极大提升了数据收集与标记效率,同时大幅度提升了模型输出的安全性。.企业解决方案亮点18北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出方向一为针对人工智能生成内容进行伪造检测,该题目方向以生成基于人物伪造视频、图像、音频的真伪检测工具为目标,探索深度伪造检测技术路径。需要参赛企业面对伪造视频、图像、音频信息进行高精准、高时效的检测发现。复赛所用训练数据集分别为人物真实音视频图像及人物伪造音视频图像,可供参赛企业将数据带回,进行部署调试。本题目主要考查大模型对人物的识别能力,针对视频、音频、图像内容的鉴别真假能
28、力,以及大模型向垂直领域适配所使用的技术手段。方向二为针对社会面热点话题进行综合分析,该题目方向以提升热点话题分析报告撰写及人工检索效率,提升报告内容准确度为目标。需要企业精准实时抓取首发媒体和全网媒体报道总量、热度信息,形成高质量热点话题分析报告。要求生成报告内容符合逻辑、语序通顺、热度准确、观点分明。复赛所用训练数据集为针对社会热点话题撰写的综合分析研判报告,主要内容包括标题、概述、热度统计、媒体报道情况等,可供参赛企业将数据带回,进行部署调试。本题目主要考核大模型的信息检索能力、总结归纳能力,以及辅助决策能力。方向三为自动化红队大模型技术,以发现当前大语言模型存在的潜在生成歧视、偏见等不
29、良内容的漏洞,缓解当前测评大语言模型过程中传统方法和提示词有效性不足,判断结果半自动化等问题为目标。需要参赛企业研发红队大模型,用户在输入原始种子提示词后,模型最终自动化生成更多提示词,通过将提示词输入目标测试模型,从而发现目标.赛题情况智慧城市领域(六)报告免费分享+V:R t h e 4 519北京市人工智能大模型行业应用分析报告大赛开放多维度场景及高质量数据大模型企业奇招频出模型生成不良内容的漏洞。复赛所用训练数据集为根据不同的风险类别构建的红队模型提示词样例,可供参赛企业将数据带回,进行部署调试。本题目主要考核红队大模型生成提示词的攻破成功率、语义相似性、流畅度,以及对种子问题的转化能
30、力、对风险类别的理解能力、对大语言模型漏洞的发现能力。数据预处理和多模态模型集成是提升准确率的关键。特定人物伪造视频、图像的鉴别需要向模型提供大量数据作为前置积累,大部分企业采取对训练数据进行随机数据增强、构建伪造数据训练集、使用随机搜索参数调整方法进行训练等手段,向模型提供清洗后的数据。但面对复杂多变的实际应用场景,仅仅做好数据预处理并不足以支撑最终效果,而是应在此基础上建立多模态之间的联系,解决单一模态鉴伪能力缺失的问题。部分参赛企业在考核训练中创新性地采用了基于多因子融合的伪造音频检测、基于多模态时空特征差异的伪造视频检测等手段,克服了伪造图多元素组合丑化、单一因子鉴伪检测能力不足、模态
31、间时间域特征差异导致视频音频不一致等技术问题,有效提升伪造人和特定人的识别准确率。.企业解决方案亮点20二、北京市人工智能大模型行业应用情况分析年,大模型落地集中于边缘场景。大模型兴起于年初,经过近一年的高速发展,其在政务、金融、产业升级等各个领域均有落地应用。大模型在政务领域,以政务问答、文件生成等场景为主;在金融领域,以智能客服、售前助理等场景为主;在产业升级领域,以知识问答、代码补全等场景为主;在医疗领域,以医疗文书生成、智能医药问答等场景为主;在文化教育领域,以内容润色、内容纠错等场景为主;在智慧城市领域,以公共安全监测、城市运行报告生成等场景为主。但上述场景大多为所属领域的边缘场景,
32、不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。年,大模型逐步向核心场景挺进。得益于大模型在边缘场景价值的成功验证及其技术演进,大模型在深耕边缘场景的同时开始向核心区挺进。在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。例如某运营商在年研发客服大模型并试点上线,由数万名员工内测试用,该运营商计划年开始在集团范围内加快规模化商用推广。大模型技术演进主要指检索增强生成(RAG)、智能体(AI Agent)和多模态,他们对扩大大模型应用范围有明显作用。检索增强生成技术是指大模型在回答问题时,会先从大量的文档中检索出相关信息,然后将.由浅入深,大模型穿越边缘场
33、景,向核心场景挺进应用特征(一)北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析21北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析这些检索出的信息作为提问的上下文构建提示词,大模型再基于提示词进行归纳总结,生成答案,检索增强生成技术主要用于解决大模型幻觉问题。智能体技术则可以实现大模型应用的能力升级,例如,类似ChatGPT的大模型应用仅能起辅助作用,而智能体技术可以赋予大模型感知、规划、记忆和使用工具的能力,实现独当一面。多模态技术使得交互模态不局限于单一的文本模态,而是扩展至文本、图片、音频、视频等多种模态,可显著提升大模型应用的产品功能和
34、交互体验,推动大模型应用从可用向好用转变。图 大模型穿越边缘场景,向核心场景挺进22北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析图 年各领域大模型公开招标金额占比大模型在各个领域均有落地应用,其中在产业升级和金融领域的落地步伐最快。年公开招投标统计数据显示,产业升级相关大模型项目招标金额最多,占比高达.%,金融占比紧随其后,占比为.%。央国企需求旺盛,引领大模型在两大领域快速落地。央国企守正创新,有较强意愿自上而下推进大模型应用。同时,央国企通常具有较强的数据基础设施、算力投入和AI应用基础,为大模型成功落地提供先决条件。在央国企引领下,大模型在产业升级和金融领域快
35、速落地。.守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐23北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析图 大模型应用搭建难度下降,“动态行业大数据”成为落地关键大模型基础能力提升、开发工具逐渐完善,为培育大模型应用提供肥沃土壤。大模型持续迭代,语义理解、上下文长度、多模态等能力愈发完善,有利于开发上层应用。同时,随着行业发展,大模型生态也在逐渐成熟,各类便捷的AI开发工具陆续推出,应用开发难度显著下降。例如百度于年推出的智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuil
36、der,可以帮助不具备代码编程能力的人员完成大模型应用开发。动态行业数据成为大模型落地新关键。基础大模型一般是基于广泛的公开文献与网络信息来训练的,属于“泛行业”,没有特定行业属性,导致基于其搭建的上层应用在专业和细分领域难以提供高价值服务。因此,打造行业大模型成为需求方和技术企业的共同关注点。具体而言,“动态行业大数据”是打造行业大模型的核心,其是指为保证行业大模型的持久生命力,技术企业应具备动态更新行业大数据的能力,而非只掌握一批“静态数据”。拥有“动态行业大数据”的技术企业更容易获得需求方青睐。.百花齐放,大模型应用搭建难度下降,“动态行业大数据”成为落地新关键报告免费分享+V:R t
37、h e 4 524北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析图 需求方IT能力对采购和部署方式的影响需求方IT能力越强,越倾向采购基础大模型,反之则倾向采购大模型应用。需求方IT能力差异显著,这会直接影响他们的采购行为。强IT能力的需求方倾向能力建设,较弱IT能力需求方倾向应用建设。聚焦大模型,强IT能力的需求方通常倾向采购基础大模型,通过自行微调来开发各类上层应用。IT能力稍弱的需求方通常倾向采购“企业大模型”,即由技术企业基于需求方数据对基础大模型进行微调。IT能力更弱的需求方通常倾向采购大模型应用,实现“开箱即用”,由技术企业对基础大模型进行调整和封装,需求
38、方无需关心。需求方IT能力越强,越具备在智算中心私有化部署大模型的条件,反之则更依赖大模型一体机和公有云部署。强IT能力需求方通常已自建智算中心,其具备高端GPU资源,支持大模型的训练和推理工作。IT能力稍弱的需求方通常采用大模型一体机,其仍为私有化部署模式,由技术企业对大模型、应用、算力资源进行整合,形成端到端解决方案,便于大模型在需求方快速落地。IT能力更弱的需求方通常倾向公有云部署,此种方式更省心且初始投入较低,有利于需求方低成本快速试错。.量体裁衣,需求方情况各异,在采购、部署大模型时 特色鲜明IT能力弱IT能力强25北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况
39、分析图 各类主体面临的安全风险大模型训练及应用通常涉及四类参与主体,均存在安全需求。大模型开发及应用全流程通常涉及数据提供方、大模型应用使用方、基础大模型提供方、大模型应用提供方四类参与主体。它们在合作过程中需要解决信任及隐私安全保护问题。数据提供方面临数据使用过程中的各种不安全因素;大模型应用使用方担心在使用过程中泄露核心业务数据,该担心并非空穴来风,例如年三星设备解决方案部门因使用ChatGPT导致半导体设备测量、良品率/缺陷、内部会议内容等相关信息被上传到ChatGPT服务器中,造成广泛负面舆论;基础大模型提供方面临模型产权被窃取风险,特别是对于初创企业而言,基础模型是公司的核心资产;大
40、模型应用提供方面临微调参数成果泄露风险。大模型安全逐渐受到重视,为可持续发展提供保障。在大模型行业发展初期,各参与方聚焦大模型、算力等方面,对安全性重视程度不足。随着行业发展逐渐深入,各参与方的安全呼声越来越高。反映到技术企业端,已有一批企业推出大模型安全类产品,为可持续发展提供保障。.保驾护航,大模型安全逐渐受到重视,为可持续发展 提供保障26北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析图 算力供需趋势示意图大模型被认为是建立在充沛算力之上的“暴力美学”,随着大模型兴起,市场上算力需求剧增。不论是公共算力还是企业自建算力,尚无法完全满足大模型企业对于智能算力的需求
41、。随着大模型应用地更深更广,算力紧张情况预计仍将延续。特别是大模型在训练环节需要大型算力集群,但市场上存在较多分散算力,难以用于大模型训练,加剧了算力紧张情况。.算力需求持续增长,掣肘大模型落地应用应用挑战(二)报告免费分享+V:R t h e 4 527北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析知识产权保护与大模型应用之间的法律平衡点仍在探索中。大模型训练涉及的数据可能包括一些版权保护的作品,从知识产权保护的角度而言,可能需要禁止使用,避免生成侵权回答。但是,这些作品数量众多、来源各异、权属不同,若采用事先授权许可的方式,这一过程漫长、复杂且几乎无法落地操作。数
42、据隐私保护与大模型应用之间的技术平衡点仍在探索中。对于数据隐私保护和大模型效率之间存在着一个两难的矛盾既要最大限度地保护数据隐私,又要最大限度地发挥模型的效果。在政务、医疗和金融领域,该矛盾尤为突出。通过开发可信的框架,从而在数据隐私保护、模型效果和训练效率之间取得一种平衡,是业内的重点讨论方向,但仍在探索中。大模型幻觉问题是影响行业大模型在部分领域落地应用的关键。政务、金融、医疗等领域对大模型输出内容的专业性、准确性有较高要求,对不准确回答的容忍度较低。例如在政务领域,面向公众的政务问答一旦生成错误的答案,将给工作人员带来额外的解释成本。当前缺乏“根治”幻觉的方法,大模型规模化落地受阻。尽管
43、当前较多大模型技术企业采取引入提示词工程或外挂知识库等方式进行内容校准,在一定程度上可以缓解大模型幻觉问题。但是,这种方式一定程度上限制了大模型的通用泛化能力,难以从根本上解决幻觉问题。.知识产权、数据隐私与大模型应用之间的最佳平衡点 仍在探索中.大模型幻觉问题有所改善,但距离规模落地尚有差距28北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析需求方在输出内容的专业性、准确性等方面要求较高,特别是在政务、教育、医疗等领域,尤为明显。当前大模型落地的各类应用大多处于可用阶段。这也导致需求方主要让内部员工使用大模型应用,而不对外服务。虽然现阶段大模型应用不能完全符合需求方实
44、际业务要求,但需求方已经从早期试点过程中看到了大模型价值和可持续优化的潜力。因此,多数需求方有意愿携手技术企业继续深耕大模型应用,推动其从可用迈向好用,让大模型的价值在员工群体和客户群体中得到“全量释放”。.部分大模型应用处于“可用阶段”,需求方和技术企业 协同发力让“可用”迈向“好用”金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应,在凝练场景、开放数据、模型训练等过程中考虑监管因素,在项目交付时考虑所属领域可能存在的特殊要求。例如部分需求方为了保证数据不出域,可能要求技术企业采用驻场微调的方式。.部分领域积极响应监管需要,对大模型落地提出 特殊
45、要求29北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析应用研判(三)政务领域大模型应用场景丰富,但公共属性偏多,商业化落地动力不足。政务领域作为社会服务的核心,业务背景包含大量政府数据及社会信息,主要工作包括公文撰写、政策研究、服务民众,因此政务领域从数据积累和业务需求上都适合大模型落地。当前政务领域已经在核心业务上初步形成产品,以政务助手的形式对不同来源的文件(如政府报告、政策法规等)进行分析、总结,并形成公文素材。然而,归因于政务领域落地周期长、准确度要求高、经济效益较低等原因,对企业的成本和技术挑战较大,令不少大模型企业望而却步。目前从事政务大模型的企业主要有以
46、下两类:一是希望在政务领域打造大模型标杆应用的头部大模型企业;二是前期政务领域系统的技术服务商,在原有系统中扩展大模型功能。政务领域大模型短期内难以具备直接面向公众提供精准政务问答的能力。政务问答对准确度要求极高,一旦生成错误的答案,将给工作人员带来额外的解释成本,这种风险尤其存在于审批和执法过程中。对问题理解有误、生成内容不准确、关联政策信息过时等问题普遍存在,大模型的幻觉问题短期内难以得到显著改善,在部分业务中尚不满足面向公众提供精准政务问答的条件。在政务领域,有三条发展建议。一是鼓励在政务内部优先应用大模型,逐步面向公众开放。短期内在政务领域落地应用方向主要是面向政务工作人员内部使用。在
47、该场景下,应明确大模型作为政务助手的定位,.政务领域30北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析引导技术企业重点提升大模型的溯源能力及汇总能力,为用户提供多角度建议以及参考出处,辅助政务工作人员得出结论,通过优先落地内部业务的试点应用为后续实现更高智能化水平的政务大模型打下基础。随着不断测试验证,当模型能力满足一定条件后,逐步探索面向公众上线服务。二是加快打造政务标杆案例,形成全行业示范效应。政务大模型应用重点提升的数据分析及总结功能具有行业普适性的特点,能够横向迁移至各行各业的办公场景中,应把握政务领域数据成熟度高、质量好的优势,从政务领域选取公文撰写、办公助
48、手等落地效果好、可推广性强的案例进行推广,向社会各界释放政府主动拥抱大模型技术的信号,对齐各行业对大模型效能的认知,带动政务细分领域以及其他行业领域逐步接纳大模型应用。三是大模型技术企业和政务IT解决方案供应商优势互补,协同推进大模型落地。政务领域对于技术供应商的行业经验、技术实力、综合实力等方面有较高要求。大模型技术企业在与政府部门合作方面的经验可能比较欠缺,而专注政务领域的传统解决方案供应商在大模型技术方面的能力较为薄弱。双方优势互补,有利于满足政务领域客户的需求。31北京市人工智能大模型行业应用分析报告北京市人工智能大模型行业应用情况分析.金融领域金融领域应用大模型的市场驱动力较强,且结
49、合点较多。金融属于高工作效率可以带来高回报的行业,金融机构为了追求更高的工作效率,更及时的决策分析,往往愿意为能显著提高效能的大模型产品买单。从实际落地角度来看,大模型可以和金融机构现有的软件系统、模型较好融合,相辅相成。目前,金融领域应用主要集中在保险售前助理、智能投研助理、招股书生成编写、智能研报合规审查、智能客服等方向。除此以外,部分企业深挖需求,带来了新颖的应用场景方向,如大模型保险理赔受理、大模型智能数据治理、个人/企业信用偿贷能力审查监控等,大模型在金融领域的商业价值将会逐步释放。除商业价值之外,大模型在金融领域的社会价值也开始显露,某银行将大模型与消费者权益保护审查平台结合,利用
50、大模型对理财产品宣传材料实现自动生成审查意见,推荐优秀相似案例作为参考,辅助审查人员开展审查,能有效解决基层审查能力不足的问题,银行方审查速度和审查准确性得到大幅提升。大模型在金融领域落地尚面临行业监管和算力资源等诸多挑战。金融行业监管严格,对大模型的输出结果准确性、安全性、合规性都具有较高要求,且金融机构数据隐私性较强,难以在机构间共享,大模型产品往往需要进行私有化训练及部署,这对于金融机构的算力资源提出新的挑战。同时,金融机构对私有化部署的依赖会引发大模型知识持续学习等问题。在金融领域,有三条发展建议。一是建立完善的政策和监管环境。制定明确的政策框架和监管指导原则,确保大模型技术在金融领域