收藏 分销(赏)

政务大模型产业图谱研究报告.pdf

上传人:宇*** 文档编号:1872885 上传时间:2024-05-10 格式:PDF 页数:55 大小:2.83MB
下载 相关 举报
政务大模型产业图谱研究报告.pdf_第1页
第1页 / 共55页
政务大模型产业图谱研究报告.pdf_第2页
第2页 / 共55页
政务大模型产业图谱研究报告.pdf_第3页
第3页 / 共55页
政务大模型产业图谱研究报告.pdf_第4页
第4页 / 共55页
政务大模型产业图谱研究报告.pdf_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、政 务 大 模 型 产 业 图 谱研 究 报 告前 言作为新一轮科技革命和产业变革的核心引擎,以 ChatGPT 为代表的大模型引发全世界的高度关注。国外科技企业竞相围绕大模型扩展商业版图,国内群雄逐鹿愈演愈烈,上百个大模型雨后春笋般涌现,引领千行百业数智化创新发展。大模型发展热潮在带动产业规模、改变生活生产方式、撬动资本市场等方面均带来深刻影响。习近平总书记高度重视人工智能技术发展,指出要加快新能源、人工智能、生物制造、绿色低碳、量子计算等前沿技术研发和应用推广。中共中央政治局 4 月 28 日召开会议强调,“要重视通用人工智能发展,营造创新生态,重视防范风险”,同时,为促进大模型的健康发展

2、和规范应用,维护国家安全和社会公共利益,生成式人工智能服务管理暂行办法、上海市推动人工智能大模型创新发展若干措施(2023-2025 年)、北京市促进通用人工智能创新发展的若干措施(2023-2025 年)、北京市通用人工智能产业创新伙伴计划等一系列政策文件陆续发布。其中,政务业务不仅是连接政府、企业和市民的重要枢纽,同样也是大模型应用和创新的桥头堡。本文主要聚焦大模型在政务行业的应用,整理了政务大模型产业图谱,并从发展态势、现状分析、热点动态等方面进行分析研究,最后提出政务大模型发展建议,希望研究成果能为社会各界参与大模型共同建设提供借鉴和参考。限于时间和能力所限,内容如有疏漏之处,烦请不吝

3、指正。本书编写组编写单位中移系统集成有限公司中移信息系统集成有限公司北京中软国际信息技术有限公司国泰新点软件股份有限公司大汉软件股份有限公司北京国脉互联信息顾问有限公司上海通办信息服务有限公司编写成员于庆军卫小波陈志刚马鹏程刘金樱胡珉郭昱孙海涛郭毅峰周洪瑶顾正嘉刘宇陈佳鑫周小红罗玉泉池明男杨云吕民辉周勤周向明庄子骏1目录01 政务大模型产业图谱02 政务大模型概念03 大模型现状与挑战04 政务大模型热点动态05 产业发展建议201政务大模型产业图谱3图 1 政务大模型产业图谱402政务大模型概念5大模型(Large Model,也称基础模型,即 Foundation Model)是指容量较大

4、,用于深度学习任务的模型,通常具有海量的参数和复杂的架构。大模型具有更好的通用性、精度和效率,可以通过预训练或其他方式在大型数据集上进行学习,再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。1随着大模型技术的不断发展,关于“大模型”的标准也不断发生新的变化。早期,数百万或几千万个参数的模型就被认为是“大模型”。但现在,由于模型的参数量和计算复杂度都在不断增加,数亿甚至数十亿个参数的模型也越来越多。ChatGPT 对大模型的解释更为通俗易懂,重点突出类似人类的归纳和思考能力:大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类

5、的智能。业界把大模型通常分为通用大模型、行业大模型两类。行业大模型是指在特定行业领域应用的大型语言模型。与通用大模型相比,行业大模型更加专注于某个特定的行业,例如政务、金融、医疗、法律等。行业大模型通过在该行业的领域数据上进行训练和优化,可以更好地理解和处理该行业的专业术语、规范和语义。行业大模型的发展得益于大数据和深度学习等技术的进步,以及对各个行业特定需求的理解。通过训练行业大模型,可以利用模型的语言理解和生成能力来解决该行业中的各种问题。1人工智能通用大模型(ChatGPT)的进展、风险与应对华东政法大学人工智能与大数据指数研究院,2023 年 2 月6参考行业大模型定义,同时,总结提炼

6、市场上各类政务大模型产品描述,政务大模型就是指应用于政务领域的大语言模型,通常具有强大的语义分析能力和深层次的理解能力,可以帮助政府机构提升信息处理效率和服务质量,或能够帮助缩短政策落地时间和决策周期,或能让业务办理更加智能化。具体政务应用场景可包括三大类2:政务服务一网通办、城市治理一网统管、政府办公一网协同。政务大模型核心价值效果在于,在政府管理、社会治理、公共服务等多个领域,可以预测政策效果、优化政务流程、提高公共服务水平,处理许多复杂政务问题,解决现行政务服务中的实际问题和痛点,更好地满足人民群众的各种需求,优化提升政府服务质量。3大语言模型(Large Language Model)

7、:通常是具有大规模参数和计算能力的自然语言处理模型,例如 OpenAl 的 GPT-4 模型。这些模型可以通过大量的数据和参数进行训练,以生成人类类似的文本或回答自然语言的问题。大型语言模型在自然语言处理、文本生成和智能对话等领域有广泛应用。视觉大模型:视觉大模型是指具有千万级别或更多参数的神经网络模型,这些模型在计算机视觉领域中广泛应用。视觉大模型可以用于图像分类、目标检测、语义分割等任务,具有很高的准确性和泛化能力。一般使用卷积神经网络(CNN)或可变形卷积神经网络2数字政府建设与发展研究报告(2023),云计算标准和开源推进委员会,2023 年 9 月3政务大模型发展趋势及运营商发展建议

8、,天翼智库,2023 年 12 月7(Transformers)进行构建。多模态大模型:多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型。涌现能力:在特定任务上,随着模型规模提升,模型性能突然出现显著提升,不再是通常的线性增长,而是成指数级快速上涨,出现原来不具备的能力。GPT(Generative Pretrained Transformer):是基于深度学习技术,用于自然语言处理的预训练模型。旨在生成自然语言文本并处理各种自然语言处理任务,如文本生成翻译、摘要等。它通常在单向生成的情况下使用,即根据给定的文本生成连贯的输出。ChatGPT:ChatGPT 是人工

9、智能技术驱动的自然语言处理工具,专注于对话和交互式对话。它经过特定的训练,以更好地处理多轮对话和上下文理解。ChatGPT 设计用于提供流畅、连贯和有趣的对话体验,以响应用户的输入并生成合适的回复。AIGC(Artificial Intelligence Generated Content):指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。例如,通过输入关键词、描述或样本,AIGC 可以生成与之相匹配的文章、图像、音频等。大模型很大程度依赖于人工智能本身的特征,除此之外还有许多8自身独特的特征,许多专家、学者从不同角度进行了

10、总结。本文在借鉴专家总结的基础上,凝练出大模型的以下 5 个特征:大规模:大模型包含数十亿个参数,模型大小可以达到数百 GB 甚至更大。巨大的模型规模使大模型具有强大的表达能力和学习能力。高性能:大模型通常具有更强大的学习能力和泛化能力,能够在各种任务上表现出色,包括自然语言处理、图像识别、语音识别等。多任务:大模型通常会一起学习多种不同的 NLP 任务,如机器翻译、文本摘要、问答系统等。这可以使模型学习到更广泛和泛化的语言理解能力。大训练:大模型需要海量的数据来训练,通常在 TB 以上甚至 PB级别的数据集。只有大量的数据才能发挥大模型的参数规模优势。大资源:训练大模型通常需要数百甚至上千个

11、 GPU,以及大量的时间,通常在几周到几个月。区别于大模型,政务大模型更加聚焦于政务领域的应用,服务于政府机构和官员执行的各种事务性工作和管理工作,具有更加鲜明的政务相关特征。服务政务:政务大模型采用先进的大语言模型技术,以“一网通管、一网协同、一网通办”为基础,不断优化政务工作,以提高政府决策科学性和效率、增强为民为企的公共服务能力。智能决策支持:利用大模型进行数据分析和预测,为政府制定更科学、合理的政策提供支持,提高决策水平。资源优化管理:运用大模型优化公共资源的管理,实现更精准的分配和更高效的利用,促进资源可持续利9用。智能公共服务:利用大模型提升公共服务的质量和效率,满足多元化的民众需

12、求,实现“一网通办”的目标。一城一策:我国各地政府政策之间的差异明显,一套标准化的通用模型难以满足各城市的多样化需求。政务大模型面向每个省份、城市以及乡镇的权利和服务的独特差异,需进行相应的模型训练和配置,确保大模型的有效运用。差异化模型训练:针对每个行政层级和地区,进行差异化的模型训练,以充分考虑其独特的政策环境和治理需求。灵活配置与调整:大模型需要具备灵活的配置和调整机制,以适应不同城市的即时变化和新兴需求,确保政务服务的及时性和准确性。多维数据融合:整合各级政府的历史数据、实际执行情况等多维数据,为政务大模型提供更全面的信息基础,以支持更精准的决策。场景丰富:政务大模型应用落地场景丰富,

13、如城市管理、公共安全、环境保护、教育卫生等,实现全场景的智能化治理。一网统管:政务大模型通过整合各领域数据,实现信息的全局性管理。例如,针对城市管理,大模型汇聚城市交通、环境、社会治安等数据,提供全面的城市治理方案。一网协同:政务大模型通过跨部门、跨层级的协同机制,实现政府各职能部门之间的信息共享和协同决策。例如,在公共安全领域,通过整合警务、交通、消防等部门的数据,实现对潜在安全风险的联动分析,为跨部门的紧急事件响应提供协同支持,提高整体治理效能。一网通办:政务大模型通过提供智能客服、智能搜索、公文写作等方式,协助开展各项行政公共服务事10宜。大模型产业按照上中下游可划分为底层算力服务商、大

14、模型建设商、以及行业解决方案提供商。底层算力服务商:主要包括数据、网络、训练工具、芯片等资源,其中英伟达单卡芯片支持完成百亿参数级的模型训练工作,为大模型训练提供硬件基础;华为、百度、阿里、腾讯等大型企业开发专有的网络协议,并结合硬件和芯片,为训练提供高带宽的网络基础;在训练集和数据方面,在主流的数据训练集之外,政务大模型还添加了政策、公文等政务领域专有数据,加强大模型的政务敏感性。通用大模型建设商:科技企业与研究机构积极布局训练框架、模型库、训练集和工具平台,不断优化算法和架构,加快大模型的训练部署,在搜索、对话、推荐等基础功能方面已经形成较为成熟的解决方案。而政务大模型则是在通用大模型的基

15、础上,进一步融合政策信息、政务知识、专家经验等特定数据,提升大模型的在政务领域的业适配性。行业解决方案提供商:相关行业厂商可以针对相关需求进行特定集的训练,从而使大模型工具能够赋能复杂的政务场景,例如智能审批、智能客服、辅助决策等,能够有效提升群众办事的满意度,提升政府人员的工作效率和服务能力。同时,政务大模型在应用过程中产生的数据反哺给训练集,使大模型更加精准有效。11图 2 大模型产业链剖析1203大模型现状与问题13国家:早在 2017 年,国务院就发布了新一代人工智能发展规划,强调人工智能是引领未来的战略性技术,要把人工智能发展放在国家战略层面来系统布局,预计到 2025 年,国家会“

16、初步建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力”。近几年,以 ChatGPT 为代表的生成式人工智能技术高速发展,但是这种技术在为社会带来便利的同时也带来了相关的法律风险。在此背景下,国家网信办等七部门正式发布了生成式人工智能服务管理暂行办法(以下简称办法),对生成式人工智能进行专项监管,于 2023 年 8 月 15 日施行。办法从技术发展与治理、服务规范、监督检查和法律责任等方面对生成式人工智能发展和应用提出指导和要求。北京:2023 年 5 月,北京市政府印发北京市促进通用人工智能创新发展的若干措施,针对提升算力资源统筹供给能力、提升高质量数据要素供给能力、

17、系统构建大模型等通用人工智能技术体系、推动通用人工智能技术创新场景应用、探索营造包容审慎的监管环境五大方向,提出 21 项具体措施。同月印发北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025 年)对本市人工智能发展战略进行系统部署和优化,从突破关键技术、夯实底层基础、构建产业方阵、推动场景建设、构建创新生态五大方向进行工作部署。上海:为贯彻国家发展新一代人工智能的战略部署,推动上海大模型创新发展,2023 年 10 月,上海政府部门制定上海市推动人工14智能大模型创新发展若干措施(2023-2025 年)、推动区块链、大模型技术赋能生产性互联网服务平台发展实施方案等文

18、件,从着力支持大模型创新能力、提升创新要素供给能级、推进大模型创新应用、营造一流创新环境 4 个方面,制定了相关措施。广东:2023 年 11 月,广东省政府发布关于加快建设通用人工智能产业创新引领地的实施意见,到 2025 年,智能算力规模实现全国第一、全球领先,通用人工智能技术创新体系较为完备,人工智能高水平应用场景进一步拓展,核心产业规模突破 3000 亿元,企业数量超 2000 家;2023 年 12 月,广东省政务服务数据管理局印发 广东省加快数字政府领域通用人工智能应用工作方案,将全面深化“数字政府 2.0”建设。其他:2023 年 10 月,安徽省政府印发安徽省通用人工智能创新发

19、展三年行动计划(20232025 年),抓新一轮人工智能革命机遇,依托大模型、大数据、大算力支持通用人工智能发展,推进政府部门运用人工智能技术改进工作流程,健全多部门协同、扁平化管理机制,切实以高水平专业化能力更好推动高质量发展。2023 年 9月,福建省政府印发福建省促进人工智能产业发展十条措施,提出布局提升算力基础、提供普惠算力服务、推动数据开放应用、加强关键技术攻关、支持企业做大做强、鼓励企业入园集聚发展、推广典型应用场景、引进领军人才团队、丰富教育培训体系、营造良好发展环境等十项措施。省份政策名称印发单位时间15国家“数据要素 X”三年行动计划(2024-2026 年)国家数据局202

20、3 年 12 月电子信息制造业 2023-2024 年稳增长行动方案工业和信息化部2023 年 8 月生成式人工智能服务管理暂行办法国家互联网信息办公室2023 年 7 月北京北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025 年)北京市人民政府2023 年 5 月北京市促进通用人工智能创新发展的若干措施 北京市人民政府办公厅2023 年 5 月北京市通用人工智能产业创新伙伴计划北京市经济和信息化局、市科委、中关村管委会、市发展改革委2023 年 5 月北京市促进未来产业创新发展实施方案北京市人民政府办公厅2023 年 9 月人工智能算力券实施方案(20232025

21、年)北京市经济和信息化局2023 年 10 月门头沟区关于促进人工智能基础大模型生态发展的若干措施中关村科技园区门头沟园管理委员会待定上海上海市推动人工智能大模型创新发展若干措施(2023-2025 年)市经济信息化委、市发展改革委、市科委、市委网信办、市财政局2023 年 11 月上海市促进人工智能产业发展条例上海市第十五届人民代表大会常务委员会2022 年 10 月徐汇区关于支持人工智能大模型发展的若干意见徐汇区科学技术委员会2023 年 11 月推动区块链、大模型技术赋能生产性互联网服务平台发展实施方案上海市经济和信息化委员会2023 年 10 月广东广东省人民政府关于加快建设通用人工智

22、能产业创新引领地的实施意见广东省人民政府2023 年 11 月广东省加快数字政府领域通用人工智能应用工作方案广东省政务服务数据管理局2023 年 12 月16安徽安徽省通用人工智能创新发展三年行动计划(20232025 年)安徽省科技厅2023 年 10 月安徽省数字政府大模型场景应用清单(第一批)安徽省数据资源局2023 年 12 月福建福建省促进人工智能产业发展十条措施福建省人民政府2023 年 9 月通过对市场规模数据的分析,能较为直观地体现出企业对大模型应用落地的热情。大模型市场竞争格局呈现百舸争流之势,根据国际数据公司 IDC 预测,全球 AI 计算市场规模将从 2022 的 195

23、.0 亿美元增长到 2026 年的 346.6 亿美元。其中,生成式 AI 计算市场规模将从 2022 年的 8.2 亿美元增长到 2026 年的 109.9 亿美元。同时,IDC 对基于大模型的 AI 市场规模进行了预测,预计中国人工智能市场规模在 2023 年将超过 147 亿美元,到 2026 年这一规模将超过 263 亿美元,对于大模型,市场都抱有较强的期待和较乐观的预期,各行业需求正大力推动 AI 的发展,将推动市场的持续增长。17图 3 数据来源:IDC,中移集成整理政务大模型未来的投资空间和投资规模受到多种因素的影响,包括政策环境、技术发展、市场需求等。然而可以肯定的是,随着数字

24、化转型的深入推进,政务大模型作为政府机构实现高效管理和优质服务的重要工具,其投资规模将会持续增长。具体而言,政务大模型未来的投资空间和投资规模可能会呈现以下趋势:(1)投资规模不断扩大18随着政务大模型技术的不断成熟和普及,政府机构对以大模型为代表的人工智能领域的投入将会逐渐增加。未来,政务大模型的投资规模可能会呈现逐年递增的趋势。(2)投资领域更加广泛政务大模型的应用场景正在不断拓展,包括智慧城市、智慧政务、智慧医疗、智慧教育等。未来,随着政务大模型技术的不断深入应用,其投资领域也将会更加广泛。(3)投资形式更加多样化目前,政务大模型的投入主要来自于政府机构内部的预算。未来,随着市场需求的增

25、加和竞争的加剧,政务大模型的投资形式也可能会更加多样化,包括政府采购、社会资本投入、产学研合作等形式。(4)投资效益更加显著政务大模型的应用旨在提高政府工作效率、优化公共服务、提升公民满意度等。未来,随着政务大模型技术的不断优化和应用效果的逐渐显现,其投资效益也将会更加显著。综上所述,政务大模型未来的投资空间和投资规模仍然具有较大的增长潜力。政府机构和社会资本需要密切关注这一领域的发展动态,加强合作与交流,共同推动政务大模型技术的不断创新和应用。大模型技术已在全球范围形成庞大技术群,衍生出涵盖各种参数规模、技术架构、模态和场景的大模型家族。从全球大模型发展态势19来看,美国谷歌、OpenAI

26、等企业机构不断引领大模型技术前沿发展,欧洲、俄罗斯、以色列等地的研发团队也投入到大模型研发中。根据中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合发布的 中国人工智能大模型地图研究报告,截至 2023 年 5 月,从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的 80%,美国的大模型数量居全球之首,中国自 2020 年起进入大模型快速发展期,整体增长态势与美国保持同步。报告基于收集整理的公开信息,分析了国内已发布的 184 个大模型,分析结果显示,目前中国在 15 个省市/地区均有团队在开展大模型研发,其中北京占比接近 40%,广东、上海、江苏和浙江紧随其后,地域集

27、中度相对较高。图 4 大模型地域分布示意图20在国内,大模型发展百家争鸣,前期入局企业已经技术落地,新入局者仍不断增加,整体格局仍未明朗。互联网巨头凭借在研发、模型、数据、应用等方面的优势率先发力,头部科技企业大模型拔地而起,以飞快的速度,不断向各个行业场景渗透;三大运营商及其他国有企业凭借大型央企优势和丰富数据资源,分别打造各自的通用大模型和行业大模型;新创公司、传统 AI 企业以及高校研究院亦加速大模型领域投入。表 2 大模型领域企业分类统计表(部分)企业分类数量举例头部科技企业11阿里、百度、腾讯、华为、字节、京东、小米、网易、360 等国有企业11中国移动、中国电信、中国联通、中国电子

28、云、中央广播电视总台、电科数字、中国农业银行、天翼云、方正电子等新创公司41智谱华章、百川智能、MiniMax、左手医生、清博智能、第四范式、天壤智能、深度求索、艾写科技、西湖心辰、实在智能、奇点智源、超对称技术公司、瑞泊、聆心智能等高校/研究院37清华大学、北京交通大学、复旦大学、上海交通大学、上海科技大学、华东师范大学、哈尔滨工业大学、武汉大学、吉林大学、北京语言大学、东北大学、中国科学技术大学、山东大学、北京大学行为与空间智能实验室、北京理工大学东南信息技术研究院、华南理工大学、智媒开源研究院、南京审计大学、上海 AI 实验室等传统 AI 企业80大汉软件、中软国际、云知声、昆仑万维、度

29、小满、中工互联、网易有道、用友、天云数据、中科创达、奇安信、大汉软件、拓世科技、文因互联、科大讯飞、蒙牛、达观数据、商汤科技、星环科技等21表 3 三大运营商大模型对比类型中国移动中国电信中国联通名称九天Telechat、启明、星辰鸿湖介绍自主设计模型结构和参数配置,实现数据构建、预训练、微调、推理加速等全链路核心技术自主掌控;训练数据规模超两万亿 Tokens,融合通信、能源等 8 大行业专业知识;具备完善的数据安全、系统安全等保障机制,解决大模型在应用中面临的“遗忘”“幻觉”等痛点;向合作企业供给研发算力、基础模型、训推平台等;快速响应、持续支持合作企业在生产、运营、客服、管理等领域智能化

30、需求。/具有以文生图、视频剪辑、以图生图等功能,也是首个面向运营商增值业务的大模型分类1+N 大模型行业大模型多模态大模型布局中国移动发布九天众擎基座大模型,同时基于该基座大模型,中国移动还面向个人、政企、新业务市场及网络等领域发布了多个行业大模型,其中包括九天客服、九天政务、九天网络、九天企业通话、九天川流出行Telechat-大语言模型启明-网络大模型星辰-星辰教育大模型、治理大模型、政务服务大模型、应急大模型、医保大模型、交通大模型、住建大模型、金融大模型、神农一号大模型、出行大模型、旅游导览大模型、矿山大模型鸿湖图文大模型目前有两个版本,分别拥有 8 亿和 20亿个训练参数22随着大模

31、型不断迭代更新,其应用场景将更加广泛。目前,各家企业机构都在原有大模型的基础上,均率先将大模型能力用于自身核心业务,在提升业务效率的同时,也打造了行业应用的标杆案例,同时积极开拓多元化的、面向不同垂直领域的行业大模型,加速在工业、金融、政务、媒体、客服、科研、教育等重点领域布局。图 5 行业大模型统计柱状图经研究,国内许多城市大模型落地以政务示范为主,当地领军企业尝试为辅。中国移动的“九天”大模型体系中包含基础大模型和面向政府治理、工业生产、民生服务、通信特色的行业大模型,其中,23“九天海算”政务大模型具备政务事项理解能力、多维度信息关联能力、面向复杂事项和复杂流程的多元交互能力,首创“政务

32、大模型信息场应用”端到端政务服务体系,提供强大的事项理解、信息关联和多元交互能力,满足工作人员动态管理、公文写作等需求,全面提升政府为公民提供便捷智能服务的水平。华为依托“盘古”政务大模型建设辅助办文、智能校对、自动生成摘要、辅助批示、智慧督办等应用,助力政务数字化转型。百应科技构建以垂直领域大模型“万机”为核心的大模型平台能力,赋能人机对话交互和协同、分析等场景应用,锚定政务领域,整合大模型能力引入到当前成熟的技术栈,提升产品效能,助力政务服务、政务基层治理、电信诈骗预防等政务领域的客户数字化、智能化升级。大汉软件推出“星汉”Galaxy 大模型,定位于数字政府、企业数字化转型等领域,应用于

33、 AI 智能客服、辅助写作、数字员工等多个场景,推出“办事小助手”、“企业小秘书”和“数据小管家”等全新服务体验。国外大模型已在办公、教育、医疗、金融、文娱、交通等领域落地应用,从行业渗透率来看,金融领域渗透率最高,达到 78%,在微软等龙头企业的带动下,办公领域渗透率也较为客观,而能源与建筑行业的渗透率较低。大模型在金融领域的应用中,美国开发应用时间较早,发展较成熟。2023 年 3 月,彭博社发布了专门为金融领域打造的大型语言模型(LLM)BloombergGPT。该模型协助彭博改进现有的金融 NLP 任务,例如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT 将释

34、放新的机会,整合彭博终端上的大量24可用数据,以更好地帮助该公司的客户,同时将人工智能的全部潜力带入金融领域。2023 年 3 月 16 日,微软正式发布 Microsoft 365Copilot,并集在微软 365 的多个应用程序中,包括 Word、Excel、PowerPoint、Outlook、Teams 等。它集成了 GPT-4 的功能,以聊天机器人的模式出现在产品的右侧。用户通过向其发号指令,便可自动生成文字、表格、演示文稿等内容。大模型产业生态涉及基础设施、模型与工具以及行业应用,各类人工智能企业、研究机构及硬件厂商已纷纷入局。报告从算力、数据、工具、应用四个方面进行产业生态分析。

35、算力:对于大模型的研发来说,最大的挑战之一就是对庞大的算力基础设施的需求。中国人工智能计算力发展评估报告(以下简称报告)从产业规模、行业算力变化、算力发展趋势等多个维度,量化反映出人工智能算力正在加快成为创新力。从市场规模看,2023年我国人工智能算力市场规模将达到 664 亿元,同比增长 82.5%,人工智能算力需求快速增长。从行业渗透率看,互联网行业作为人工智能技术应用的主阵地居于首位,电信、金融和制造业排名靠前。从地区分布看,报告公布的城市人工智能算力排行中,北京、杭州、深圳、上海、苏州排名前五,智算中心的建设是拉动地区实现人工智能发展的重要驱动力。从应用场景看,知识管理、对话式应用、代

36、码生成等是企业应用人工智能的主要场景。目前,67%的中国企业已经25开始探索人工智能的应用机会或已经开始进行相关资金投入,中国的人工智能技术应用已经迈入加速阶段。数据:我国有着大量优质、结构化的数据集。受益于移动互联网时代积累的海量用户、应用和数据,互联网企业在自有数据上更具特色化和独占性,叠加更强大的数据处理能力,从而能够通过数据优势带来模型训练成果的差异。例如,阿里在研发 M6(中文预训练模型)时,构建了最大的中文多模态预训练数据集 M6-Corpus,包含超过 1.9TB 图像和 292GB 文本,涵盖百科全书、网页爬虫、问答、论坛、产品说明等数据来源,并设计了完善的清洁程序以确保数据质

37、量。百度 ERNIE 模型的训练数据集中也运用了大量百度百科、百度搜索以及百度知识图谱等生态内数据,通过更高质量的数据保障了模型的训练效果。表 4 大模型训练数据集整理序号数据集来源主要内容1中文维基百科数据集维基百科维基百科中的中文文本数据2百度百科数据集百度百科百度百科中的中文文本数据3中文自然语言处理数据集(CLUE)CLUE中文常用词停用词数据集、汉语拆字词表、中文词表、人名语料库、中文缩写数据库、中文专业领域词库、中文敏感词库、维基百科词条(104 万)、新闻语料json 版(250 万篇)、百科类问答 json 版(150 万)、社区问答 json 版(410 万)、翻译语料(52

38、0 万对)等4WuDaoCorpora北京智源人工智能研究院中文文本数据集(3TB)、多模态数据集(90TB)与中文对语改据集(181G),使用 30 亿个网页作为原始致据源,并从中提取高文本密度的文本内容。265中文自然语言处理共享平台(ChineseNLP)清华大学自然语言处理与社会人文计算实验室包括新闻、论坛、微博、问答等6百度中文问答数据集(DuReader)百度担索引擎数据、百度知道问答社区从真实的匿名用户查询中采样,数据量 831.3K。DuReader 2.0版本包含超过 300K 个问题、140 万份证据文件和 660K 个人工生成的答案。7人民日报数据集人民日报由人民日报语料

39、库 1998 成和 2014 版生成,包含人名、地名和机构名 3 类常见的实体类型。工具:在模型与工具方面,科技巨头企业以及研究机构积极布局CV、NLP、多模态等多个方向的训练框架、模型库、工具平台及模型托管交易平台,大幅降低大模型快速训练部署的算力依赖。应用:随着前沿技术推动产业全链条升级,大模型正在渗透至千行百业。从大模型应用类型来看,国外研发的大模型主要以通用大模型为主,而我国国产大模型更加贴近产业端,呈现出行业大模型占比较高的发展形态。大模型的价值在于应用,要在多样化的实际应用场景中赋能数字经济、数字社会和数字政府的发展。将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研

40、究等领域,在实体产业落地,为社会经济带来实实在在的价值。在我国,利用大模型加速千行百业的数字化、智能化转型,深耕实体经济行业,正在成为业界的共同选择。27在大模型技术落地的过程,其表现出的问题也愈发明显。计算资源和成本:AI 大模型的训练和推理需要大量的计算资源,包括高性能计算机、大规模存储和高速网络等。这些资源不仅成本高昂,而且难以获取和管理。此外,由于 AI 大模型的参数和计算复杂度很高,其训练和推理过程也十分耗时,进一步增加了成本和时间压力。数据质量和多样性:AI 大模型的性能高度依赖于输入数据的质最和多样性。然而,获取高质量和多样性的数据是一项挑战,需要大量的标注和清洗工作,这不仅成本

41、高昂,而且耗时费力。隐私和安全:AI 大模型需要大量的数据输入,包括个人信息、企业数据、政府数据等敏感信息。这些信息如果泄露或被滥用,可能会对个人隐私和企业机密造成威胁。因此,如何在保证 AI 性能的同时保护隐私和安全,是在大模型发展过程中的重点工作内容。政策和法规:AI 大模型的发展还面临着政策和法规的挑战。如何制定合理的政策和法规,以促进 AI 大模型的发展,同时保障公众利益和社会稳定,是一个亟待思考和解决的问题。2804政务大模型热点动态29报告聚焦于政务大模型,收集整理了政府侧及企业侧的政务模型应用以及落地场景等动态,以供研究借鉴。2023 年 12 月 8 日,以“泛在可及、智慧便捷

42、、公平普惠”为主题的第二届数字政府建设峰会政务服务专题论坛在广州举办。其政务服务主题论坛上,与会专家围绕政务服务能效提升、服务“数字经济”、改革发展趋势等热点话题进行深入探讨,共商在“数字中国”与“数字政府”建设大背景下政务服务发展新格局。国际欧亚科学院院士邬伦围绕“政务服务大模型进展与应用趋势”分享了自己的最新思考,“迈向政务服务大模型已成为必由之路。”他表示,多模态政务大模型的创新发展与应用支撑,将支撑政府管理和服务智能化、自动化、主动化、精准化水平提升,全面推进智慧政务服务改革。中央党校(国家行政学院)电子政务研究中心相关负责人表示,政务服务发展已进入拓成效、谋长远的深化阶段,政务服务转

43、型升级需要技术创新、业务创新和制度创新的深度融合。安徽省政府在印发安徽省通用人工智能创新发展三年行动计划(20232025 年)后,于 12 月 5 日发布安徽省数字政府大模型场景应用清单(第一批),通过“通用能力+场景建设”模式和产品化模式,推动包括政务咨询、辅助办理、城市治理、机关运行、30辅助决策、专业工具等 6 类应用共 18 个场景应用。政务咨询类是针对专业性较强的行业领域,利用大模型打造专业知识助手,为企业、群众和机关工作人员提供精准问答,优化企业、群众办事体验,提高机关办事效率。具体场景应用为公务人员财政制度规范问答指引、企业环保助手 2 个场景应用。辅助办理类是利用大模型全面学

44、习政务服务知识和办件数据,建立对政务服务事项和企业群众办事意图的精准理解能力,使政务服务更加精准智能、高效便捷。具体包括无差别综合窗口助手、关联事项智能办理 2 个场景应用。城市治理类是聚焦城市治理中民意诉求快速响应、问题智能分类、事件工单高效处置等需求,开发大模型特色应用,充分提升城市事件的处置效率、提高城市治理智能化水平。具体包括 12345 热线智能化应用、执法助手(生态环境业务)、县域“事岗人”一体化管理、智能工单助手(自然资源业务)等 4 个场景应用。机关运行类是运用大模型技术,通过人机协同方式,减少公务人员日常简单重复劳动,更好聚焦工作职责,提高工作效率,具体为公文助手、公文智能分

45、办助手、政策问答、知识管理等 4 个场景应用。辅助决策类大模型的逻辑推理、数学计算等能力,通过智能问答的方式,快速了解相关领域发展情况,为相关决策提供辅助参考,具体为生态环境指标查询助手、民生福祉研究助手、政策智能质检等 3个场景应用。专业工具类是运用大模型技术,在业务统计分析、报告报表生成、31法律法规咨询等专业领域,打造一系列通用工具,协助公务人员开展相关工作,帮助企业、群众理解专业知识,具体为个性化分析报告助手(自然资源业务)、财务报表助手、法律咨询助手等 3 个场景应用。2023 年 7 月 2 日,2023 全球数字经济大会人工智能高峰论坛举办,北京市政务服务管理局发布了政务服务大模

46、型场景需求,包括政务咨询、政府网站智能问答、智能搜索、精准化政策服务、市民热线智能受理、智能派单、交互式智能政务办事等。论坛发布了北京市通用人工智能大模型应用场景需求榜单,共涉及市政务服务管理局、市中小企业服务中心等 32 个项目,涵盖智慧政务、智慧办公等 14 类场景。作为国内首个政务服务领域大模型应用探索,北京市政务服务大模型在国内外探索大模型助力政务管理实践方面具有极强的示范带动意义,在推动大模型赋能千行百业、加快推进大模型商业化落地应用等方面也极具吸引力。深圳市龙华区率先开发了全市首个政务垂直领域的 AI 产品“龙知政”政务 GPT 大模型,将面向政务业务咨询问答、智能办公等场景,激活

47、传统业务系统效能,赋能数字龙华建设。“龙知政”以山海通用 GPT 大模型为底座,结合区政数局龙眼 GPT 系列研究成果,经过高质量政务语料训练和参数精调,从功能性上满足政府部门知识32问答、垂直搜索、文本生成、材料审核等需求,可为企业法人单位、人民群众和政府工作人员提供专业、高效、个性化的知识服务。在招商引资方面,大模型从各类招商引资政策、企业公开资料、互联网数据中抽取知识,构建全面且专业的知识库,结合寻商招商的要求标准,快速获取直观的数据分析结果,满足企业筛选、企业评估、精准对接、招商谈判、政策制定等需求。在政务服务方面,“龙知政”GPT 大模型训练学习自身专业知识库的所有政策文件和专业术语

48、,理解对企业群众的办事诉求进行语义和上下文,颠覆了传统线上机器问答,实现了信息服务由被动式的人工查找向主动的、双向的、实时的智能全程引导转变,有效解决智能客服“不解人意”“答非所问”。厦门今立方科技有限公司联合厦门人社正式发布了人社领域的大语言模型,并应用于厦门 12333 智能客服,通过 AI 智能坐席替代人工坐席完成咨询服务工作。人社 12333 智能政务大模型具备政务咨询问题的理解能力,政策知识信息实时获取与分析能力,面向复杂的市民场景咨询和业务办理流程交互对话能力,整合多源渠道关联的知识信息,融合传统的客服工作体验,用协同化的方式解决市民对政务咨询日益增长的服务需求。该模型提高了“智能

49、客服”的智能度,在知识覆盖的广度和多轮对话的深度上都得到强化,可以直接面对口语化的语音和文字版本,走在行业同期前列。332023 年 10 月 7 日,广州市海珠区联合百度智能云推出的海珠政务云脑大模型正式亮相。海珠将利用百度智能云政务大模型能力,建立海珠区“数智政府”AI 底座,提升政府治理水平。海珠政务云脑大模型,由 AI 算力底座、政务服务业务中台、大模型服务应用等部分构成,基于政务大模型和海珠区数字政府基础底座和智慧政务创新成果,面向公众、企业、政府三类对象,率先在数字政务、数智决策、数治基层三大应用场景先行先试,共同打造数字政府建设新标杆。在数字政务领域,海珠区整合原有办事渠道,通过

50、政务云脑大模型千万级政务问答、百万级政策指南预训练,融合百度搜索能力,解决口语对话和政务术语之间的鸿沟,提供“所问即所得,问答即服务”全新政务服务模式。在数智决策领域,海珠区打造市场化、国际化、法治化的营商环境,构建“亲清”政商关系,基于大数据+大模型能力,通过算法对企业和群众诉求内容进行文本分析和语义理解,提取关键信息,实现诉求工单自动分派、办理结果自动审核,确保企业和群众诉求“办的快”“办得好”。在数治基层领域,充分运用大模型语言界面、海量知识、逻辑推理三大核心能力,打造政务数据解读智能助理,打破基层管理传统繁复的静态数据表格分析模式,以对话形式实现数据的自动统计分析、自动图表展示、智能数

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服