1、本白皮书有幸得到行业知名学者专家的指导,由百度智能云水务业务部编写完成。鉴于大模型在行业的应用尚在发展阶段,限于编写时间仓促、编写人员知识积累有限,该白皮书内容或有疏漏,敬请指正。编写说明主要作者石清华 刘 斌 李 琴 黄 锋 汪秋婉 宋子亨 冯 江 马 蕊 相始林 申田田 何坚白 曾佳越 张一冉 李晓龙 原水利部信息中心(水文水资源监测预报中心)主任、党委书记中国工程院院士、发展中国家科学院院士、美国国家工程院外籍院士、中国科学院生态环境研究中心研究员、清华大学环境学院特聘教授曲久辉指导专家蔡 阳清华大学环境学院教授、京津冀国家技术创新中心环境与资源研究所荣誉所长、原环境模拟与污染控制国家重
2、点联合实验室主任 施汉昌中国水利水电科学研究院减灾中心主任、水利史研究所所长吕 娟E20环境平台董事长、北京大学环境科学与工程学院产学研中心主任傅 涛武汉大学智慧水业研究所所长、武汉大学校董刘炳义西安理工大学教授、西北旱区生态水利国家重点实验室副主任罗军刚长江设计集团有限公司研发中心副主任谢明霞住房和城乡建设部科技与产业化发展中心高级工程师黄海伟CONTENTS目 录030201大模型驱动行业变革2.1 大模型技术跨越式发展2.2 国内外大模型发展态势2.3 大模型激发行业创新风潮2.4 水行业智能化发展的现状与挑战2.5大模型为水行业智能化变革提供新范式040407101101序言2.2.1
3、 基础设施层2.2.2 平台层2.2.3 应用层3.3 核心技术与特色优势2.3.1 强大的数据处理能力 2.3.2 领先的人工智能技术2.3.3 灵活的大模型服务2.3.4 多元插件体系和知识增强机制2.3.5 丰富的水行业场景解决方案1303百度领先的水系统管控解决方案3.1 用科技让复杂的水系统更简单3.2 水业大模型总体架构1414 193.4 大模型背景下的AI基础设施223.5 大模型驱动水行业场景应用能力升级2.5.1 全面感知2.5.2 精准认知2.5.3 辅助决策2.5.4 人机交互2.6.1 整体技术路线2.6.2 大模型应用开发建设模式2.6.3 大模型应用核心功能2.6
4、4 水业大模型训练与调优233.6 水业大模型建设模式3450致谢0506展望5.1 大模型在水行业应用的局限性5.2 共创水业大模型繁荣生态45455.2.1 大模型生态体系构建5.2.2 水业大模型合作共赢模式5.2.3 水业大模型生态圈的发展前景与机遇3704水业大模型应用探索与创新实践4.1 大模型保障水环境文献管理更准确高效4.2 大模型助力水务管理驾驶舱及投研报告智能升级4.3 大模型驱动水旱灾害防御调度更加智能4.4 大模型驱动供水全流程管理全局调优 4.5 大模型助力流域污染管控与水质监测预报更加高效智能383941424244序言0101-百度智能云水业大模型白皮书-02当
5、今世界正处在百年未有之大变局和国内外经济环境巨变的历史交汇期,在新一轮科技革命和产业变革的大背景下,传统生产力已经发生质变,科技创新正扮演着重要的角色,对于推动高质量发展至关重要。随着数字技术的迅猛发展,以ChatGPT为代表的大模型技术正引领着一场深刻的科技变革,其影响之深远,堪比历史上的任何一次科技革命。这一技术的跨越式发展,不仅意味着生产工具的巨大飞跃,更预示着生产资料与生产关系的全面重塑。在此背景下,中国政府高瞻远瞩,将“人工智能+”写入政府工作报告,在今年2月初,国资委提出中央企业要把发展AI放在全局工作中统筹谋划。当前,加快形成以人工智能为引擎、大模型为抓手的新质生产力,以人工智能
6、开辟发展新领域新赛道,塑造发展新动能新优势,已经成为当下经济高质量发展的迫切要求。提升全要素生产率,科技创新驱动的产业变革是关键,通过对生产资料、劳动者进行优化组合,形成新质生产力。这不仅会出现在新兴产业,也会出现在传统行业,大模型赋能行业管理全链路,提升行业核心竞争力,实现行业高质量发展。习近平总书记提出的“节水优先、空间均衡、系统治理、两手发力”的治水思路,为我们指明了前进的方向。在这一思路的指引下,国家发展和改革委员会、水利部、住房和城乡建设部、生态环境部等部门纷纷出台了一系列重要文件,涵盖了水资源、水环境、水生态、水安全等各个领域,展现了我国在水资源治理上的全面布局和坚定决心。水利工程
7、和水务市政基础设施作为国家基础设施的重要组成部分,其智能化进程和创新实践不仅关系到国家安全和经济发展,更与广大人民群众的福祉息息相关,以人工智能为引擎、大模型为抓手的新质生产力要素提升成为重要破局点。在大模型时代下,百度凭借其在人工智能领域的深厚积累,积极投身于水行业的智能化升级,从芯片层框架层模型层应用层全面布局与深入探索,以期为我国的水行业注入新的活力。芯片层作为算力的基础,为水行业夯实基础、提升效能;框架层是大模型应用的关键,百度推出的深度学习框架,还提供了丰富的开发工具,降低了开发者的门槛,促进了水行业的创新应用。模型层是实现行业智能化的核心,百度在模型层上构建了一系列具有水行业特色的
8、模型,包含机器视觉、融合模型等,能帮助我们更好地监测厂站水库的安全,为水厂水量进行预测,实现对于厂站药剂投加做安全调优等。应用层是实现智能化服务的窗口,百度紧密结合水行业场景的实际需求,应用涵盖了防洪抗旱、水资源管理、内涝防汛应急、水厂工艺优化等多个方面,旨在提升水行业管理与服务的效率和品质,更好地服务于民生。百度依托自身在人工智能领域的领先技术,不断深化与水行业的合作,共同推动我国水行业的智能化进程。百度将持续发挥自身技术优势,与全球水行业合作伙伴共同探索智能化发展新路径,为构建可持续发展的水资源管理新格局贡献力量,助力水行业奔赴一个更加智能、高效、安全的未来!序言PREFACE大模型驱动行
9、业变革0203-大模型热潮席卷全球并持续升温,技术生态不断迭代升级,模型能力不断加强,逐渐形成从底层算力、模型开发到行业应用的全新智能化产业。什么是大模型?它通常是指预训练大语言模型(Large Language Models,LLMs),属于人工智能领域中机器学习方向的深度学习模型,是指参数规模过亿、复杂程度较高的神经网络模型,包含生成式自然语言模型、机器视觉模型、跨模态模型等。大模型具备强大的记忆、理解、推理和生成能力,以应对更复杂、更庞大的数据集或任务。大模型技术快速发展对信息系统技术带来根本性的转变,主要体现在四个方面。首先,在行业智能化应用升级中,传统的AI模型针对单个场景特定任务进
10、行定制化建模训练。而大模型则通过扩大参数规模,使用海量数据训练,成为通用化人工智能基础模型,使执行跨任务、跨语言的多模态任务不再成为难题。其次,人机交互方式发生了根本性的演变。过去,人对机器的互动是人类向机器学习适应的过程。如今,机器正朝着更人性化的方向发展。人们只需采用最自然的方式与机器互动,即可获得智能化的能力。这一新形态使得人机交互更加有效,操作更为便捷。此外,在诸多应用场景中,典型的开发模式是通过软件编程方式来设计应用。随着大模型能力不断提升,使编程门槛降低,如今的开发趋势出现了根本性的变革。在许多情况下,开发应用不再需要叠堆繁多的代码,而是被数据驱动的方式取代。最后,大模型具备分解和
11、处理复杂问题的能力,通过调用外部插件实现思考到执行的无缝连接,进一步拓宽了大模型应用的空间。这些变革意味着业务应用开发效率的提高,使得应用效果更好、用户体验更优。近年来,无论是国际还是国内,大模型的发展都取得了显著进展,为各行各业带来了技术性的变革。2.1 大模型技术跨越式发展2.2 国内外大模型发展态势-04百度智能云水业大模型白皮书而在国内,大模型的发展也呈现出蓬勃的生机。近年来,我国在大模型技术研究和应用方面取得了显著成果。国内科技巨头纷纷投入巨资,加强大模型技术的研发和应用。百度推出的文心大模型系列,不仅在国内市场上取得了良好的口碑,还在国际舞台上展现了中国大模型技术的实力。此外,我国
12、还涌现出了一大批优秀的大模型厂商,形成了“百模大战”的壮观景象。这些大模型厂商通过不断创新和优化,推动了我国大模型技术的快速发展。从国际视角来看,美国在大模型的发展上一直处于领先地位。以OpenAI为代表的企业,通过不断地技术创新和模型优化,推出了GPT系列的大模型,包括ChatGPT、Gemini等引领了全球大模型技术的发展潮流。这些大模型不仅在自然语言处理领域取得了突破,还在图像识别、语音识别等多个领域展现了强大的应用能力。同时,美国的大模型商业化应用也走在了前列,已经广泛应用于医疗、金融、媒体、军事、气候预测等多个领域,为社会的各个方面带来了实实在在的效益。大模型10年演进 1年突围百度
13、开始布局研发深度学习框架2013百度推出文心大模型1.02019.3文心大模型3.02021.12微软发布集成ChatGPT的新版Bing2023.2.8ChatGPT 开放第三方插件2023.3.24文心大模型3.52023.6.21OpenAI推出ChatGPT企业版2023.8.28ChatGPT开放语音、图像等多模态功能2023.9.25DALLE-3被集成到ChatGPT中2023.10.19文心一言用户规模突破1亿2023.12.28GPT-4发布ChatGPT注册用户破亿2023.1百度智能云发布千帆大模型平台2.02023.9.5百度智能云千帆大模型平台推出2023.3.27文
14、心一言完成四次重大技术升级(单机QPS 每秒查询推理响应速度提升10倍)2023.4.24百度文心一言启动研发OpenAI 开始布局神经网络语言模型2017OpenAI 推出ChatGPT2022.11.30文心大模型2.02019.7微软正式上线Azure OpenAI服务2023.3.32023.3.14百度文心一言新闻发布会2023.3.16ChatGPT移动应用在苹果App Store上线2023.5.18ChatGPT开放自定义指令2023.7.20文心大模型4.0发布10余款AI原生应用同期发布AI原生应用开发工作台“千帆AppBuilder”上线2023.10.17OpenAI发
15、布GPT-4 Turbo和GPTs2023.11.6文心一言向全社会开放2023.8.3105-百度智能云水业大模型白皮书随着大模型技术的快速发展,政策环境也日渐明朗。国家层面出台了一系列支持大模型发展的政策措施,为大模型的研发和应用提供了有力保障。同时,通用大模型趋于收敛,大模型的建设重心开始由基础设施建设向应用能力建设转移。这意味着大模型的应用将更加广泛和深入,为各行各业带来更多的创新和发展机遇。2023年4月,国家网信办发布了关于生成式人工智能服务管理办法(征求意见稿)。7月,国家网信息办联合国家发改委、教育部、科技部等七部门共同发布生成式人工智能服务管理暂行办法,均促进了生成式人工智能
16、健康发展规范应用。2023年世界人工智能大会上,上海率先成立上海人工智能开源生态产业集群,打造AI“模都”,公布上海市推动人工智能大模型创新发展的若干措施,支持研发人工智能大模型在垂直领域的深度应用及标杆场景的打造。2024年2月,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会,会议中强调国资企业需加快人工智能全局工作的统筹建设,构建多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。习近平总书记高度重视人工智能大模型发展,分别在2023年4月中共中央政治局会议、2023年5月二十届中央财经委员会第一次会议上强调指出,要重视通用人工智能发展,要把
17、握人工智能等新科技革命浪潮。2024年全国两会上,政府工作报告提出深入推进数字经济创新发展。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。习近平总书记在主持中央政治局第十一次集体学习时进一步明确:发展新质生产力是推动高质量发展的内在要求和重要着力点,必须继续做好创新这篇大文章,推动新质生产力加快发展。作为新质生产力领先的生产工具,人工智能大模型将驱动水利行业数字化映射、智能化模拟、精准化决策的高质量长效发展。国务院新一代人工智能发展规划中指出,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济
18、转型的主要动力,智能社会建设取得积极进展。国家发改委、国家数据局等六部委“数据要素”三年行动计划(20242026年)(征求意见稿)中要求,推动科学数据有序开放共享,在注重知识产权保护基础上,提升科学数据复用价值。水利部部长李国英在2024年全国水利工作会议中明确要求“推动人工智能大模型算法落地应用,提升2+N智能业务水平”。这进一步加强了国家以科学数据支撑产业创新,提供高质量科学数据资源与知识服务,加速发展水利行业人工智能大模型技术自主创新能力的恒心;明确了以科学数据支持大模型开发,深入挖掘包含水利科学在内的各类科学数据,通过细粒度的知识抽取,构建科学数据底板和知识资源底座,建设高质量水利数
19、据库和相关学科知识集,支持开展通用人工智能大模型在水利垂直领域训练的决心;夯实了探索水利智能技术科研新范式,面向新范式需求迫切的重点科研领域,推进跨机构、跨学科、跨领域协同创新,发现新规律,创造新知识,加速水利智能化科学研究范式变革的信心。发展人工智能大模型在水利行业技术实践和业务应用,符合李国英部长提出“要锚定智慧化模拟的目标,推进水利专业模型技术攻关,构建水利业务知识库,建设水利业务智能模型,确保数字孪生流域模拟过程和流域物理过程实现高保真”的重要指示和要求。建设水利大模型智能应用是开拓类脑智能与水利业务科学化运行和管理精准化决策结合的产业创新,是推进水利行业新质生产力的重要抓手,符合关于
20、大力推进智慧水利建设的指导意见“十四五”智慧水利建设规划和我国“十四五”“十五五”时期水利智能化发展目标等要求,对进一步促进水利又好又快发展,为省、市、县智慧水利联动发展提供强有力保障。综上所述,大模型作为人工智能领域的核心驱动力,正在全球范围内掀起一场科技革命。无论是国际还是国内,大模型的发展都取得了显著进展,为各行各业带来了革命性的变革。未来,随着技术的不断进步和应用场景的不断拓展,大模型将在更多领域发挥重要作用,推动人类社会的持续发展和进步。-06百度智能云水业大模型白皮书对于大多数实体企业来说,产业转型路,每一步都重要且艰巨。当行业迈进通用人工智能时代,大模型就是产业智能化转型的“创新
21、推进器”,是帮助产业建立先发优势的关键引擎!有了这个特点之后,当你有一套基础技术能够做得非常好的时候,它在各种各样的场景都能够迅速做出有价值的应用来,这是AI过去70年从来没有过的,是完全不一样的机会。大模型的技术浪潮,不一样之处在于它的通用性,叫做智能涌现,就是没有教过的它也学会了。智能涌现,大模型的全新机遇与通用性革命2.3 大模型激发行业创新风潮随着人工智能技术的不断发展,产业经历过起起落落。所以这一次生成式AI浪潮,大家迅速把关注点转入了拼落地、拼应用的下半场。技术真正的价值在于应用,没有构建于大模型之上的繁荣的AI原生应用,大模型的价值就比较有限。大模型已经构建了许多领域的热门应用。
22、这些大模型不仅在自然语言处理等技术领域取得了显著进展,还在政务、交通和金融等实际应用场景中展现出巨大的实际应用价值潜力。07-百度智能云水业大模型白皮书生成式AI重塑产业发展产业智能化转型迎来决战期,大模型助力企业打造先发优势政务金融工业水务能源交通领域大模型在多模态感知以及综合研判方面,具有较好的优势,因此交通领域的应用主要涉及智能交通管理、智能驾驶等方面。大模型通过分析海量交通数据,系统能够预测交通流量、路况等信息,为管理部门提供决策支持。同时,大模型还可以用于车辆违章识别、交通拥堵治理等方面,提高交通运行效率。大模型是实现智能驾驶的关键技术之一。通过处理大量驾驶数据,系统能够学习到驾驶技
23、能,实现在复杂道路环境下的自动驾驶。这不仅可以提高道路安全性,还可以缓解驾驶员的疲劳程度,提升驾驶体验。政务领域大模型在事件综合感知方面,拥有较为全面和突出的应用能力。在政务领域的应用主要涉及自动化问答、智能客服、智能审批等方面。政务机构可以通过大模型构建自动化问答系统,为公众提供准确、及时的政策咨询和业务办理指导。当用户可以输入问题,系统自动匹配政策法规,并给出相应的答复。政务机构可以运用大模型构建智能客服系统,实现7X24小时在线服务。当用户遇到问题时,可以通过智能客服系统快速获取解决方案,大大提高了政务服务的便捷性。此外,还可以帮助政务机构通过自然语言处理技术,自动识别申请材料中的关键信
24、息,减少人为干预和失误,提高智能审批效率和公正性。海淀城市大脑规划打造了AI计算中心、异构算力服务、时空一张图等核心底座能力,基于大模型通过智能问答、综合研判等场景服务于城市各领域应用场景创新建设,助力“海淀城市大脑”成为中国新型智慧城市建设的“样板间”。-08百度智能云水业大模型白皮书北京市海淀区人民政府海淀区城市大脑于2018年启动建设。百度作为海淀区城市大脑核心企业之一,为其打造 AI计算中心、异构算力服务、时空一张图等核心底座能力,服务于城市各领域应用场景创新建设,助力“海淀城市大脑”成为中国新型智慧城市建设的“样板间”海淀城市大脑作为标杆案例,覆盖海淀9个委办局,融合了55个应用场景
25、127个应用模型,50+亿条多维感知数据,支撑多种城市治理应用场景,并创新打造了基于大模型的接诉即办问数场景驾驶舱问数指标统计区间接诉即办 自动派单准确率从 85%10%到从 70%90%到从 3天 1分钟到渣土车违规率下降案例:北京海淀区城市大脑激活城市大脑中枢,打造智慧城市样板间金融领域大模型在AGENT调用以及报告生成编撰的能力比较突出,因此在金融领域的应用主要涉及智能风控、智能投顾等方面。大模型可以通过分析海量数据,系统能够识别异常交易、预测信贷风险等,实现智能化风控,提高金融机构的风险防范能力;此外,大模型可以通过分析用户的投资偏好、风险承受能力等信息,为用户提供定制化的投资建议,
26、降低投资风险,提高投资回报。银河证券已经率先实现了大模型在场外衍生品交易场景的应用落地,凭借秒级回复、无遗漏响应等特点,突破业务瓶颈,交易询报价日均业务规模翻倍,下单转化率也由10%提升至30%。电力能源领域大模型在电力能源领域的应用优势显著,涉及智能调度、智能巡检和智能运维等场景。通过实时分析电网数据,大模型可优化调度决策,确保电力系统稳定运行,并用于需求侧管理,实现资源合理配置和节能减排。同时,大模型在电力巡检中提高效率和准确性,预防事故发生。在运维方面,大模型可预测设备寿命和性能,提升响应速度和准确性。国能榆林能源煤矿利用大模型实现智能调度,降低派车数量,提高订单完成率,显著提升运输效率
27、最终实现派车数量降低20%,订单完成率提高25%。09-百度智能云水业大模型白皮书银河证券银河证券作为全国性综合类证券公司。为政府、企业、机构、个人及国际业务和资本市场客户提供财富管理、投资交易、国际业务等全方位、多层次、专业高效的综合金融服务。企业希望在机构业务的典型场景中通过接入大模型能力实现智能化转型。借助百度智能云先进的AI技术,银河证券率先实现了大模型在场外衍生品交易场景的应用落地。通过构建端到端的场外衍生品智能交易服务,凭借秒级回复、无遗漏响应等特点,突破业务瓶颈,交易询报价日均业务规模翻倍,客户从询价到下单的转化率也由10%提升至30%,为证券行业机构业务典型场景智能化转型提供
28、了新的借鉴。案例:银河证券场外衍生品智能交易服务率先落地大模型在证券行业机构业务应用客户从询价到下单的转化率从10%到30%信息量大、功能菜单繁杂,系统学习成本高水行业信息化系统都存在多级菜单、众多按钮、复杂界面的问题,导致使用者学习成本加大,很难快速掌握系统。面对众多业务系统及各种各样的数据,水行业工作人员与决策者很难在短时间内全部掌握并快速获取当前最关心的问题答案。数据汇聚程度与业务系统协同不足,数据价值难以充分挖掘由于水行业各信息系统间缺乏统一的数据标准和规范,导致数据格式各异、难以整合,形成了数据孤岛。例如,在供水管理系统中,水质监测、水量统计和泵站运行等数据分散在不同子系统中,难以进
29、行统一分析和决策。“数据中台”“业务中台”期望在技术上解决中心化建设带来的孤岛效应,但这类建设方式需要在平台之上进行主动式的信息化治理,“中台”建设解决不了理解数据、理解业务的问题,要求实施方具有很强的业务认知和管理协调能力。随着新理念和新技术在行业内的广泛运用,物联网、数据库、云计算等信息技术的应用正成为主流,机理模型、数字孪生、GIS、BIM等行业生态体系日趋稳定,行业信息化建设成果“趋同”的现象逐步显现。当前阶段,信息系统使用过程中仍面临不简单、不好用、不灵活的问题,面对各类用户,水行业信息系统难以快速上手,难以应对需求变化,难以真正形成决策辅助,现有的信息系统建设模式不足以支撑行业智能
30、化发展。大模型在政务、金融、电力能源等领域的应用已经取得了创新成果,这些应用不仅提高了行业运行效率和服务水平,还为公众提供了更加便捷、高效的服务体验。随着技术的不断发展,相信未来大模型在这些领域的应用将会更加广泛和深入,为人类社会的进步作出更大的贡献。-10百度智能云水业大模型白皮书2.4 水行业智能化发展的现状与挑战国能榆林煤矿国能榆林能源郭家湾煤矿位于陕西省榆林市。面向用户、调度员、驾驶员、矿领导等核心用户痛点需求,百度智能云与国能榆林能源合作,打造煤矿AI辅运大脑,实现了辅运的全要素管理,以数据驱动日常辅运系统运行、实现供需匹配,形成了运输前资源规划-运输中过程管控-运输后综合分析的闭环
31、管理体系派车数量降低25%20%订单完成率提高案例:国能榆林能源煤矿辅运智能调度企业智能:基于AI能力构建煤矿核心调度大脑业务经验知识整理缺乏手段,难以有效支撑业务应用围绕信息采集、查询和分析,水行业信息化建设已取得显著成效,通过系统实现水务资产和运行状态“看得见”已普遍实现。而在业务经验知识整理方面,传统的文档管理和人工归纳效率低下,知识图谱虽然将数据以图的方式进行存储,但其生产过程仍然繁冗。由于知识整理手段不足,导致大量有价值的数据和知识被埋没,系统产生的数据难以被学习,面向复杂多变的实际生产场景,系统难以做到足够“聪明”。在这种情况下,数据无法有效转化为知识,知识也无法进一步推动数据的增
32、值。应用过程中数据模型知识融合程度不足水行业信息系统需要将数据、模型和知识进行有效地融合,才能实现智能化决策支持。譬如四预应用依赖于数据、模型计算、监测预警、专家经验和业务规则的紧密结合,会商场景下仍需将系统中的数据和模型演算结果提取出来,由主管领导和专家会商讨论,数字孪生的应用目标难以完全通过信息系统实现自动化和智能化。距离人们预想的理解数据、分析数据、挖掘数据并有效指导实际业务,当前的水行业信息系统仍存在显著差距,因此“水务大脑”的构建依赖代际技术实现业务革新。综上所述,水系统面临的挑战是多层次的,需要从系统开发、交互方式、数据链、知识链和决策链等多个维度入手,加强技术研发和跨领域合作,寻
33、找智慧水系统发展实现代际变革的技术新引擎。水行业作为国民经济的基础性行业,对于保障人民生产生活和生态环境的可持续发展具有重要意义。然而,随着经济的快速发展和人口的不断增长,水行业面临越来越多的挑战。以物联网、大数据、云计算、人工智能等为代表的信息技术革命正逐步与水行业基础设施、生产运行、经营管控相融合,使水行业的智慧化在技术层面得到了更为广泛的支撑,尤以大模型为代表的AI技术为水行业的发展带来了新的机遇和可能。大模型为水行业智能化应用提供了新的交互范式基于提示词工程,应用创新高效实现。借助大模型的强大能力和提示词工程的精妙设计,水行业的应用创新得以高效实现。通过简洁明了的提示语,用户能够迅速引
34、导大模型生成符合特定场景和需求的输出,从而极大地简化了应用开发流程,提升了创新效率。智能调度革新,一级菜单秒速响应。智能调度是水行业场景业务创新的高阶形态,大模型可将智能调度从传统的多级菜单操作中解放出来,实现了一级菜单的秒速响应。用户只需通过简单的操作,即可快速完成复杂的调度任务,无需逐级进入不同的菜单。这种交互方式的革新,不仅提升了调度的便捷性,更确保了水行业调度的精准性和时效性。11-百度智能云水业大模型白皮书2.5 大模型为水行业智能化变革提供新范式大模型为水行业提供数据治理新路径水利工程与城镇水务领域涉及大量历史数据(水文、气象、地理、工程)、动态数据(流量、水位、水质、视频数据、遥
35、感数据)、专业模型库以及专家经验(知识库、运维库、预案库等),行业数据的质量与准确性对于行业数智化创新起关键作用。而由于监测手段缺乏、数据标准起步晚、行业知识图谱尚未形成、数据治理方法论与工具难以结合具体场景落地等种种原因,水行业数据治理一直停留在浅水区。得益于大模型在数据处理、分析和应用方面的独特优势,大模型不仅可以快速、高效地处理这些数据,实现数据的清洗、整合和标准化,为后续的数据分析提供坚实基础。通过深度学习和大规模数据处理,大模型可以挖掘出数据之间的深层次关联和模式,如可以预测水质变化趋势、及时发现异常情况,并提供相应的决策依据。此外,大模型在数据治理方面的优势还体现在其可扩展性和灵活
36、性上。随着水行业的不断发展,数据治理的需求也在不断变化。大模型可以适应这些变化,提供定制化的数据治理解决方案,满足行业的特定需求。由于数据质量而限制了创新应用发展的场景,将随着基于大模型的创新应用带动,倒逼行业数据质量的标准化、体系化以及工程化,从而催生监测手段的精准高效、模型封装的鲁棒性与标准程度、创新应用的多样化。因此,基于大模型创新应用这种范式,不仅可以提高数据治理的效率和质量,还能推动水行业的智能化和可持续发展。大模型创新水行业知识应用,引领行业智能化问答与决策新时代大模型在记忆、推理、逻辑、生成等方面的强大能力,为知识构建提供创新手段。水系统的知识体系往往分散在不同专家以及各类工程应
37、用中,大模型技术可以模拟人类的思考过程,快速吸收行业专业知识,并通过知识库插件、微调等方式,可高效构建服务于生产应用和监督管理的水行业专家系统。如基于思维链的智能问答系统可以帮助用户逐步获得问题的答案,而不是简单地提供一个直接的答案。这种系统可以提供更详细、更深入的解释,帮助用户更好地理解问题并获得最佳实践解决方案。大模型的强大调用能力为水行业综合决策、智慧调度等场景提供重要技术支撑大模型的应用在软件开发、意图识别、人机交互、理解分析等方面改变水行业业务系统流程和产品设计,推动新业务模式的出现和发展,为水务信息化产业降本增效。大模型的API(Application Programming In
38、terface,应用程序接口)调用能力,实现AGENT智能体调用与业务系统的集成,可通过思维链编排技术,将大模型与其他工具和系统集成,实现更高效的工作流程。模型间的协同与调用:大模型可以协调多个水行业专业模型之间的关系,实现模型间的协同工作。通过调用不同模型的功能和输出结果,大模型可以综合多个模型的优势,提高整体的分析和预测能力。复杂决策支持:大模型具备强大的推理和决策能力,能够处理复杂的行业问题。通过运用复杂的思维逻辑和算法,大模型可以为决策者提供全面的决策支持,包括风险评估、方案优化、趋势预测等。综上所述,大模型在水行业中的智能化提升范式改变主要体现在数据整合与共享、实时数据监测与分析、知
39、识图谱构建与完善、预案与应急管理方案优化、模型间的协同与调用以及复杂决策支持等方面。这些改变将有助于提高水行业管理的效率和准确性,为水利事业与生态环保事业提供更有力的支持。-12百度智能云水业大模型白皮书百度领先的水系统管控解决方案0313-致力于用科技让复杂的水系统更简单,百度在水行业的战略定位是成为行业智能化加速解决方案的引领者。利用百度在人工智能、大模型、时空大数据等领域的深厚积累,基于云智一体,打造领先的智慧水系统管控平台,围绕水行业“安全”“提质增效”“便民”三大业务目标,提供全面、高效的智能化解决方案。以数字化转型和智能化升级为核心抓手,助力水资源利用管理更高效,更安全,更便民。百
40、度在人工智能领域深厚的技术积累,以及长期深耕水行业所沉淀的业务能力及行业理解能力,依托文心大模型,并配合成熟的大模型训推一体工具链,为水行业核心业务场景的创新应用提供高效便捷的解决方案。水资源利用效率经济效率、人员效率资源化回用节能降耗、绿色低碳减少洪涝灾害影响减少安全事故提升服务质量提升民众水务幸福感安全提质增效便民云智一体,打造领先的智慧水务平台大水:控制、管理和监督天然“坡面河道”自然水循环过程小水:控制“取水输水用水耗水排水-再生水回用-河道补水”为基本环节的社会水循环过程水资源综合利用水环境综合治理全面感知智慧决策智能控制服务效益能耗流量水质水位库容-14百度智能云水业大模型白皮书3
41、1 用科技让复杂的水系统更简单3.2 水业大模型总体架构百度智能云智慧水务愿景图15-百度智能云水业大模型白皮书智能应用层平台层物联网平台大数据平台GIS平台百度飞桨深度学习框架基础设施层GPU调度AI作业调度弹性训练数据湖存储加速分布式训练加速推理加速容器用户使用反馈部署推理服务模型压缩与优化模型评估模型训练精调训练数据准备X-MANXPUGPUCPU多模态CVNLP大模型生产大模型应用&运营AppBuilder(公有云,AI原生开发)GBIRAGAgent思维链管理主题域管理API服务管理Prompt管理运营管理大模型应用&运营平台(混合云、私有化)流域防洪抗旱水资源管理与调配工程建设与
42、运行预演预案动态驾驶舱预报交互场景开发预警工程建设管理工程安全水 利供水保障排水防涝水环境治理工艺优化热线客服排涝调度设备运维知识库立项报告撰写环保执法水务宣教生产运营分析城镇水务智能问数智能问答事件感知文案生成可视化场景生成智能体大模型服务能力模型平台开发中心数据中心服务中心资产中心水利专业模型水环境模型污水生化混合模型专业模型知识平台业务规则历史场景知识抽取知识融合专家经验预案调度方案知识推理知识存储对象关联关系知识表示安全体系运管体系文心大模型百度智能云水业大模型总体架构结合水利工程以及城镇水务基础设施运行管理的要求,以及大模型开发应用对算据、算力的要求,水业大模型的基础设施层着重构建包
43、括GPU处理能力、CPU处理能力和异构算力调度等能力。同时,面向水行业开发企业和开发者提供微服务的算法调度能力,精准匹配业务场景,保障大模型算法的长期稳定运行与持续更新迭代,大幅提升业务效率,支撑水利及城镇水务领域全场景的业务需求。水业大模型的平台层提供从数据接入处理、模型训练和部署、模型运营的技术支撑体系,大幅提升行业大模型开发和运行效率。平台层通过模型生产、运营支撑以及AI原生应用开发三个层面协同作用,构建高效、稳定的行业大模型,支撑便捷的大模型调用以及AI原生应用构建,赋能水行业业务场景的创新应用。3.2.1 基础设施层训练生产,夯实平台底座千帆大模型平台是百度智能云打造的一站式大模型开
44、发及应用平台,提供包括文心一言在内的文心大模型服务,支持大模型(含第三方)定制开发,生产迭代行业专属大模型,提供覆盖全生命周期的大模型工具链。生产训练是大模型应用的基础,主要包括数据采集处理、模型训练精调、部署推理、用户反馈等环节,水利管理部门、水务企业等相关大模型应用方可通过该平台持续开发和训练各种模型用于感知、认知、决策支持等任务。数据采集处理是千帆大模型平台的关键环节,平台能够支持海量大规模数据的处理和管理,对于高质量精标数据能够具备高效的标注能力,帮助构建高质量数据,进而驱动模型具有更好的效果。模型训练精调是千帆平台的核心,平台能够融合多方大模型能力,提供“训练、精调、评估、强化学习”
45、训练能力,从而训练出满足水行业需求的大模型。同时,千帆平台集成一系列的大模型生产工具和算法,包括模型评估、模型转换、压缩优化、部署、用户反馈等全流程工具,让大模型的训练和生产变得更加高效和简单。3.2.2 平台层-16百度智能云水业大模型白皮书模型广场大模型工具链大模型通用大模型行业大模型百度文心大模型ERNIE BotERNIE-ViLG千帆大模型平台千帆AI原生应用工作台百度百舸AI异构计算平台BMLAI开发平台数据管理数据集管理数据标注数据清洗数据增强数据分析模型调优Post-pretrainingSFTRLHF增量训练训练可视化模型评估&优化模型管理模型评估模型压缩推理服务部署推理服务
46、部署Profile记忆在线测试器统计监控Prompt工程预知Prompt模板自定义模板自动优化批量优化插件库插件库调试编排第三方大模型ChatGLMLlama 2HuggingFaceTransformersRWKVStable DiffusionBLOOMZbaichuan217-百度智能云水业大模型白皮书运营支撑,引领应用创新运营支撑是水业大模型的中枢层,开物数智化平台承载了水业大模型走向场景化应用的重要一环。主要包括水行业综合数据管理、生成式应用组件、融合知识、运营管理等方面。其中,水务综合数据是对水雨情信息、工情信息、水文、厂站运营数据、政策、经济、民生、城市基建等水行业数据的治理和融
47、合,形成融合知识图谱数据源以及水行业应用的基础数据;生成式应用组件包含意图组件、会话组件、检索组件、提示组件、安全组件。意图组件主要包含意图识别、意图澄清、语义识别(词槽填充、标签抽取,实体抽取),用于任务类问答;会话组件管理会话(对话)记录;检索组件提供DBSchema(Data Base Schema,数据库架构)和FAQ(Frequently Asked Questions,常见问题解答)两种形式文档导入、文档检索的基础组件;提示组件针对模型输入的提示文本(prompt)进行设计、优化和管理的过程,具备引导模型生成特定内容、控制输出风格和方向、优化生成结果;安全组件提供业务安全审核,强调
48、业务领域和意图过滤,重视业务精细化的安全配置;融合知识是将水行业不同领域的信息进行整合、融合,不限于政策服务、水利知识图谱、事件图谱等,通过整合多领域的知识,模型能够更好地理解问题、提供更全面的解决方案,为科学决策和公共服务提供更有价值的支持;运营管理对大模型的日常运行、监控、维护和升级等活动的管理和控制,具备业务评测、运行监控、服务授权、多租户管理、风控管理等能力,以确保服务的稳定性和可靠性、提高服务的效率和质量。基于大模型便捷搭建AI原生应用百度智能云千帆AppBuilder是基于大模型搭建AI原生应用的工作台,主要提供两个层面的服务,一个是应用组件,一个是应用框架,从而降低AI原生应用的
49、开发门槛,赋能水行业开发者快速实现应用搭建。千帆AppBuilder定位为提供AI原生应用的开发工作台,基于大模型开发各种应用的常见模式、工具、流程,沉淀成一个工作台,能够让每一个开发者聚焦在自己的业务诉求上,不再为研发过程发愁。应用组件,包括文档问答,表格问答,对话,创作、文图,语音等,就是对AI和基础云的能力进行组件化封装,让每个组件完成一个特定的功能,这些组件可以分成两类:一类是AI组件,包括思维链(Chain of Thought,CoT)等基于大语言模型的组件;也包括一些像文图、语音识别这样的多模态组件。另一类是基础云组件,包含向量数据库、对象存储等。应用框架,包括应用框架包括检索增
50、强生成RAG(Retrieval-Augmented Generation),智能数据分析GBI(Gen-erative Business Intelligence),智能体(AGENT)等,将以上组件串联、组合起来、让它们可以比较完整地完成一个特定场景的任务。每个框架下,都会提供不同的样板间,助力开发者更轻松地开发自己的AI原生应用。AppBuilder面向不同开发能力的用户和开发场景,分别以低代码态,无代码态的产品形态,提供两层服务,以提高AI原生应用的开发效率,降低开发门槛。-18百度智能云水业大模型白皮书百度智能云云智一体3.0架构从算力芯片、深度学习框架、大模型和行业应用四层,凝聚百