收藏 分销(赏)

腾讯云TI平台的大模型精调解决方案.pdf

上传人:宇*** 文档编号:3080007 上传时间:2024-06-17 格式:PDF 页数:23 大小:6.07MB
下载 相关 举报
腾讯云TI平台的大模型精调解决方案.pdf_第1页
第1页 / 共23页
腾讯云TI平台的大模型精调解决方案.pdf_第2页
第2页 / 共23页
腾讯云TI平台的大模型精调解决方案.pdf_第3页
第3页 / 共23页
腾讯云TI平台的大模型精调解决方案.pdf_第4页
第4页 / 共23页
腾讯云TI平台的大模型精调解决方案.pdf_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、腾讯云 TI 平台的大模型精调解决方案胡哲优图实验室高级AI技术专家行业知识、模型训练稳定性、资源利用率、国产化适配大模型精调全生命周期的方法论与全流程陪跑自研大模型、大规模预训练、自研加速、国产化适配大模型摘要;大模型问答大模型落地痛点TI 大模型精调解决方案TI精调的核心优势案例分享大模型在业务场景落地的痛点大规模训练不稳定大模型训练需耗费大量GPU 资源且训练周期长,对训练平台的稳定性、故障隔离性、自动容错性等底座能力,以及断点续训能力考验极大模型欠缺行业知识通用领域大模型百花齐放,但都不具备特定行业的独有知识,欠缺行业属性导致无法落地实际业务需国产化适配响应国家政策,摆脱国外资源限制,

2、需要从硬件服务器芯片、操作系统、模型等多个层面完成国产化适配大模型落地业务场景的痛点需提高资源利用率分布式训练需要高效的资源调度管理系统,减少节点资源碎片提高调度成功率;支持虚拟 GPU 调度提高容器资源利用率TI 的大模型精调解决方案MaaS客户专属客户专属大模型大模型传媒行业大模型精调解决方案TI平台平台技术底座技术底座平台平台&工具工具TI-DataTruth数据标注平台TI-ONE 训练平台TI-Matrix应用平台太极Angel 加速组件基础设施基础设施高性能计算集群HCC高性能网络:自研星脉计算网络架构向量数据库行业大模型行业大模型传媒大模型政务大模型文旅大模型金融大模型教育大模型

3、TI 的一站式大模型精调解决方案模型选型训练共建部署应用应用场景应用场景资源采购资源采购业务形态业务形态数据评估资源评估环境搭建服务开通交付方案项目排期训练数据准备训练数据准备模型训练模型训练知识挖掘+增强数据清洗+切块向量库建设+维护训练平台搭建无监督训练有监督训练人工反馈强化学习训练框架加速脱敏合规模型评测模型评测模型管理模型管理服务发布服务发布性能评测效果评测模型注册模型发布推理框架加速推理服务部署内容安全内容安全应用联调应用联调需要客户深度参与需要客户深度参与TI 对大模型开发全生命周期的一体化方法论TI精调的核心优势核心优势1 自研模型:混元大模型超千亿参数规模(蒸馏出百亿级模型),

4、全链路自主研发,从零训练自主创新超千亿参数规模(蒸馏出百亿级模型),全链路自主研发,从零训练自主创新AngelHCF 推理框推理框架架推理速度相比业界主推理速度相比业界主流框架提升流框架提升 1.3 倍倍AngelPTM 训练框训练框架架相比业界主流框架提升相比业界主流框架提升 1 倍训练速度倍训练速度预训练预训练超超 2 万亿万亿token语料优化语料优化预训练算法及策略预训练算法及策略精调及强化学习精调及强化学习改进注意力机制开发思维链改进注意力机制开发思维链新算法新算法知识增强知识增强逻辑推理逻辑推理内容创作内容创作自研机器学习框架创新大模型训练四大核心能力多轮对话多轮对话共测试29个能

5、力项综合评级 级当前最高分共测试37个能力项综合评级 级当前最高分模型开发信通院测评模型能力C-EvalMMLUAGlEval总集AGlEval中文AGlEval英文混元GPT-3.5GPT-4VSVS腾讯混元大模型 主流大模型010203040506070GPT-4GPT-4GPT-3.5GPT-3.5混元混元代码子项代码子项01020304050607080GPT-4GPT-3.5混元混元STEMSTEM子项子项HumanEval分数Ceval-STEMAGlEval-高考0102030405060GPT-4GPT-4GPT-3.5GPT-3.5混元混元高考题子项高考题子项05101520

6、2530354045GPT-4GPT-4GPT-3.5GPT-3.5混元混元数学子项数学子项AGlEval-数学核心优势1 自研模型:混元大模型核心优势1 自研模型:行业大模型降低不同行业数据彼此干扰降低不同行业数据彼此干扰提升垂类任务性能提升垂类任务性能应用层舆情助手 写作助手 营销助手 访谈助手 客服助手 .大模型层平台层自研行业大模型训练支撑:TI-ONE 训练平台行业阅读理解行业数值计算行业知识问答行业文案生成行业信息抽取行业情感分析行业术语增强行业合规安全基础大模型基础大模型金融行业大模型 医疗行业大模型 文旅行业大模型.通用大模型PT&SFT行业大模型传媒文旅金融医疗大规模通用数据

7、大规模通用数据无监督:数T文本有监督:数亿条数据大规模行业数据大规模行业数据无监督:百G文本有监督:数百万条数据核心优势1 自研模型:行业大模型在有行业数据精调的情况下:在有行业数据精调的情况下:行业大模型(行业大模型(1010亿参数)可以比通用大模型(千亿参数)用小得多的训练资源,训练后得到差不多性能的应用亿参数)可以比通用大模型(千亿参数)用小得多的训练资源,训练后得到差不多性能的应用阅读理解阅读理解API调用调用问答对生成问答对生成新闻摘要新闻摘要核心优势2 大规模训练:简单最快仅需最快仅需 5 5 步即可完成步即可完成大模型精调落地大模型精调落地1.一键启动一键启动平台内置精调物料 快

8、速启动精调任务2.训练监控训练监控实时监测资源利用率、训练指标3.任务管理任务管理 模型评估模型评估管理任务版本 记录超参、指标快照 4.模型发布模型发布平台内置推理加速镜像 快速部署服务5.服务调用服务调用可视化网页、API接口调用模型服务核心优势2 大规模训练:稳定NodeNodeNodeNodeTrainOperator1.机器故障迁移机器故障迁移云原生监控2.异常异常POD驱逐重新调度驱逐重新调度3.断点续训断点续训NodeNodeTaskManger节点发生故障时节点发生故障时:主动发现主动发现 屏蔽节点屏蔽节点 自动扩容自动扩容 故障迁移故障迁移网络网络/系统等异常时系统等异常时:

9、任务管理自动重启训练任务任务管理自动重启训练任务 恢复历史恢复历史checkpoint继续训练继续训练自底向上自底向上 3 3 层机制保障大模型稳定训练层机制保障大模型稳定训练节点节点/磁盘等突发故障时磁盘等突发故障时:训练训练operator感知感知pod运行状运行状态态 将异常将异常pod重新调度到其他节点重新调度到其他节点 恢复训练任务恢复训练任务核心优势2 大规模训练:高效开发开发效率效率用户仅需聚焦训练任务本身,TI 平台自动注入分布式训练网络通信配置分布式训练网络通信配置、RDMA、网络拓扑网络拓扑、训练节点训练节点相关参数资源利资源利用率用率问题问题排查排查效率效率支持一键登陆训

10、练容器登陆训练容器便捷查看日志、事件、监控管理任务队列,支持高优任务抢占低优任务高优任务抢占低优任务AI 批量任务使用 gang 调度策略调度策略(要么都成功,要么都失败)GPU任务使用 binpack 调度策略调度策略(优先填满一个节点,避免多卡任务启动失败)GPU 任务使用拓扑感知调度拓扑感知调度,提升通信效率支持虚拟虚拟 GPU 调度调度(0.1-1.0卡)1.提高容器对资源的利用率2.减少资源碎片,提高调度成功率3.支持任务排队,合理分配调度资源1.异步调度优化异步调度优化CPU&GPU异步调用提高吞吐2.显存优化显存优化缓存定长+池化,提升参数支持规模3.计算优化计算优化Attent

11、ion及MLP Block块算子融合优化AddLayernormTensorQ GemmK GemmV GemmFusedAddNormFusedBatchGemm核心优势3 自研加速:Angel 三重优化Bloom 7B行业方案太极Angel8.9 example/s19.1 example/s加速比2.14ChatGLM行业方案太极Angel19.8 example/s33.3 example/s加速比1.7Llama 2行业方案太极Angel48.6 example/s66.8 example/s加速比1.4训练加速效果对比(系统吞吐,越大越好)Bloom 7B行业方案太极Angel17

12、.7 ms/token12.9 ms/token加速比1.37ChatGLM行业方案太极Angel加速比2.4Llama 2行业方案太极Angel加速比1.4推理加速效果对比(输出token速度,越小越好)30 ms/token12.5 ms/token46 ms/token26ms/token核心优势4 国产化适配:全生命周期腾讯云腾讯云TITI平台平台信创芯片算力可分配信创芯片算力可分配底层软件底层软件信创信创CPUCPU芯片芯片信创信创AIAI加速卡加速卡(NPU(NPU芯片)芯片)信创容器平台信创容器平台信创数据库信创数据库信创操作系统信创操作系统硬件服务器硬件服务器训练任务可运行训练

13、任务可运行模型服务可部署模型服务可部署信创芯片算力可调度信创芯片算力可调度预置大模型物料可运行预置大模型物料可运行提供大模型开发全生命周期信创支持提供大模型开发全生命周期信创支持核心优势4 国产化适配:产品支持情况腾讯云腾讯云TITI平台平台已支持对以下信创芯片算力进行分配和调度底层软件底层软件已支持基于以下信创容器平台部署TI平台已支持基于以下信创数据库部署TI平台已支持基于以下信创操作系统部署TI平台支持以下模型在信创芯片算力上进行训练支持以下模型在信创芯片算力上进行服务部署腾讯腾讯TCSTCS,灵雀云,灵雀云TKETKE,青云容器平台,青云容器平台腾讯腾讯TDSQLTDSQL腾讯腾讯Te

14、ncentOSTencentOS,银河麒麟,银河麒麟鲲鹏系鲲鹏系CPU+CPU+昇昇腾系腾系NPUNPU,鲲鹏系,鲲鹏系CPUCPU,飞腾系,飞腾系CPUCPU,海光系,海光系CPUCPU开源大模型、自研行业大模型开源大模型、自研行业大模型开源大模型、自研行业大模型开源大模型、自研行业大模型支持在信创支持在信创CPUCPU芯片算力上使用芯片算力上使用LLMLLM训练框架训练框架支持在信创支持在信创CPUCPU芯片算力上使用芯片算力上使用LLMLLM推理框架推理框架核心优势4 国产化适配:获得多项信创认证案例分享输入完整的长篇新闻文稿内容,基于大模型对原文的理解,重新组织用词造句,生成对主题内容

15、的概括性描述。支持输出智能标题或智能摘要不同粒度的摘要结果。通过自然语言处理方式,按照新闻语言风格,智能化地概括文本内容,可以用于智能标题的拟定。智能标题智能标题:仁怀:坚守生态底线提升民生福祉渐渐次(可生成多个标题)关键词关键词:生态、保护、发展(可指定3-5个关键词)好水、好土产好粮。为了保护好赤水河的生态,仁怀近年来下大力气实现了工业核心区废水收集处理全覆盖,城镇生活污水处理率达95%,赤水和水质如今常年稳定在地表二类以上。守牢生态底线,在高质量发展中保障和发展民生。党的18大以来,在石漠化严重的山区,仁怀持续加大基础设施建设投入和退耕还林力度,帮助当地群众打造农旅一体的生态观光业,以创

16、建省级生态乡镇13个,市级生态村寨127个。仁怀还下决心对城区最大的垃圾填埋场进行彻底改造和生态修复,为群众打造出一个鸟语花香的生态公园。近五年,仁怀绿化造林30余万亩,森林覆盖率达56.35%,城镇新增就业36524人,乡村两级医疗卫生机构规范化建设全覆盖,公通车总里程达3961公里智能提取文章主题信息,生成指定字数的摘要内容。可以用于导语、简讯的输出。示例示例1 1:军事新闻:军事新闻俄罗斯国防部10号称,俄军打击了顿涅茨克地区、哈尔科夫地区的乌军指挥所以及存有美国提供的大量弹药的仓库等军事目标。示例示例2 2:民生新闻:民生新闻刚刚过去的国庆假期,各地丰富消费场景,扩大市场供给,持续升级

17、的假日消费彰显中国市场巨大潜力的同时,也让百姓的生活品质不断提升。新闻智能标题与关键字新闻智能标题与关键字新闻智能摘要新闻智能摘要落地案例:某传媒客户客户诉求方案价值产品示例1.接口信息配置酒店的查询,预订,修改和取消2.输出样式配置图文模版、气泡列表3.对话体验无需配置对话流程,大模型端到端解决业务问题任务完成率提升任务完成率提升对话构建成本降低对话构建成本降低在无多轮画布增加的前提下,突破效果天花板聚焦场景是酒店业务,包括酒店的查询,预订、修改、查询,后期逐步覆盖机票、旅游等全栈场景。自动判断意图和识别槽位,生成相应的API并自动调用,基于API的返回,自动生成拟人化的回复话术。运营人力有限运营人力有限,人工配置成本高人工配置成本高人工有限,期望知识库运营上手简单,低成本投入涉及订单等接口场景涉及订单等接口场景,对机器人任务要求高对机器人任务要求高复杂业务场景,无配置情况下无法通过机器人闭环解决问题极低配置极低配置精准解答精准解答落地案例:某文旅客户

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服