2024年中国AI大模型创业格局报告.pdf

资源描述

2022 年 11 月 ChatGPT 发布，引爆国内百模大战，创业玩家如雨后春笋，互联网巨头也纷纷下场，巅峰时期国内公开大模型数量超越 300 个。如今一年半过去，巨头们依托固有业务，更早形成壁垒，率先晋级。而创业玩家这边，胜局也已锁定，目前或许只有少数几家公司拿到了和巨头角逐下半场的门票。他们分别是智谱 AI、MiniMax、阶跃星辰、百川智能、月之暗面和零一万物，这六家公司背后都转起了一个关键飞轮模型、应用和融资飞轮，这使得他们能够与巨头同场竞技。另外，这一赛道上还有面壁智能和 DeepSeek。他们共同组成了许多人认为，继移动互联网之后的 AI 时代，新的巨头或将从这八家公司中诞生。而放眼全球，美国大模型行业同样存在类似的阶段性竞争格局变化，像曾经的移动互联网时代一样，中美再次在两个“平行宇宙”中上演新的历史进程在本篇报告中，量子位智库将以一个逐步放大的视角，从国内创业玩家“6+2”格局、国内巨头玩家格局、海外玩家格局三个层次，力求为读者描绘大模型行业格局完整画卷。分类创始人模型C 端产品B 端产品最新估值学院派学院派唐杰GLM智谱清言、清影 API、云端私有化、本地私有化约 30 亿美元青年派青年派闫俊杰abab星野、海螺、TalkieAPI约 25 亿美元杨植麟MoonshotKimiAPI约 30 亿美元大佬派大佬派姜大昕Step跃问、冒泡鸭AI 金融、AI 内容创作约 20 亿美元*王小川Baichuan百小应、健康顾问MaaS+AaaS 行业解决方案超 20 亿美元李开复Yi-数字人解决方案全行业 ToB 解决方案、AI Infra 解决方案超 10 亿美元模型创始人DeepSeek梁文锋模型创始人MiniCPM李大海刘知远创业特别关注创业六小强2019.062019.06智谱 AI 成立2021.122021.12MiniMax 成立2022.082022.08面壁智能成立2023.04.062023.04.06阶跃星辰成立2023.04.102023.04.10百川智能成立2023.02023.03 3月之暗面成立2023.05.162023.05.16零一万物成立2023.07.172023.07.17深度求索成立2020.06.112020.06.11OpenAI 发布 GPT-32022.112022.11OpenAI 发布 ChatGPT，引爆百模大战*为投前估值国内创业玩家“6+2”格局总览国内创业玩家核心竞争力四维度模型在模型维度上，本章将根据各家创业公司特点有侧重地介绍其研发历程、模型能力特点、架构特色、矩阵构成、Benchmark 成绩、AGI 路径规划等情况中的一到三项。竞争力维度具体内容应用在应用维度上，本章将根据各家创业公司特点有侧重地介绍其大模型应用矩阵、特色应用、主力应用、实现功能、用户数据、战略特点、生态布局、付费模式等情况中的一到三项。团队在团队维度上，本章将介绍各家创业公司核心团队成员情况，具体包括教育背景、学术影响力、重要头衔、相关工作履历等信息。融资在融资维度上，本章将介绍各家创业公司融资历程，具体包括历次融资时间、轮次、金额、估值及投资机构。脱胎于高校实验室，技术成熟自然转化：脱胎于高校实验室，技术成熟自然转化：智谱 AI 脱胎于清华 KEG 实验室，是清华计算机系技术成熟到一定程度的转化成果，于 2019 年 6 月正式成立，2022 年 8 月发布自研百亿参数大模型 GLM，彼时 GPT-3.5 还未发布。自研底层框架打破垄断，矩阵全面对标自研底层框架打破垄断，矩阵全面对标 OpenAI OpenAI：2022 年 3 月，唐杰团队提出了全新自研的通用预训练框架 GLM，打破当时西方垄断主流大模型预训练框架技术路径的局面。智谱 AI 在模型和产品矩阵甚至投资策略上均对标 OpenAI，最新的 GLM-4 基座大模型能力多方位接近世界领先水平。智谱 AI模型：清华系成果转化，自研底层架构，对标 OpenAIOpenAI vs 智谱1996清华 KEG 实验室成立致力于网络环境下知识工程理论、方法和应用研究2015.12OpenAI 正式成立2022.08智谱发布开源千亿大模 GLM-130B，效果对标 GPT-3 175B2021智谱百亿参数大模型 GLM 发布，采用全新预训练模型框架2020.06OpenAI 发布 GPT-32019.06智谱 AI 正式成立2022.12OpenAI 发布 GPT-3.5，引爆百模大战2023.08智谱上线 AI 助手应用“智谱清言”2024.01智谱发布最新一代基座大模型 GLM-4 性能达到国际领先水平2024.07智谱发布视频生成功能“清影”智谱 GLM-4(0520)在 GSM8K、MATH、BBH、GPQA、HumanEval 等多个国际主流 Benchmark 上成绩超过 GPT-4(0314)。信息来源：智谱及公开信息整理SoraCogVideo 清影面壁智能、生数科技、无问芯穹等产业投资视频生成Agent 开发平台图像生成platform.openaibigmodel.aiChatGPTDALLECodexGPT-4oChatGLM 智谱清言CogViewCodeGeeXCogVLM应用产品代码多模态MaaS平台gptstore智谱清言智能体中心Helion、Rain AI、Anthropic等GPT底层框架GLM智谱 AI应用：工程基因，侧重 ToB，商业化进程身位领先ToToB B 基因突出，主打基因突出，主打 MaaS MaaS 平台：平台：智谱脱胎的清华 KEG 知识工程研究室自 90 年代就强调工程落地，造就了团队将技术落地到需求中的做事风格。智谱团队以 ToB 背景为主，商业化重心在 B 端，智谱大模型开放平台目前已有超 40 万的企业用户，主要覆盖金融、教育、互联网、零售、汽车、能源、传统制造业等行业。ToToC C 侧重生产力应用，视频生成功能侧重生产力应用，视频生成功能“清影清影”上线：上线：智谱 ToC 业务目前仍以免费为主，主力应用“智谱清言”，截至 2024 年 6 月历史下载量突破 500 万，同时智谱清言也是智能体开发平台，目前已有超过 30 万个智能体活跃在智谱清言 APP 可供使用，2024 年 7 月新上线视频生成功能“清影”，对标 Sora，免费公开使用不限次。智能座舱售后服务市场营销研发制造AI 汽车AI 手机售后服务生活服务助手AI 医疗AI 金融 AI 旅行AI BIAI 陪伴AI 导购AI 客服AI 营销AI 质检AI 供应链AI 风控其他信息来源：智谱及公开信息整理智谱清影 AI 生成视频功能网页端依据量子位智库量子位智库发布的 AIAI 智能助手智能助手 APP 8APP 8 月榜单月榜单，智谱的 ToC 主力应用智谱清言下载量突破 500 万，位列第七。（完整报告数据请查看量子位智库公众号）API 单日调用量600 600 万万+API 单日调用 tokens400 400 亿亿+服务企业客户3 30 0 万万+融资金额及估值处于第一梯队：融资金额及估值处于第一梯队：智谱是目前国内估值最高的大模型初创公司之一，最新一轮融资估值报据传为 30 亿美元，从团队背景、模型开发进展、商业化方向及资金储备情况来看，公司处于国内 AI 创业公司头部。积极布局产业生态，投资多家技术优势公司：积极布局产业生态，投资多家技术优势公司：为打造自己的 AI 大模型生态圈，智谱参与了十多家 AI 大模型产业相关创业公司的投资，被投企业多为清华系，且以技术导向为主。信息来源：智谱、相关报道及公开信息整理智谱 AI融资：融资轮次多、估值领先，全产业链投资积极布局生态时间轮次金额估值投资机构2024/09B+轮数十亿200 亿中关村科学城2024/05B+轮约 4 亿美元约 30 亿美元Prosperity7 Ventures2024/03B+轮-顺禧基金2024/01B+轮-光速光合2023/10B+轮-蚂蚁集团2023/09B+轮12 亿25 亿好未来、小米、红杉、美团、腾讯投资、金山软件、阿里巴巴、顺为资本、高瓴资本、君联资本2023/07B+轮约 3 亿40 亿美团2023/05B+轮约 4 亿40 亿今日资本，蚂蚁金服，光速中国2022/09B 轮约 2 亿20 亿启明创投，君联资本，华控基金2021/09A 轮约 1.5 亿-图灵创投、凌云光、华控基金、将门创投、海南智桥、IMO Ventures、达晨财智、北京荣品2021/04天使轮-北京创新智源科技有限公司2019/08种子轮-中科创星、华控技术转移有限公司、清控资管集团发起总额为 10 亿人民币的大模型创业基金，支持大模型原始创新，覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等各方面。对创业者分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金，用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。对学术界成立大模型开源基金，计划累计用 1000 张 GPU、1000 万人民币和 1000亿 tokens 来支持人工智能开源社区建设。对开源社区智谱投资布局依托清华依托清华 AI AI 人才资源：人才资源：截至 2024 年 9 月，公司员工共计 600 余人，其中大模型研发人员接近半数，其余为客户服务落地人员及产品人员。公司借助清华系高校背景，持续吸引高端人才。团队具备从研发到落地全栈能力：团队具备从研发到落地全栈能力：公司团队源自清华知识工程研究室 KEG，该实验室自 90 年代成立起就走的是“科研+工程化落地”路线，团队成员具备深厚技术积累及综合运营经验；创始人唐杰教授是认知智能领域顶尖专家，具备 20 余年人工智能领域研究经验。信息来源：智谱及公开信息整理智谱 AI团队：学院派代表，清华计算机系人才众多王绍兰王绍兰总裁总裁曾任清华数据科学研究院科技大数据研究中心副主任凹凸科技北京公司总经理获得授权发明专利 15 项，美国发明专利 2 项 20余年技术和政府项目综合经验清华数据科学研究院科技大数据研究中心副主任中科院计算所博士，师从高文院士获得授权发明专利 40 余项，国际标准一项刘德刘德兵兵董事长董事长清华计算机系本硕博，中国新闻信息标准化分会委员电子学会标准化工作委员会机器人技术委员会委员在 ICML、ISWC 等顶级会议上发表 10 余篇文章张鹏张鹏 CEOCEO 清华大学计算机科学与技术工学博士、IEEE Fellow 清华大学计算机系教授，研究方向知识图谱曾主导开发全球最大万亿级超大规模预训练模型悟道唐杰唐杰创始人创始人技术顾问技术顾问巴黎第十一大学计算机硕士、法国梅斯大学计算机硕士曾任大搜车集团 CTO，曾创立元因智能任 CEO，创立妙计旅行任 CEO，是智能技术领域连续创业者曾在字节，腾讯，搜狗从事技术管理工作张帆张帆 COOCOO信息来源：MiniMax 及公开信息整理MiniMax模型：选择混合专家架构技术路径，打造多模态模型Dense Dense 稠密模型稠密模型MMoE oE 混合专家模型混合专家模型由自注意力机制层（SA）和前馈神经网络层（FFN）组成，每一层都与前层直接相连。每次前向传播中所有的参数都被激活和使用，需要的计算量和显存更大。自注意力机制层（SA）后接了多个前馈神经网络层（FFN）。在每次前向传播中，由路由机制选择性激活部分 FFN。可减少计算量和显存需求，同时提高模型在同等条件下的灵活性和容量。模型架构对比主流测试集成绩视频大模型abab-video-1压缩率高、文本响应好、风格多样，支持原生高分辨率、高帧率视频音乐大模型abab-music-1支持多功能端到端音乐生成，可合成多种音乐形式，支持伴奏人声同时生成语音大模型abab-speech-1支持粤语、韩语、班牙语等多语种，生成语句超拟人，情绪细腻自然模型矩阵单日交互次数3030 亿亿次次日均处理Tokens3 3 万亿万亿abab 6.5 系列包含两个模型：abab 6.5 和 abab 6.5s。在各类核心能力测试中，abab 6.5 开始接近 GPT-4、Claude-3、Gemini-1.5 等世界上最领先的大语言模型。abab 6.5 与世界领先语言模型在多个开源测试集上的成绩对比国内最早研发国内最早研发 MoE MoE 及及 Linear AttentionLinear Attention：2023 年 6 月，MiniMax 在 MoE 混合专家架构仍是行业非共识时选择 All in MoE，彼时行业大部分公司仍在训练 Dense 稠密模型。2024 年 1 月，MiniMax 发布千亿参数 MoE 架构模型；4月底，推出万亿参数 MoE 架构模型。即将发布的 abab 7 模型将基于 MOE+Linear Attention。围绕产品需求打造全矩阵多模态模型：围绕产品需求打造全矩阵多模态模型：截至 2024 年 9 月，MiniMax 已推出视频大模型、音乐大模型及语音大模型，最新主力模型 abab 6.5 在多项核心能力上开始接近世界最领先大语言模型水平。信息来源：MiniMax、Sensor Tower 及公开信息整理MiniMax 应用：以娱乐陪伴方向为主，专注打造超级应用海外海外 Talkie Talkie：Talkie 于 2023 年 6 月上线，主要面向北美市场。产品玩法与星野类似，用户可以定制 AI 智能体的形象、声音、人设、技能，并进行卡牌抽取及交易。根据 Sensor Tower 数据，Talkie 2024 年 H1 在美国市场累计下载量 380 万次，位列美国同类 AI 产品排名第一，超过 Character.AI。目前 Talkie 全球月活数据已达到 1100 万，一半以上用户来自美国，与Character.ai 月活数据 1700 万的差距逐渐缩小。国内星野：国内星野：星野于 2023 年 9 月上线，用户可以在星野上通过简单描述定制 AI 智能体的形象、声音、人设、技能，并在后续对话中不断调整强化。也可以选择首页推荐的数百万款由用户创建的智能体进行多模态沉浸式互动。此外，星野还探索了订阅制和抽卡制的付费模式、以宝石为主的经济体系和以星念为中心的用户共创激励体系。依据量子位智库量子位智库发布的AIAI 陪伴陪伴 8 8 月月 APPAPP 榜单榜单，星野 APP 下载总量超 1400 万，月新增下载及 DAU 均位列国内同类 AI 产品第一。生产力应用海螺海螺 AI AI：海螺 AI 于 2024 年 5 月上线，支持多种交互方式：可以发送文字消息、上传图片、PDF、PPT、TXT、DOCX 等格式文件，支持语音通话。8 月下旬最新开放音乐创作与视频创作入口，可由此进入海螺音乐及海螺 AI 创意视频平台，调用海螺视频生成大模型能力。API开放平台角色扮演AI客服聊天问答AI招聘智能硬件AI 教育AI办公AI 零售落地场景ToC ToC 打造超级应用工厂：打造超级应用工厂：MiniMax 是国内创业公司里做应用产品最早、最多的公司，2022 年早于 ChatGPT 一个月上线 Glow，又陆续推出了 AI 内容平台应用星野、Talkie，以及生产力助手海螺 AI。8 月最新发布海螺 AI 创意视频平台，可调用最新视频生成模型，视频生成能力尤其是人物表情生成方面受到海内外好评。ToToB B 布局开放平台：布局开放平台：ToB 方向布局 API 开放平台，目前已接入 3 万余家企业客户，主要落地场景包含零售、教育、办公、智能硬件、招聘、客服、聊天等。估值高、投资门槛高、融资金额高：估值高、投资门槛高、融资金额高：MiniMax 作为国内大模型创业六小强中唯二在 ChatGPT 爆火之前就成立的大模型公司，很早就吸引了头部机构注意，目前已集集齐阿里、红衫、高瓴、经纬、IDG、顺为、明势、云启一众头部机构，估值约 25 亿美元。人才技术实力强，产品经验丰富：人才技术实力强，产品经验丰富：创始人兼 CEO 闫俊杰具备丰富的技术、产品和商业化管理经验，核心技术团队拥有世界顶尖自然语言处理、语音、计算机视觉、计算机图形学等工业和学术经验。信息来源：MiniMax 及公开信息整理MiniMax融资&团队：率先晋升独角兽，Under 35 创始人带队时间轮次金额估值投资机构2024/03A轮6 亿美元25 亿美元阿里巴巴、红杉中国、高瓴投资、经纬创投2023/06A轮2.5 亿美元12 亿美元腾讯投资、绿洲资本、小红书、顺为资本、高瓴投资、IDG 资本2022/07A轮-超 2000 万美元IDG 资本、明势资本、高瓴创投、米哈游2022/01天使轮-云启资本团队成员闫俊杰闫俊杰创始人、创始人、CEOCEO中科院自动化所博士，在人工智能顶会及核心期刊发表论文 200余篇，谷歌学术被引用超 3 万次曾任商汤集团副总裁，从零打造通用计算机视觉模型、深度学习工具链和人脸识别相关的技术体系获得多项重要奖项和荣誉，包括超过 10 次重要国际学术竞赛的冠军，广东省技术发明一等奖，两次吴文俊人工智能二等奖等魏伟魏伟合伙人合伙人开放平台业务负责人开放平台业务负责人曾任腾讯云副总裁，百度技术总监，中国云计算领域的早期贡献者涉足技术和业务两大领域，早在 2011 年就开始使用 GPU 驱动深度学习，支持算力平台的发展贠烨祎贠烨祎联合创始人、联合创始人、COOCOO毕业于约翰霍普金斯大学，主修电子计算机工程、数学和经济，主研深度学习在医疗影像领域的技术和应用曾任商汤科技投融资经理、战略/国际化总监、创新业务总经理，负责集团多项业务孵化、国际化探索，参与集团多轮融资主打长文本，专注迭代唯一模型：主打长文本，专注迭代唯一模型：月之暗面成立于 2023 年 3 月，同年 10 月首次发布支持 128k 上下文长度的模型时处于业界领先地位，目前 200 万文本长度功能内测中，仅发布唯一一款千亿参数大语言模型，下阶段即将发力多模态。AGI AGI 路径战略有一定前瞻性：路径战略有一定前瞻性：多次在行业非共识阶段提出公司的 AGI 战略思路，如长文本是必经之路、通过ToC 产品实现数据 Scaling、专注迭代文本能力、在智力密集场景打造超级应用转动数据飞轮反哺模型等观念。信息来源：月之暗面 Kimi 及公开信息整理月之暗面模型：明确主打长文本能力，专注迭代文本模型2023.032023.03月之暗面成立2022024.084.08正式发布企业级 API 2022024.074.07Kimi 开放平台引入上下文缓存功能，加快模型响应速度 202024.0324.03Kimi 智能助手 200 万字上下文功能内测202023.1023.10推出 Kimi 智能助手，支持 20 万字上下文输入202024.0224.02Kimi 开放平台公测二百万字长文本根据月之暗面提供的信息，对于中文文本，1 个 Token 大约相当于 1.5-2 个汉字，如果按 1.75 的比例换算，200 万字相当于 114 万 t o k e n s。（Kimi 智能助手 200 万字上下文目前未对公众开放，只能通过申请内测使用。）Kimi 智能助手 200 万字上下文功能上传英伟达 2016-2024 年财报后进行长文本分析。流量领跑创业玩家，积极探索变现路径：流量领跑创业玩家，积极探索变现路径：2023 年 10 月推出 kimi 智能助手，2024 年 3 月爆火，带涨 kimi 概念股；6 月网页端点击量超越百度文小言；2024 年 5 月，率先上线六档打赏功能，强调灵活性和趣味性，持续积极探索变现路径。营销能力突出，获客成本高引争议：营销能力突出，获客成本高引争议：营销年轻化、网感好，获客手段之一是投流，据传 CPA 高达 30 元，虽然在业内引起争议，但也投出了一个早期爆款应用。开始通过开始通过 API API 建设生态，加码建设生态，加码 B B 端业务：端业务：2024 年 2 月正式面向企业和开发者开放企业级 API 服务，在增加 B 端服务的同时也开始布局产业生态。信息来源：量子位智库、月之暗面 Kimi 及公开信息整理月之暗面应用：高成本获客打造爆款应用，网感营销风格突出社交平台网感营销打赏项目价格高峰期使用权限平均每天价格送 Kimi 一朵花5.2元4天1.30元给 Kimi 加鸡腿9.9元8天1.23元请 Kimi 喝咖啡28.8元23天1.25元给 Kimi 充充电49.9元40天1.24元请 Kimi 吃顿饭99元93天1.06元和 Kimi 一起登月399元365天1.09元Kimi 智能助手积极探索变现路径，首发打赏制，相比传统订阅制度更加灵活机动，强调趣味互动，营造智能助手伙伴感。提供的高峰期不限速服务平均日价格约 1.2 元/天。海外竞品 OpenAI 订阅价格为 20 美元/月（约人民币 140 元/月），国内竞品大多为免费制。根据量子位智库量子位智库AIAI 智能助手智能助手 APP 8APP 8 月榜单月榜单及及AIAI 智能助手智能助手 8 8 月月 WebWeb 端榜单端榜单，Kimi 智能助手截至 2024 年 8 月 APP 端历史总下载量近 3000 万，位列国内第二，仅次于豆包 AI；Web 端月访问量超 2000 万，位列国内第一。（完整报告请查看量子位智库公众号）信息来源：月之暗面 Kimi及公开信息整理月之暗面融资&团队：资本宠儿，小天才范本，创业流量担当创始团队时间轮次金额估值投资机构2024/05B+-30亿美元腾讯、高榕创投2024/02B超10亿美元-阿里、红杉中国、小红书、美团、砺思资本2023/07A-美团龙珠2023/06天使超2亿美元-真格基金、红杉中国、今日资本融资估值高、金额高、门槛高：融资估值高、金额高、门槛高：截至 2024 年 7 月月之暗面已进行 4 轮融资，估值高达 30 亿美元，融资金额均为上亿美元，资方全部为头部机构。很大程度由于创始人杨植麟在求学之路早期就开始闪耀天才星光，符合资本投人“小天才”画像，早早吸引投资人押注，其中部分资方与杨植麟在创办循环智能时就已结缘。创始团队为清华计算机系四同门：创始团队为清华计算机系四同门：主要团队是清华计算机系本科同学。灵魂人物杨植麟标签包括但不限于“天才学霸”、“连续创业”、“顶尖计算机学府”、“懂艺术”、“情智双高”。周昕宇周昕宇联合联合创始人创始人清华大学计算机系本科，本科曾与杨植麟共同组建乐队 Splay Tree在旷视科技从事算法量产工作，与旷视研究院基础科研负责人张祥雨合作在 CVPR 发表 ShuffleNet 论文，后影响包括苹果 3D 人脸解锁在内的各种手机毫秒级人脸解锁技术吴育昕吴育昕联合联合创始人创始人清华大学计算机系本科毕业，后到卡耐基梅隆大学深造，研究方向为计算机视觉中的检测和识别问题，谷歌学术被引超过 1.9 万次2018 年获欧洲计算机视觉会议 ECCV 最佳论文提名。同年在 GeekPwn 国际安全极客大赛上成为唯一破解人脸识别算法的参赛团队曾在 Meta 人工智能实验室 FAIR，与队员何恺明共同提出组归一化 Group Normalization 方法。期间还创建了 Detectron2，是 Meta 最受欢迎的 AI 项目之一杨植麟杨植麟创始人创始人高中竞赛保送清华大学，大二转去计算机系师从 IEEE Fellow 唐杰，2015 年以年级第一名成绩毕业，本科期间曾组建摇滚乐队 Splay Tree，任鼓手和词曲作者博士就读于卡内基梅隆大学，在语言技术研究所 LTI 深造，师从苹果 AI 研究负责人 Ruslan Salakhutdinov、谷歌 AI 首席科学家William Cohen。博士期间，一作身份论文引用次数破万，顶会发表论文 20 余篇，和众多学术明星如 Yoshua Bengio、Yann LeCun、Quoc VLe 等合著论文博二时和张宇韬创办循环智能博士毕业后任清华大学交叉信息研究院助理教授蛰伏一年，亮相惊艳，蛰伏一年，亮相惊艳，Scaling Law Scaling Law 攀登者：攀登者：2023 年 4 月阶跃星辰成立，一年后首次发布 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态模型和 Step-2 万亿参数 MoE 语言大模型预览版三款大模型，团队主要从算力、系统、数据、算法四方面为攀登 Scaling Law 作准备。MoE MoE、多模态两手抓，迈入万亿模型俱乐部：、多模态两手抓，迈入万亿模型俱乐部：2024 年 7 月 4 日，阶跃星辰在 2024 年世界人工智能大会上第二次亮相，发布了 Step-2 万亿参数 MoE 语言大模型正式版、Step-1.5V 千亿参数多模态大模型、Step-1X 图像生成大模型三款 Step 系列模型新款。信息来源：阶跃星辰及公开信息整理阶跃星辰模型：模型矩阵能力全面，技术路径规划清晰算力通过自建机房+租用算力，积极储备算力。系统成员实践过单集群万卡以上的系统建设与管理，训练千亿模型的有效算力输出 MFU 达 57%。数据数据团队核心骨干来自必应搜索引擎，曾支持全球 100 多种语言，为 200 多个国家和地区提供服务。对全球互联网高质量语料的分布有深入了解。并建立了高质量数据处理和知识图谱流水线。算法驾驭多种大模型架构，同时对大模型的认知以及发展路线进行深刻洞察。类型模型参数架构对标文本Step-2万亿MoEGPT-4多模态Step-1.5V千亿-GPT-4V图像生成Step-1X8BDiTDALL-E模型矩阵阶跃星辰 Step-2 在 VICUNA、AGIEVAL、BBH、DROP、MATH 等多个国际主流 Benchmark 上成绩超过 GPT-4-1106、Claude 3 和 Llama 3 70B Chat。主流测试集成绩AGI路径早期当前未来语言模型视觉模型声音模型参数数据算力Scale多模理解多模生成多模态大模型统一理解及生成探索物理世界抽象归纳世界超级对齐System 2具身智能环境交互ToToC C 布局生产力和娱乐陪伴两款产品：布局生产力和娱乐陪伴两款产品：2024 年 3 月首发亮相时同步发布生产力智能助手“跃问”和 AI 内容开放平台应用“冒泡鸭”两款产品，跃问目前已实现 AI 联网搜索、多格式文档解析、拍照识图、语音输入等功能。推出模型开放平台，启动繁星计划布局生态：推出模型开放平台，启动繁星计划布局生态：阶跃星辰开放平台目前已上线，2024 年 7 月启动繁星计划，寻找多模态优秀初创企业、团队和独立开发者，提供模型、算力及其他配套支持，补充丰富自身应用生态矩阵。信息来源：跃问、冒泡鸭、阶跃星辰及公开信息整理阶跃星辰应用：发力 ToC，繁星计划意图布局应用生态可实现长篇网页、复杂文档理解及总结理解方面：理解方面：目前已支持拍照识图、语音输入、pdf、doc/docx、excel、csv、png、jpg 等多格式文档解析。生成方面：生成方面：可以快速完成内容创作、逻辑推理、数据分析等任务。功能方面：功能方面：优化了联网搜索、文档解析、推理速度等性能，最新推出浏览器插件。可实现拍照问答、图片理解冒泡鸭网页端用户在冒泡鸭上可以根据自身偏好打造智能体和剧情。冒泡鸭支持用户自定义智能体的形象、个性、声音、记忆、背景经历等。目前优秀案例包括胃之书 APP、野猫子工作室融资进展神秘，资方选择审慎：融资进展神秘，资方选择审慎：成立至今未正式披露融资情况，据传仅在 2023 年 11 月完成过一轮融资，投资方或包括红杉中国、启明创投、五源资本，据量子位报道，2024 年 6 月阶跃星辰正在接洽新一轮估值 20 亿美元的新融资，阿里巴巴在投资机构名单中。研发实力突出，人才引力强，据传背景深厚研发实力突出，人才引力强，据传背景深厚:有深厚研发技术积淀，数据算力经验丰富，CEO 技术强，有大团队经验，核心团队聚集来自微软、谷歌、字节、腾讯、旷视等公司相关人才，成立短短一年，规模已达 150 人，先后吸引多位行业大牛加入。据传有著名基金管理合伙人、独角兽公司创始人、微软华人大佬等支持。信息来源：阶跃星辰及公开信息整理阶跃星辰融资&团队：团队聚集学术大牛，大模型相关经验丰富朱亦博朱亦博系统负责人系统负责人毕业于美国加州大学圣芭芭拉分校曾任微软研究院研究员，曾任职字节跳动，负责公司 AI 基础设施与基础 AI 框架，积累了万卡集群的搭建经验，曾任谷歌高级主管，直接支持 Anthropic段楠段楠天津大学博士、中国科学技术大学、西安交通大学兼职博导，天津大学兼职教授曾任微软亚洲研究院MSRA资深首席研究员，自然语言计算团队研究经理，主要从事自然语言处理、多模态智能、代码智能、机器推理等研究，多项研究成果成功应用到微软AI产品中，担任微软 NWA 系列模型家族项目研究组长和导师谷歌学术被引用次数逼近 1.9 万，与 CEO 姜大昕合著过 44 篇论文俞刚俞刚主任研究员主任研究员山东大学本科，上海交通大学计算机硕士，南洋理工大学博士曾任腾讯担任研究总监，旷视 Detection 组长，负责检测、分割、跟踪、骨架、动作行为等方面的研究以及算法落地工作，后在腾讯 PCG 光影研究室从事 CV 相关算法及技术研究张祥雨张祥雨西安交通大学与微软亚洲研究院博士生联合培养项目，师从孙剑和何恺明，博士学位曾在微软亚洲研究院工作，期间与何恺明、孙剑、任少卿共同完成了著名的 ResNet，负责底层框架和编码，2016 获得 CVPR 最佳论文奖，2023 未来科学大奖“数学与计算机科学奖”，谷歌学术被引用数已超 23 万曾在旷视工作，与周昕宇共同完成移动端高效卷积神经网络 ShuffleNet姜大昕姜大昕创始人、创始人、CEOCEO纽约布法罗州纽约州立大学计算机科学博士，南洋理工大学担任助理教授在机器学习、数据挖掘、自然语言处理、生物信息等领域有丰富经验前微软全球副总裁、微软亚洲互联网工程院 STCA 首席科学家，在微软期间主导多个人工智能项目，曾为 Microsoft 365、Azure、智能语音助手 Cortana 等核心产品提供关键技术支持焦斌星焦斌星数据负责人数据负责人中科大和 MSRA 联合培养博士微软必应引擎核心搜索团队前负责人，负责利用数据挖掘和 NLP 算法优化索引和搜索质量曾开发全球高质量站点的自动挖掘算法并用于索引和排序开源模型生态建设表现突出：开源模型生态建设表现突出：百川智能成立于 2023 年 4 月，同年 6 月发布国内第一款开源模型，同年 8 月首批通过了生成式人工智能备案，是名单中最年轻的公司；百川大模型支持 LLAMA 热插拔，兼容及可拓展性好，开源后下载量领先，累计下载超 700 万次。搜索引擎技术基因，先天优势：搜索引擎技术基因，先天优势：自 2023 年 4 月 10 日成立以来，持续迭代基座大模型，最新一代基座超千亿参数大模型 Baichuan 4 在 SuperCLUE 评测中处于国内大模型第一梯队，在知识百科、长文本、生成创作等文科类中文任务方面，表现优于国外大模型。信息来源：百川智能、hugging face及公开信息整理百川智能模型：开源生态突出，模型矩阵全面2023.042023.04百川智能成立2022024.014.01发布超千亿参数大语言模型 Baichuan 32022023.093.09发布 Baichuan2 大模型，开放 API 接口202023.0823.08发布 530 亿参数模型，同步启动千亿参数模型训练2022024.054.05发布 Baichuan 4，并推出智能助手应用百小应2022024.074.07联合天津大学推出 Sibyl System Agent 框架，GAIA 排名第一202023.0623.06推出 70 亿参数大模型 Baichuan-7B202023.0723.07推出 130 亿参数大模型 Baichuan-13BBaichuan 开源模型 huggingface 8 月月下载量百川智能 Baichuan2 系列开源模型在开放社区公开累计下载量已经突破 700 万次，最新 hugging face 月下载量超 6 万次。开源模型下载量百川智能 Baichuan4 在 MMMU、MMBench-EN、CMMMU等多个国际主流 Benchmark 上成绩接近 GPT4V。ToC 布局生产力应用，发力 AI 生命医疗方向：百川智能于 2024 年 5 月发布了 ToC 生产力助手百小应，主打多轮搜索能力。另外，还在 2024 WAIC 上发布了 AI 健康顾问应用，具备丰富医学知识，高度拟人，可连续交互并给出诊断建议，百川智能计划在 2025 年实现 L3 级别 AI 医疗。ToB 以 MaaS 平台为业务重心：百川智能在 ToB 方向推出 MaaS（Model as a service）+AaaS（Agent as a service）服务，Maas 为重心，分旗舰版和专业版，AaaS 服务已开启公测，API 调用能力接近 OpenAI。信息来源：百川智能、蝶境内测及公开信息整理百川智能应用：ToC 上线生产力应用，发力 AI 生命医疗等级百川智能划分 AI 医疗水平L5完全自动化健康管理AI 能够管理患者的整个健康旅程，从预防、诊断到治疗，无需人工干预L4高度自动化诊疗AI 可以在大多数常见疾病中独立做出诊断和治疗决策，仅复杂案例需要医生介入L3条件自动化诊疗AI 可以在特定条件下自动推荐治疗方案，但在关键决策时需要医生确认L2多模态辅助AI 可以整合多种数据源（如病历、影像、实验室结果），提供更全面的辅助信息L1辅助诊断AI 可以提供数据分析活图像识别等单一功能的辅助，帮助医生做出更好的决策L0传统医疗医生负责所有的诊断和治疗决策，没有 AI 介入百川智能计划在 2025 年实现 L3 级别 AI 医疗发力 AI 医疗ToB业务ToB云服务AI 法律AI 教育AI 医疗AI 供应链百小应主打多轮搜索功能，相比单轮搜索，在市场调研、产业分析等复杂场景下，能更有效地获取专业深度信息，搜索结果可结构化呈现，还能实现网页链接、PDF、word 文档长文理解分析。百小应 APP 端页面已完成已完成 A A 轮融资，金额大、估值高：轮融资，金额大、估值高：截至 2024 年 7 月，百川智能已完成 A 轮融资，7 月最新一轮融资规模 50 亿人民币，资方包括阿里巴巴、腾讯投资、小米集团等机构以及北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资基金。目前已经以 200 亿估值开启 B 轮融资。王小川带队，携搜狗核心班底再创业：王小川带队，携搜狗核心班底再创业：作为搜狗前任 CEO，王小川是大模型创业六小强中唯一具备创业并上市经历的创始人，他带领搜狗核心班底创立百川智能，团队技术实力不容小觑，由强系统性工程经验人才，语言模型认知优势的研发人员两部分组成。信息来源：百川智能及公开信息整理百川智能融资&团队：A 轮融资已完成，搜狗核心班底再创业团队成员时间轮次金额估值投资机构2024.07A50 亿人民币-三七互娱、中金资本、亚投资本、信雅达、卓源亚洲、好未来、小米集团、慕华资本、深创投、红点中国、腾讯投资、阿里巴巴、顺为资本、上海人工智能产业股权投资基金合伙企业、临港科创投、北京市人工智能产业投资基金、顺禧基金、中贝通信集团股份有限公司2023.10A3.5 亿美元19 亿美元阿里巴巴、腾讯投资、小米集团、心资本、愉悦资本、金山软件、顺为资本、好未来、清华控股、深创投、红点中国、慕华科创、淡策资本、卓源亚洲、众为资本2023.04天使轮5000 万-王小川王小川王小川创始人、创始人、CEOCEO清华大学计算机科学与技术专业，拥有工学学士、工学硕士、工程博士及 EMBA 学位与清华大学共建天工智能计算研究院，任联席院长曾任搜狗公司 CEO、董事、搜狐高级副总裁兼 CTO，

展开阅读全文