资源描述
应用进阶宝典 职场生存指南 1 时代商业法则
陈 根· 著。
DeepSeek
打开财富 密码
Al 导师成就个体崛起 100% 能力提升 国民级AI赋能干行百业 万亿级场景展现
粤+四工你mwNn 图 赶 志
DeepSeek: 打开财富密码
2/192
内容简介
内容简介
本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远
影响。全书共6章,第1章追溯DeepSeek 的起源与发展,展示其从初创 到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成 本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应 用方法,包括优化交互方式、调用API 服务、本地部署模型等;第4章、 第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行业 领域的应用前景;第6章剖析AI行业发展中的挑战与机遇,为未来AI 行业发展提供思考方向。
本书适合希望拥抱AI时代、借助AI技术实现突破与超越的各界读者阅 读。
3/192
前言
前言
2025年注定是不平凡的一年。
2025年伊始,DeepSeek(深度求索)的AI模型和春节档电影《哪吒之魔 童闹海》(以下简称《哪吒2》)横空出世,迅速成为各自领域的现象级 作品,成功破圈,让中国在科技与文化两个领域接连震撼整个世界。
《哪吒2》自1月29日春节档上映以来,票房一路高歌猛进,不仅跻身 全球影史票房榜TOP10, 更是登顶全球动画电影票房榜。
DeepSeek 则是在人工智能这一前沿科技领域让世界看到中国力量。 DeepSeek发布的DeepSeek-R1模型,在全球知名AI模型评测平台Chat- bot Arena上,基准测试排名升至全类别大模型第三,在风格控制类模 型分类中与OpenAI o1并列第一;其应用登顶苹果应用商店中国地区 和美国地区免费App 下载排行榜,成为全球用户增速最快的AI应用。
DeepSeek甚至凭一己之力,引发美股震荡。DeepSeek 通过混合专家模 型、多头潜在注意力机制、强化学习等技术创新,显著降低了模型训 练和推理的算力消耗,因而引发了市场对算力重要性的怀疑。受此影 响,美国科技巨头股价集体大跌,当地时间1月27日,英伟达股价暴跌 约17%,博通股价下跌17%,超威半导体股价下跌6%,微软股价下跌 2%,就连比特币等虚拟货币也未能幸免,价格随之下跌。
4/192
前言
DeepSeek真的有这么牛吗?我可以很明确地说,是的。DeepSeek 的颠 覆性主要体现在两个方面:
一 方面,DeepSeek 以极低的成本打破了美国科技巨头在AI领域的垄 断。要知道,AI的发展向来是一场围绕算力、算法和数据的竞赛。在 OpenAI、谷歌、Anthropic等企业的统治下,市场普遍认为,要想打造一 个足够强大的AI模型,就需要投入海量的算力和资金。这也导致这几 年AI产业一直在向寡头化演进。但就在所有人都以为AI赛道已经固化 的时候,DeepSeek 横空出世,打破了这一认知。其模型以极高的性价 比和强大的性能在全球AI竞赛中杀出重围,也让世界看到了AI领域 的中国力量。
另 一 方面,DeepSeek 开创了一种全新的AI发展模式——开源+轻量 化,进而改写了AI产业的竞争格局。DeepSeek的崛起,并不仅仅是一 个新AI企业的崭露头角,而是一次商业模式、技术路径和行业应用方 式的重大变革。
DeepSeek选择了一条与传统大模型完全不同的发展路径,它没有追 求超大规模的参数,而是通过轻量化的AI解决方案,让AI在更低的计 算资源下运行,使AI真正普及化。它不仅让AI服务变得更便宜,还开 放了模型源代码,让所有开发者都能在其基础上构建自己的AI模型, 这种模式将颠覆AI产业现有的封闭体系。
无论是个人,还是行业,都会因为DeepSeek的开源及其简易的本地部 署方式与可及的专属训练空间而受益。人人拥有AI助手的时代因此提
5/192
前言
前到来。换言之,DeepSeek 使我们看到了AI让个体能力提升,让AI应 用进入千行百业,落地赋能社会,打开万亿级市场的真正可能。
站在个体角度上,过去,AI技术往往掌握在大企业手中,普通人想使 用AI, 通常只能依赖封闭平台。而DeepSeek的开源+轻量化AI模式,允 许任何人进行个性化的AI模型微调,这彻底改变了当前AI产业的商 业模式。现在,AI不再神秘,变得人人可用,人人可调,人人可受益。
DeepSeek允许任何个体或企业在本地部署AI,并通过微调训练使其 适应自己的需求。这意味着,个人能力可以借助AI成倍提升:一个普 通的上班族,可以通过DeepSeek提高写作、编程和数据分析的效率; 一个自由职业者,可以用DeepSeek 快速生成商业计划书,优化社交媒 体内容,甚至完成法律文书的撰写。就连知识主播和直播带货达人, 都可以利用自己所在领域的独有数据对DeepSeek模型进行针对性的 训练,以打造一个属于自己的AI数字孪生人。
DeepSeek让AI不再只是科技巨头的生产力工具,更成为个体崛起的 智能助手。未来的人类将分成两种——会用AI的人与不会用AI的人, 二者之间的差距将随着AI的普及而越来越大。
如果说DeepSeek提升了个体的生产力,那么它对行业的影响更是颠 覆性的。AI的真正价值,不仅在于它的技术突破,更在于它在千行百 业中的应用,为社会创造了实实在在的价值。DeepSeek以轻量化AI的 模式,让AI应用的成本大幅降低,使得它可以深入每一个行业,推动 生产力的大幅提升。
6/192
前言
在医疗行业,本地部署的DeepSeek 模型可以用来辅助医生进行医学 影像分析,提高疾病筛查的效率,甚至可以作为医生的智能助手,帮 助整理病历、生成诊断报告,让医疗服务更加精准和普惠。
在金融行业,DeepSeek 能够快速分析海量市场数据,预测经济趋势, 优化投资策略,甚至可以帮助银行和保险公司自动处理合规报告,降 低运营成本。
在法律行业,DeepSeek 已经展现出了巨大的潜力,它可以进行智能合 同审查、自动化法条检索,甚至为法官提供案件判决参考,大幅提升 司法效率。
在教育行业,DeepSeek 使个性化教学成为可能,学生可以借助AI进行 智能问答,教师可以用AI辅助备课和批改作业,让教育资源更加公平 和高效。
这些行业的市场规模都足够庞大,AI的深度渗透将催生出全新的商 业模式,推动AI产业进入真正的万亿级市场。
未来,AI竞争将不再是少数几家头部企业的烧钱游戏,无数中小企 业、开发者、科研机构都有机会参与AI产业发展。这也让全球AI行业 进入了一个全新的阶段——竞争的焦点不再仅仅是“谁的AI模型更 大更强”,而是“谁能更好地将AI赋能行业和实际应用”。DeepSeek的 开源策略,让全球AI生态系统迎来了更加开放和去中心化的发展方
6/192
前言
向,这不仅为中国AI产业提供了突围机会,也让AI发展真正进入“普 惠时代”。
当然,这不是让大家盲目崇拜DeepSeek, 而是要理性地看待DeepSeek 的突破和价值。只有客观,才能真正把握新一波AI浪潮的机遇,包括 如何真正善用AI,以及如何通过DeepSeek 赋能各项任务,赋能行业。
事实上,AI产业每天都有让人眼前一亮的进展,DeepSeek 的成功是昙 花一现还是“哪吒降世”依然需要时间来验证。并且,虽然DeepSeek 成功地把AI应用的成本打下来了,但算力仍然是制约AI发展的重要 因素。没有算力,就不可能实现AI落地应用。
除了算力,DeepSeek及整个AI产业还要面对许多新的挑战,比如,De- epSeek 带来开源AI的兴起,让AI监管变得更加复杂,本地部署的AI使 传统的云端监管体系失效。随着DeepSeek 模型的大规模应用,如何确 保AI的合规性、如何防范AI被滥用、如何建立新的AI监管机制,都是 未来必须面对的问题。同时,AI模型训练对高质量数据的需求激增, 促使全球科技公司开始抢占数据资源,如何获得高质量的大数据将 是接下来AI产业发展的新竞争点。未来,随着AI需求的增长,数据的 获取和管理将成为新的瓶颈,AI产业也将进入一个全新的竞争阶段。
本书的写作目的,就是尽可能地向大家全面解析DeepSeek 及其影响。 同时,在这个AI私人定制时代,教会大家如何借助DeepSeek 模型实现 本地部署、开展本地应用。让所有人,都可以低成本地基于DeepSeek 模型来打造一个自己的专属AI。
7/192
前言
我将从多个角度深入剖析DeepSeek的发展历程、技术原理、应用方 法:向大家介绍DeepSeek 从诞生到爆火的全过程;讨论DeepSeek 如何 用低成本、高性能的方式让AI真正普及化,并剖析其背后的技术原 理;详细介绍如何使用DeepSeek, 包括优化AI交互、打造私人AI助手 等,让读者能够真正上手并利用DeepSeek 赋能自己的业务。在本书的 后半部分,我还将和大家一起讨论DeepSeek 如何改变AI产业的商业 模式,分析DeepSeek 在医疗、金融、法律、教育、科研、创作、电商、设 计、交通、制造等行业的实际应用。本书文字表达通俗易懂,内容深入 浅出、循序渐进,无论你是对DeepSeek 感兴趣的大众读者,还是深耕 相关领域的专业人士,希望这本书都能帮助你深入了解突然爆火的 DeepSeek 以及DeepSeek 对未来产生的影响和冲击,并启发你思考AI 在未来的无限可能。
陈根
2025年2月
7/192
1.1干翻GPT,DeepSeek 爆火出圈
第1章
DeepSeek 的前世今生
1.1 干翻GPT,DeepSeek 爆火出圈
DeepSeek彻底火了——2025年一开年,被宣传“干翻GPT”的DeepSe- ek几乎成为全世界科技圈唯一热议的焦点。
自2023年春节被OpenAI 的ChatGPT 引爆以来,人工智能这一话题在 2024年春节依然火热,那时围绕的是OpenAI的Sora, 而进入2025年春 节,出现了变与不变。不变的是,这个春节依然被人工智能所点燃,而 变的是,这次的焦点由美国的科技公司变为了中国的科技公司。
DeepSeek 的火爆程度超乎想象。美国当地时间1月27日,纳斯达克指 数出现3%的下跌,市场分析认为,原因就是中国人工智能初创公司 DeepSeek的最新突破,引发了美国投资者的关注,DeepSeek 甚至被认 为动摇了美国科技行业的“无敌”地位。
具体而言,1月27日当日,美国芯片巨头英伟达(NVIDIA) 股价暴跌约 17%,半导体公司博通(Broadcom) 股价下跌17%,超威半导体公司(A - MD) 股价下跌6%,微软股价下跌2%。此外,人工智能领域的关联行业 企业,如电力供应商的股价也受到重创,美国联合能源公司股价下跌 21%,Vistra股价下跌29%。
8/192
1.1干翻GPT,DeepSeek 爆火出圈
而与此同时,DeepSeek应用登顶15个国家和地区的苹果应用商店免 费App 下载排行榜,超越了ChatGPT 及Meta、谷歌、微软等公司的生成 式AI产品。
面对突然出圈的DeepSeek, 很多人最好奇的问题就是:这个DeepSeek 到底是什么?为什么突然这么火?
DeepSeek 是一家中国人工智能公司,全称是杭州深度求索人工智能 基础技术研究有限公司,由著名量化私募幻方量化支持。幻方量化以 其雄厚的资金实力,为DeepSeek 提供了强大的资金支持。
2023年11月29日,DeepSeek 发布了通用大模型DeepSeek LLM。不过, 当时市面上已经有GPT-4、Claude-3.5、Gemini等国际顶尖模型,甚至在 国内曾经的“百模大战”中,它都属于不起眼的小角色。因此,DeepS- eek LLM的出现并未在市场上引起太多关注。
让DeepSeek 引发关注的,是五个月后的DeepSeek-V2.2024 年5月7日, DeepSeek-V2发布, 一发布就开源。
在中文综合能力评测AlignBench中 ,DeepSeek-V2 成为最强的开源模 型,甚至与GPT-4 Turbo、文心4.0等闭源模型处于同一梯队。而在英文 评 测MT-Bench中,它与当时最强的开源模型Llama3-70B不相上下,甚 至超越了Mixtral-8×22B 等混合专家模型。在知识、数学、推理、编程等 多个领域,DeepSeek-V2 也都排名前列。更重要的是,它的API 价格只 有GPT-4o的2.7%,这直接引爆了国内大模型的价格战,字节、阿里、百
9/192
1.2这么火,DeepSeek 凭什么
度、腾讯全部跟进降价。
而这只是DeepSeek 掀起的第一波风暴。2024年12月26日, DeepSeek- V3发布,再次开源,它的性能比V2版本更进一步,直接挑战国际闭源 大模型。无论是知识类任务、长文本理解、编程能力,还是数学运算, DeepSeek-V3的表现都已经接近甚至超越了GPT-4o 、Claude-3.5-Sonnet 等顶级闭源大模型。更令人震撼的是,它的训练成本竟然只有557.6万 美元,远低于大厂动辄上亿美元的训练开支。这次亮相让DeepSeek的 名字开始在海外科技社区疯狂刷屏,众多AI研究者和开发者争相测 试。
如果说DeepSeek-V3让DeepSeek 在全球AI行业站稳了脚跟,那么2025 年1月20日发布的DeepSeek-R1,就 让DeepSeek真正走上了神坛。
DeepSeek-R1—— 一个推理能力媲美OpenAI o1的模型,但API价格仅 为01的3.7%。可以说,DeepSeek 再次用低价策略冲击了市场,让整个 AI行业再次颤动。短短几天,DeepSeek 的影响力就突破了AI技术圈, 甚至影响到了资本市场。1月27日,DeepSeek 应用同时登顶苹果应用 商店中美两区免费App下载排行榜,超越长期霸榜的ChatGPT, 投资者 开始动摇,英伟达股价大跌。从这个时候开始,DeepSeek 彻底火遍全 网,被各大媒体争相报道。
1.2 这么火,DeepSeek凭什么
DeepSeek的爆火,既是意料之外,又是情理之中,因为DeepSeek 确实
10/192
1.2.1 超级强悍的性能,谁都能打
太厉害了。DeepSeek 的厉害,至少体现在三方面:性能、成本、开源模 式。
1.2.1 超级强悍的性能,谁都能打
DeepSeek-R1的横空出世,让不少AI研究者和开发者都大为震惊。根 据测试结果,这款大模型在数学、编程和推理任务上的表现已经达到 甚至在部分情况下超越了o1的水平(见图1)。要知道,o1可 是OpenAI 最新推出的旗舰模型,代表着当前世界最先进的AI技术之一。DeepS- eek-R1作为一个国内研发的大模型,竟然能在部分任务上正面对抗 o1, 甚至在个别测试中更胜一筹,这无疑是一个巨大的突破。
10/192
DeepSeek各版本模型与01模型在不同基准测试中的表现对比
有人可能会怀疑,DeepSeek-R1是不是在这些特定任务上做 生优化,从而在跑分上取得了好看的成绩。但毋庸置疑的是, 实体验给出了最具说服力的证明。在X(原推特)、微博、小红 平台上,大量开发者和普通用户纷纷给出实测评价。DeepSee 力,尤其是编程能力,在某些场景下确实优于o1。这不仅仅 【据的结果,更是大量用户在实际应用中的反馈。
:震动整个科技圈的是硅谷的科技巨头与人工智能科学家的: 25年1月27日,据Information网站报道,脸书母公司Meta成立
11/
1.2.1 超级强悍的性能,谁都能打
四个专门小组来研究DeepSeek应用的工作原理,并基于此来改进旗 下 的Llama 大模型。
其中,两个小组正在试图了解DeepSeek如何降低训练和运行大模型 的成本;第三个小组则正在研究DeepSeek可能使用了哪些数据来训练 模型;第四个小组正在考虑基于DeepSeek模型属性重构Meta 模型的 新技术。
DeepSeek-R1之所以能在编程和推理任务上展现如此强劲的实力,离 不开它的底层架构优化。尽管它的创造力和语言组织能力可能仍然 比不上o1 Pro,但要注意,它的参数量远远小于后者。DeepSeek-R1的 总参数规模只有6710亿个,而且是基于混合专家模型(Mixture of Experts,MoE) 架构,这意味着它在一次推理调用时,实际激活的参数 只有370亿个。
相比之下,GPT-4级别的大模型通常需要调用数千亿个参数,计算资 源消耗巨大,而DeepSeek-R1能够在较小的参数规模下,仍然提供高 质量的推理和编程能力,这表明其技术优化能力已经达到了惊人的 水平。
更重要的是,DeepSeek-R1这种“小模型大能量”的设计思路,使其在 计算资源的消耗上具有明显的优势。AI模型的性能,往往需要在计算 效率和智能水平之间找到最佳平衡点,而DeepSeek-R1的架构显然在 这方面做到了极致优化。它不仅让模型在较小的算力消耗下展现接 近甚至超越国际旗舰大模型的表现,同时也让整个模型更加灵活,适
12/192
1.2.2便宜到惊人,革命性的性价比
用于更多的实际应用场景。
相比那些需要大量计算资源才能运行的超大模型,DeepSeek-R1 的优 势更加明显,这意味着它可以在更多的设备、平台和业务场景中高效 运行,而不必依赖昂贵的高性能计算资源。
DeepSeek的这一设计思路,不仅让其模型在性能上取得了突破,更重 要的是,使它成功地找到了降低AI模型成本、提高AI可用性的方式。 对于企业用户来说,AI模型的落地不仅要考虑性能,还要考虑运行成 本、推理速度、商业化适配性等因素。而DeepSeek-R1 的架构,使得它 在这些方面都具有很强的竞争力,让它不仅是一个强大的技术产品, 更是一款具备商业落地价值的AI模型。
1.2.2 便宜到惊人,革命性的性价比
DeepSeek实在太便宜了。根据公开数据,o1的训练成本高达上亿美 元,而DeepSeek 的训练成本却不到600万美元。这个对比简直是碾压 级的——相当于OpenAI花20块钱才能干成的事,DeepSeek只用1块钱 就搞定了,而且效果还不差。
这种极致的成本优化能力,不仅意味着DeepSeek 可以持续以极低的 价格提供高质量的AI服务,还意味着它可以在商业竞争中进一步拉 低整个行业的产品定价,让更多企业和开发者都能用得起AI,而不仅 仅是大型科技公司。同时也让千行百业看到了另一种可能性,那就是 在各自的垂直领域,完全可以构建起轻量化高性能模型。
13/192
1.2.2便宜到惊人,革命性的性价比
要知道,一直以来,AI行业都被高昂的算力成本所困扰,特别是在大 模型的训练和推理阶段,GPU 资源的消耗极为惊人。OpenAI、Anthropi- c、DeepMind等头部AI企业,都不得不依赖英伟达提供的高端AI芯片, 每训练一个新模型,成本都以亿美元计。这让很多行业,让很多希望 借助AI实现效率优化的企业望而却步,如医疗、教育、工业等行业企 业。
但DeepSeek的出现改变了AI模型之前的训练逻辑,其模型不仅轻量, 还能以极低的算力满足高性能的运行需求。而DeepSeek 之所以能做 到成本的大幅削减,核心在于它对模型架构和算力调度的极致优化。 它采用的混合专家模型架构,可以让模型在每次推理时只激活部分 参数,而不是整个模型一起计算,大幅减少了算力消耗。
同时,DeepSeek 在数据处理、并行训练、推理计算等多个环节,都进行 了深度优化,使得它在相同的算力条件下,可以训练出更好的模型。 换句话说,它不仅会省钱,而且还能保证模型的质量不打折扣。
DeepSeek的API价格比GPT-4o的要低好几倍,这就导致国内的AI 供应 商被迫跟进降价,字节、阿里、百度、腾讯纷纷调整价格策略,并且这 种降价压力已经开始向海外市场蔓延,影响到了OpenAI和Anthropic 等国际AI公司。AI本来是一个高投入、高回报的领域,但DeepSeek 的 定价策略正在重新定义游戏规则,让AI模型从昂贵的高端科技变成 了一种人人都用得起的生产力工具。
这一现象的直接成效,就是DeepSeek 应用的用户数量开始呈指数级
13/192
1.2.3彻底开源,真正的“AI界安卓”
增长,并迅速抢占全球市场。DeepSeek在苹果应用商店的成绩,表明 这不是一个简单的市场波动,而是在释放一个清晰的信号:DeepSeek 已经不再只是中国的AI新星,更是一个正在全球范围内挑战OpenAI 霸主地位的强劲竞争者。
DeepSeek的成功也对资本市场产生了直接影响。过去几年,AI芯片需 求的爆发是英伟达股价暴涨的重要支撑点,但DeepSeek 的出现让人 们开始重新思考:如果AI模型可以更高效地训练,是否意味着未来对 昂贵GPU 的需求会降低?这种思考及市场情绪的变化,进一步证明 DeepSeek的影响力已经超越了行业本身,开始撼动整个科技生态,改 变了以往AI模型的叙述方式。
AI行业的竞争,已经不再只是“谁的模型更聪明”这么简单,而是演 变成了一场关于技术、成本、商业模式和市场布局的全方位竞赛。而 DeepSeek正在用前所未有的低成本、高性能AI技术,改写这场竞赛的 规则。如果它能继续保持这种极致的性价比优势,那么未来,它不仅 会成为中国AI领域的领军者,甚至可能成为全球AI行业最重要的破 局 者 。
1.2.3 彻底开源,真正的“AI 界安卓”
之前,AI行业的主流做法是封闭生态,例如OpenAI的ChatGPT、Anthro- pic的Claude 和DeepMind的Gemini, 基本都采取了“闭源+高价”的模 式。想用?可以,但要么交高额的API费用,要么只能依赖官方的封闭 产品,开发者无法自由调整,企业也无法掌握数据安全。
14/192
1.2.3彻底开源,真正的“AI界安卓”
但DeepSeek 直接来了个反向操作— — 全开源,不仅可免费下载,还公 开了训练方法,甚至允许其他开发者用它的技术去训练自己的模型, 并且还能商业化。这就意味着,全球任何人都可以基于DeepSeek-R1 开发自己的AI,而无须受制于任何商业公司的政策和定价。
DeepSeek不仅开源了自己的大模型,甚至还主动对市面上的两个开 源模型(Qwen和Llama)进行蒸馏,训练出了六个高性能的“小模型”, 并且无条件开放给所有开发者。这些小模型的表现同样惊人(见图2) ——例如, 一个仅有320亿个参数的模型,在数学任务上的表现居然 超过了o1-mini;更夸张的是, 一个只有15亿个参数的“迷你模型”,在 数学和算法竞赛任务上的表现竟然超过了GPT-4o和Claude-3.5-Sonn- et这两个最主流的闭源模型。
模 型
AlME
2024
pass@1
AIME
2024
cons@64
MATH-
500
pass@1
GPQA
Diamond pass@1
LiveCodeBench CodeForces pass@1 rating
GPT-4o-0513
9.3
13.4
74.6
49.9
32.9
759.0
Claude-3.5-Sonnet-1022
o1-mini
16.0
63.6
26.7
80.0
78.3
90.0
65.0
60.0
38.9
53.8
717.0
1820.0
QwQ-32B
44.0
60.0
90.6
54.5
41.9
1316.0
DeepSeek-R1-Distill-Qwen-1.5B
28.9
52.7
83.9
33.8
16.9
954.0
DeepSeek-R1-Distill-Qwen-7B
55.5
83.3
92.8
49.1
37.6
1189.0
DeepSeek-R1-Distill-Qwen-14B
69.7
80.0
93.9
59.1
53.1
1481.0
DeepSeek-R1-Distill-Qwen-32B
72.6
83.3
94.3
62.1
57.2
1691.0
DeepSeek-R1-Distill-Llama-8B
50.4
80.0
89.1
49.0
39.6
1205.0
DeepSeek-R1-Distill-Llama-70B
70.0
86.7
94.5
65.2
57.5
1633.0
1.2.3彻底开源,真正的“AI界安卓”
这种突破,让DeepSeek 不仅在大规模AI应用上占据了领先优势,还成 功打破了人们对“AI 只能依赖云端算力”的传统认知。因为15亿个参 数的模型,已经轻量到可以直接在个人计算机甚至手机上运行。换句 话说,DeepSeek的开源策略,不仅仅是开放了一个大模型,而是彻底 让AI从“云端霸权”变成了人人都可以使用的智能工具。
反观ChatGPT, 它虽然仍然是当前AI领域的佼佼者,但封闭性却成了 它最大的短板。如今,ChatGPT 正在逐渐变成“AI界的苹果”——性能 强大,但极度封闭。其API价格居高不下,企业想要部署自己的私有AI 助手,不仅得支付昂贵的费用,还得完全依赖OpenAI的云端,没有自 主权,甚至连数据隐私都无法完全掌控。
换句话说,使用ChatGPT 意味着我们的数据要交到OpenAI 手上,而企 业最关心的恰恰就是数据安全。如果未来某一天,OpenAI 调整价格、 修改政策,或者限制API权限,企业只能被迫接受,而无法做出任何改 变。而DeepSeek 的开源模式,直接打破了这种垄断,它更像是“AI界的 安卓”——谁都能用,谁都能改,不仅给开发者提供了极大的自由 度,也让企业能够更安心地将AI部署到自己的服务器上,确保数据的 安全性和可控性。
更重要的是,DeepSeek 的开源策略,还让全球的开发者都能参与进 来,共同优化模型,让它越用越强。相比之下,封闭的AI公司只能依靠 自己的团队做优化,进展速度必然受限;而DeepSeek 的开源模式类似 于Linux和安卓,全球的开发者都可以贡献自己的改进方案,不断优化
16/192
1.2.3彻底开源,真正的“AI界安卓”
代码、修正漏洞,增强模型的推理能力。
这种模式的优势在技术发展史上已经被无数次验证——Linux打破了 微软Windows 的市场垄断,Android让智能手机不再受限于苹果的封闭 生态 … … 如今,DeepSeek 正在用同样的逻辑,挑战AI行业的现有秩 序。
DeepSeek的开源策略不仅让它在开发者社区中迅速积累了大量支持 者,也让AI行业的竞争规则发生了彻底变化。过去,大模型的竞争主 要是参数规模的较量、算力投入的比拼,而DeepSeek 的开源模式,则 让竞争从“谁的模型更大”变成了“谁能让AI真正普及”。
这场变革的影响力远比我们想象的更为深远——如果未来越来越多 的开发者基于DeepSeek-R1进行二次开发,全球范围内会诞生出大量 的行业专用AI模型,它们的功能可能更加精准,应用范围更加广泛, 而OpenAI、Anthropic 、DeepMind这些选择闭源的公司,则可能会逐渐 丧失市场主导权。因为,历史已经一次又一次地证明,技术的进步,往 往源自开放与合作。正如尽管苹果的iOS封闭系统占据着一定的市场 份额,但是安卓这种开源系统的市场占有率远超前者。
如果说过去几年,OpenAI一 直是AI行业无可争议的领头羊,那么Dee- pSeek的崛起,可能会使整个行业的未来走向发生巨变。
DeepSeek的成功让我们不得不重新思考:未来的AI行业,还会继续走 封闭生态的老路吗?OpenAI 、Anthropic等头部企业,是否会被迫调整
16/192
1.3.1 从量化交易到AI先锋
自己的策略?国产AI是否能够借助这次机会,在全球市场上站稳脚 跟?DeepSeek 会不会将业务扩展到AI搜索,甚至AI硬件领域?这些问 题,已经突破行业界限,开始影响全球科技产业的未来。
一切都充满了未知,但可以肯定的是,DeepSeek已经改写了AI行业的 游戏规则。
OpenAI 或许仍然强大,但它已经无法再像过去一样,高高在上地掌控 AI市场,因为DeepSeek 的崛起,已经让AI的未来变得更加开放、更加 民主、更加充满可能性。
1.3 DeepSeek的崛起之路
随着DeepSeek 应用的爆火出圈,它的故事也开始进入公众视野,受到 了广泛关注——没有人不好奇,这么一款极具性价比的AI产品,到底 是怎么诞生的?DeepSeek 诞生的背后,又是一个什么样的故事?
1.3.1 从量化交易到AI先锋
要了解DeepSeek 的故事,就不得不提到DeepSeek 的创始人——梁文 锋。梁文锋是一个典型的小镇少年。1985年,梁文锋出生在广东湛江 的一个普通家庭。他的父亲是一名小学教师,从小就对他的学习给予 了很大的支持和引导。
在这样的家庭环境下,梁文锋对数学和计算机产生了浓厚的兴趣。初
17/192
1.3.1 从量化交易到AI先锋
中时,他就提前学完了高中的数学课程,甚至开始自学大学数学。
2002年,17岁的梁文锋以优异的成绩考入浙江大学电子信息工程专 业。在大学期间,他不仅在本专业表现出色,还积极参与各种数学建 模竞赛,展现了非凡的才华。本科毕业后,他继续在浙江大学攻读信 息与通信工程硕士学位,专注机器视觉的研究。
梁文锋的研究生阶段,正值2008年全球金融危机爆发,金融市场动荡 不安。他敏锐地意识到,数学和计算机技术或许可以用来应对金融市 场的波动。
于是,梁文锋开始带领一群志同道合的同学,尝试用机器学习的方法 分析市场数据,探索自己的量化交易方法。他们收集了大量的市场行 情、宏观经济数据,利用数学建模的方法研究价格波动的规律。这些 早期的探索为梁文锋日后的创业奠定了坚实的基础。
梁文锋所聚焦的量化交易,简单来说,就是用计算机程序代替人工进 行交易。 一旦市场交易情况满足某些条件,程序就会自动执行操作, 进行买入、卖出等。
早些年,交易员们都是自己盯着市场行情,根据经验和直觉来决定什 么时候买进或卖出的。但人的精力有限,面对海量的市场信息,很难 全面、及时地做出反应。随着计算机技术的发展,金融专家们开始探 索利用计算机强大的计算能力,分析市场数据,制定交易策略。于是, 量化交易应运而生。
18/192
1.3.2幻方量化的转折点
量化交易的核心是利用数学模型和算法来自动化交易决策。首先,需 要收集大量的市场数据,如股票价格、交易量、公司财报等。然后,利 用统计学和机器学习的方法,对这些数据进行分析,寻找市场中的规 律。接着,根据发现的规律,建立数学模型,制定交易策略。最后,将 这些策略编写成计算机程序,实时监测市场, 一旦满足设定的条件, 程序就会自动执行交易。
2013年,梁文锋与大学同学徐进共同创立了杭州雅克比投资管理有 限公司,正式进军量化投资领域,公司名称就取自德国数学家卡尔 · 雅可比。
两年后,他们又成立了幻方量化(High-Flyer),专注利用数学和人工智 能进行量化投资。在2015年的市场波动中,幻方量化凭借先进的高频 量化策略取得了令人瞩目的成绩。2016年,幻方量化推出了首个基于 深度学习的交易模型,实现了所有量化策略的AI化转型。到2019年, 幻方量化的资金管理规模突破一百亿元,成为中国最大的量化基金 管理公司之一。
1.3.2 幻方量化的转折点
2016年对幻方量化来说,是一个重要的转折点。这一年,他们推出了 首个基于深度学习的交易模型,开始用AI来指导投资决策。以往,量 化交易依靠的是统计模型、数学公式和传统编程逻辑,而深度学习的 加入,让交易系统有了更强的自适应能力,能够更快地捕捉市场趋 势、识别投资机会,并实时调整策略。AI的引入,让幻方量化的交易决
18/192
1.3.2幻方量化的转折点
策更智能、更高效,也让他们在竞争激烈的量化交易市场中,迅速拉 开了与同行的距离。
到了2018年,幻方量化做出了一个重要的战略决策——正式将AI作 为公司的核心发展方向。这意味着其不仅在交易策略上更依赖AI,而 且将全面向AI驱动的交易体系转型。他们不再只把AI当成一种工具, 还要让AI成为量化交易的灵魂。这个决定,标志着幻方量化不仅是一 家量化交易公司,还是一家技术驱动的AI企业。
但随着交易策略的复杂化和业务规模的急剧扩张,幻方量化很快遇 到了一个前所未有的问题——计算资源瓶颈。
就像家里的一台老电脑在跑大型3D游戏时会卡顿一样,幻方量化原 有的计算平台已经满足不了模型的需求了。AI模型的深度学习训练需 要巨大的算力支撑,而原先的计算资源,已经无法满足他们对交易模 型的训练和优化需求。这不仅影响了交易决策的效率,也限制了他们 进一步开发更高级AI算法的可能性。
面对这个问题,幻方量化决定不再依赖外部的算力供应,而是搭建一 套属于自己的AI训练平台。2019年,在梁文锋的带领下,幻方量化自 主研发了“萤火一号”训练平台。这是一个堪称豪华的计算集群,总 投资接近2亿元,搭载了1100块GPU。GPU就像是AI计算的发动机,数 量越多,计算能力就越强。对于AI模型训练来说,更多的GPU 意味着 可以更快地完成模型训练、更高效地优化算法,让交易系统具备更强 的学习能力。
19/192
1.3.3 DeepSeek的诞生与突破
“萤火一号”的投入,让幻方量化的AI模型训练速度大幅提升,也使 他们的交易策略更加精细化、实时化,交易效率提升到了一个全新的 水 平 。
但幻方量化的野心显然不止于此。量化交易只是他们实现AI梦想的第 一步,而真正的挑战,是如何让AI走得更远。随着AI模型规模的不断 扩大,计算需求再一次暴增,“萤火一号”已经不够用了。他们意识 到,要在AI领域真正取得突破,必须进一步提升计算能力。于是,在 2021年,幻方量化做出了更大手笔的投入,正式推出“萤火二号”。
相比“萤火一号”,“萤火二号”堪称计算怪兽——这次幻方量化直接 投资10亿元,配置了约1万张英伟达A100 GPU,让训练平台的计算能 力再一次实现了指数级跃升。这套平台不仅能支持更大规模的AI模型 训练,还能让AI交易系统的运行效率达到前所未有的水平。
更重要的是,“萤火二号”不仅仅是为量化交易服务的,它还为幻方 量化进军更广阔的AI领域铺平了道路。当AI交易技术日渐成熟,幻方 量化开始思考:如果AI能优化金融市场的交易策略,
展开阅读全文