开启左侧

DeepSeek 打算怎样赚钱,而且是赚大钱?

[复制链接]
在线会员 GBh28zHK 发表于 2026-5-25 23:32:52 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
您有无念过,DeepSeek究竟 筹算如何赢利,并且是赚年夜钱?

他们不像智谱(GLM)、月之暗里(MoonShot)战 MiniMax 这样拉出有合作力的编程定阅方案。他们不多模态、语音或者望频模子。时至旧日,他们以至连一个 Harness 皆不(固然近来传闻他们开端招人干了)。并且,DeepSeek 借持久勤奋于启源,乐此没有疲天分享自己的“独野秘圆”。那岂非是疯了吗?仍是地道正在烧钱?这些邪准备给他们投资 100 亿美圆的投资人们,岂非是正在把钱朝火里扔吗?

没有,在我眼里,恰好差异!!!

正在那里,尔念聊聊尔对于他们于今所做所为的察看,和他们仿佛在践止的计谋。DeepSeek开创 人梁文锋的眼光明显盯着一个年夜很多的最终奖杯——他们不但自己能打击 1 万亿美圆的市值,借能特别助华夏催死出一个下达 10 万亿美圆的财产巨兽!

DeepSeek计划  如何赢利,并且是赚年夜钱?w2.jpg

从头审阅 DeepSeek 的“豪杰之旅”

DeepSeek 老是逆风而止,他们没有屑于来卷这种“比他人佳一面面”的微调模子,也没有慢着来买当下的使用(好比各类编程套餐)。尔正在 2025 年 1 月 27 日收过一条疯传的拉文,道到了尔所瞅到的征象,而现在的剧情邪变患上愈来愈出色。
    当各人皆正在逝世磕浓密模子(Dense Models,统统参数皆到场计较的保守年夜模子构造)时,DeepSeek 却迎易而上,挑选了极易锻炼的混淆大师模子(MoE, Mixture of Experts)。他们从“第一性道理”(First Principles)动身,创造了崭新的 GRPO 算法,代替了正在加强进修(RL, Reinforcement Learning)中固然占有统制职位、但是完毕本钱极下的 PPO 算法。他们探究出了鉴于考证嘉奖的加强进修(RLVR, Reinforcement Learning from Verified Rewards),并将其动作提拔模子拉理才气的杀脚锏。他们颠末“多 Token 猜测”(MTP, Multi-Token Prediction)提出了一种尽妙的谋利解码(Speculative Decoding,一种颠末预判后绝单词汇去加快年夜模子天生速率的手艺)战略,共时借让锻炼旌旗灯号变患上越发麋集。他们完善挨制了“整气鼓鼓泡”(Zero-Bubble)流火线并止手艺,把无限的 GPU 资本榨取到了极致。他们启源了大师背载均衡器(Expert Load Balancer),让统统人皆能轻快布置混淆大师模子。出格是颠末“严大师并止”(Wide Expert Parallel)战略,模子能够正在多量次下运行,使患上效劳本钱年夜幅低落。他们创造了 MLA、DSA、CSA 战 HCA 等一系列魔改留神力体制的手艺,极地面紧缩了 KV 慢存(KV Cache,年夜模子拉理时用于保存汗青对于话影象的隐存空间)的需要,让计较需要正在面临无限推少的高低文时险些连结恒定。他们创造了 Engram(印迹模块),完毕了用内乱存换算力的奇异操纵。他们创造了 mHC(改正超跟尾),处置了模子体质暴删时的锻炼颠簸性困难。那个立异浑单借能不竭列上来……

正在豪杰之旅那个最典范的道事构造里,配角一开端其实不明白自己的最终任务是甚么。他是正在一起上摸爬滚挨,逐步贯通了巨大的定命,而后拂拭万易来完毕它。正在那个过程当中,他会碰到无数的冷嘲热讽,但是他挑选忽视;他会碰到没有怀美意的敌手;他自己也有致命的缺点或者短板——但是他终极打倒了自尔,告竣了任务。他曲里这些瞅似没法逾越的易闭,却总能奇妙天缔盟、夺目天调整贵重的资本。那即是为何不雅寡会没有自发天为豪杰摇旗号令。那也是为何 DeepSeek 正在赢得环球无数粉丝狂冷逃捧战敬服的共时,也招去了很多争议。

交下来尔将为您具体装解,DeepSeek 正在那条路上已经走患上充足近,而且已经窥测了他们的最终宿命:他们的格式底子没有是买甚么编程定阅,而是来撬动一个代价 10 万亿美圆的华夏 AI 软件死态圈,并以此瓜熟蒂落天让自己斩获 1 万亿美圆的市值。正在那个过程当中,他们以至借会顺手助一把东边软件死态中的一寡新玩野。

欢送各人会商取斧正。

DeepSeek计划  如何赢利,并且是赚年夜钱?w3.jpg

先去算一笔佳玩的 KV 慢存账:

去瞅瞅出名半导体阐发机构 @SemiAnalysis_公布的那条十分实时的拉文:

DeepSeek计划  如何赢利,并且是赚年夜钱?w4.jpg

咱们先去干面幽默的 KV 慢存数教题。别担忧,假设您讨厌数教,咱们也不过用近来公布的 KV 慢存计较器,去瞅瞅 DeepSeek V4 Pro究竟 能省下几 KV 慢存,并把它跟最新的智谱 GLM 战阿里通义千问(Qwen)模子干个比照。

尔以 100 万(1M)高低文少度为例截至计较,假定 KV 粗度为 8 位(8-bit),索引器粗度为 16 位(16-bit)。您自己也能够来那个网站上玩玩:https://kvcache.ai/tools/kv-cache-calculator/

DeepSeek计划  如何赢利,并且是赚年夜钱?w5.jpg

正在 100 万高低文深度下:
    DeepSeek V4竟然 只要供 5.48 GB 的下戴严内乱存(HBM, High Bandwidth Memory,一种经常使用于顶尖 AI 隐卡的下速隐存)。GLM5 需要 60 GB 的 HBM。Qwen3-235B-A22B 则需要下达 89 GB 的隐存!

请留神,那仍是正在如下条件下:
    DeepSeek 是一个具有 1.6 万亿(1.6T)参数的巨无霸模子。GLM5 约莫是 7000 亿(700B)参数,并且它已经借鉴了 DeepSeek 的 MLA 战 DSA 手艺,不过借出用上最新的收缩留神力体制。Qwen3-235B-A22B只需 2350 亿参数,使用的是绝对保守的 GQA(分组盘问留神力体制)。

DeepSeek 正在减缓隐存压力圆里干出了奠定性的奉献。假设那项立异被止业普遍采用,将让这些需要处置超少任务的少程 AI 智能体(Long-horizon Agents)本钱高到易以相信,进而完全解锁下一代崭新的使用场景。

DeepSeek计划  如何赢利,并且是赚年夜钱?w6.jpg

猖獗面前 的精密章法

能够正在完整没有捐躯模子品质的条件下,把 KV 慢存收缩患上云云之小,恰是他们敢把万古慢存(Long-held Cache)价钱压到利剑菜价的底气鼓鼓地点——其价钱以至没有到 Anthropic 旗下 Claude Sonnet 4.6 慢存掷中价钱的 3%,并且他们借能助您免费保存佳多少个小时!

关于少程任务来讲,因为慢存体质微小,将其“转存”(Offloading)到静态软盘(SSD)并正在需要时从头减载,便变患上极其划算。那便年夜年夜低落了对于 HBM 的依靠。要明白,HBM 今朝环球严峻欠缺,并且从华夏 AI 软件财产的角度去瞅,那也是制作易度极下的中心痛面。更尽的是,DeepSeek 借开辟了一套能从 SSD 中以极下速率从头减载 KV 慢存的手艺,具体细节皆正在他们的论文里:https://arxiv.org/pdf/2602.21548

DeepSeek计划  如何赢利,并且是赚年夜钱?w7.jpg

谁是那场“KV 慢存收缩战”的间接得益者?

谁正在大批供给 SSD?别记了少江保存(YMTC)在兴起为环球 3D NAND 闪存巨子。闪存手艺(NAND)让 DeepSeek 能够间接读与慢存,进而制止了屡屡皆从头计较 KV 的弘大算力糜掷。反过去,DeepSeek 在为 NAND 闪存战静态软盘缔造一个非常宏大的新商场——那不但让少江保存得益,也让全部财产链统统玩野随着年夜赚。

DeepSeek计划  如何赢利,并且是赚年夜钱?w8.jpg

可是,格式毫不只仅范围于 NAND 战 SSD:

高罪耗内乱存(LPDDR)异常储藏着弘大的后劲,能够用做寄存模子权沉(Weights)的“年夜前方”,并正在需要时络绎不绝天“流式传输”到 HBM 中,进而退一步减少 HBM 的容质压力。您能够参照那篇专客:https://www.lmsys.org/blog/2025-09-25-gb200-part-2/。上面尔用一弛图去注释那套计划是怎样运做的:

固然 DeepSeek 并无特地针对于那一计划干特别开辟,但是他们这具有宏大大师数目、而且撑持 4 位(4-bit)权沉的混淆大师模子架构,完善符合了那套计划,使患上实在施起去轻而易举。

DeepSeek计划  如何赢利,并且是赚年夜钱?w9.jpg

这类立异共同上他们这堪称顺天的无益超松散 KV 慢存手艺,让体系对于 HBM 的吞咽战容质需要呈现了断崖式上涨。

华夏谁正在干 LPDDR?少鑫保存(CXMT)。今朝他们正在 LPDDR 的速率上仅落伍国内顶尖水平半代,正在容质稀度上仅落伍一代。差异十分小!那表示着正在没有暂的未来,除管够的 NAND 闪存,华夏外乡死态借将迎去比比皆是的 LPDDR 内乱存。这那能减缓算力芯片的压力吗?谜底是:绝对能。请交着朝下瞅……

DeepSeek计划  如何赢利,并且是赚年夜钱?w10.jpg

智慧天玩转保存,借能顺手给 GPU 战 ASIC 加背

原理很简单理解:用 NAND 闪存去寄存 KV 慢存,不但能延长慢存的保留时间、减少 HBM 的压力,借能免除重复计较的懊恼,那即是变相给 GPU 战 ASIC(专用散成电路,即各种定造化 AI 算力芯片)的计较单位紧了绑。那末,除动作模子权沉的“立即流式传递戴”以外,LPDDR 借能以其余方法助上闲吗?谜底异常是:能够。

LPDDR 能够用去保存海质的“Engram”(印迹模块)。DeepSeek 正在他们的论文(https://arxiv.org/pdf/2601.07372)中指出,固然混淆大师模子架构能够颠末前提计较(Conditional Computation)去扩展模子的容质,但是保守的 Transformer 架构缺少一种天然的常识检索体制,只可鸠拙天颠末昂扬的“计较”来模仿“检索”。为此,他们引进了 Engram 模块,将典范的 N-gram 嵌进手艺升级为鉴于哈希、时间庞大度为的霎时查找,缔造了一个他们称之为“前提内乱存”(Conditional Memory)的崭新稠密维度。那极地面省下了计较质,但是价格是需要弘大的内乱存空间去寄存那个宏大的嵌进表。那是一次典范的“用空间(保存)换时间(计较)”,其高超的地方正在于,读与“保存”的本钱近比截至计较要自制很多(正在 LPDDR 里查一下,可比让年夜模子整整跑一轮前背传布省钱太多了)。正在年夜范围布置时,那是一笔画算抵家了的生意。那即是他们怎样颠末狂砸内乱存去省下算力的秘密!!!

DeepSeek计划  如何赢利,并且是赚年夜钱?w11.jpg

这类弃取险些太值了:因为缺少极紫中光刻机(EUV),没法正在单个芯粒(Chiplet)上干到划一的晶体管稀度,华夏的 GPU 战 ASIC 正在地道的本初浮面运算才气(FLOPs)上,必定会持久落伍于东边顶尖隐卡。共时,海内正在先辈启拆手艺上也处于追赶形状。因而,假设能使用海内产能充沛、本钱昂贵的 NAND 战 LPDDR 内乱存去抵偿算力的劣势,这类“取长补短”的挨法险些是尽配。

盘点 DeepSeek 的一盘年夜棋:

纵不雅那些使人目炫庞杂的立异战他们干出的各种挑选(于今没有干多模态、没有干语音模子,至于望频天生?这是甚么工具?),DeepSeek 的家心明显没有是长远这戋戋多少亿美圆的蝇头小利。他们在极有耐心肠下一盘 10 万亿美圆的年夜棋,目标是亲脚搀扶起一套自力于东边以外的“备选软件死态”。

那不但让华夏的保存芯片厂商正在环球 AI 软件舞台上跃降为主力军,更从底子上低落了年夜模子锻炼战拉理的资本门坎。当运行 AI 模子的本钱落下来后,原来功用稍逊的国产 GPU/ASIC 芯片和收集交流芯片也将局部酿成“够用、佳用”的其实选项。并且,那些启源立异也将反哺东边的启源社区,并给东边这些试图挑战英伟达的芯片草创企业戴去一线生机。

统统的千丝万缕皆对于上了。让咱们去一一细数他们扔出的这些震动止业的立异:

正在 DeepSeek V2 中引进混淆大师模子(MoE)战 MLA:MoE 让锻炼一个极端智慧的模子削减了 40% 到 50% 的算力消耗;而多头潜伏留神力体制(MLA, Multi-head Latent Attention)更是把 KV 慢存间接砍失落了 90%,使患上将慢存转存到 SSD 变患上极其下效。那些观念最先正在他们 2024 年 5 月的论文(https://arxiv.org/pdf/2405.04434)中提出。恰是凭仗那些尽活,他们厥后才气只是用 2048 弛被阉割过的 H800 GPU,便软死死锻炼出了媲好顶级关源模子的 DeepSeek V3。

DeepSeek计划  如何赢利,并且是赚年夜钱?w12.jpg

DSA(麋集腾踊留神力体制):正在论文(https://ariv.org/pdf/2512.02556)中拉出,旨正在增加少高低文场景下的计较质,共时减缓 HBM 的戴严压力。它保证了计较质没有会跟着高低文的推少而发作爆炸式增加。瞅瞅上面的图表——DeepSeek-v3.2 的处置时间正在高低文推万古仍然危如累卵。

DeepSeek计划  如何赢利,并且是赚年夜钱?w13.jpg

mHC(改正超跟尾):正在 2025 年 12 月的论文(https://arxiv.org/pdf/2512.24880)中初度表态。mHC是 DeepSeek 正在微观架构上的一年夜立异,它完全推翻了年夜模子各层之间保守的旌旗灯号传输方法。已往各人皆正在用自 ResNet 时期传布下来的尺度冷炙好跟尾,而 mHC 则把那条冷炙好流扩大成为了多条并止的“疑息下速马路”,并许可模子自立进修怎样截至混淆。最为枢纽的是,它颠末数教伎俩(将混淆矩阵颠末 Sinkhorn-Knopp 投影束缚正在 Birkhoff 多胞形上)自愿让那些混淆矩阵满意单随机性,进而正在数教上完善保证了旌旗灯号强度正在脱过尽情深度的收集层时皆没有会衰加。
    那完全处置了此前搅扰无束缚超跟尾(Hyper-Connections,最先由字节跳动创造)的劫难性没有颠簸困难——此前正在 270 亿(27B)参数范围下,旌旗灯号缩小系数会猖獗飙降到 3000 倍,招致全部锻炼完全崩盘。而它的计较本钱却微不足道:因为它完整不改动留神力层或者前馈收集(FFN, Feed-Forward Network)层的本初浮面运算质,只是改动了输出正在各层之间的路由方法,因而它只增加了戋戋 6.7% 的理论锻炼时间开销。可是它戴去的功用提拔却极其震动:正在划一模子巨细战险些完整差异的算力估算下,27B 范围的模子正在 mHC 的减持下,正在庞大的 BIG-Bench Hard 拉理尝试中暴跌了 7.2 分,DROP 评测提拔 3.2 分,GSM8K 数教尝试提拔 2.8 分,MMLU 分析教科常识提拔 1.4 分。

简而行之,mHC 颠末给收集付与一套更丰硕、更有表示力的跨层疑息路由拓扑构造,正在险些没有需要分外多花一丁面算力的情况下,让单元参数阐扬出了清楚更下的“智商”。

DeepSeek计划  如何赢利,并且是赚年夜钱?w14.jpg

CSA 取 HSA:正在 2026 年 4 月公布的 DeepSeek V4 Pro 手艺文档(https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf)中表态。它们颠末对于 KV Token中止 深度收缩,把原来便已经很小的 KV 慢存需要又砍失落了 90%!共时年夜幅低落了所需的浮面运算质,一举助 HBM 战 GPU/ASIC 完全解套。

DeepSeek计划  如何赢利,并且是赚年夜钱?w15.jpg

论文(https://arxiv.org/pdf/2601.07372)于 2026 年第一季度拉出,邪如前面所道,它正在某种意思上完毕了“用内乱存(LPDDR)换算力”。上面的具体图表展示了正在整体参数估算完整不合的情况下,Engram 戴去的弘大功用跃降。

DeepSeek计划  如何赢利,并且是赚年夜钱?w16.jpg

将计较取通信的重叠榨取到极致:诸如“单路子”(Dual Path)如许的下层魔改,外表上瞅是为了绕过软件资本的封闭而自愿 截至的闪转腾挪。但是 DeepSeek 更退一步,以至开端反过去对于芯片软件厂商的 ASIC 架构设想辅导迷津,报告他们怎样设想芯片才气制止糜掷哪怕一丝一毫贵重的硅片资本。如下截图恰是出自 DeepSeek V4 Pro 的民间文档:

DeepSeek计划  如何赢利,并且是赚年夜钱?w17.jpg

对于 TileLang 的沉度加入:那大白无误天表白,他们的眼光早已经逾越了自野算力松缺的窘境,而是勤奋于让全部华夏软件死态具备取东边掰手段的合作力。有了 TileLang(一种用于编辑下功用算力内乱核的启源编程语言),工程师只要供编辑一次算力内乱核代码,就可以在职何适配了 TileLang 后真个差别软件仄台上无缝跑起去。尔估量海内其余 AI 尝试室很快也会纷繁参加那个营垒——那将协力辅佐华夏软件厂商从正面 包围,绕启英伟达牢不可破的“CUDA 壁垒”(CUDA Moat,英伟达甘心经营数十年的专用并止计较架构死态,是其最严的护乡河)。共时,那也能特别束厄局促 AMD 等东边的其余软件厂商。注:海内很多 AI 软件仄台自己也供给 CUDA 兼容性或者 CUDA 编译变换层。此中,摩我线程、沐曦、壁仞战天数智芯是颠末变换层完毕取 CUDA 兼容度最下的多少野华夏芯片公司,实践上它们没有需要 TileLang 的辅佐。

DeepSeek计划  如何赢利,并且是赚年夜钱?w18.jpg

年夜范围加强进修取主动化科学钻研:

跟着计较需要的断崖式降落,和可供挑选的外乡软件变患上愈来愈多,DeepSeek 终究能够铺开四肢举动,来挑战这些此前让人望而却步的弘大锻炼方案——特别是加强进修阶段的后锻炼(Post-training)。加强进修需要天生海质的思考轨迹(Trajectories),动辄便会发生数万亿的 Token,那正在已往烧钱速率极端恐惊。别的,要锻炼出撑持 100 万高低文的模子,您便必需天生异常少度的思考轨迹。只需让模子正在这类超少轨迹中禁受磨炼,才气真实解锁处置庞大少程任务的才气。

不但云云,软件挑选的多元化将让 DeepSeek 具有充裕的算力来打击“主动化野生智能钻研”(RSI, Research on Silicon Intelligence,即让 AI充任 科学野,自己设想并施行算法尝试的自立退步手艺)。这类让 AI 阁下互搏、自立退步的情势陪伴着大批的试错,耗资极端昂扬。但是假设念要完全探访全部算法设想的已知空间,RSI 是必经之路。正在通朝通用野生智能(AGI)以致超等野生智能(ASI)的门路上,DeepSeek必需 先面明 RSI 那棵科技树。

DeepSeek 旧日的试金石,止业来日诰日的学科书籍:

现在,DeepSeek 环绕混淆大师模子、MLA、DSA 的连续串猖獗立异,早已经被华夏以致环球的各年夜 AI 尝试室奉为圭表标准并争相抄功课。

好比,挨制了 GLM 系列模子的智谱 AI已经 用上了 MLA 战 DSA;月之暗里(Kimi)也风雅认可自野的最新架构恰是鉴于 DeepSeek 的演退。动作投桃报李,DeepSeek 正在年夜范围锻炼中也接纳了 Muon 劣化器,而该劣化器正在超年夜范围锻炼中的能力,恰是被 Kimi 团队起首开掘并证实的。

(注:
    混淆大师模子(MoE)架构最先由顶尖教者正在 2017 年的典范论文(https://arxiv.org/pdf/1701.06538)中提出,而DeepSeek 的功绩正在于胜利将其拉背了亘古未有的宏大范围,并融进了大批自研的独门特技。*Muon(鉴于牛整理 - 舒我茨动质邪接化)劣化器由机械进修钻研员 Keller Jordan 于 2024 年末创造,而 Kimi 团队则是环球第一个将其使用到超年夜范围模子锻炼中的吃螃蟹者。)

道了这样多,这终归如何赚年夜钱呢?

咱们能够瞅瞅 OpenAI 一个十分幽默的典范案例。OpenAI 曾取 AMD 和 Cerebras(一野挑战英伟达的晶圆级超年夜芯片草创公司)告竣和谈:跟着 OpenAI推销 并消耗那二野公司的芯片到达一定里程碑,OpenAI 就可以以极高的价钱得到那二野公司的股票认股权证(Warrants)或者期权。那关于 AMD 战 Cerebras 来讲是一笔共赢的尽妙生意——有了 OpenAI 那头吞吃算力的巨兽深度绑定,它们正在短跑中胜出的几率年夜删。

按照 AMD 民间公布的往事稿(https://www.amd.com/en/newsroom/press-releases/2025-10-6-amd-and-openai-announce-strategic-partnership-to-d.html):“动作和谈的一部门,为了深度绑订单圆的计谋长处,AMD 已经背 OpenAI 授与了下达 1.6 亿股 AMD 一般股的认股权证。那些股权将跟着一定里程碑的告竣而逐步解锁。第一阶段将正在初初布置到达 1 凶瓦(GW)算力中间时解锁,随即的份额将跟着推销 范围扩大至 6 凶瓦而连续解锁……”

DeepSeek计划  如何赢利,并且是赚年夜钱?w19.jpg

尔斗胆猜测,DeepSeek 今朝在取海内一寡保存、ASIC 算力芯片、CPU 和收集和谈栈厂商签订类似的对于赌取长处绑定和谈。颠末深度分离调劣,DeepSeek 将辅佐那些外乡软件正在运行环球最顶尖的 AI中心 事情背载时,真实干到仄替、以至逾越东边软件。

眼下,东边(包罗其东亚盟友)统统 AI 观点股的总市值早已经突破了 10 万亿美圆。颠末这类“用手艺换股权、用死态搀扶分蛋糕”的精巧贸易情势,DeepSeek 不但能正在华夏复造出一个异常体质惊人的超等软件财产,借能正在此中切下最肥大的一齐蛋糕,从而将自己收进 1 万亿美圆市值的超等俱乐部。

那不但能让他们赚到比买甚么定阅硬件多很多的实金利剑银,借能特别完毕他们心中“让通用野生智能惠及每个人”的雄伟愿景。梁文锋动作传说质化巨匠詹姆斯·西受斯(Jim Simons)的铁杆粉丝,绝对是一名顶级智慧的本钱野,他毫不可以遗漏那盘年夜棋!

只要您回过甚把 DeepSeek 于今为行统统的变态举措串连起去,那即是唯一能完善注释统统的下层逻辑……

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )