职贝云数AI新零售门户

标题: DEEPSEEK为何要开启外部融资 [打印本页]

作者: 6KjHg7gd 时间: 12 小时前
标题: DEEPSEEK为何要开启外部融资
本周2026年的AI圈里最大的旧事，置信就是中国大模型独角兽DeepSeek（深度求索）正启动成立以来的初次外部融资，计划以超100亿美元的估值，募集不少于3亿美元资金。

这家公司过去两年里，是整个中国AI行业最“特立独行”的存在。

背靠千亿规模的量化巨头幻方量化，手握功能对标全球顶级的大模型技术，多次回绝阿里、腾讯等科技巨头和头部VC的投资邀约，甚至把“不融资、不稀释股权、不被资本绑架”写进了公司的底层逻辑里。

一个明明“不差钱”的技术理想主义者，为什么偏偏在这个工夫点，向资本市场敞开了大门？

01

DeepSeek的“异类之路”：为什么它能坚持两年不融资？

在中国大模型行业，“融资-烧算力-迭代模型-再融资”是一切玩家的标准生活途径。

从智谱AI、MiniMax到月之暗面，这些被称为“AI六小龙”的头部公司，无一不是靠着一轮又一轮的融资，在这场烧钱大赛里续命。

智谱IPO前完成了8轮融资，累计融资金额超83亿元；

MiniMax上市前完成6轮融资；月之暗面更是在3个月内连融3轮，估值从43亿美元飙到180亿美元。

唯独DeepSeek，走出了一条完全相反的路。

2023年7月，幻方量化创始人梁文锋在杭州成立了DeepSeek，从诞生第一天起，这家公司就自带“不差钱”的基因。

它的母公司幻方量化，是国内顶流的量化私募，管理规模超100亿美元，2025年平均收益达到56.55%，在百亿量化私募中位列第二，一年在二级市场赚的钱，足够覆盖DeepSeek的日常烧钱开支。

正是靠着幻方量化的持续“输血”，梁文锋给DeepSeek划下了三条红线：

不接受外部融资、

不被商业化工夫表绑架、

专注于底层技术研发，

做一个纯粹的AGI研讨机构。

而DeepSeek也确适用技术，交出了一份震惊全球的答卷。

2025年终，DeepSeek-R1模型发布，在斯坦福大学AI指数排行榜上，功能仅落后美国最强模型0.4%，几乎完成了技术追平，一夜之间让全球记住了这个中国名字。

随后的两年里，DeepSeek把“开源”和“极致性价比”做到了极致。

它的核心模型DeepSeek-V3采用自研MoE架构，总参数671B，激活参数仅37B，在14.8T token上完成预训练，多项基准测试成绩超越了Qwen、Llama等开源模型，功能和GPT-4o、Claude-3.5-Sonnet不分伯仲。

更恐惧的是，它把推理成本紧缩到了GPT-4 Turbo的1%，用1%的成本完成了全球顶级的功能。

仰仗着过硬的技术和开源策略，DeepSeek成了全球开发者社区的顶流：

GitHub仓库Star数超80k，Hugging Face平台模型下载量破百万，成为国产开源模型的相对标杆。

C端产品更是一路狂飙，上线仅20天日活用户打破2000万，最高周活跃用户规模近9700万，跻身国内AI运用第一梯队。

一边是母公司源源不断的资金支持，

一边是技术和用户规模的片面迸发，看起来DeepSeek完全没有融资的必要。

那为什么，梁文锋最终还是选择了向资本妥协？

02

不是缺钱，是单靠一己之力，扛不住大模型的“地理级烧钱”

很多人说，DeepSeek融资，是由于幻方量化的钱不够烧了。

但真相是，不是没钱，是大模型这场竞赛的烧钱规模，曾经从“千万级”飙升到了“百亿级”，单靠一家公司的输血，曾经撑不起通往AGI的路。

大模型行业，从来都是资本的游戏，没有任何一家公司能靠自有资金走到最后。

首先是模型训练的固定成本。

行业数据显示，训练一款有全球竞争力的顶级大言语模型，至少需求上万张AI算力卡持续全速运转数月，单次训练成本曾经打破1亿美元。

假如要研发下一代万亿参数的前沿模型，仅算力基础设备的投入，就需求至少10亿美元。

而DeepSeek正在研发的V4模型，正是瞄准了万亿参数规模，想要完成对GPT-4的片面超越，背后需求的算力投入，是地理数字。

更可怕的，是持续增长的推理成本。

大模型的成本只要训练，殊不知在2026年，推理成本曾经成了真正的“算力黑洞”。

唐博预测，2026年全球AI计算工作量中，推理占比将从2023年的42%飙升至66%，初次片面压倒训练。

什么概念？

就是模型训练完只是末尾，用户每问一个成绩、每调用一次API，公司都要为算力买单。

而DeepSeek的用户规模正在迸发式增长，国内日均Token调用量相比2024年终曾经增长了1000倍，打破140万亿。对于一个日活破千万、周活近亿的产品来说，每天的推理算力耗费，就是一个无底洞。

从智谱AI和MiniMax的招股书中可知，过去三年多，这两家公司合计烧掉了110亿元，其中一半都花在了算力租赁上；

全球龙头OpenAI更夸张，估计2026年全年盈余将达到140亿美元，曾经签下了总计6650亿美元的算力租赁合同，覆盖到2030年。

DeepSeek虽然靠着技术创新，把推理成本做到了行业极致，但用户规模的指数级增长，依然让算力支出呈几何级上升。

幻方量化的盈利才能再强，也很难长期支撑这种每年数十亿、甚至上百亿的算力投入。

更重要的是，AI竞赛没有终点，模型需求持续迭代，算力需求持续投入，一旦停下，就会被对手瞬间超越。

开启外部融资，本质上是DeepSeek为这场长期军备竞赛，储备足够的弹药，避免在技术迭代的关键节点，被资金成绩拖慢脚步。

03

人才保卫战，没有市场化的资本定价，就留不住顶级AI人才

假如说算力成本是硬压力，那人才流失的焦虑，就是DeepSeek开启融资的核心导火索。

AI行业的竞争，说到底是人才的竞争。

一个顶尖的大模型研讨员，能决议一款模型的功能下限，也是一切科技公司争抢的核心资源。

而留住这些人才，光靠情怀和理想远远不够，必须有实打实的薪酬激励和股权兑现通道。

近期DeepSeek多位核心研讨员，曾经被小米、字节跳动等科技公司高薪挖角。

而背后的核心缘由，就是DeepSeek长期封闭的股权结构，让员工的期权无法完成市场化定价，更没有明白的兑现加入通道。

智谱AI和MiniMax登陆港交所后，上市首日市值分别打破500亿、700亿港元，如今市值双双超过3000亿港元。

上市不只给了早期投资人加入通道，更给了核心员工的期权一个明白的市场化价格，只需满足解禁条件，就能直接兑现真金白银，这种激励效果，是任何固定薪酬都比不了的。

反观DeepSeek，过去两年里，公司股权高度集中在幻方量化和创始团队手中，没有外部融资，就没有市场化的估值，员工手里的期权，本质上只是一张“白纸”，无法定价，更无法兑现。

哪怕公司技术再强、前景再好，核心人才看不到实真实在的收益，面对字节、小米等公司开出的百万年薪、甚至千万级总包，自然很难不动心。

在唐博看来，DeepSeek此次开启融资，最核心的目的之一，就是给员工期权做市场化定价，建立完善的股权激励体系，用资本的力气留住核心人才。

在AI人才争夺战进入白热化的明天，这一步，DeepSeek不得不走，而且走得曾经有些晚了。

04

商业化包围，要从技术标杆到商业闭环，资本是最快的加速器

技术决议了一家公司的下限，而商业化决议了它能活多久。

这是DeepSeek必须面对的理想，也是它开启融资的关键缘由。

过去两年，DeepSeek靠着开源策略，打出了全球知名度，积累了海量用户和开发者，但客观来说，它的商业化进程，曾经落后于同行。

2025年全年，智谱AI完成营收约7.2亿元人民币，同比增长132%；

MiniMax完成营收约5.6亿元人民币，同比增长159%；

海外巨头更夸张，Anthropic的年化支出曾经打破300亿美元，OpenAI的年化支出也达到250亿美元，四个月工夫完成了翻倍增长。

而DeepSeek，目前的支出次要来自API调用和大批的企业服务，营收规模和头部玩家相比，还有不小的差距。

这不是由于它的技术不行，恰恰相反，它的技术才能完全处于行业第一梯队，成绩在于，它没有足够的资源和团队，去把技术优势转化为商业优势。

大模型的商业化，无非两条路：

ToC的订阅服务，

ToB的企业处理方案。

但无论哪条路，都需求巨额的资金投入。

ToC端，想要做好订阅服务，不只需求持续优化产品体验，更需求大规模的市场推行、用户运营，在字节、百度、阿里等大厂都下场厮杀的C端市场，想要抢下更多的用户，没有资本的支持，根本无法和大厂抗衡。

ToB端，更是一场重投入的持久战。企业客户，尤其是中大型企业，需求的不只是一个通用大模型，而是适配行业场景的定制化处理方案。

这意味着DeepSeek需求组建大规模的销售团队、客户成功团队、行业定制化研发团队，针对金融、政务、制造、法律等不同行业，做深度的模型适配和场景落地。

而这些团队的搭建和运营，每一项都需求巨额的资金投入。

更重要的是，DeepSeek的核心优势是开源，而开源形式的商业化，需求搭建一个完善的开发者生态。

这意味着它需求持续投入资源，维护开源社区，扶持开发者，打造行业处理方案，建立合作伙伴体系。

这些投入短期内看不到报答，长期来看却是构建护城河的关键，只要借助资本的力气，才能沉下心来做这些长期的事。

开启融资，不是DeepSeek要向资本妥协，而是要用资本的力气，补上商业化的短板，完成从“技术标杆”到“商业闭环”的关键一跃。

05

全球化卡位与行业结局之战：100亿美元估值，是入场券，也是护城河

假如说算力、人才、商业化，是DeepSeek的内生需求，那全球化竞争和行业洗牌，就是它必须拥抱资本的外部压力。

首先是全球化的战略需求。

AI是一场全球竞赛，中国的大模型公司，最终的对手从来不是国内同行，而是OpenAI、Anthropic这些手握千亿美金的全球巨头。

而想要在全球市场站稳脚跟，没有资本的支持，根本无从谈起。

DeepSeek的开源模型，曾经在全球开发者社区积累了极高的知名度，Hugging Face上的下载量破百万，海外用户占比持续提升，这是它出海的自然优势。

但想要真正完成全球化规划，需求做的事还有很多：在海外建设本地数据中心、组建本地化运营团队、满足全球各国的合规要求、做海外市场的品牌推行，每一项都需求巨额的资金投入。

更重要的是，海外市场的竞争，不只是技术的竞争，更是资本和生态的竞争。

OpenAI拿到了1220亿美元的融资，Anthropic拿到了300亿美元的融资，它们可以用资本锁定将来数年的算力供给，和亚马逊、微软、英伟达等巨头达成深度战略合作。

DeepSeek想要和它们同台竞技，单靠幻方量化的自有资金，根本不在一个量级，必须引入外部资本，才能拿到全球竞赛的入场券。

其次，是国内大模型行业的洗牌期，曾经片面到来。

2026年，中国大模型行业曾经从“百花齐放”的野蛮生长阶段，进入了“寡头垄断”的淘汰赛阶段。

智谱AI、MiniMax曾经成功登陆港交所，拿到了二级市场的融资通道，市值双双打破3000亿港元，手握数十亿的现金储备；

月之暗面正在筹备赴港IPO，新一轮融资后估值达到180亿美元，随时预备弯道超车；而字节、阿里、百度、腾讯等互联网大厂，更是靠着本身的现金流和生态优势，在大模型赛道疯狂投入。

行业的马太效应正在有限放大，资本正在疾速向头部玩家聚集，中小公司的融资窗口曾经基本关闭。

假如DeepSeek继续坚持不融资的策略，很能够会在这场军备竞赛中，被对手用资本优势拉开差距，哪怕技术再强，也很难补偿资金上的鸿沟。

此次以100亿美元估值开启初次融资，对DeepSeek来说，最重要的不是拿到3亿美元的资金，而是完成了市场化的估值锚定，正式跻身全球大模型第一梯队。

100亿美元的估值，不只奠定了它在国内大模型行业的头部地位，更为后续的融资、甚至IPO，打下了坚实的基础。

06

不是理想向理想低头，而是为了更长远的理想

DeepSeek开启融资，不是梁文锋的理想主义，向资本市场的理想主义低头。

恰恰相反，唐博以为这不是妥协，而是一个理想主义者，为了更长远的目的，做出的最感性的选择。

梁文锋当初回绝融资，是为了不被资本的短期业绩要求绑架，能沉下心来做底层技术研发，不用为了营收数据，牺牲长期的技术投入。

而如今，他选择开启融资，是由于他清楚地知道，单靠一己之力，根本无法打赢这场全球AI竞赛。

通往AGI的路，是一条用算力、人才和资金铺出来的路。

在这条路上，OpenAI曾经拿到了超千亿美金的弹药，Anthropic也拿到了数百亿美金的融资，全球的科技巨头和资本，都在疯狂下注。

DeepSeek想要在这场竞赛中，为中国大模型争得一席之地，就必须借助资本的力气，把技术优势放大，把商业化短板补齐，把全球化的路走通。

100亿美元的估值，3亿美元的募资额，不是DeepSeek的终点，而是它新的终点。

这场融资之后，DeepSeek不再是那个“躲在深闺”的技术黑马，而是正式加入了全球AI巨头的资本军备竞赛。

将来，我们能看到的，一定是一个更有底气、更有战役力的DeepSeek。

它依然会坚持技术理想，依然会坚持开源开放，但它会有更多的弹药，去迭代更好的模型，去服务更多的用户，去和全球最顶级的AI公司正面抗衡。

中国大模型行业的结局之战，从这一刻起，才算真正拉开了序幕。

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)