职贝云数AI新零售门户

标题: DEEPSEEK为何要开启外部融资 [打印本页]

作者: 6KjHg7gd    时间: 12 小时前
标题: DEEPSEEK为何要开启外部融资
本周2026年的AI圈里最大的旧事,置信就是中国大模型独角兽DeepSeek(深度求索)正启动成立以来的初次外部融资,计划以超100亿美元的估值,募集不少于3亿美元资金。

这家公司过去两年里,是整个中国AI行业最“特立独行”的存在。

背靠千亿规模的量化巨头幻方量化,手握功能对标全球顶级的大模型技术,多次回绝阿里、腾讯等科技巨头和头部VC的投资邀约,甚至把“不融资、不稀释股权、不被资本绑架”写进了公司的底层逻辑里。

一个明明“不差钱”的技术理想主义者,为什么偏偏在这个工夫点,向资本市场敞开了大门?

01

DeepSeek的“异类之路”:为什么它能坚持两年不融资?

在中国大模型行业,“融资-烧算力-迭代模型-再融资”是一切玩家的标准生活途径。

从智谱AI、MiniMax到月之暗面,这些被称为“AI六小龙”的头部公司,无一不是靠着一轮又一轮的融资,在这场烧钱大赛里续命。

智谱IPO前完成了8轮融资,累计融资金额超83亿元;

MiniMax上市前完成6轮融资;月之暗面更是在3个月内连融3轮,估值从43亿美元飙到180亿美元。

唯独DeepSeek,走出了一条完全相反的路。

2023年7月,幻方量化创始人梁文锋在杭州成立了DeepSeek,从诞生第一天起,这家公司就自带“不差钱”的基因。

它的母公司幻方量化,是国内顶流的量化私募,管理规模超100亿美元,2025年平均收益达到56.55%,在百亿量化私募中位列第二,一年在二级市场赚的钱,足够覆盖DeepSeek的日常烧钱开支。

正是靠着幻方量化的持续“输血”,梁文锋给DeepSeek划下了三条红线:

不接受外部融资、

不被商业化工夫表绑架、

专注于底层技术研发,

做一个纯粹的AGI研讨机构。

而DeepSeek也确适用技术,交出了一份震惊全球的答卷。

2025年终,DeepSeek-R1模型发布,在斯坦福大学AI指数排行榜上,功能仅落后美国最强模型0.4%,几乎完成了技术追平,一夜之间让全球记住了这个中国名字。

随后的两年里,DeepSeek把“开源”和“极致性价比”做到了极致。

它的核心模型DeepSeek-V3采用自研MoE架构,总参数671B,激活参数仅37B,在14.8T token上完成预训练,多项基准测试成绩超越了Qwen、Llama等开源模型,功能和GPT-4o、Claude-3.5-Sonnet不分伯仲。

更恐惧的是,它把推理成本紧缩到了GPT-4 Turbo的1%,用1%的成本完成了全球顶级的功能。

仰仗着过硬的技术和开源策略,DeepSeek成了全球开发者社区的顶流:

GitHub仓库Star数超80k,Hugging Face平台模型下载量破百万,成为国产开源模型的相对标杆。

C端产品更是一路狂飙,上线仅20天日活用户打破2000万,最高周活跃用户规模近9700万,跻身国内AI运用第一梯队。

一边是母公司源源不断的资金支持,

一边是技术和用户规模的片面迸发,看起来DeepSeek完全没有融资的必要。

那为什么,梁文锋最终还是选择了向资本妥协?

02

不是缺钱,是单靠一己之力,扛不住大模型的“地理级烧钱”

很多人说,DeepSeek融资,是由于幻方量化的钱不够烧了。

但真相是,不是没钱,是大模型这场竞赛的烧钱规模,曾经从“千万级”飙升到了“百亿级”,单靠一家公司的输血,曾经撑不起通往AGI的路。

大模型行业,从来都是资本的游戏,没有任何一家公司能靠自有资金走到最后。

首先是模型训练的固定成本。

行业数据显示,训练一款有全球竞争力的顶级大言语模型,至少需求上万张AI算力卡持续全速运转数月,单次训练成本曾经打破1亿美元。

假如要研发下一代万亿参数的前沿模型,仅算力基础设备的投入,就需求至少10亿美元。

而DeepSeek正在研发的V4模型,正是瞄准了万亿参数规模,想要完成对GPT-4的片面超越,背后需求的算力投入,是地理数字。

更可怕的,是持续增长的推理成本。

大模型的成本只要训练,殊不知在2026年,推理成本曾经成了真正的“算力黑洞”。

唐博预测,2026年全球AI计算工作量中,推理占比将从2023年的42%飙升至66%,初次片面压倒训练。

什么概念?

就是模型训练完只是末尾,用户每问一个成绩、每调用一次API,公司都要为算力买单。

而DeepSeek的用户规模正在迸发式增长,国内日均Token调用量相比2024年终曾经增长了1000倍,打破140万亿。对于一个日活破千万、周活近亿的产品来说,每天的推理算力耗费,就是一个无底洞。

从智谱AI和MiniMax的招股书中可知,过去三年多,这两家公司合计烧掉了110亿元,其中一半都花在了算力租赁上;

全球龙头OpenAI更夸张,估计2026年全年盈余将达到140亿美元,曾经签下了总计6650亿美元的算力租赁合同,覆盖到2030年。

DeepSeek虽然靠着技术创新,把推理成本做到了行业极致,但用户规模的指数级增长,依然让算力支出呈几何级上升。

幻方量化的盈利才能再强,也很难长期支撑这种每年数十亿、甚至上百亿的算力投入。

更重要的是,AI竞赛没有终点,模型需求持续迭代,算力需求持续投入,一旦停下,就会被对手瞬间超越。

开启外部融资,本质上是DeepSeek为这场长期军备竞赛,储备足够的弹药,避免在技术迭代的关键节点,被资金成绩拖慢脚步。

03

人才保卫战,没有市场化的资本定价,就留不住顶级AI人才

假如说算力成本是硬压力,那人才流失的焦虑,就是DeepSeek开启融资的核心导火索。

AI行业的竞争,说到底是人才的竞争。

一个顶尖的大模型研讨员,能决议一款模型的功能下限,也是一切科技公司争抢的核心资源。

而留住这些人才,光靠情怀和理想远远不够,必须有实打实的薪酬激励和股权兑现通道。

近期DeepSeek多位核心研讨员,曾经被小米、字节跳动等科技公司高薪挖角。

而背后的核心缘由,就是DeepSeek长期封闭的股权结构,让员工的期权无法完成市场化定价,更没有明白的兑现加入通道。

智谱AI和MiniMax登陆港交所后,上市首日市值分别打破500亿、700亿港元,如今市值双双超过3000亿港元。

上市不只给了早期投资人加入通道,更给了核心员工的期权一个明白的市场化价格,只需满足解禁条件,就能直接兑现真金白银,这种激励效果,是任何固定薪酬都比不了的。

反观DeepSeek,过去两年里,公司股权高度集中在幻方量化和创始团队手中,没有外部融资,就没有市场化的估值,员工手里的期权,本质上只是一张“白纸”,无法定价,更无法兑现。

哪怕公司技术再强、前景再好,核心人才看不到实真实在的收益,面对字节、小米等公司开出的百万年薪、甚至千万级总包,自然很难不动心。

在唐博看来,DeepSeek此次开启融资,最核心的目的之一,就是给员工期权做市场化定价,建立完善的股权激励体系,用资本的力气留住核心人才。

在AI人才争夺战进入白热化的明天,这一步,DeepSeek不得不走,而且走得曾经有些晚了。

04

商业化包围,要从技术标杆到商业闭环,资本是最快的加速器

技术决议了一家公司的下限,而商业化决议了它能活多久。

这是DeepSeek必须面对的理想,也是它开启融资的关键缘由。

过去两年,DeepSeek靠着开源策略,打出了全球知名度,积累了海量用户和开发者,但客观来说,它的商业化进程,曾经落后于同行。

2025年全年,智谱AI完成营收约7.2亿元人民币,同比增长132%;

MiniMax完成营收约5.6亿元人民币,同比增长159%;

海外巨头更夸张,Anthropic的年化支出曾经打破300亿美元,OpenAI的年化支出也达到250亿美元,四个月工夫完成了翻倍增长。

而DeepSeek,目前的支出次要来自API调用和大批的企业服务,营收规模和头部玩家相比,还有不小的差距。

这不是由于它的技术不行,恰恰相反,它的技术才能完全处于行业第一梯队,成绩在于,它没有足够的资源和团队,去把技术优势转化为商业优势。

大模型的商业化,无非两条路:

ToC的订阅服务,

ToB的企业处理方案。

但无论哪条路,都需求巨额的资金投入。

ToC端,想要做好订阅服务,不只需求持续优化产品体验,更需求大规模的市场推行、用户运营,在字节、百度、阿里等大厂都下场厮杀的C端市场,想要抢下更多的用户,没有资本的支持,根本无法和大厂抗衡。

ToB端,更是一场重投入的持久战。企业客户,尤其是中大型企业,需求的不只是一个通用大模型,而是适配行业场景的定制化处理方案。

这意味着DeepSeek需求组建大规模的销售团队、客户成功团队、行业定制化研发团队,针对金融、政务、制造、法律等不同行业,做深度的模型适配和场景落地。

而这些团队的搭建和运营,每一项都需求巨额的资金投入。

更重要的是,DeepSeek的核心优势是开源,而开源形式的商业化,需求搭建一个完善的开发者生态。

这意味着它需求持续投入资源,维护开源社区,扶持开发者,打造行业处理方案,建立合作伙伴体系。

这些投入短期内看不到报答,长期来看却是构建护城河的关键,只要借助资本的力气,才能沉下心来做这些长期的事。

开启融资,不是DeepSeek要向资本妥协,而是要用资本的力气,补上商业化的短板,完成从“技术标杆”到“商业闭环”的关键一跃。

05

全球化卡位与行业结局之战:100亿美元估值,是入场券,也是护城河

假如说算力、人才、商业化,是DeepSeek的内生需求,那全球化竞争和行业洗牌,就是它必须拥抱资本的外部压力。

首先是全球化的战略需求。

AI是一场全球竞赛,中国的大模型公司,最终的对手从来不是国内同行,而是OpenAI、Anthropic这些手握千亿美金的全球巨头。

而想要在全球市场站稳脚跟,没有资本的支持,根本无从谈起。

DeepSeek的开源模型,曾经在全球开发者社区积累了极高的知名度,Hugging Face上的下载量破百万,海外用户占比持续提升,这是它出海的自然优势。

但想要真正完成全球化规划,需求做的事还有很多:在海外建设本地数据中心、组建本地化运营团队、满足全球各国的合规要求、做海外市场的品牌推行,每一项都需求巨额的资金投入。

更重要的是,海外市场的竞争,不只是技术的竞争,更是资本和生态的竞争。

OpenAI拿到了1220亿美元的融资,Anthropic拿到了300亿美元的融资,它们可以用资本锁定将来数年的算力供给,和亚马逊、微软、英伟达等巨头达成深度战略合作。

DeepSeek想要和它们同台竞技,单靠幻方量化的自有资金,根本不在一个量级,必须引入外部资本,才能拿到全球竞赛的入场券。

其次,是国内大模型行业的洗牌期,曾经片面到来。

2026年,中国大模型行业曾经从“百花齐放”的野蛮生长阶段,进入了“寡头垄断”的淘汰赛阶段。

智谱AI、MiniMax曾经成功登陆港交所,拿到了二级市场的融资通道,市值双双打破3000亿港元,手握数十亿的现金储备;

月之暗面正在筹备赴港IPO,新一轮融资后估值达到180亿美元,随时预备弯道超车;而字节、阿里、百度、腾讯等互联网大厂,更是靠着本身的现金流和生态优势,在大模型赛道疯狂投入。

行业的马太效应正在有限放大,资本正在疾速向头部玩家聚集,中小公司的融资窗口曾经基本关闭。

假如DeepSeek继续坚持不融资的策略,很能够会在这场军备竞赛中,被对手用资本优势拉开差距,哪怕技术再强,也很难补偿资金上的鸿沟。

此次以100亿美元估值开启初次融资,对DeepSeek来说,最重要的不是拿到3亿美元的资金,而是完成了市场化的估值锚定,正式跻身全球大模型第一梯队。

100亿美元的估值,不只奠定了它在国内大模型行业的头部地位,更为后续的融资、甚至IPO,打下了坚实的基础。

06

不是理想向理想低头,而是为了更长远的理想

DeepSeek开启融资,不是梁文锋的理想主义,向资本市场的理想主义低头。

恰恰相反,唐博以为这不是妥协,而是一个理想主义者,为了更长远的目的,做出的最感性的选择。

梁文锋当初回绝融资,是为了不被资本的短期业绩要求绑架,能沉下心来做底层技术研发,不用为了营收数据,牺牲长期的技术投入。

而如今,他选择开启融资,是由于他清楚地知道,单靠一己之力,根本无法打赢这场全球AI竞赛。

通往AGI的路,是一条用算力、人才和资金铺出来的路。

在这条路上,OpenAI曾经拿到了超千亿美金的弹药,Anthropic也拿到了数百亿美金的融资,全球的科技巨头和资本,都在疯狂下注。

DeepSeek想要在这场竞赛中,为中国大模型争得一席之地,就必须借助资本的力气,把技术优势放大,把商业化短板补齐,把全球化的路走通。

100亿美元的估值,3亿美元的募资额,不是DeepSeek的终点,而是它新的终点。

这场融资之后,DeepSeek不再是那个“躲在深闺”的技术黑马,而是正式加入了全球AI巨头的资本军备竞赛。

将来,我们能看到的,一定是一个更有底气、更有战役力的DeepSeek。

它依然会坚持技术理想,依然会坚持开源开放,但它会有更多的弹药,去迭代更好的模型,去服务更多的用户,去和全球最顶级的AI公司正面抗衡。

中国大模型行业的结局之战,从这一刻起,才算真正拉开了序幕。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5