职贝云数AI新零售门户

标题: 中国 AI 大厂,被 Deepseek 掀了牌桌之后 [打印本页]

作者: BLpt8N    时间: 昨天 15:20
标题: 中国 AI 大厂,被 Deepseek 掀了牌桌之后
<img   />

当技术范式重构,强者也不得不重新起跑。
作者|连冉
编辑|郑玄

过去几个月,尤其是 2025 年一季度,国内大厂在 AI 大模型范畴的声量分明低调了不少。最直观的感受就是,发布会分明少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而往年则低调了不少,声响变得慎重,动作也更抑制。

这种转变,多少跟 DeepSeek-R1 在春节时期的发布有关,这个模型以开源、低价、高功能的组合,打破了「大模型=高投入、高门槛」的行业共识,也撬动了模型产业的权利结构。

它不只刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的「重资产」范式。一工夫,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。

而在国内,这场「技术地震」最先震动的,其实正是那些本来被以为应该在 AI 战役中冲在最前的大厂们。一边是像 DeepSeek、Manus 这样的新玩家用「小而强」「快而灵」的策略不断迭代打破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。

新玩家冲击的,不只是模型功能或训练成本,更是许多建立在历史阅历基础上的途径依赖——比如「只要闭环才有护城河」「只要高预算才能出好模型」「只要通用大一统才是正确方向」。

越来越多的理想正在指向同一个结论:在 AI 疾速演进的浪潮中,任何僵化的范式认知,都能够成为创新的绊脚石。

明天的大厂,正在面临一次理念上的转向:不再追求「我的模型服务我的运用」的闭环逻辑,而是回到「用最合适的模型,构建最好的产品」这一产品主义原点。

一系列深层次的战略重构,正在中国互联网大厂里悄然发生。

01
Deepseek-R1 出现前,大厂鏖战大模型赛道,各自押注不同

回头看 2023 年,国产大模型赛道迅速升温,几乎一切有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到本人的打破口。

彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,「自研闭环」几乎成为主流打法(阿里则探求开源较早),强调的是「模型要自主可控,生态要自给自足」,从底层模型到运用产品都要打通。

在这样的背景下,百度主打「模型+搜索」途径,字节力推豆包,阿里对通义千问团队停止拆分以优化资源配置,腾讯则相对慎重地投入「混元」大模型,全体更强调「运用场景驱动」,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的「AI 六小龙」,试图在技术道路或创新方向上包围。

(, 下载次数: 0)

<img   />

图片来源:视觉中国

彼时大家的竞争逻辑还建立在几个假设之上:1)自研才能越强越有护城河;2)参数量和才能相关,功能靠堆大模型赢;3)需求构建一个「自我可控」的模型+运用闭环。

但这些共识在 DeepSeek-R1 发布之后被彻底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行业视为一个「临界点」事情——一方面,它以极低的成本训练出了对标 GPT-4 的才能,公开技术细节并放出权重;另一方面,它代表着一种更彻底的「开源范式」:不是简单开放一个模型,而是直接让下游开发者「拿来即用」,训练思绪、数据比例、推理效率都了如指掌。

这直接打在了原来那种「闭环型自研」的道路关键上。很多大厂花大钱训练的模型,在 DeepSeek-R1 面前变得毫无优势——不是才能不行,而是「性价比不行」:你没法再说「自研比别人更强」,由于别人把过程全开了,而且你追上也要几个月;你也没法说「闭环护城河更高」,由于别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。

这种「开源即才能平权」的冲击,不只打到了大厂,也打乱了 AI 小龙们的节拍。以面壁、百川为代表的「小模型派」,本来还希望在训练效率和推理速度上做文章,如今发现 DeepSeek 直接掀了桌子,把效率和才能统统平衡好了,而且是白送的——这让「闭源商业化」变得愈加困难。

行业由此进入了一段分明的「战略迷茫期」:

大厂末尾重新评价自研的价值:能否还值得烧钱去追一个很能够被开源赶超的模型?能否应该把精神转向「拼装模型才能+打造 AI 原生运用」的组合打法?

AI 小龙们则面临最直接的生活压力:原来讲闭源、讲技术栈的优势正在消逝;大厂又末尾加速从开源模型中「拿货」,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找「差异化垂直场景」。

投资人也在重新审视项目价值:一个大模型初创公司假如没有特别的创新机制或生态合作资源,其估值逻辑就会遭到应战。

总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次「范式洗牌」:用极致透明和开源方式打破旧有途径依赖,把「自研大模型闭环」从主流选项变成了一个「代价极高」的冒险。这个时辰之后,谁能疾速认清算想,找到重生态位,谁才有能够留在下一轮的牌桌上。

02
震荡之后,大厂探索新方向

DeepSeek 带来的冲击在持续发酵时,整个行业一末尾是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但详细要怎样应对、往哪儿走,其实那时分没有明白答案。

但从 2 月下旬末尾,状况渐渐变了。大厂末尾陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调「运用先行」「超级 App」的落地道路,重新回到了「AGI 优先」的轨道上。

这轮转向有几个关键的变化。

第一个变化是目的明晰了。过去讲 AI 运用的时分,很多公司都停留在「做一个超级 App」的层面,比如搞一个 AI 助手、一个 AI 搜索或者 AI 办公工具。

但如今,在字节与阿里最新的对表面达中,都明白把「冲刺 AGI」作为最核心的目的。

在 2 月的全员会上,字节 CEO 梁汝波曾表示:「智能程度是最重要的,要把提高智能本身当成最重要的目的,而不是某个产品的 DAU。」

3 月,豆包大模型部门召开全员会,明白部门的最重要目的是探求智能下限;同时强调进一步加强组织文明,提高技术开放程度,并思索推进开源。

「Seed Edge」是字节豆包大模型团队在年终组建的 AGI 长期研讨团队,鼓励探求更长周期的 AGI 研讨课题,如推理才能、感知才能、软硬一体化等。

这个项目强调「宽松的研讨环境」和「长周期考核」,为当选课题提供独立算力支持,表现了字节对 AGI 的长期规划。

Seed Edge 的目的是探求 AGI 的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研讨方向,包括探求推理才能的边界、探求感知才能的边界、探求软硬一体的下一代模型设计、探求下一代 AI 学习范式、探求下一个 scaling 方向。

可以看出,字节正在为通向 AGI 的下一阶段做技术储备。

2025 财年财报后的电话会上,阿里 CEO 吴泳铭初次明白提出 AGI 是阿里 AI 战略的核心目的,甚至用了「AI 将影响全球 50% GDP 结构」这样激进的表述。

这也意味着,阿里正在从强调「云+模型」服务才能,逐渐走向更高层次的通用智能探求。

第二个变化,是对「开源」和「模型选择」的态度发生了实质变化。过去讲模型、做运用时,往往强调「全链路自主可控」,什么都要本人来。但如今,尤其是腾讯和百度,看起来越来越强调适用主义导向:谁的模型才能强就接谁的模型,运用产品的目的是用户称心、场景落地,而不是一定要套用自家大模型。

这背后,其实是每家公司在重新厘清本人的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。

阿里的反应看起来「稳」一些,或者可以说是延续之前的节拍。

由于阿里在大模型上的投入本身就走在了开源道路的前列。通义千问(Qwen)系列在海外和开源社区持续表现微弱,Qwen2.5-Max 一度号称功能超越 DeepSeek-V3,而 4 月底刚开源的 Qwen3,不只成本分明降低,功能更是反超 DeepSeek-R1 和 OpenAI-o1,登上开源模型榜首。阿里的打法很明白:先用模型功能证明本人,再用开源吸引全球开发者,把生态「引出去」。

不过,阿里的途径也并非好事多磨。过去一段工夫,由于组织架构频繁调整,大模型和 AI 业务一度堕入「各自为战」的割裂形态。但随着 2024 年阿里云重新整合、AI 团队在马云回归后重新靠拢,阿里末尾回到「集中力气办大事」的主形式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。

可以说,相比强调 C 端产品或 Agent 体验的打法,阿里正在重新确认本人在 AI 时代的角色——不是冲在最前的运用先锋,而是一个全球级的模型平台和技术基础设备提供者。

百度的选择,是比较务虚的。一方面它有本人的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的详细运用能不能变得更智能。所以在实践落地中,百度强调「谁好用就用谁」,哪怕不是自家的模型也没关系,只需能让文库变得更好用,就可以接入。

这种态度其实是阅历过一次反思的。之前极客公园就曾经了解到,2024 年百度外部其实是为了推进模型在各运用场景落地,分散了大量精神,导致文心团队反而没能集中精神把模型本身推上一个更高的台阶。新的调整,就是不再强求「模型服务一切运用」,而是让每个业务线根据场景灵敏选择,把用户体验拉起来才是第一位。

而关于开源闭源之争,此前作为大模型闭源道路的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业形式,开源其实是一种智商税"。

(, 下载次数: 0)

<img   />

李彦宏在 Create2025 百度 AI 开发者大会|图片来源:百度

直到往年 2 月,百度选择了顺应开源的大趋向,宣布将在将来几个月中陆续推出文心大模型 4.5 系列,并于 6 月 30 日起正式开源。

腾讯的途径更明晰,也更符合它一向的产品哲学。无论是微信、QQ 还是游戏体系,腾讯最核心的资源就是这些衔接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把 AI 才能疾速嵌入到这些产品里,提升效率和体验。

所以,当 DeepSeek-R1 新模型出现之后,腾讯是第一工夫接入的公司之一,没有太多顾虑。毕竟据正点报道,腾讯董事局主席兼 CEO 马化腾跟一些 AI 团队说过,「要好好与外部合作,不要想着什么都本人做」,以及「要清醒地看法到实践状况,不要过高估计本人的才能。」

2 月 13 日,腾讯率先官宣接入「满血版」DeepSeek-R1,并迅速在全平台展开推行攻势。从微信、小红书到 B 站、知乎,元宝产品的广告漫山遍野,引发了用户对腾讯 AI 助手的集中关注。与此同时,腾讯外部也紧急协调,加速推进微信与 DeepSeek 的交融。

(, 下载次数: 0)

<img   />

「元宝」入驻微信|图片来源:极客公园

相应地,腾讯也在组织架构上停止了一系列调整。继腾讯元宝从 TEG(技术工程事业群)并入 CSIG(腾讯云与产业事业群)之后,QQ 阅读器、搜狗输入法、ima 等更多产品也陆续划归 CSIG,组成腾讯在大模型时代面向 C 端的新产品阵列。同时,这些产品本来从属的团队和组织也将从 PCG(平台与内容事业群)全体调整至 CSIG,以更集中地推进 AI 战略下的产品规划与晋级。

这一系列疾速动作,其实表现了腾讯对「AI 是才能,不是目的」的判别。更强的模型、更开放的生态,只需能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快顺应变局的一家公司——甚至可以说,这次 AI 开放生态的发展节拍,刚好踩中了腾讯最擅长的才能嵌套逻辑。

字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、昔日头条、番茄小说等超大规模运用场景。既想做 AGI 技术的引领者,又不愿放弃在运用层面的优势闭环。

但这就带来了中间要抓的压力——模型要抢先,产品也要突出,生态既要自洽又要开放。在 DeepSeek-R1 爆火之后,字节一方面末尾重申「AGI 是核心目的」,加强对豆包的投入,也在开源方面更多动作;另一方面在运用层也出现了新的应战:到底是坚持「豆包+字节运用」的闭环道路,还是打破内外壁垒,接入更强的外部模型去赛马?

据正点报道,字节跳动最后对能否将 DeepSeek 接入旗下产品持观望态度,外部普遍以为「随时可以接入,不急」。但是,机遇稍纵即逝,春节过后,字节末尾紧急调动团队加班开发,加速整合 DeepSeek。

目前看,字节的策略还在过渡期。一方面,它在对表面达中强调开源、强调开放生态价值;另一方面,在外部系统上,豆包依然是很多运用场景的默许选择,只在少许运用上开放对 DeepSeek 模型的接入。但将来会不会像腾讯一样,末尾在更广泛的层面接入第三方模型,或者在某些运用上放开「自家模型优先」的准绳,如今还没有完全看清楚。

过去几个月是 AI 大厂们重新定位本人的生态角色、重新判别技术途径的关键窗口期。阅历了 DeepSeek-R1 带来的「才能维度重构」之后,各家公司几乎都末尾重新聚焦 AGI 这个长期目的,同时也在技术和生态层面愈加理想与开放。

不过,即便目的分歧,途径选择依然千差万别。这背后,是每家公司对本身优势的认知差异,也是它们对「AI 时代应该怎样跑」的不同下注。

03
技术颠覆面前,没有永远的「历史赢家」

AI 行业不会由于某一个产品忽然「杀出重围」而终结对抗,它注定是一场持续演出的生态重构游戏——生态地位、才能分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思索「我是谁、我该怎样做」。

在 DeepSeek-R1 的冲击下,大厂末尾重新审视本人与 AI 的关系。这场变化不会中止:在 AI 这个疾速演进的技术浪潮中,任何人其实都没有资历背负历史包袱。

历史包袱,不只是落后的产线、繁重的组织、冗余的团队,更是一种途径依赖式的认知惯性。

过去几年,整个 AI 行业积累了太多「默许共识」:比如做大模型一定要砸上亿美金、做 AI 运用一定要追求闭环、只要 To B 业务才能构成支出闭环、AI 不是消费品只能是工具型软件……这些「感性判别」在过去的技术范式下看似正确,但在新途径被打通之后,很多「感性」就变成了限制想象力的牢笼。

技术革命的残酷性就在于,它并不会给巨头太多「吃成本」的机会。AI 的疾速迭代,正不断吞噬那些依赖过往成功阅历的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对理想的一种「醒悟」:在 AI 的有限游戏中,独一的生活法则,是保持战略弹性——既要摒弃对历史阅历的自觉依赖,也要以开放姿态,拥抱技术普惠的新趋向。

旧范式困住了谁?

回顾国内过去两三年内大厂与头部创业公司的发展途径,几乎都踩在一套「经典剧本」上:

先围绕一个目的设定 OKR;

再从模型才能、数据体系、运用矩阵做残缺闭环;

最终希望经过模型降本、产品增长、生态协同走通商业途径。

这个逻辑没错,但成绩是它太像过去互联网时代的打法了——它默许「资源越多,途径越明晰」;但AI的渐变恰恰是在途径模糊中迸发的。

比如,之前很多团队一边追求「闭环场景」,一边困于「才能不足」;一边想讲「自主模型」的故事,一边又拿不到基础设备层的调优才能。很多战略决策是「既定假设+组织惯性」的结果——看起来合理,但没人停上去问:假如这些假设本身就错了呢?

反观这轮跑出来的新玩家,无论是 DeepSeek、Manus,他们有个共同点:思想轻盈,没有历史负担,也没有道路执念,这反而让他们成了这轮范式跃迁的开拓者。

假如回过头去看,DeepSeek 和 Manus 做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?由于它们过于感性、过于系统化,也就过于保守。

比如大厂能够会问:做 MoE 到底能不能规模化?极限调优是不是糜费工夫?——这些成绩本身没错,但当还没验证过途径,就先否定它,那能够永远不会发现新大陆。

这也是为什么,越来越多投资人、开发者、行业观察者末尾重新审视 AI 创业的价值判别:不是谁能讲出最全的闭环,不是谁能招来最多的模型迷信家,而是——谁能打破「历史正确性」,走出一条技术与产品都能疾速验证的新道路。

在 AI 这条超高速行进的技术公路上,最风险的不是落后一步,而是还置信旧的红绿灯规则。真正的变化总是发生在「不合理」与「不被看好」之间。

*头图来源:视觉中国本文为极客公园原创文章,转载请联络极客君微信 geekparkGO

极客一问你如何对待 DeepSeek 带来的影响?

(, 下载次数: 0)

<img   />

(, 下载次数: 0)

<img   />

(, 下载次数: 0)

<img   />

热点视频
马斯克:我希望死后人们还能记得我为文明发展做出了贡献。

点赞关注极客公园视频号,观看更多精彩视频



<img   />

更多阅读

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

<img   />

<img   />




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5