职贝云数AI新零售门户

标题: DeepSeek-R2 推延发布?一场关于功能、芯片与机遇的博弈 [打印本页]

作者: eQrFHY    时间: 2025-7-1 10:01
标题: DeepSeek-R2 推延发布?一场关于功能、芯片与机遇的博弈
最近关于 DeepSeek-R2 的讨论很热。

我翻了一下,最后的信息源应该是科技媒体 The Information 于 6 月 26 日发表的一篇题为《DeepSeek’s Progress Stalled by U.S. Export Controls》的文章,其中指出 DeepSeek 外部的 R2 模型开发遇到了两个关键瓶颈:一是 CEO 梁文锋对模型当前功能不称心,回绝同意发布;二是受限于美国政府对 NVIDIA H20 芯片的新一轮出口管制,算力短缺正本质性妨碍新模型的训练与部署。

文章还提到,R2 原定于 2025 年 5 月初发布,如今曾经默默跳票超过 50 天,DeepSeek 团队正尝试经过国产算力替代和模型结构优化来“重新构建发布条件”。

这条音讯一出,路透社、The Tech Basic、NewsBytes,以及国内的 IT 之家、新浪财经,都迅速跟进了相关报道。

那么,终究是哪里出了成绩?R2 为何迟迟不上线?这场沉默背后,隐藏着两个理想:功能没达标,芯片没到位。


01|R2 “难产”全过程



02|第一条主线:功能没过关

DeepSeek-R2 本来承载了“国产开源模型压制国外闭源模型”的野心。

根据之前的爆料,其核心规格包括(传闻,未证明):

(, 下载次数: 0)

假如是真的,那 R2 就“无敌”了。但能够正由于“目的太高”,反而卡在了最后一公里。

据 The Tech Basic 报道,R2 在外部基准测试中一直无法完成对 R1 的片面碾压,尤其在多言语、编程等关键才能上“提升有限”。

DeepSeek CEO 梁文锋对此态度坚决:“达不到标准,就不发布。”

外界很难判别 R2 的实践表现终究离“标准”差了多少,但可以揣测 DeepSeek 的态度:必须“碾压”才发布。


03|第二条主线:算力的理想冲击

技术功能之外,更理想的成绩是:DeepSeek 没有足够的芯片训练和部署 R2。

根本缘由在于 —— H20 芯片断供了。

美国政府于 2025 年 4 月晋级了对我国 AI 芯片出口管制,英伟达特供中国市场的 H20 被列入新一轮限制清单。受此影响,DeepSeek 无法继续采购新一批芯片。

回顾一下 R1 的数据(估算数据来源:SemiAnalysis)。

路透社征引知情云厂商员工泄漏,DeepSeek 已提早向云服务合作商下发了 R2 的资源规格预告(算力需求、并发目的、推理延迟目的等)。

另一方面迟迟未发布,能够是在等待“合规芯片”和“国产替代”的成熟。


04|沉默也是一种战略?

有观点以为,DeepSeek 当前的“沉默”形态,其实是一种“有意降温”。

因此,社区中出现了新的猜测:R2 能够将在 7 月下旬 WAIC(世界人工智能大会,World Artificial Intelligence Conference) 或 8 月 AI Infra Summit 上初次亮相。

但就目前来看,关于 R2 什么时分发布,DeepSeek 官方一直没有表态。


结语


做个能赢的模型,而不是能发的模型。

假如要总结一句话,那大概是这样:

DeepSeek 不是没预备好上线,而是还没预备好“打败仗”。




我是木易,一个专注AI范畴的技术产品经理,国内Top2本科+美国Top10 CS硕士。

置信AI是普通人的“外挂”,努力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的将来加速。


精选引荐






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5