职贝云数AI新零售门户

标题: DeepSeek V4.1灰度走漏:代码"天差地别",多模态这次能够真来了 [打印本页]

作者: fSh5o    时间: 昨天 08:40
标题: DeepSeek V4.1灰度走漏:代码"天差地别",多模态这次能够真来了
6月15日,Linux.do社区一个帖子炸了。

网友@风 云雨发现,DeepSeek网页版疑似悄然上架了V4.1 Flash模型。他观察到了两个变化:知识截止从2025年5月跳到了2026年1月,常用的鸬鹚SVG测试分明变好。

随后他又用金门大桥Three.js场景做了深度测试,评价就四个字——天差地别。

说句不好听的,这不是什么不测。V4发布之前,DeepSeek也是这个套路:Flash先灰度,小参数模型先试水,稳了再放大参数版本。节拍你可以预判,但每次出来的东西还是能吓人一跳。

而这一次,代码炸裂,多模态也终于有了实锤。
💻 01 灰度测试代码炸裂,后训练补上关键一块

先说代码。

@风 云雨的三条测试结果在社区里传开了。鸬鹚SVG更流利,Three.js金门大桥场景差别宏大——他用的原话是"天差地别"。

其他灰度用户也反馈:网页版DeepSeek代码才能的确大幅提升了。

代码才能为什么是V4.1的主攻方向?
"Flash及Pro两个模型的基模才能不弱,缺的是后训练,这两个月工夫可以进一步调校更优秀的才能,尤其是在AI编程代码方面。"——快科技

说白就是:V4曾经把天花板撑到了,V4.1要干的是把天花板下面的东西填实。

而且有一个容易被忽略的信号——6月初,深圳市政府公布了一条音讯:深圳河套学院牵头,结合哈工大深圳校区、深圳大数据研讨院、华为、深智城等多家单位,用约1000颗昇腾910C芯片,完成了DeepSeek V4-Pro的全参数后训练,1500多步训练零缺点。

这是中国AI芯片史上第一次——国产芯片跑通了万亿参数模型的后训练。不是推理,是后训练——在已有模型基础上做全参数微调和对齐,不是从零末尾的预训练。但即便如此,1.6万亿参数的V4-Pro全参数后训练能跑通且零中缀,曾经是严重打破。此前DeepSeek R2在昇腾上连一次残缺训练都没跑完。

这意味着什么?意味着DeepSeek的后训练才能又多了一条腿。以前只能靠英伟达的卡做后训练,如今昇腾也能跑了。更多算力,更多步数,代码才能自然往上走。

代码本来就是DeepSeek的基本盘。V4-Pro-Max在Codeforces上拿了3206分,据第三方横评函数初次执行经过率超过九成——这是它和Claude、GPT掰伎俩的核心战场。V4.1假如在这个方向再拉一截,竞争格局会怎样变?

DeepSeek在代码这条赛道上,不是在追,是在甩。
📅 02 知识截止之谜与端午发布窗口

再说一个诡异的事。

灰度测试里,不同用户测出来的知识截止日期完全不一样。有人测到2026年5月,新颖得像刚出炉;有人只测到2024年,直接倒退两年;更离谱的是,同一个用户多次问,DeepSeek给的工夫也不一样。

大概率是大模型幻觉。模型本人都说不清本人知道什么,这恰恰阐明——还没定型,灰度测试停止中。

但知识更新是硬刚需。V4的知识截止卡在2025年5月,放到明天看,曾经整整落后一年了。你问它2026年的事,它要么不知道,要么编一个。V4.1假如能把知识截止推进到2026年,哪怕只到1月,也补上了一块大短板。

一个模型厉不凶猛,不只看它能做什么,还看它知道本人不知道什么。

然后是发布窗口。

DeepSeek有个不成文的规矩:挑节假日前放大招。R1是春节前发布的。如今马上端午节,The Information早在5月就报道过DeepSeek计划6月推出V4.1。Flash曾经在灰度了——按照V4的节拍,正式发布能够就是一周内的事。

时点选择不是随意的。节假日流量高峰,话题容易集中迸发,传播效率最大化。

别人赶deadline,DeepSeek赶节假日。
👁️ 03 多模态画风反转:悲观预期被打脸

然后说多模态——这次的画风能够跟很多人想的不一样。

V4.1会不会搭载多模态?社区分析之前普遍悲观——觉得不理想。理由也硬:多模态对推理算力的要求指数级上升,DeepSeek的定价极低(V4-Flash输入1元/百万Token,Pro永世降到了原价的1/4),这个价格体系曾经是赔本赚呼喊了;再加上第三方反代薅得千疮百孔,GitHub上的DS2API项目截至6月初已拿超过1200颗Star,把收费额度转成标准API白嫖,开放多模态等于多开一个破绽。

但最新信号跟悲观预期打了脸。

6月12日,有海外技术媒体发现,DeepSeek曾经悄然上线了图像辨认功能,面向大多数测试用户开放。这个功能的入口在输入框上方,跟"疾速形式""专家形式"并列——这不是实验性附加功能的地位,这是核心才能的排面。

The Information 5月的报道也确认V4.1将新增图像和音频了解功能。DataLearnerAI的V4.1模型卡异样标注了输入模态为"文本、图像、音频"。

所以,多模态不是"大概率没有",而是大概率有,只是范围能够有限——图像了解先上,音频和文生图能够后续迭代。白嫖和成本成绩怎样处理?大概率是网页端限制交互频率、API端单独计费,两条线分治。

DeepSeek的选择比外界想象的更激进:不是先把文本和代码做到极致再谈多模态,而是趁着灰度热度把多模态一同推了。

这不是才能成绩,是节拍成绩。梁文锋赌的是——多模态早推比晚推更有战略价值,抢在对手之前把全模态的盘子占住。

V4.1的核心信号就三条:代码才能拉满,知识更新补齐,多模态能够同船到达。

DeepSeek的节拍感不断很准——V4用"价格屠夫"的身份打下了市场,V4.1假如同时交出代码+多模态两张卷子,那就不是单点碾压,而是片面施压

端午节假如真发了,梁文锋打的就是这张牌。

不是精准补刀,是片面宣战。

你觉得V4.1多模态能不能打?评论区聊聊。

觉得有用就转发给异样关注AI的冤家吧 👇




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5