职贝云数AI新零售门户

标题: DeepSeek V4.1灰度走漏:代码＂天差地别＂,多模态这次能够真来了 [打印本页]

作者: fSh5o 时间: 昨天 08:40
标题: DeepSeek V4.1灰度走漏:代码＂天差地别＂,多模态这次能够真来了
6月15日，Linux.do社区一个帖子炸了。

网友@风云雨发现，DeepSeek网页版疑似悄然上架了V4.1 Flash模型。他观察到了两个变化：知识截止从2025年5月跳到了2026年1月，常用的鸬鹚SVG测试分明变好。

随后他又用金门大桥Three.js场景做了深度测试，评价就四个字——天差地别。

说句不好听的，这不是什么不测。V4发布之前，DeepSeek也是这个套路：Flash先灰度，小参数模型先试水，稳了再放大参数版本。节拍你可以预判，但每次出来的东西还是能吓人一跳。

而这一次，代码炸裂，多模态也终于有了实锤。
💻 01 灰度测试代码炸裂，后训练补上关键一块

先说代码。

@风云雨的三条测试结果在社区里传开了。鸬鹚SVG更流利，Three.js金门大桥场景差别宏大——他用的原话是"天差地别"。

其他灰度用户也反馈：网页版DeepSeek代码才能的确大幅提升了。

代码才能为什么是V4.1的主攻方向？

"Flash及Pro两个模型的基模才能不弱，缺的是后训练，这两个月工夫可以进一步调校更优秀的才能，尤其是在AI编程代码方面。"——快科技

说白就是：V4曾经把天花板撑到了，V4.1要干的是把天花板下面的东西填实。

而且有一个容易被忽略的信号——6月初，深圳市政府公布了一条音讯：深圳河套学院牵头，结合哈工大深圳校区、深圳大数据研讨院、华为、深智城等多家单位，用约1000颗昇腾910C芯片，完成了DeepSeek V4-Pro的全参数后训练，1500多步训练零缺点。

这是中国AI芯片史上第一次——国产芯片跑通了万亿参数模型的后训练。不是推理，是后训练——在已有模型基础上做全参数微调和对齐，不是从零末尾的预训练。但即便如此，1.6万亿参数的V4-Pro全参数后训练能跑通且零中缀，曾经是严重打破。此前DeepSeek R2在昇腾上连一次残缺训练都没跑完。

这意味着什么？意味着DeepSeek的后训练才能又多了一条腿。以前只能靠英伟达的卡做后训练，如今昇腾也能跑了。更多算力，更多步数，代码才能自然往上走。

代码本来就是DeepSeek的基本盘。V4-Pro-Max在Codeforces上拿了3206分，据第三方横评函数初次执行经过率超过九成——这是它和Claude、GPT掰伎俩的核心战场。V4.1假如在这个方向再拉一截，竞争格局会怎样变？

DeepSeek在代码这条赛道上，不是在追，是在甩。
📅 02 知识截止之谜与端午发布窗口

再说一个诡异的事。

灰度测试里，不同用户测出来的知识截止日期完全不一样。有人测到2026年5月，新颖得像刚出炉；有人只测到2024年，直接倒退两年；更离谱的是，同一个用户多次问，DeepSeek给的工夫也不一样。

大概率是大模型幻觉。模型本人都说不清本人知道什么，这恰恰阐明——还没定型，灰度测试停止中。

但知识更新是硬刚需。V4的知识截止卡在2025年5月，放到明天看，曾经整整落后一年了。你问它2026年的事，它要么不知道，要么编一个。V4.1假如能把知识截止推进到2026年，哪怕只到1月，也补上了一块大短板。

一个模型厉不凶猛，不只看它能做什么，还看它知道本人不知道什么。

然后是发布窗口。

DeepSeek有个不成文的规矩：挑节假日前放大招。R1是春节前发布的。如今马上端午节，The Information早在5月就报道过DeepSeek计划6月推出V4.1。Flash曾经在灰度了——按照V4的节拍，正式发布能够就是一周内的事。

时点选择不是随意的。节假日流量高峰，话题容易集中迸发，传播效率最大化。

别人赶deadline，DeepSeek赶节假日。
👁️ 03 多模态画风反转：悲观预期被打脸

然后说多模态——这次的画风能够跟很多人想的不一样。

V4.1会不会搭载多模态？社区分析之前普遍悲观——觉得不理想。理由也硬：多模态对推理算力的要求指数级上升，DeepSeek的定价极低（V4-Flash输入1元/百万Token，Pro永世降到了原价的1/4），这个价格体系曾经是赔本赚呼喊了；再加上第三方反代薅得千疮百孔，GitHub上的DS2API项目截至6月初已拿超过1200颗Star，把收费额度转成标准API白嫖，开放多模态等于多开一个破绽。

但最新信号跟悲观预期打了脸。

6月12日，有海外技术媒体发现，DeepSeek曾经悄然上线了图像辨认功能，面向大多数测试用户开放。这个功能的入口在输入框上方，跟"疾速形式""专家形式"并列——这不是实验性附加功能的地位，这是核心才能的排面。

The Information 5月的报道也确认V4.1将新增图像和音频了解功能。DataLearnerAI的V4.1模型卡异样标注了输入模态为"文本、图像、音频"。

所以，多模态不是"大概率没有"，而是大概率有，只是范围能够有限——图像了解先上，音频和文生图能够后续迭代。白嫖和成本成绩怎样处理？大概率是网页端限制交互频率、API端单独计费，两条线分治。

DeepSeek的选择比外界想象的更激进：不是先把文本和代码做到极致再谈多模态，而是趁着灰度热度把多模态一同推了。

这不是才能成绩，是节拍成绩。梁文锋赌的是——多模态早推比晚推更有战略价值，抢在对手之前把全模态的盘子占住。

V4.1的核心信号就三条：代码才能拉满，知识更新补齐，多模态能够同船到达。

DeepSeek的节拍感不断很准——V4用"价格屠夫"的身份打下了市场，V4.1假如同时交出代码+多模态两张卷子，那就不是单点碾压，而是片面施压。

端午节假如真发了，梁文锋打的就是这张牌。

不是精准补刀，是片面宣战。

你觉得V4.1多模态能不能打？评论区聊聊。

觉得有用就转发给异样关注AI的冤家吧 👇

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)