开启左侧

DeepSeek V4.1灰度走漏:代码"天差地别",多模态这次能够真来了

[复制链接]
在线会员 fSh5o 发表于 昨天 08:40 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
6月15日,Linux.do社区一个帖子炸了。

网友@风 云雨发明,DeepSeek网页版信似悄悄上架了V4.1 Flash模子。他察看到了二个变革:常识停止从2025年5月跳到了2026年1月,经常使用的鸬鹚SVG尝试清楚变佳。

随即他又用金门年夜桥Three.js场景干了深度尝试,评介便四个字——天好天别。

道句欠好听的,那没有是甚么意外。V4公布以前,DeepSeek也是那个套路:Flash先灰度,小参数模子先试火,稳了再缩小参数版原。节奏您能够预判,但是屡屡进去的工具仍是能吓人一跳。

而那一次,代码炸裂,多模态也终究有了真锤。
💻 01 灰度尝试代码炸裂,后锻炼补上枢纽一齐

先道代码。

@风 云雨的三条尝试成果正在社区里传启了。鸬鹚SVG更流畅,Three.js金门年夜桥场景不同弘大——他用的本话是"天好天别"。

其余灰度用户也反应:网页版DeepSeek代码才气确实年夜幅提拔了。

代码才气为何是V4.1的主攻标的目的?
"Flash及Pro二个模子的基模才气没有强,缺的是后锻炼,那二个月时间能够退一步伐校更优良的才气,特别是正在AI编程代码圆里。"——快科技

道利剑即是:V4已经把天花板撑到了,V4.1要搞的是把天花板上面的工具挖真。

并且有一个简单被疏忽的旌旗灯号——6月初,深圳市当局宣布了一条消息:深圳河套教院牵头,分离哈工年夜深圳校区、深圳年夜数据钻研院、华为、深智乡等多野单元,用约1000颗昇腾910C芯片,完毕了DeepSeek V4-Pro的齐参数后锻炼,1500多步锻炼整缺陷。

那是华夏AI芯片史上第一次——国产芯片跑通了万亿参数模子的后锻炼。没有是拉理,是后锻炼——正在已经有模子根底上干齐参数微和谐对于齐,没有是从整开端的预锻炼。但是即使云云,1.6万亿参数的V4-Pro齐参数后锻炼能跑通且整中断,已经是严峻突破。此前DeepSeek R2正在昇腾上连一次残破锻炼皆出跑完。

那表示着甚么?表示着DeepSeek的后锻炼才气又多了一条腿。从前只可靠英伟达的卡干后锻炼,现在昇腾也能跑了。更多算力,更多步数,代码才气天然朝上走。

代码原来即是DeepSeek的根本盘。V4-Pro-Max正在Codeforces上拿了3206分,据第三圆横评函数初度施行颠末率超越九成——那是它战Claude、GPT掰手段的中心疆场。V4.1假设正在那个标的目的再推一截,合作格式会如何变?

DeepSeek正在代码那条赛讲上,没有是正在逃,是正在甩。
📅 02 常识停止之谜取端五公布窗心

再道一个诡同的事。

灰度尝试里,差别用户测进去的常识停止日期完整纷歧样。有人测到2026年5月,新奇患上像刚刚出炉;有人只测到2024年,间接发展二年;更离谱的是,统一个用户屡次问,DeepSeek给的时间也纷歧样。

大要率是年夜模子幻觉。模子自己皆道没有浑自己明白甚么,那恰好分析——借出定型,灰度尝试截至中。

但是常识革新是软刚刚需。V4的常识停止卡正在2025年5月,搁到来日诰日瞅,已经整整落伍一年了。您问它2026年的事,它要末没有明白,要末编一个。V4.1假设能把常识停止促进到2026年,哪怕只到1月,也补上了一齐年夜短板。

一个模子厉没有勇猛,不但瞅它能干甚么,借瞅它明白自己没有明白甚么。

而后是公布窗心。

DeepSeek有个不可文的端方:浮薄节沐日前缩小招。R1是秋节前公布的。现在即刻端五节,The Information早正在5月便报导过DeepSeek方案6月拉出V4.1。Flash已经正在灰度了——根据V4的节奏,邪式公布可以即是一周内乱的事。

时面挑选没有是随便的。节沐日流质顶峰,话题简单集合爆发,传布服从最年夜化。

他人赶deadline,DeepSeek赶节沐日。
👁️ 03 多模态绘风反转:灰心预期被挨脸

而后道多模态——此次的绘风可以跟许多人念的纷歧样。

V4.1会没有会拆载多模态?社辨别析以前遍及灰心——以为不睬念。来由也软:多模态对于拉理算力的请求指数级升高,DeepSeek的订价极高(V4-Flash输出1元/百万Token,Pro永久落到了本价的1/4),那个价钱系统已经是亏本赚呼叫招呼了;再加之第三圆反代薅患上千疮百孔,GitHub上的DS2API名目停止6月初已经拿超越1200颗Star,把免费额度转成尺度API利剑嫖,盛开多模态即是多启一个漏洞。

但是最新旌旗灯号跟灰心预期挨了脸。

6月12日,有外洋手艺媒介发明,DeepSeek已经悄悄上线了图象识别功用,里背年夜大都尝试用户盛开。那个功用的进口正在输出框上圆,跟"快速情势""大师情势"并列——那没有是尝试性附带功用的职位,那是中心才气的排里。

The Information 5月的报导也确认V4.1将新删图象战音频理解功用。DataLearnerAI的V4.1模子卡异常标注了输出模态为"文原、图象、音频"。

以是,多模态没有是"大要率不",而是大要率有,不过范畴可以无限——图象理解先上,音频战文死图可以后绝迭代。利剑嫖战本钱成就如何处置?大要率是网页端限定接互频次、API端零丁计费,二条线分治。

DeepSeek的挑选比中界设想的更保守:没有是先把文原战代码干到极致再道多模态,而是趁着灰度冷度把多模态共同拉了。

那没有是才气成就,是节奏成就。梁文锋赌的是——多模态早拉比早拉更有计谋代价,抢正在敌手以前把齐模态的盘子占住。

V4.1的中心旌旗灯号便三条:代码才气推谦,常识革新补齐,多模态可以共船抵达。

DeepSeek的节奏感不竭很准——V4用"价钱屠妇"的身份挨下了商场,V4.1假设共时接出代码+多模态二弛卷子,这便没有是单面碾压,而是全面施压

端五节假设实收了,梁文锋挨的即是那弛牌。

没有是精确补刀,是全面媾和。

您以为V4.1多模态能不克不及挨?批评区聊聊。

以为有效便转收给异常存眷AI的朋友吧 👇
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )