职贝云数AI新零售门户

标题: DeepSeek识图上线:梁文锋的＂选择＂有了新答案 [打印本页]

作者: TG3eX0y 时间: 昨天 22:27
标题: DeepSeek识图上线:梁文锋的＂选择＂有了新答案

5天前说不支持多模态，5天后灰度测试识图形式——这不是打脸，是分阶段。

之前写过一篇文章，标题是《DeepSeek V4发布了，为什么还是纯文本？》。

核心结论是：梁文锋选择了先适配国产芯片，牺牲了多模态。

如今看来，这个结论只猜对了一半。

发生了什么

4月24日，DeepSeek V4发布。技术规格写得清清楚楚：纯文本模型，不支持多模态。

当时很多人困惑：别家都在卷多模态，DeepSeek为什么不跟？

4月28日，DeepSeek多模态团队的陈小康发了条推文："Soon, we see you. 👀"

配图是两只鲸鱼logo，一只戴着"XX"眼罩，一只摘下眼罩。

4月29日，他又发了一条："Now, we see you."

同一天，DeepSeek网页端上线了"识图形式"，标注"图片了解功能内测中"。

从"不支持多模态"到"灰度测试识图"，只隔了5天。

梁文锋的选择2

之前我们分析过，DeepSeek V4为什么不做多模态：

是由于政治义务，要用国产芯片，而国产芯片适配曾经吃掉了一切资源。

从CUDA转向华为昇腾，不是简单的迁移，是"从底层架构末尾的换骨"。

梁文锋的取舍很清楚：

资源有限，必须做选择。先证明国产芯片能用，再思索其他。

这个逻辑变了吗？

没有。

那为什么5天后又有识图形式了？

由于国产芯片适配这一关，先迈过去了。

关键不在"做不做"，在"什么时分做"

V4发布的时分，很多人以为DeepSeek放弃了多模态。

其实不是放弃，是排队。

梁文锋的优先级很清楚：

国产芯片适配 > 多模态功能。

V4发布意味着什么？意味着国产芯片适配这一关，曾经过了最难的时分。

资源可以释放出来，补其他课。

多模态就是一门要补的课。

为什么多模态这门课必须补？

不是跟风，是真需求。

V4发布稿里，DeepSeek把Agent才能作为三个核心卖点之一。

但纯文本Agent有下限。

举个例子：

你让Agent帮你操作阅读器，它看不到屏幕，怎样操作？

你让Agent帮你读一份PDF报告，它看不到图表，怎样了解？

你让Agent帮你分析一张截图，它看不到图片，怎样处理？

没有视觉了解，Agent就是残废的。

所以识图才能不是"如虎添翼"，是Agent才能的"入场券"。

DeepSeek的识图有什么不一样？

这个值得多说几句。

传统的OCR是“读文字”，辨认图片里的字，输入出来。

DeepSeek的识图形式是“读画面”，了解图片的语义，输入分析。

有个实测案例：

有人上传了一张"慵懒风躺姿"的照片。

DeepSeek不是简单说"这是一张人像照片"。

它是这样思索的：

先拆解画面，地位、姿态、头发、着装、光影。

然后自我修正，“能够是淑女姿态”、“能够是忧郁自拍”，不对，这些都不能完全涵盖，“慵懒氛围感姿态”才是最准确的描画。

最后辨认文明语境，这是小红书、抖音上常见的“清冷氛围感姿态”。

最关键的是"自我修正"这一步。

模型会先列出几种能够的解读，再判别哪个最能解释一切细节。

这不是在"辨认"，是在"了解"。

梁文锋的选择还在继续

之前那篇文章，我们说梁文锋选择了"先适配国产芯片，再补其他"。

如今看，这个判别是对的。

但他还有一个选择：灰度测试，不高调发布。

没有发布会，没有宣传，就是一个小范围的灰度，标注"内测中"。

这是梁文锋一向的风格，先做出来，让用户试，好用了再说。

还有一个选择没定：开源还是闭源？

DeepSeek一向开源。

但思索到正在以超过200亿美元估值寻求融资，这个选择能够有变化。

开源意味着技术外溢，闭源意味着护城河。

这次识图形式的模型，会不会开源？

这个信号值得关注。

回到那个成绩：梁文锋变了吗？

没有。

V4发布时不做多模态，是由于资源被国产芯片适配占满了。

如今做，是由于适配这一关先过了。

先做什么后做什么，这个优先级从来没变。

梁文锋的选择逻辑很清楚：

资源有限，必须取舍。先过国产芯片这一关，再补多模态这门课。

5天前说不支持，5天后灰度测试，这不是"反复"，是"分阶段"。

这门课补上之后呢？

DeepSeek的Agent才能终于残缺了。

之前只能处理文本，如今能看图、读截图、了解界面。

和Claude Code竞争，也有了基础。

国产大模型的多模态竞争，又多了一个玩家。

梁文锋的"选择"，还在继续。

你怎样看DeepSeek这次识图上线？

评论区聊聊！

点个"在看"，让更多关注国产AI的冤家看到。 👇

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)