职贝云数AI新零售门户

标题: DeepSeek V4 要来了!这次不和英伟达玩了? [打印本页]

作者: KOsV 时间: 4 天前
标题: DeepSeek V4 要来了!这次不和英伟达玩了?
间隔DeepSeek R1问世，曾经了1年多了。这时期，虽然 DeepSeek 也停止了几个小版本的更新，但是暂时没有特别大的晋级。我都感觉DeepSeek曾经快要被其他家的AI大模型超越了。憋了一年的大招，DeepSeek V4，终于要来了！什么时分发？晋级了啥？听说还不带英伟达玩了？明天我们一同来看看。V4 到底什么时分发布？综合路透社、正点等这些靠谱的音讯源，DeepSeek V4 的发布工夫曾经基本板上钉钉了。其实，早在 2 月 11 号，V4 就悄然开启了灰度内测。假如你手快，能够曾经在网页端或者 App 上体验过那个百万上下文的版本了。大概在往年 3 月的第一周，V4 就会正式亮相。这次晋级有多猛？这次是个大更新，绝不是缝缝补补。挑几个最硬核的点来说一下：1. 100万 tokens 上下文相比上一代的128K上下文，V4 提升了将近8 倍！你可以一口吻把一整本《三体》塞出来，或者把一整个项目的源代码扔给它。这一点为模型的长文本了解、文档分析才能带来质的飞跃。2. 原生多模态支持DeepSeek V4 不再局限于文本，而是完成了原生多模态支持，可以直接生成和了解图片、视频及文字内容。3. 底层架构的创新次要是流形约束超衔接（mHC）、Engram 条件记忆模块、分层 KV 缓存存储。听不懂没关系，你只需知道，外面那个叫 mHC 的技术，让模型训练更波动，而且做到了加量不加价。4. 写代码才能大幅提升根据内测的数据，DeepSeek V4 在 SWE-Bench Verified 测试里拿了 83.7% 的高分。跨文件了解、自动调试、工程化才能大幅加强。这次，不和英伟达玩了？除了下面聊的这些晋级的点，这次最让我觉得风趣的是它对国产芯片的支持。放在以前，AI 大厂发新模型前，一定得先拿给英伟达、AMD 这些美国芯片巨头去跑测试、做适配。但这次，DeepSeek 不和英伟达玩了。据媒体爆料，V4 优先交给了国内的硬件厂商（比如华为）做早期测试和优化。至于英伟达和 AMD？这次被无视了。这信号太分明了，国产大模型正在与国产算力芯片（如华为昇腾）深度交融。也就是说，V4 跑在我们本人的芯片上，效率能够会有大惊喜。最后想想一年前 R1 带来的震撼，再看看如今DeepSeek V4 的更新力度。说假话，挺感慨的，国产AI正在疾速崛起，隐隐有超越的趋向了。极低的推理成本、万亿级的参数、加上丝滑的国产算力适配……等 3 月份 DeepSeek V4 真正上线那天，不知道会给我们带来什么样的体验。大家对 DeepSeek V4 怎样看？欢迎在评论区聊聊你的想法。

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)