职贝云数AI新零售门户

标题: DeepSeek V4 要来了!这次不和英伟达玩了? [打印本页]

作者: KOsV    时间: 4 天前
标题: DeepSeek V4 要来了!这次不和英伟达玩了?
间隔DeepSeek R1问世,曾经了1年多了。这时期,虽然 DeepSeek 也停止了几个小版本的更新,但是暂时没有特别大的晋级。我都感觉DeepSeek曾经快要被其他家的AI大模型超越了。憋了一年的大招,DeepSeek V4,终于要来了!什么时分发?晋级了啥?听说还不带英伟达玩了?明天我们一同来看看。V4 到底什么时分发布?综合路透社、正点等这些靠谱的音讯源,DeepSeek V4 的发布工夫曾经基本板上钉钉了。其实,早在 2 月 11 号,V4 就悄然开启了灰度内测。假如你手快,能够曾经在网页端或者 App 上体验过那个百万上下文的版本了。大概在往年 3 月的第一周,V4 就会正式亮相。这次晋级有多猛?这次是个大更新,绝不是缝缝补补。挑几个最硬核的点来说一下:1. 100万 tokens 上下文相比上一代的128K上下文,V4 提升了将近8 倍!你可以一口吻把一整本《三体》塞出来,或者把一整个项目的源代码扔给它。这一点为模型的长文本了解、文档分析才能带来质的飞跃。2. 原生多模态支持DeepSeek V4 不再局限于文本,而是完成了原生多模态支持,可以直接生成和了解图片、视频及文字内容。3. 底层架构的创新次要是流形约束超衔接(mHC)、Engram 条件记忆模块、分层 KV 缓存存储。听不懂没关系,你只需知道,外面那个叫 mHC 的技术,让模型训练更波动,而且做到了加量不加价。4. 写代码才能大幅提升根据内测的数据,DeepSeek V4 在 SWE-Bench Verified 测试里拿了 83.7% 的高分。跨文件了解、自动调试、工程化才能大幅加强。这次,不和英伟达玩了?除了下面聊的这些晋级的点,这次最让我觉得风趣的是它对国产芯片的支持。放在以前,AI 大厂发新模型前,一定得先拿给英伟达、AMD 这些美国芯片巨头去跑测试、做适配。但这次,DeepSeek 不和英伟达玩了。据媒体爆料,V4 优先交给了国内的硬件厂商(比如华为)做早期测试和优化。至于英伟达和 AMD?这次被无视了。这信号太分明了,国产大模型正在与国产算力芯片(如华为昇腾)深度交融。也就是说,V4 跑在我们本人的芯片上,效率能够会有大惊喜。最后想想一年前 R1 带来的震撼,再看看如今DeepSeek V4 的更新力度。说假话,挺感慨的,国产AI正在疾速崛起,隐隐有超越的趋向了。极低的推理成本、万亿级的参数、加上丝滑的国产算力适配……等 3 月份 DeepSeek V4 真正上线那天,不知道会给我们带来什么样的体验。大家对 DeepSeek V4 怎样看?欢迎在评论区聊聊你的想法。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5