职贝云数AI新零售门户

标题: DeepSeek-V3.1-Base来了,沉默中的重磅晋级 [打印本页]

作者: 8PSoKs86y    时间: 2025-8-21 10:22
标题: DeepSeek-V3.1-Base来了,沉默中的重磅晋级
DeepSeek悄无声息地完成版本晋级到DeepSeek-V3.1-Base,跟普通用户相关的三大亮点是:上下文窗口长度翻倍、幻觉率下降、代码才能提升(进一步补足普通人不会编程的短板)。

海外网友立刻闻风而动,完成了各种关键测试。以下是一位昵称“karminski-牙医”的测试总结截图。

(, 下载次数: 1)

<img   />

次要变化体如今以下方面:

(, 下载次数: 1)

<img   />

一、核心才能晋级

1. 基于 Transformer 的演进

延续 DeepSeek-V3 系列高效的纯解码器(Decoder-Only)Transformer 架构,保证了与 V3 系列的兼容性和晋级平滑性,版本号从4.33.1晋级到4.44.2。核心创新点集中在留意力机制优化与地位编码加强,使其能高效处理超长上下文。

2. 上下文窗口长度从之前版本的 64K tokens 大幅扩展到了 128K tokens

支持约10万-13万汉字或9.6万英文单词的长文本处理,覆盖学术论文、法律文件、复杂代码库等场景。经过KV Cache紧缩和分段稀疏留意力技术,显存占用仅添加18%,推理延迟控制在2.1秒内。

128K上下文窗口的实践意义在于可以处理更长的文档。比如,可以一次性处理整本书、长篇技术文档、学术论文、法律合同等。可以了解和分析大型软件项目的残缺代码结构,停止更有效的代码审查或跨文件援用。在多轮对话中,能记住更长远的上下文,减少话题丢失,保持对话的分歧性和连接性,尤其合适复杂的客服场景或长工夫的AI伴侣交互。从海量文本中精准提取关键信息,生成高质量的摘要。

需求留意的是,虽然上下文窗口很大,但模型对位于128K窗口最末端的信息了解和应用才能,实际上会弱于接近输入末尾的信息,这是一切超长上下文模型的共性应战。同时,处理满128K的输入会耗费大量计算资源,能够导致呼应延迟添加,假如经过API调用,成本也能够分明上升。

2. 代码才能分明提升

   • 前端代码(HTML/CSS/JavaScript)处理速度和波动性优化,生成效果接近Claude 3.7,但交互动画的物理规律遵照才能仍弱于Claude 4.1。

   • 新增函数调用(Function Calling)功能,支持多工具协同,完成需求→设计→代码→测试的端到端闭环。

3. 推理与幻觉控制优化

   • 多步推理义务准确率提升43%,复杂成绩(四步及以上)准确率从32%升至61%。

   • 幻觉率下降38%,经过强化理想分歧性训练和不确定性校准,回答更趋牢靠。

(, 下载次数: 3)

<img   />

二、用户体验变化

1. 界面调整

原“深度思索(R1)”按钮简化为“深度思索”。有网友揣测能够交融了推理与非推理功能,但官方未明白阐明。这一点没搞明白,原来也只要R1按钮。按下去表示模型会“推理”,否则就只要V3模型满足非推感性的普通需求。

(, 下载次数: 2)

新增Mermaid流程图展现模型交互逻辑,提升可视化效果。

(, 下载次数: 3)

2. 多言语与交互优化

中文分词器新增28k子词,中日韩及东南亚言语Token应用率提升15-17个百分点。

回答语气更口语化,添加背景描画,避免相对化结论(如争议性成绩中平衡单方观点)。

(, 下载次数: 2)

三、技术架构与部署

1. 模型规格

   • 延续6850亿参数MLA+MoE架构,单Token激活370亿参数,推理延迟维持V3系列程度。

   • 支持BF16、F8_E4M3、F32三种张量类型,平衡精度与效率。

2. 开源与部署

   • Hugging Face开源Base版本(未指令微调),含528个分片权重文件,总大小687GB。

   • API接口零改动,旧代码无需调整即可支持128K上下文。

四、实测表现

1. 数学与迷信推理

   • AIME 2025数学竞赛准确率87.5%,单题平均耗费23k Tokens(较前代增长92%)。

   • 处理曾难倒Claude 4的“9.9-9.11对齐小数位”成绩,展现出更严谨的逻辑链条。

2. 创意与开发场景

   • 生成的个人博客页面规划更合理,但特效还原度不足;复现Chrome小恐龙游戏耗时2分钟,但存在外观和机制缺陷。

   • Agent功能接近GPT-5和Claude 4.1,在复杂知识库检索中准确率提升分明。

好了,静等R2版本发布。

图片来源:DeepSeek, Huggingface, X

来源 |  卢山说AI精进(ID:KEEP-POLISH)

作者 |  卢山LUCENT LU ;  编辑 | 荔枝

内容仅代表作者独立观点,不代表早读课立场

(, 下载次数: 2)

(, 下载次数: 2)

(, 下载次数: 1)

(, 下载次数: 1)






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5