职贝云数AI新零售门户

标题: DeepSeek-V3.1-Base来了,沉默中的重磅晋级 [打印本页]

作者: 8PSoKs86y 时间: 2025-8-21 10:22
标题: DeepSeek-V3.1-Base来了,沉默中的重磅晋级
DeepSeek悄无声息地完成版本晋级到DeepSeek-V3.1-Base，跟普通用户相关的三大亮点是：上下文窗口长度翻倍、幻觉率下降、代码才能提升（进一步补足普通人不会编程的短板）。

海外网友立刻闻风而动，完成了各种关键测试。以下是一位昵称“karminski-牙医”的测试总结截图。

(, 下载次数: 1)

<img />

次要变化体如今以下方面：

(, 下载次数: 1)

<img />

一、核心才能晋级

1. 基于 Transformer 的演进

延续 DeepSeek-V3 系列高效的纯解码器（Decoder-Only）Transformer 架构，保证了与 V3 系列的兼容性和晋级平滑性，版本号从4.33.1晋级到4.44.2。核心创新点集中在留意力机制优化与地位编码加强，使其能高效处理超长上下文。

2. 上下文窗口长度从之前版本的 64K tokens 大幅扩展到了 128K tokens

支持约10万-13万汉字或9.6万英文单词的长文本处理，覆盖学术论文、法律文件、复杂代码库等场景。经过KV Cache紧缩和分段稀疏留意力技术，显存占用仅添加18%，推理延迟控制在2.1秒内。

128K上下文窗口的实践意义在于可以处理更长的文档。比如，可以一次性处理整本书、长篇技术文档、学术论文、法律合同等。可以了解和分析大型软件项目的残缺代码结构，停止更有效的代码审查或跨文件援用。在多轮对话中，能记住更长远的上下文，减少话题丢失，保持对话的分歧性和连接性，尤其合适复杂的客服场景或长工夫的AI伴侣交互。从海量文本中精准提取关键信息，生成高质量的摘要。

需求留意的是，虽然上下文窗口很大，但模型对位于128K窗口最末端的信息了解和应用才能，实际上会弱于接近输入末尾的信息，这是一切超长上下文模型的共性应战。同时，处理满128K的输入会耗费大量计算资源，能够导致呼应延迟添加，假如经过API调用，成本也能够分明上升。

2. 代码才能分明提升

• 前端代码（HTML/CSS/JavaScript）处理速度和波动性优化，生成效果接近Claude 3.7，但交互动画的物理规律遵照才能仍弱于Claude 4.1。

• 新增函数调用（Function Calling）功能，支持多工具协同，完成需求→设计→代码→测试的端到端闭环。

3. 推理与幻觉控制优化

• 多步推理义务准确率提升43%，复杂成绩（四步及以上）准确率从32%升至61%。

• 幻觉率下降38%，经过强化理想分歧性训练和不确定性校准，回答更趋牢靠。

(, 下载次数: 3)

<img />

二、用户体验变化

1. 界面调整

原“深度思索（R1）”按钮简化为“深度思索”。有网友揣测能够交融了推理与非推理功能，但官方未明白阐明。这一点没搞明白，原来也只要R1按钮。按下去表示模型会“推理”，否则就只要V3模型满足非推感性的普通需求。

(, 下载次数: 2)

新增Mermaid流程图展现模型交互逻辑，提升可视化效果。

(, 下载次数: 3)

2. 多言语与交互优化

中文分词器新增28k子词，中日韩及东南亚言语Token应用率提升15-17个百分点。

回答语气更口语化，添加背景描画，避免相对化结论（如争议性成绩中平衡单方观点）。

(, 下载次数: 2)

三、技术架构与部署

1. 模型规格

• 延续6850亿参数MLA+MoE架构，单Token激活370亿参数，推理延迟维持V3系列程度。

• 支持BF16、F8_E4M3、F32三种张量类型，平衡精度与效率。

2. 开源与部署

• Hugging Face开源Base版本（未指令微调），含528个分片权重文件，总大小687GB。

• API接口零改动，旧代码无需调整即可支持128K上下文。

四、实测表现

1. 数学与迷信推理

• AIME 2025数学竞赛准确率87.5%，单题平均耗费23k Tokens（较前代增长92%）。

• 处理曾难倒Claude 4的“9.9-9.11对齐小数位”成绩，展现出更严谨的逻辑链条。

2. 创意与开发场景

• 生成的个人博客页面规划更合理，但特效还原度不足；复现Chrome小恐龙游戏耗时2分钟，但存在外观和机制缺陷。

• Agent功能接近GPT-5和Claude 4.1，在复杂知识库检索中准确率提升分明。

好了，静等R2版本发布。

图片来源：DeepSeek, Huggingface, X

来源 | 卢山说AI精进（ID：KEEP-POLISH）

作者 | 卢山LUCENT LU ; 编辑 | 荔枝

内容仅代表作者独立观点，不代表早读课立场

(, 下载次数: 2)

(, 下载次数: 2)

(, 下载次数: 1)

(, 下载次数: 1)

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)