职贝云数AI新零售门户

标题: DeepSeek-V3.1 发布 [打印本页]

作者: 5UzkOc 时间: 2025-8-21 16:43
标题: DeepSeek-V3.1 发布
DEEPSEEK
V3.1 正式发布2025年08月21日
北京混合推理架构
思索/非思索形式合一更高思索效率
更少 Token，更快呼应更强 Agent 才能
工具运用与智能体义务提升MODEL UPDATES核心架构与运用混合推理架构: 单一模型支持思索与非思索双形式。
网页端/App: 已同步晋级，经过“深度思索”按钮自在切换。
API 晋级: 上下文扩展至 128K。
                     • deepseek-chat 对应非思索形式。
                     • deepseek-reasoner 对应思索形式。AGENT BOOST智能体才能加强经过 Post-Training 优化，工具运用与智能体义务表现大幅提升。
编程智能体: 在代码修复 (SWE) 和命令行终端 (Terminal-Bench) 评测中，相比旧版模型有分明提高。

搜索智能体: 在复杂搜索 (browsecomp) 和多学科难题 (HLE) 测试上，功能大幅抢先 R1-0528。
(, 下载次数: 2)
EFFICIENCY UP思索与输入效率思索形式 (V3.1-Think): 经思想链紧缩训练，输入 token 数减少 20%-50%，而功能与 R1-0528 持平 (如 AIME, GPQA 等评测)。
非思索形式: 相比 V3-0324，输入长度分明减少，同时保持同等模型功能。
(, 下载次数: 4)
API & FRAMEWORKAPI 新特性Strict Mode FC: Beta 接口支持严厉形式的 Function Calling，确保输入严厉满足 Schema 定义。
Anthropic API 兼容: 添加对 Anthropic API 格式的支持，可轻松将 V3.1 才能接入 Claude Code 等框架。OPEN SOURCE模型开源与技术要点训练增量: V3.1 Base 模型在 V3 基础上额外训练了 840B tokens。
开源模型: Base 模型与后训练模型均已在 Huggingface 和魔搭开源。
留意: 运用 UE8M0 FP8 Scale 参数精度；分词器及 chat template 与 V3 存在较大差异，部署需详读新文档。PRICING ADJUST价格调整告诉失效工夫: 北京工夫 2025年9月6日清晨起。
调整内容:
1. 执行新版价格表。
2. 取消夜间时段优惠。
过渡期: 在 9月6日前，仍按原价格政策计费。API 服务资源已扩容。

Hugging Face
huggingface.co/deepseek-ai魔搭 (ModelScope)
modelscope.cn/organization/deepseek-ai

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)