职贝云数AI新零售门户

标题: DeepSeek-V3.1 发布 [打印本页]

作者: 5UzkOc    时间: 2025-8-21 16:43
标题: DeepSeek-V3.1 发布
DEEPSEEK
V3.1 正式发布2025年08月21日
北京混合推理架构
思索/非思索形式合一更高思索效率
更少 Token,更快呼应更强 Agent 才能
工具运用与智能体义务提升MODEL UPDATES核心架构与运用混合推理架构: 单一模型支持思索与非思索双形式。
网页端/App: 已同步晋级,经过“深度思索”按钮自在切换。
API 晋级: 上下文扩展至 128K。
                         • deepseek-chat 对应非思索形式。
                         • deepseek-reasoner 对应思索形式。AGENT BOOST智能体才能加强经过 Post-Training 优化,工具运用与智能体义务表现大幅提升。
编程智能体: 在代码修复 (SWE) 和命令行终端 (Terminal-Bench) 评测中,相比旧版模型有分明提高。

搜索智能体: 在复杂搜索 (browsecomp) 和多学科难题 (HLE) 测试上,功能大幅抢先 R1-0528。
(, 下载次数: 2)
EFFICIENCY UP思索与输入效率思索形式 (V3.1-Think): 经思想链紧缩训练,输入 token 数减少 20%-50%,而功能与 R1-0528 持平 (如 AIME, GPQA 等评测)。
非思索形式: 相比 V3-0324,输入长度分明减少,同时保持同等模型功能。
(, 下载次数: 4)
API & FRAMEWORKAPI 新特性Strict Mode FC: Beta 接口支持严厉形式的 Function Calling,确保输入严厉满足 Schema 定义。
Anthropic API 兼容: 添加对 Anthropic API 格式的支持,可轻松将 V3.1 才能接入 Claude Code 等框架。OPEN SOURCE模型开源与技术要点训练增量: V3.1 Base 模型在 V3 基础上额外训练了 840B tokens。
开源模型: Base 模型与后训练模型均已在 Huggingface 和魔搭开源。
留意: 运用 UE8M0 FP8 Scale 参数精度;分词器及 chat template 与 V3 存在较大差异,部署需详读新文档。PRICING ADJUST价格调整告诉失效工夫: 北京工夫 2025年9月6日清晨起。
调整内容:
1. 执行新版价格表。                       
2. 取消夜间时段优惠。
过渡期: 在 9月6日前,仍按原价格政策计费。API 服务资源已扩容。

Hugging Face
huggingface.co/deepseek-ai魔搭 (ModelScope)
modelscope.cn/organization/deepseek-ai




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5