DeepSeek-V3.1 发布

5UzkOc · 发表于 2025-8-21 16:43:37

DEEPSEEK
V3.1 邪式公布2025年08月21日
北京混淆拉理架构
思考/非思考情势开一更下思考服从
更少 Token，更快照应更强 Agent才干
东西使用取智能体任务提拔MODEL UPDATES中心架构取使用混淆拉理架构: 简单模子撑持思考取非思考单情势。
网页端/App: 已经共步升级，颠末“深度思考”按钮自由切换。
API 升级: 高低文扩大至 128K。
• deepseek-chat 对于应非思考情势。
• deepseek-reasoner 对于应思考情势。AGENT BOOST智能体才气增强颠末 Post-Training 劣化，东西使用取智能体任务表示年夜幅提拔。
编程智能体: 正在代码建设 (SWE) 战号令止末端 (Terminal-Bench) 评测中，比拟旧版模子有清楚进步。

搜刮智能体: 正在庞大搜刮 (browsecomp) 战多教科困难 (HLE) 尝试上，功用年夜幅争先 R1-0528。
DeepSeek-V3.1 公布w2.jpg

EFFICIENCY UP思考取输出服从思考情势 (V3.1-Think): 经思惟链收缩锻炼，输出 token 数削减 20%-50%，而功用取 R1-0528 持仄 (如 AIME, GPQA 等评测)。
非思考情势: 比拟 V3-0324，输出少度清楚削减，共时连结划一模子功用。
DeepSeek-V3.1 公布w3.jpg

API & FRAMEWORKAPI 新特征Strict Mode FC: Beta 交心撑持严峻情势的 Function Calling，保证输出严峻满意 Schema 界说。
Anthropic API 兼容: 增加对于 Anthropic API 格局的撑持，可轻快将 V3.1才干交进 Claude Code 等框架。OPEN SOURCE模子启源取手艺重心锻炼删质: V3.1 Base 模子正在 V3根底上分外锻炼了 840B tokens。
启源模子: Base 模子取后锻炼模子均已经正在 Huggingface 战魔拆启源。
留神: 使用 UE8M0 FP8 Scale 参数粗度；分词汇器及 chat template 取 V3 存留较年夜差别，布置需详读新文档。PRICING ADJUST价钱调解报告生效时间: 北京时间 2025年9月6日黄昏起。
调解实质:
1. 施行新版价钱表。
2. 打消夜间时段劣惠。
过度期: 正在 9月6日前，仍按本价钱策略计费。API效劳资本已经扩容。

Hugging Face
huggingface.co/deepseek-ai魔拆 (ModelScope)
modelscope.cn/organization/deepseek-ai

越消费越富有？陕西永倍达疑涉传销被多地发

DeepSeek-V3.1 发布

用deepseek疾速寻觅供应商资源真的靠谱吗?

关于我们

产品与服务

全网营销

加盟与合作