开启左侧

DeepSeek-V3.1 发布

[复制链接]
在线会员 5UzkOc 发表于 2025-8-21 16:43:37 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
DEEPSEEK
V3.1 邪式公布2025年08月21日
北京混淆拉理架构
思考/非思考情势开一更下思考服从
更少 Token,更快照应更强 Agent才干
东西使用取智能体任务提拔MODEL UPDATES中心架构取使用混淆拉理架构: 简单模子撑持思考取非思考单情势。
网页端/App: 已经共步升级,颠末“深度思考”按钮自由切换。
API 升级: 高低文扩大至 128K。
                         • deepseek-chat 对于应非思考情势。
                         • deepseek-reasoner 对于应思考情势。AGENT BOOST智能体才气增强颠末 Post-Training 劣化,东西使用取智能体任务表示年夜幅提拔。
编程智能体: 正在代码建设 (SWE) 战号令止末端 (Terminal-Bench) 评测中,比拟旧版模子有清楚进步。

搜刮智能体: 正在庞大搜刮 (browsecomp) 战多教科困难 (HLE) 尝试上,功用年夜幅争先 R1-0528。
DeepSeek-V3.1 公布w2.jpg
EFFICIENCY UP思考取输出服从思考情势 (V3.1-Think): 经思惟链收缩锻炼,输出 token 数削减 20%-50%,而功用取 R1-0528 持仄 (如 AIME, GPQA 等评测)。
非思考情势: 比拟 V3-0324,输出少度清楚削减,共时连结划一模子功用。
DeepSeek-V3.1 公布w3.jpg
API & FRAMEWORKAPI 新特征Strict Mode FC: Beta 交心撑持严峻情势的 Function Calling,保证输出严峻满意 Schema 界说。
Anthropic API 兼容: 增加对于 Anthropic API 格局的撑持,可轻快将 V3.1才干 交进 Claude Code 等框架。OPEN SOURCE模子启源取手艺重心锻炼删质: V3.1 Base 模子正在 V3根底 上分外锻炼了 840B tokens。
启源模子: Base 模子取后锻炼模子均已经正在 Huggingface 战魔拆启源。
留神: 使用 UE8M0 FP8 Scale 参数粗度;分词汇器及 chat template 取 V3 存留较年夜差别,布置需详读新文档。PRICING ADJUST价钱调解报告生效时间: 北京时间 2025年9月6日黄昏起。
调解实质:
1. 施行新版价钱表。                       
2. 打消夜间时段劣惠。
过度期: 正在 9月6日前,仍按本价钱策略计费。API效劳 资本已经扩容。

Hugging Face
huggingface.co/deepseek-ai魔拆 (ModelScope)
modelscope.cn/organization/deepseek-ai
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )