职贝云数AI新零售门户

标题: DeepSeek-V3.1 正式发布,带来多项重磅晋级! [打印本页]

作者: A6Qua4jMtW 时间: 2025-8-21 16:11
标题: DeepSeek-V3.1 正式发布,带来多项重磅晋级!
各位关注 DeepSeek 的冤家们，好音讯来啦！据 DeepSeek 官方公众号音讯，DeepSeek-V3.1 已正式发布。这次晋级可是诚意满满，带来了不少适用又弱小的新变化，快来一同看看吧！

次要晋级变化，亮点纷呈混合推理架构，灵敏应对不同场景
DeepSeek-V3.1 采用了混合推理架构，这意味着一个模型就能同时支持思索形式与非思索形式。无论是需求深化分析、层层推理的复杂义务，还是追求疾速呼应、简约输入的简单需求，它都能轻松应对，让用户的运用体验愈加灵敏便捷。更高的思索效率，节省宝贵工夫
相比 DeepSeek-R1-0528，DeepSeek-V3.1-Think 在思索形式下，能在更短工夫内给出答案。这对于那些需求疾速获取结果的用户来说，无疑是一大福音，大大节省了等待工夫，提高了工作和学习效率。更强的 Agent 才能，轻松驾驭复杂义务
经过 Post-Training 优化，新模型在工具运用与智能体义务中的表现有了较大提升。无论是处理各种工具的调用，还是完成复杂的智能体义务，都愈加得心应手，展现出了更弱小的实力。官方平台同步晋级，操作便捷
官方 App 与网页端模型已同步晋级为 DeepSeek-V3.1。用户只需经过 “深度思索” 按钮，就能完成思索形式与非思索形式的自在切换，操作简单方便，轻松享用新模型带来的优质体验。API 晋级，功能更弱小
DeepSeek API 也已同步晋级，其中 deepseek-chat 对应非思索形式，deepseek-reasoner 对应思索形式，而且上下文均已扩展为 128K。这意味着模型能处理更长的上下文信息，更好地了解用户的意图。同时，API Beta 接口支持了 strict 形式的 Function Calling，以确保输入的 Function 满足 schema 定义，让接口调用愈加规范、牢靠。另外，还添加了对 Anthropic API 格式的支持，大家可以轻松将 DeepSeek-V3.1 的才能接入 Claude Code 框架，拓展了其运用范围。
工具调用 / 智能体支持加强，表现亮眼
编程智能体
在代码修复测评 SWE 与命令行终端环境下的复杂义务（Terminal-Bench）测试中，DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有分明提高。这对于程序员们来说，无疑是一个好音讯，能在编程工作中提供更有力的支持。
搜索智能体
DeepSeek-V3.1 在多项搜索评测目的上获得了较大提升。特别是在需求多步推理的复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，其功能已大幅抢先 R1-0528，能更精准、高效地为用户提供搜索结果。
思索效率提升，输入更精准
测试结果显示，经过思想链紧缩训练后，V3.1-Think 在输入 token 数减少 20%-50% 的状况下，各项义务的平均表现与 R1-0528 持平。这意味着在保证效果的同时，大大减少了输入内容，让信息愈加精炼。
同时，V3.1 在非思索形式下的输入长度也得到了有效控制，相比于 DeepSeek-V3-0324，可以在输入长度分明减少的状况下保持相反的模型功能，让沟通愈加高效。
API & 模型开源，助力开发者
模型开源信息
V3.1 的 Base 模型在 V3 的基础上重新做了外扩训练，一共添加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源，为开发者们提供了更多的研讨和运用机会。
需求留意的是，DeepSeek-V3.1 运用了 UE8M0 FP8 Scale 的参数精度。另外，V3.1 对分词器及 chat template 停止了较大调整，与 DeepSeek-V3 存在分明差异。建议有部署需求的用户细心阅读新版阐明文档，以确保顺利部署和运用。
总的来说，DeepSeek-V3.1 的这次晋级带来了诸多惊喜，无论是功能还是功能都有了分明提升。假如你是 DeepSeek 的用户，不妨赶紧去体验一下这个新版本带来的变化；假如你还没运用过，也可以借此机会尝试一下，置信它会给你带来不错的体验！

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)