开启左侧

深度求索 DeepSeek-V3.1 发布,官方称之:迈向智能体时代的第一步

[复制链接]
华夏野生智能公司深度供索(DeepSeek)邪式公布了 DeepSeek-V3.1,那是对于其5个月前拉出的V3版原的一次严峻升级。

这次公布被望为DeepSeek加入“智能体时期”的枢纽一步,民间称其为“迈背Agent(智能体)时期的第一步”。新模子引进了**混淆拉理架构**,正在思考服从、Agent才气战多语言撑持等圆里均有清楚提拔。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w2.jpg

模子升级:混淆拉理架构的反动性突破

DeepSeek-V3.1最众目睽睽的特性是其混淆拉理架构,一个模子共时撑持思考情势(Think Mode)取非思考情势(Non-Think Mode)。

用户可颠末民间App或者网页真个“深度思考”按钮自由切换那二种情势。正在API交心中,deepseek-chat对于应非思考情势,deepseek-reasoner对于应思考情势,二者均撑持128K高低文少度。

这类设想让用户能够按照任务庞大度活络挑选照应体制—简朴任务快速照应,庞大成就深度思考。

功用提拔:服从取才气的两重奔腾

DeepSeek-V3.1正在思考服从圆里得到了清楚进步。颠末思惟链收缩锻炼,V3.1-Think正在输出token数削减20%-50%的情况下,各项任务的均匀表示取专用于拉理的前代模子R1-0528持仄。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w3.jpg

正在多项专科尝试中,V3.1展示出出色气力。编程圆里,它正在AiderPolyglot多语言编程尝试中得到71.6%的下分,逾越Claude 4 Opus等模子,而屡屡残破编程任务本钱仅1.01美圆,仅为博有体系的六十分之一。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w4.jpg

搜刮才气上,V3.1正在需要多步拉理的庞大搜刮尝试(browsecomp)取多教科大师级困难尝试(HLE)上,功用已经年夜幅争先R1-0528。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w5.jpg

智能体才气:赋能AI Agent死态的中心引擎

DeepSeek-V3.1的中心突破正在于其智能体(Agent)才气的全面提拔。颠末后锻炼劣化,新模子正在东西使用取智能体任务中的表示有较年夜提拔,更佳天撑持多步任务处置取内部体系配合。

正在代码建设测评SWE取号令止末端情况下的庞大任务(Terminal-Bench)尝试中,DeepSeek-V3.1比拟以前的DeepSeek系列模子有清楚进步。

具体来讲,它正在SWE-bench Verified上到达66.0%的胜利率(比照V3-0324的45.4%),正在Terminal-Bench上得到31.3%的分数(比照R1-0528的13.3%)。

那些提拔使患上DeepSeek-V3.1能够撑持多种Code Agent框架,开辟者能够自己拆修智能体,处置更加庞大的任务。

手艺规格:强大功用面前 的软件立异

DeepSeek-V3.1连结了671B的总参数目,但是每一个token仅激活37B参数(5.5%的激活率),接纳混淆大师(MoE)架构,正在包管功用的共时年夜幅提拔了计较服从。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w6.jpg

模子的高低文窗心从64K扩大到128K tokens,约相称于10万其中笔墨符或者96,000个英文单词汇,使其能够处置整原书籍、少篇教术论文或者庞大代码库。

锻炼数据圆里,V3.1正在V3根底上增加了840B tokens的持续预锻炼,使用了UE8M0 FP8 Scale的参数粗度,并对于分词汇器战chat模板截至了较年夜调解。

启源死态取API升级:低落开辟门坎

DeepSeek对峙启源战略,V3.1的Base模子取后锻炼模子已经正在Hugging Face取魔拆仄台启源,接纳MIT容许证,许可贸易使用取改正。

API交心也共步升级,除撑持128K高低文中,Beta交心借增加了strict情势的Function Calling,保证输出的Function满意schema界说,Function Calling 让模子能够挪用内部东西,去增强自己才气。
那里以获得用户目前职位的气候疑息为例,展示了使用 Function Calling 的残破 Python 代码。from openai import OpenAIdef send_messages(messages):    response = client.chat.completions.create(        model="deepseek-chat",        messages=messages,        tools=tools    )    return response.choices[0].messageclient = OpenAI(    api_key="<your api key>",    base_url="https://api.deepseek.com",)tools = [    {        "type": "function",        "function": {            "name": "get_weather",            "description": "Get weather of a location, the user should supply a location first.",            "parameters": {                "type": "object",                "properties": {                    "location": {                        "type": "string",                        "description": "The city and state, e.g. San Francisco, CA",                    }                },                "required": ["location"]            },        }    },]messages = [{"role": "user", "content": "How's the weather in Hangzhou?"}]message = send_messages(messages)print(f"User>\t {messages[0]['content']}")tool = message.tool_calls[0]messages.append(message)messages.append({"role": "tool", "tool_call_id": tool.id, "content": "24℃"})message = send_messages(messages)print(f"Model>\t {message.content}")

并增加了对于Anthropic API格局的撑持,让各人能够轻快将 DeepSeek-V3.1 的才气交进 Claude Code 框架。
为了满意各人对于 Anthropic API 死态的使用需要,DeepSeek的 API 新删了对于 Anthropic API 格局的撑持。颠末简朴的设置,便可将 DeepSeek 的才气,交进到 Anthropic API 死态中。将 DeepSeek 模子交进 Claude Code装置 SMALL_FAST_MODEL=deepseek-chat加入名目目次,施行 claude 号令,便可开端使用了。cd my-projectclaude颠末 Anthropic API 挪用 DeepSeek 模子装置 Anthropic SDKpip install anthropic设置情况变质export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropicexport ANTHROPIC_API_KEY=${YOUR_API_KEY}挪用 APIimport anthropicclient = anthropic.Anthropic()message = client.messages.create(    model="deepseek-chat",    max_tokens=1000,    system="You are a helpful assistant.",    messages=[        {            "role": "user",            "content": [                {                    "type": "text",                    "text": "Hi, how are you?"                }            ]        }    ])print(message.content)
价钱策略圆里,从2025年9月6日黄昏起,DeepSeek将调解API交心挪用价钱,并打消夜间时段劣惠。

使用场景:从编程到多语言的普遍合用

DeepSeek-V3.1正在多语言撑持才气上有清楚劣化,今朝能处置超越100种语言,特别对于亚洲语言战资本较少语种的使用截至了劣化。

使用场景包罗:
    - 少文档阐发:教术论文、法令文献、手艺脚册;-顺序 开辟:特别是前端取庞大代码库保护;- 教诲教导:STEM范围本性化讲授;- 贸易智能:庞大数据阐发取陈述天生;- 实质创做:多语实质天生取翻译。

DeepSeek-V3.1的问世不但是一次手艺迭代,更是通背智能体未来的桥梁。其混淆拉理架构让一个模子共时具备快速照应战深度思考二种才气,而年夜幅增强的Agent功用则使开辟者能够建立真实合用的智能体使用。

跟着API死态的完美战启源模子的开释,DeepSeek-V3.1在低落初级AI才气的获得门坎,让每一个开辟者皆能站正在智能体时期的前沿。

深度供索 DeepSeek-V3.1 公布,民间称之:迈背智能体时期的第一步w7.jpg

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )