职贝云数AI新零售门户
标题:
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
[打印本页]
作者:
TG3eX0y
时间:
2025-8-23 10:54
标题:
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
点击上方“慧天地”关注
(, 下载次数: 0)
上传
点击文件名下载附件
转载自微信公众号新智元,编辑:桃子,版权归原作者及刊载媒体一切。
(, 下载次数: 1)
上传
点击文件名下载附件
(, 下载次数: 2)
上传
点击文件名下载附件
【新智元导读】DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。
官宣了!
DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。
新版V3.1采用了「混合推理」,一个模型,两种模型:思索与非思索(自主切换)。
(, 下载次数: 2)
上传
点击文件名下载附件
相较于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快。
最关键的是,V3.1具有了弱小的智能体才能,不论是工具运用,还是多步骤义务,全部拿捏。
在软件工程基准测试中,DeepSeek-V3.1全方位碾压V3-0324和R1-0528。
(, 下载次数: 1)
上传
点击文件名下载附件
在人类的最后考试HLE中,V3.1拿下了29.8高分,另内在数学、知识问答、编程等义务中,片面超越推理模型R1。
(, 下载次数: 2)
上传
点击文件名下载附件
CoT紧缩训练后,V3.1-Think在输入token减少了20%-50%,与R1-0528打成平手
在Hugging Face上,一共开源了两款V3.1 Base和V3.1,前者在V3基础上又停止了8400亿token的持续预训练,扩展了上下文支持。
(, 下载次数: 0)
上传
点击文件名下载附件
项目地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
总的来说,DeepSeek-V3.1此次更新的最大亮点:
参数共671B,激活参数37B,上下文128k
混合推理形式:一个模型,即可同时支持推理形式和非推理形式。
更智能的工具调用才能:工具运用、智能体义务有了分明提升,多步推理才能强化,复杂搜索不在话下
更高的推理效率:回答质量上与DeepSeek-R1-0528相媲美,思索效率飙升,反应快如闪电
片面基准测试:实力片面碾压DeepSeek-R1-0528、DeepSeek-V3-0324
在API方面,deepseek-chat是非思索形式,deepseek-reasoner是思索形式,全部支持128k。
(, 下载次数: 0)
上传
点击文件名下载附件
从9月5日末尾,采用新的API定价
继OpenAI gpt-oss之后,DeepSeek终于做出了最强回应。
(, 下载次数: 1)
上传
点击文件名下载附件
V3.1编程击败Claude 4,训练扩增10倍
HF模型卡中,给出了DeepSeek新模型技术的详细解读。
基于DeepSeek-V3.1-Base,DeepSeek-V3.1经过后训练优化完成。而V3.1-Base又是基于V3模型训练而来。
(, 下载次数: 1)
上传
点击文件名下载附件
详细来说,它经过「两阶段长上下文扩展策略」构建,遵照了原始V3论文中的方法。
研讨团队又扩展了数据集,搜集了更多长文档,并大幅延伸了两个训练阶段的规模。
32k扩展阶段添加了10倍,达6300亿Token,而128k扩展阶段添加了3.3倍,达到2090亿Token。
(, 下载次数: 1)
上传
点击文件名下载附件
此外,DeepSeek-V3.1采用UE8M0 FP8缩放数据格式停止训练,确保与微尺度数据格式的兼容性。
在通用才能的基准测试中,开启思索形式V3.1,在MMLU、GPQA上拿下了亮眼的成绩。
(, 下载次数: 1)
上传
点击文件名下载附件
数学方面,V3.1异样刷新SOTA,创下了最高分。
(, 下载次数: 0)
上传
点击文件名下载附件
如上文所述,V3.1是迈向智能体时代第一步。它可以支持多种Code Agent框架,开发者可以本人搭建智能体。
在编码测试中,DeepSeek-V3.1-Thinking在Aider编码测试中,拿下了76.3%高分,远超Claude 4 Opus、Gemini 2.5 Pro(0325)。
(, 下载次数: 0)
上传
点击文件名下载附件
在编码智能体测试中,DeepSeek-V3.1-Non Thinking功能碾压R1、V3。
(, 下载次数: 1)
上传
点击文件名下载附件
此外,DeepSeek-V3.1可以支持Search Agent,在推理形式下可以运用。
当需求访问外部信息或最新信息的复杂成绩,V3.1可以经过多轮工具调用流程,应用用户提供的搜索工具来完成。
基准测试中,尤其是BrowseComp上,V3.1实力粉碎了R1。
(, 下载次数: 2)
上传
点击文件名下载附件
第三方Artificial Analysis基准,异样验证了DeepSeek-V3.1弱小实力,仅次于gpt-oss。
(, 下载次数: 1)
上传
点击文件名下载附件
在推理效率方面,V3.1也与OpenAI相当。
(, 下载次数: 0)
上传
点击文件名下载附件
如今来看,DeepSeek-V3.1稳坐编程开源第一王座。
(, 下载次数: 1)
上传
点击文件名下载附件
参考材料:
https://x.com/karminski3/status/1958429843558945015 https://x.com/deepseek_ai/status/1958417062008918312
(, 下载次数: 2)
上传
点击文件名下载附件
荐读
Meta如何应用航空航天遥感协助世界资源研讨所恢复全球森林和农场
英伟达ViPE:恣意视频一键转为3D几何数据,开源引擎与亿级帧数据集重磅发布!
关于公布2025年中国迷信院院士增选有效候选人名单的公告
《慧天地》敬告
《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界交融趋向,发现企业核心竞争力,传播测绘地理信息文明,为相关专业学子提供日常学习、考研失业一站式服务,打造政产学研金服用精准对接的平台。
《慧天地》自创《读者》办刊理念,把时空信息范畴的精髓内容汇聚到平台上。我们高度注重版权,对于精选的每一篇推文,都会在文章扫尾分明注明出处,以表达对作者和推文援用平台版权的充分尊重和感激;对于来源于网络作者不明的作品,转载时如出现侵权,请后台留言,我们会及时删除。感激大家不断以来对《慧天地》的关注和支持!
——《慧天地》运营团队
投稿、转载、商务等合作请联络
微信号:huitiandi321
(, 下载次数: 1)
上传
点击文件名下载附件
邮箱:geomaticshtd@163.com
编辑:孙凡淅,一审:孙凡淅,二审:孙凡淅,三审:万剑华指点:万剑华教授
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5