职贝云数AI新零售门户
标题:
DeepSeek-V3.1 AI的极致性价比
[打印本页]
作者:
2TWRsXY3o
时间:
2025-8-22 00:37
标题:
DeepSeek-V3.1 AI的极致性价比
在这个炎热无比的8月21日,下午14点25分,据DeepSeek官方公众号音讯,DeepSeek-V3.1正式发布。
本次晋级包含以下次要变化:
混合推理架构:一个模型同时支持思索形式与非思索形式;
更高的思索效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短工夫内给出答案;
更强的Agent才能:经过Post-Training优化,新模型在工具运用与智能体义务中的表现有较大提升。
目前,官方App与网页端模型已同步晋级为DeepSeek-V3.1。用户可以经过“深度思索”按钮,完成思索形式与非思索形式的自在切换。
(, 下载次数: 2)
上传
点击文件名下载附件
在OpenAI发布GPT-5模型14天后,梁文锋终于出招了。这次晋级,表明了DeepSeek将坚持不懈的走极致性价比的道路。
根据网友曝出的结果,在编程方面,DeepSeek V3.1在Aider Polyglot多言语编程测试中拿下了71.6%高分,一举击败Claude 4 Opus、DeepSeek R1。而且,它的成本仅1美元,成为非推理模型中的SOTA。
最鲜明的对比,DeepSeek V3.1编程功能比Claude 4高1%,成本却要低68倍。
在SVGBench基准上,V3.1实力仅次于GPT-4.1-mini,远超DeepSeek R1的实力。在MMLU多义务言语了解方面,DeepSeek V3.1毫不逊色于GPT-5。不过在编程、研讨生级基准问答、软件工程上,V3.1与之有一定的差距。
非常值得留意的是,DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章提到,DeepSeek-V3.1运用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chat template停止了较大调整,与DeepSeek-V3存在分明差异。
(, 下载次数: 1)
上传
点击文件名下载附件
DeepSeek官微在置顶留言中表示,UE8M0FP8是针对即将发布的下一代国产芯片设计。
按照360大boss接受采访的说法,Deepseek的终极目的是AGI而不是一个赚钱的App,由于梁文锋曾谈到创业初心:
“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。“
”DeepSeek愿做大家代码荒野里的火柴,但真误点燃AI火种的,永远是你们眼底不灭的猎奇与坚持。“
(, 下载次数: 2)
上传
点击文件名下载附件
让我们继续关注和支持梁文锋及DS团队,由于我们置信:
支持
不是由于我们觉得DS最好,而是由于我们希望DS最好。
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5