职贝云数AI新零售门户

标题: DeepSeek-V3.1:加速与国产芯片的协同退化 [打印本页]

作者: KoVPKB8er8    时间: 前天 08:02
标题: DeepSeek-V3.1:加速与国产芯片的协同退化
运用 UE8M0 FP8 尺度的数据格式停止模型训练,是 DeepSeek V3.1 的最大亮点。目前华为、寒武纪等国内芯片可提供支持,这打开了业界对"国内本土芯片+本土算法+本土开放模型+本土人才"的国内AI产业生态链的想象力。
严重更新请留意 DeepSeek V3.1 运用了 UE8M0 FP8 尺度的参数精度。此外,V3.1 对分词器和聊天模板停止了严重调整,与 DeepSeek-V3 存在分明差异。建议计划部署的用户细心阅读此新版本的文档。注:FP8 目前次要有两种主流格式:
E4M3: 4位指数 (Exponent) + 3位尾数 (Mantissa) + 1位符号位。动态范围较小,但精度更高。

UE8M0: 8位指数 (Exponent) + 0位尾数 (Mantissa) + 1位符号位。动态范围极大(与FP16相当),但精度很低(没有小数部分,相当于一个整数格式)。

支持 UE8M0 FP8 的AI开源框架(目前5.6k stars):

https://github.com/deepseek-ai/DeepGEMM

基准评测综合比较:V3.1 模型在智力测试上略输于 Qwen3-235B-2507,最高分是 GPT-5(high);推理速度上,V3.1 快于 Qwen3 系列 模型,最快是 Gemini 2.5 Flash;定价比较上,V3.1 低于 Qwen3-235B-2507 模型,最低价是 gpt-oss-120B(high-深度推理);而全体上 V3.1 模型优于本身的 V3/R1 功能。
(, 下载次数: 0)
智力:DeepSeek V3.1 初步跑分结果显示,推理形式下人工智能分析指数达到 60,高于 R1 的 59;非推理形式下,V3.1 得分为 49,较之前 V3 0324 的 44 有较大提升。这使得 V3.1(推理)落后于阿里巴巴最新的 Qwen3 235B 2507(推理),DeepSeek 尚未夺回抢先优势。
(, 下载次数: 0)
Token 运用状况:DeepSeek V3.1 在推理形式下的得分比 DeepSeek R1 略高,并且在我们用于人工智能指数的评价中运用的 Token 略少。在非推理形式下,它运用的 Token 比 V3 0324 略多,但依然比其本身的推理形式少几倍。
(, 下载次数: 0)

(, 下载次数: 0)
和Sonnet 4比较Deepseek V3.1 在编码和代理方面迈出了一大步  V3.1 版本重点关注:1. 多步骤工具运用 2.代理用例它在编码代理(coding agent)义务方面已赶超 Sonnet 4,并在推理和数学义务方面超越 Sonnet 4。价格比 Sonnet 4 低 6-9 倍!  以下是 DeepSeek V3.1 和 Sonnet 4 的比较
(, 下载次数: 0)
API运用老接口不用改就自动晋级到最新版
deepseek-chat(V3) → 非思索形式的V3.1

deepseek-reasoner(R1) → 思索形式的V3.1

(, 下载次数: 0)
例子prompt:世界上支持UE8M0 FP8的公司分别是哪些公司以下是DeepSeek V3.1的回复(开启了深度思索和联网搜索):
(, 下载次数: 0)
以下是GPT-5的回复(开启了联网搜索):
(, 下载次数: 0)
结语UE8M0 FP8 是严重更新,V3.1 的全体功能比本身的 V3/R1强,API定价和速度比Qwen3有优势,可尝试本地部署或在项目中继续接入API运用。参考材料
https://api-docs.deepseek.com/zh-cn/

https://artificialanalysis.ai/models

转载自【最佳人生】公众号
【免责声明】:

本公众号所转载的图文、视频等内容均出于传递更多信息之目的,文中观点不代表本公众号立场,亦不构成任何投资、消费、医疗等建议,请大家慎重运用。转载内容版权归原作者或发布机构一切,若存在来源标注错误、侵权或其他不当之处,请及时联络我们删除。(联络微信:yesuo8931)

因转载内容引发的任何争议、损失或法律责任,均由内容提供方及相关责任主体承担,本公众号不承担任何直接或间接责任。

感激您对本公众号的关注与支持!阅读转载运用内容时,请自行鉴别信息真实性,并遵照相关法律法规及专业建议。

辨认图中二维码赞赏




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5