职贝云数AI新零售门户

标题: DeepSeek V3.1模型发布!上下文扩展至128k [打印本页]

作者: o9WJWZs 时间: 2025-8-20 13:46
标题: DeepSeek V3.1模型发布!上下文扩展至128k
2025年8月19日晚间，DeepSeek官方宣布线上模型晋级至V3.1，带来了上下文窗口扩展、功能字样更改等变动，并开源了Base版本。经实践体验，该模型在多方面才能上有不同程度的提升与变化，引发了网友的关注与猜测。

DeepSeek V3.1模型晋级内容

8月19日晚间，DeepSeek在官方群宣布，线上版本模型已晋级至DeepSeek V3.1。此次晋级，上下文窗口从原有的64k扩展至128k，在网页、App、小程序都可体验这一模型。此外，DeepSeek还将App、网页端的“深度思索（R1）”字样改为“深度思索”。目前，这一模型已上传至Hugging Face，仅开源了未经指令微调的Base版本，其配置文件、脚本代码和模型权重均可供下载。与DeepSeek-V3-0324相比，模型参数量、张量类型没有分明变化。

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

V3.1模型多方面才能体验

我们在网页端对新模型的才能停止了体验，发现该模型在编程、物理定律了解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。在编程方面，以个人网站开发为例，与DeepSeek-V3-0324相比，DeepSeek-V3.1写出的代码长度添加，开发耗时更久，最终交付的结果在完成度、美观性上有一定提升；

在小游戏开发上，DeepSeek-V3.1虽能在2分钟左右复现Chrome阅读器断网时的小恐龙游戏，但小恐龙外观未准确还原，游戏可玩性较差。

小众历史成绩回答上，DeepSeek-V3.1回答内容信息量添加，新增细节基本有理想印证，且语气更活泼暖和，言语粗浅口语化，下结论时运用更多条件性语句。

面对“马斯克和阿尔特曼谁更牛”的成绩，DeepSeek-V3.1未遵照只输入一个名字的指令，而是对两人都予以夸奖。诗歌创作仍充满各种比喻、类比。

数学才能上，9.8 - 9.11这样的基础算术题，虽最终能给出正确答案，但过程迂回。此外，AI博主Zephyr反映，新模型打造的小球弹跳效果愈加符合物理定律，还有可调整参数。

网友对V3.1模型的猜测与等待

DeepSeek-V3.1上线后，不少网友用上了这一模型。有网友猜测将“深度思索（R1）”改为“深度思索”，是交融推理模型与非推理模型的征兆。体验完模型才能后，一些网友曾经刻不容缓蹲守DeepSeek的Hugging Face主页，按照惯例，后续或许会有更多不同版本的DeepSeek-V3.1开源。

DeepSeek 体验地址🔗https://chat.deepseek.com/

- END -

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)