职贝云数AI新零售门户
标题:
DeepSeek V3.1模型发布!上下文扩展至128k
[打印本页]
作者:
o9WJWZs
时间:
2025-8-20 13:46
标题:
DeepSeek V3.1模型发布!上下文扩展至128k
2025年8月19日晚间,DeepSeek官方宣布线上模型晋级至V3.1,带来了上下文窗口扩展、功能字样更改等变动,并开源了Base版本。经实践体验,该模型在多方面才能上有不同程度的提升与变化,引发了网友的关注与猜测。
DeepSeek V3.1模型晋级内容
8月19日晚间,DeepSeek在官方群宣布,线上版本模型已晋级至DeepSeek V3.1。此次晋级,上下文窗口从原有的64k扩展至128k,在网页、App、小程序都可体验这一模型。此外,DeepSeek还将App、网页端的“深度思索(R1)”字样改为“深度思索”。目前,这一模型已上传至Hugging Face,仅开源了未经指令微调的Base版本,其配置文件、脚本代码和模型权重均可供下载。与DeepSeek-V3-0324相比,模型参数量、张量类型没有分明变化。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
V3.1模型多方面才能体验
我们在网页端对新模型的才能停止了体验,发现该模型在编程、物理定律了解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。在编程方面,以个人网站开发为例,与DeepSeek-V3-0324相比,DeepSeek-V3.1写出的代码长度添加,开发耗时更久,最终交付的结果在完成度、美观性上有一定提升;
在小游戏开发上,DeepSeek-V3.1虽能在2分钟左右复现Chrome阅读器断网时的小恐龙游戏,但小恐龙外观未准确还原,游戏可玩性较差。
小众历史成绩回答上,DeepSeek-V3.1回答内容信息量添加,新增细节基本有理想印证,且语气更活泼暖和,言语粗浅口语化,下结论时运用更多条件性语句。
面对“马斯克和阿尔特曼谁更牛”的成绩,DeepSeek-V3.1未遵照只输入一个名字的指令,而是对两人都予以夸奖。诗歌创作仍充满各种比喻、类比。
数学才能上,9.8 - 9.11这样的基础算术题,虽最终能给出正确答案,但过程迂回。此外,AI博主Zephyr反映,新模型打造的小球弹跳效果愈加符合物理定律,还有可调整参数。
网友对V3.1模型的猜测与等待
DeepSeek-V3.1上线后,不少网友用上了这一模型。有网友猜测将“深度思索(R1)”改为“深度思索”,是交融推理模型与非推理模型的征兆。体验完模型才能后,一些网友曾经刻不容缓蹲守DeepSeek的Hugging Face主页,按照惯例,后续或许会有更多不同版本的DeepSeek-V3.1开源。
DeepSeek 体验地址🔗https://chat.deepseek.com/
- END -
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5