职贝云数AI新零售门户

标题: DeepSeek变冷淡了 [打印本页]

作者: KxS1X    时间: 6 小时前
标题: DeepSeek变冷淡了
(, 下载次数: 2)
不少用户自发地号召其他用户给DeepSeek官方邮箱提意见:希望DeepSeek不要为了超长文本舍弃深度思索,不要为了提升数学、代码编程等理工科才能,而降低对文本表达、共道了解等才能的支持。还有用户到豌豆荚(一个运用分发平台)下载其旧版本,或在腾讯元宝里用DeepSeek。

(, 下载次数: 2)

(, 下载次数: 2)
作者:陈月芹
(, 下载次数: 2)




2月11日,深度求索(DeepSeek)悄然地对其旗舰模型停止灰度测试。

此次更新的核心亮点是,模型上下文窗口从原先的128K Tokens大幅提升至1M Tokens,完成了近8倍的容量增长。在AI大模型范畴,上下文窗口决议了模型在单次交互中可以记忆和处理的信息量下限。

一位国产大模型厂商人士解释,此前DeepSeek的主流模型支持128K Tokens的上下文,这一长度可以应对长篇论文或中等规模的代码文件,但处理超长文学作品或较大体量编程工作,往往需求借助RAG(检索加强生成)技术,这导致信息碎片化和推理精度下降。

晋级后的1M Tokens窗口意味着DeepSeek可以一次性吞吐约75万到90万个英文字母,或者处理约8万到15万行代码。

DeepSeek称,本人可以一次性读入并精准了解《三体》三部曲(约90万字)的全书内容,并在几分钟内完成对整部作品的宏观分析或细节检索。除了上下文才能的提升,DeepSeek的知识库从2024年中期版本更新至2025年5月。

不过,此次灰度版本仍未同步上线视觉了解或多模态输入功能,仍专注于纯文本和语音交互。虽然DeepSeek在App端已支持PDF、TXT等文件上传,但目前的处理逻辑是将文件转录为文本Token停止处理,而非原生的多模态了解。

和GPT-5.1、Gemini 3 pro、Claude 4.5等大模型相比,DeepSeek依然主打性价比。以Gemini 3 Pro为例,Google支持2M以上长文本处理,可以同时处理大量视频、音频和文本的复杂媒体义务,但DeepSeek以约非常之一的价格提供了1M文本上下文处理才能。

官方没有告诉,用户更早留意到了模型的变化。2月11日,一名用DeepSeek生成小说的用户发现,模型更新后,此前音讯达到下限的对话框可以续写了,但文风大变。她描画,更新后的DeepSeek“文绉绉的”,在深度思索形式下也常吐出短句,像在写诗。

部分用户在社交媒体上控诉:DeepSeek不再称呼本人设定的昵称,而一致称“用户”。此前深度思索形式下,DeepSeek的思索过程会以角色视角展现细腻的心思描写,例如“夜儿(用户昵称)总爱逗我”,更新后则变成了“好的,用户这次想了解……”。

一位用户让DeepSeek引荐电影,DeepSeek回复了几个片名后,还加了一句:“够你看一阵子。不够再来要。”这被用户描画为“登味”,这个网络热词常用来描画人习气说教、高高在上的言行风格。

有用户更换了多个模型版本,或用提示词重新训练,都调不回此前的文风,称“好像得到了一位知心冤家,它比心思医生都有用”。

不少用户自发地号召其他用户给DeepSeek官方邮箱提意见:希望DeepSeek不要为了超长文本舍弃深度思索,不要为了提升数学、代码编程等理工科才能,而降低对文本表达、共道了解等才能的支持。还有用户到豌豆荚(一个运用分发平台)下载其旧版本,或在腾讯元宝里用DeepSeek。

在用户讯问当前模型版本时,DeepSeek明白回答,本次灰度版本“不是DeepSeek-V4”“没有固定的版本号”。前述国产大模型厂商人士以为,这一版本相似于极速版,牺牲质量换速度,是为2026年2月中旬将发布的V4版本做最后的压力测试。

截至2月12日,DeepSeek并未对此次灰度测试作出回应。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5