职贝云数AI新零售门户

标题: Deepseek V3.1 发布 [打印本页]

作者: TG3eX0y    时间: 2025-8-20 04:43
标题: Deepseek V3.1 发布
明天,Deepseek在微信中,宣布上线了V3.1版本,3.1版本的上线,阐明版本4间隔我们好像又远了一步。毕竟一切人都在等的是V4。

Deepseek 的V3.1次要的晋级点是上下文长度拓展至128k。其他晋级点没有说,实测上去属于晋级的正常表现,不是宏大的晋级和提升。

扩展上下文处理才能:V3.1版本的核心晋级在于上下文窗口的翻倍扩容,使模型可以处理更长的多轮对话序列和复杂的查询义务,为用户提供更连接和深化的交互体验。

优化输入结构:根据早期用户反馈,V3.1在言语表达风格方面停止了分明优化,模型如今更倾向于生成结构化输入内容,包括表格、列表等格式化数据呈现,提升了信息的可读性和适用性。

加强物理了解才能:新版本在物理现象模拟和相关概念了解方面表现出分明改进,为迷信计算和工程运用场景提供了更强的支撑才能。

架构延续与优化:V3.1继续采用经过验证的专家混合(MoE,Mixture of Experts)架构设计,针对常规推理义务停止了专门优化,在此类运用场景下无需启用"DeepThink"深度思索形式,既保证了处理效率又维持了输入质量。

目前Deepseek的官网,APP,API都同步上线了新的模型,调用方式不变。

目前Hugging Face平台尚未提供V3.1版本的模型权重文件下载,但DeepSeek重申了其对开源社区的长期承诺,承诺将继续遵照开源发布策略,为全球AI研讨社区和开发者提供技术支持。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5