开启左侧

DeepSeek深夜发布新模型,但不是R2

[复制链接]
在线会员 NWI 发表于 2025-8-20 15:54:26 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录

DeepSeek正在深夜上线了新模子V3.1:128k高低文、API无缝切换。


昨早DeepSeek 颁布发表其线上模子版原已经升级至 V3.1。这次革新虽非商场等候的 R2 系列,但是正在少文原处置才气上完毕清楚突破,将高低文窗心从 64K 扩大至 128K,相称于可处置 10 万至 13 万汉字实质。





DeepSeek深夜公布新模子,但是没有是R2w2.jpg





新模子接纳稠密混淆大师架构(MoE)取多头潜伏留神力体制(MLA),总参数目到达 685B,激活参数目为 37B per token,正在连结下功用的共时掌握计较本钱。枢纽手艺立异包罗分块留神力体制战扭转职位编码劣化,有用低落少序列处置的隐存占用。




总的来讲,新模子取 DeepSeek-V3-0324 比拟,正在参数目等圆里不清楚变革。

媒介取社区疑息显现,线上彀页、App取女伶 href="https://www.taojin168.com/cloud/" target="_blank">小法式进口已经切换到新版原,API 挪用方法连结稳定;启源侧则上传了 Base 权沉。




今朝,该模子已经冲上了 Hugging Face 热门模子榜第 2 位:

DeepSeek深夜公布新模子,但是没有是R2w3.jpg




值患上留神的是, Base 权沉搁到仄台而没有慢于宣布一少串基准分数,表示着团队更垂青把可复现取可布置的阈值推高,让社区后行试跑,汇集实在场景反应,再补齐体系性的评测质料。关于期望干私有化适配的团队,如许的节奏反而更友好:先考证拉理链路、质化取弛质格局,再决定可否年夜范围迁徙。




固然,V3.1 其实不即是 R2。后者违背的中界预期更多正在新范式取更高低限,而前者夸大的是当下可用性。鄙人游软件取供给链仍有谬误定性的时候,模子门路的快取稳很易兼患上。




V3.1 是一个夸大可用性的版原,它没有会处置统统对于 R2 的等候,却能正在当下把体会推齐,保持产物取死态的活泼




回忆 DeepSeek 今年的几回革新,根本皆是变更没有年夜的小革新,那里尔收拾整顿了 DeepSeek-R1 公布此后的一系列模子革新的时间节面:




时间

  模子称呼

  特性

2025年1月尾

DeepSeek-R1

初初公布。

2025年3月

DeepSeek-V3-0324

模子参数约660B,网页端、App战API供给64K高低文,启源版原高低文少度为128K。

2025年5月尾

DeepSeek-R1-0528

R1模子的小版原升级,正在数教、编程取通用逻辑等多个基准测评中表示优良,并改进了幻觉、创意写做、东西挪用等功用。

2025年8月19日

DeepSeek-V3.1

线上模子版原升级,高低文少度拓展至128K;多步拉理任务功用提拔,模子幻觉削减;编程战Agent功用清楚增强




固然 V3.1 有必然改良,商场存眷的 R2 模子仍已宣布具体公布时间。各人觉得 R2 将会正在哪些圆里完毕新突破?欢送交换会商!

END

朝期举荐

秒懂算野 | 算野云少租劣惠指北:最下66合,举动期合后再赠500算野币!
DeepSeek深夜公布新模子,但是没有是R2w4.jpg

2025智能体年夜爆发!云计较启动万亿级商场反动

DeepSeek深夜公布新模子,但是没有是R2w5.jpg

更多举动

DeepSeek深夜公布新模子,但是没有是R2w6.jpg

DeepSeek深夜公布新模子,但是没有是R2w7.jpg

DeepSeek深夜公布新模子,但是没有是R2w8.jpg

DeepSeek深夜公布新模子,但是没有是R2w9.jpg

右滑检察更多举荐

联系咱们

  商务协作 |成果 征询 | AI定礼服务   

Tel:18085138124(企微共号)

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

avatar

关注0

粉丝1

帖子199

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )