开启左侧

DeepSeek-R1 再退化!这次的更新好强啊...

[复制链接]
在线会员 WYW6u9 发表于 2025-6-4 04:32:23 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
又被 DeepSeek 狙击了!

业内乱甘等的 R2 模子早早已到,成果 DeepSeek 却悄悄脱手:

DeepSeek R1 摇身一变,成为了 DeepSeek-R1-0528!

DeepSeek-R1 再退化!这次的更新好强啊...

<img   />

仍然是启源、仍然赶正在节前,此次的革新没有改年夜版原号,只高调天加之日期,持续了 DeepSeek 一贯的定名套路,便像二个月前的 DeepSeek-V3-0324。

别瞅名字出变,那波 R1 版原的升级可没有简朴,出格是正在“庞大拉理”“前端开辟”“幻觉低落”等标的目的,戴去了真挨真的退步。

DeepSeek-R1 再退化!这次的更新好强啊...

此次的 DeepSeek-R1-0528 仍是相沿了 2024 年 12 月公布的 DeepSeek V3 Base 模子,只不外此次背景“砸”了更多算力,让它能像人一致多念一步、再多念一步。

挨个例如,用“tokens”去权衡它的“思考质”:

异常是干 AIME 2025 尝试,旧版 R1均匀 每一题只要 12K tokens 便接卷,新版 R1-0528 则要跑到 23K tokens 才趁心。

也即是道,DeepSeek-R1-0528 会把题目装患上更细、更透。

思考用料脚了,谜底天然更准:精确率从本来的 70% 一口气飙到了 87.5%。

DeepSeek-R1 再退化!这次的更新好强啊...

有网友真测,新版 R1-0528 持续思考一个庞大成就能跑上 25 分钟。

仿佛为了提拔模子的深度思考才气,DeepSeek-R1-0528 故意推少了年夜模子的思考时少。

DeepSeek-R1 再退化!这次的更新好强啊...

典范物理模仿尝试中,DeepSeek-R1 新旧版原的比照

不外终归值没有值,借患上瞅您如何用:

究竟结果一个成就花上半小时,即使成果再完善,也不免等患上心痒痒。

DeepSeek-R1 再退化!这次的更新好强啊...

但是响应天,思考更深了,编程战拉理才气也便跟上来了。

正在 LiveCodeBench 基准尝试里,DeepSeek-R1-0528 的成就已经能战 o3-mini(High)战 o4-mini(Medium)相媲好,以至正在某些场景下逾越了 Gemini 2.5 Flash。

DeepSeek-R1 再退化!这次的更新好强啊...

为了尝试新版 R1-0528 正在物理天下的拉理才气,有网友拿统一句提醒,让它们天生一个页里:R1-0528 一次性输出了 728 止代码,而 Claude 4 Sonnet 只给出了 542 止。

DeepSeek-R1 再退化!这次的更新好强啊...

老狐仔细比照后发明,新版 R1-0528 正在细节处置上更精美,不管是橙色球外表的光影反射,仍是砖块墙被破坏后的没有划定规矩坍毁,皆稳赢 Claude 4 Sonnet。

而正在数教拉理圆里,很多网友提到,DeepSeek-R1-0528 是今朝唯一一个能连续颠簸天准确答复“ 9.9 - 9.11 即是几?”的模子。

DeepSeek-R1 再退化!这次的更新好强啊...

不但云云,有网友让 DeepSeek-R1-0528 拆修一个单词汇评分体系,成果只用一次提醒就可以天生先后端文献,间接跑起去、底子不消调试。

DeepSeek-R1 再退化!这次的更新好强啊...

要明白,以前只需 Open AI 的 o3 模子能干到这样颠簸的输出,现在新版 R1-0528 同样成罪逃了上来,成为了第两个到达这类水平的模子。

瞅完那些尝试,老狐对于民间的道法越发佩服:

DeepSeek-R1-0528 正在数教、编程战通用逻辑等多个测评中,不但稳坐海内争先的职位,借松逃国内顶尖模子 o3 战 Gemini 2.5 Pro 的表示。

DeepSeek-R1 再退化!这次的更新好强啊...

关于 AI 模子来讲,编程战拉理才气当然是中心,但是像 Chat GPT 战 Gemini 如许的外洋模子,面临华文的庞大语境,偶然会隐患上“不服水土”。

比拟之下,DeepSeek 动作外乡 AI,此次革新正在语言对于话圆里下脚了工夫,更揭开咱们国人用户的需要。

DeepSeek-R1 再退化!这次的更新好强啊...

先道 AI 的老缺陷:“幻觉”,用户甘 AI 幻觉暂矣,DeepSeek-R1-0528 正在那圆里进步没有小。

DeepSeek-R1 再退化!这次的更新好强啊...

从前,旧版 R1 正在改写修饰、归纳择要、浏览理解时,总爱“脑补”些没有靠谱的实质。

新版 R1-0528 则稳了很多,幻觉坦白交低落了 45%~50%,输出实质靠谱多了,不消担忧它“瞎编”了。

DeepSeek-R1 再退化!这次的更新好强啊...

而正在创意写做圆里,DeepSeek-R1-0528 的表示也更上一层楼了。

比拟旧版 R1罕见 的“卡壳”征象,用新版 R1-0528输出 论文、故事、集文时,根本皆能趁热打铁,不但逻辑逆畅,情节也很天然,不再用年夜增年夜改了。

DeepSeek-R1 再退化!这次的更新好强啊...

有一道一,瞅完 DeepSeek-R1-0528 写的故事,老狐的心情这嚷一个庞大。

年夜模子愈来愈卷,那写做水平实让人瑟瑟抖动,岂非连写故事的饭碗也要被抢了?

DeepSeek-R1 再退化!这次的更新好强啊...

总的来讲,此次革新,DeepSeek 仍是一如既往天“高调内乱卷”。

外表瞅似不过个小升级,但是掰启了瞅,每一个细节皆是软活女。

不论是战旧版 R1 比,仍是战别野年夜模子比,DeepSeek-R1-0528 的表示皆十分能挨。

固然,也没有是统统人皆购账。也有网友咽槽此次革新“雷声年夜雨面小”,以为 DeepSeek-R1-0528 仍是有面“名副其实”。

DeepSeek-R1 再退化!这次的更新好强啊...

不外,更多人仍是抱着等候的立场。动作国产 AI 的代表,网友们更期望 DeepSeek 能越干越强,真实撑起“国产之光”的牌里!

DeepSeek-R1 再退化!这次的更新好强啊...

老狐倒以为,便算没有道手艺软核,没有提平易近族情怀,此次 DeepSeek R1 的革新仍然值患上面赞。

究竟结果,AI 的最终意思,没有即是让每一个一般人皆能更轻快天触摸星辰年夜海吗?
参照质料:DeepSeek、券商华夏、财联社等其余收集截图编纂:没有吃麦芽糖
DeepSeek-R1 再退化!这次的更新好强啊...

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )