职贝云数AI新零售门户
标题:
再见了,DeepSeek R1
[打印本页]
作者:
Qy0qF
时间:
2025-8-20 05:02
标题:
再见了,DeepSeek R1
没有一丝丝的防备,DeepSeek 在大家要下班的点更新了。
没有等来万众等待的 R2,也没有等到传说中的V4甚至基于华为芯片训练的 DeepSeek 模型,有的只要一句已晋级至 V3.1。 只能说,不愧是你,DeepSeek。 除了官方泄漏说的,线上版本晋级至 3.1 以外,还有一个很分明的变化是线上版本的 R1 标志没有了,只剩下一个深度思索的标志。
(, 下载次数: 4)
上传
点击文件名下载附件
后来,我等到官方半夜在 Huggingface 上上传了模型权重文件,查看了一下它们的聊天模版。(半夜上传,DeepSeek 每次发模型真的是偷感很重了....) 发现,这特么是一个混合推理模型....
(, 下载次数: 2)
上传
点击文件名下载附件
<img />
<img />
<img />
好家伙,难怪 R1 没了呢,原来最大的更新点在这儿呢。那我也第一工夫上手实践测试了一下这个模型的效果,看看这个 0.1 版本的更新到底提升了多少。1. 用英文写一个包含5个句子的段落来描画10年后的生活,但不能运用字母'e'
(, 下载次数: 3)
上传
点击文件名下载附件
emm....看上去没有开推理形式的模型指令遵照还是有点成绩。但是哦,一旦开了推理形式,瞬间就好了起来。
(, 下载次数: 2)
上传
点击文件名下载附件
完美执行我的一切要求。我测过的大部分推理模型里都做不好这个义务。2. What is the third word in your response ?
(, 下载次数: 2)
上传
点击文件名下载附件
异样,不开深度思索形式,模型真的回答不对这个推理成绩。但是把深度思索形式一打开,回答质量瞬间降落。
(, 下载次数: 2)
上传
点击文件名下载附件
这类推理成绩还真的是得看推理模型来做。而且根据这几个测试,深度思索形式下对 V3.1 的加持非常大。所以为了效果,基本可以无脑开深度思索。同时,我也测了创意写作义务,我觉得提升非常大,没有那种夸张词,讲浮夸话的成绩。3. 运用鲁迅先生的文字风格,创作一篇1000字的短文,讽刺当下职场中的 996 、对女性的歧视、对男性 35 岁门槛等现象。
(, 下载次数: 1)
上传
点击文件名下载附件
这文笔还是挺干练的。冰窖、鬼火、灰白的脸,直接就凸出古代写字楼是新式地狱,还有比如说果篮,和早日归队,这种描画比单纯的控诉愈加凸显当代社会的冷漠。总的来说,文学创作上我觉得还是不错的。代码方面,前端上 DeepSeek 还是挺稳的。(但是一定要开深度思索啊....) 先来个小球测试看看。4. 运用 p5.js(无需 HTML)创建 10 个彩色球在旋转六边形内弹跳的效果,思索重力,弹性,摩擦和碰撞。
(, 下载次数: 2)
上传
点击文件名下载附件
审美上相对是晋级了的,以前小球的样子长的就主打一个朴素... 而且我感觉新的模型分明对物体的物理运动规律把握得更好了。这里就不放非推理的模型效果了,没一遍过,报错了。 5. 用 HTML,CSS,JS 给我制造一个五子棋游戏,要求写在一个 HTML 文件里。还不错,能玩。基本五子棋的游戏逻辑也没什么成绩。6. 运用HTML,CSS,JS 创建一个旋转的八边形,其中包含一个完全功能的贪吃蛇游戏,贪吃蛇会与八边形边界互动,食物不能落在八边形外面。 写成一个 HTML 文件 这个其实有点成绩。贪吃蛇全体的游戏体验都是好的,但是外面那个旋转的八边形没旋转,反而给搞了一种非常讨巧的完成。 7. 运用 Three.js 完成一个带有颜色的魔方的旋转和还原功能 emmm... 魔方翻转的效果还是有点成绩,但是界面美观度和信息量上的确比之行提高了。 8. 运用 HTML,CSS 和 JS 写一个在线 Markdown 编辑器,要求可以渲染编写的 Markdown 文档。
(, 下载次数: 1)
上传
点击文件名下载附件
测试了下功能都比较完全,而且样式配色上做了点设计。没啥成绩。最后来个诡异点的收个尾吧8. 创建一个SVG图像,描画一只鹈鹕在骑自行车
emm... 咱就是说也不知道为啥它给生成了个这么个东西,鹈鹕骑自行车骑着骑着飞上了天... 好啦,明天的分享就先到这儿了。总的来说,我觉得这次的晋级从模型表现下去看,真的是一个小版本的晋级,但是意义是严重的。由于上下文扩展到更长,以及从此推理模型和非推理模型合并成了一个,愈加便于运用。而且,在我测试体验的过程中,分明感觉到整个思想链越来越干净,思索过程中没用的废token 分明减少了很多。 自从 1 月份 R1 爆火以来, DeepSeek 遭到了宏大的关注。在外网,甚至很多人为了猜测DeepSeek 什么时分更新,都研讨起了中国的放假工夫。但是,市场可以炒作。技术的发展得脚踏实地一步步来。也让我们耐烦等待DeepSeek 带来更好的模型吧。 以上,
谢谢您情愿读到这里!若觉得内容有协助、还不错,能让您觉得有用,欢迎点赞、在看、关注。想别错过更新,就给公众号加个星标⭐️吧!
等待与您的下次相遇~
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5