开启左侧

OpenAI对战DeepSeek,20B对8B,优势在我!

[复制链接]
在线会员 KOsV 发表于 2025-8-18 05:26:10 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
各人佳,尔是 Ai 进修的老章

简朴尝试二个模子,gpt-oss-20b 对于战 DeepSeek-R1-0528-Qwen3-8B

尽人皆知,尔出格喜好的三个 DeepSeek_版原中 DeepSeek-R1-0528-Qwen3-8B 是最新的 DeepSeek-R1-0528 思惟链蒸馏提炼后对于 Qwen3-8B-Base 后锻炼而去。那个模子尔最喜好的多少个面:
    本钱极高,模子文献 16GB,默认参数下,二弛 4090 隐卡逆畅运行功用很强,不管是各类 Bench 上的注释成果,仍是尔小我私家使用体会,挨参数战模子文献皆 4 倍宁可的 Qwen32-B 皆出成就速率极快,2 弛 4090 启用时,90Tonken/s

OpenAI 启源了,当地布置失利,线上真测,很火!一文中,介绍的gpt-oss-20b —— 合用于高提早战当地或者一定用处的场景(21B 参数,此中 3.6B 激活参数),拉理功用靠近 OpenAI o4 - mini;gpt - oss - 20b 能正在 16GB 内乱存的边沿装备运行。

尔内乱网的 vllm 启用gpt-oss-20b遭受 GLIBC 版原高成就,间接升级危急极下,以是便做而已。近来尔正在内乱网布置 llama.cpp,运行质化年夜模子,而后胜利推起 GPT-OSS-20B-F16.GGUF,15 个 GB 的隐存占用,本钱是实高。

会战军力是 20B 对于 8B,谁能胜出?
小教数教

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w2.jpg

那是一讲易倒 GPT-5 的题目
OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w3.jpg

gpt-oss-20b 犯了战 GPT-5 一致的毛病,降败
极简成就

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w4.jpg
即使是极简朴成就,gpt-oss-20b的表示也十分一般,问甚么问甚么,没有像DeepSeek-R1-0528-Qwen3-8B,没有担心谜底,也有延长。
简朴编程

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w5.jpg

DeepSeek-R1-0528-Qwen3-8B的表示

gpt-oss-20b 的表示:很失利,只需一个杂乌页里。

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w6.jpg

怕gpt-oss-20b 陌生华文,换英语提问

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w7.jpg

DeepSeek-R1-0528-Qwen3-8B表示更佳了 !

gpt-oss-20b,页里挨没有启。。。

综上,DeepSeek-R1-0528-Qwen3-8B仍然是尔最喜好的小尺微暇年夜模子!十分能挨!

市情上各类测评OpenAI启源的那二个模子表示皆近没有如民间宣扬

OpenAI对于战DeepSeek,20B对于8B,劣势正在尔!w8.jpg
网友推测gpt-oss系列模子的下幻觉估量是质化保守+模子单个大师太小+激活大师数过少招致的。  该当是一个从o3下度蒸馏质化进去的小模子,仅蒸馏了OpenAI最喜好的数教才气。

制作不容易,假设那篇文章以为对于您有效,能否面个存眷。给尔个三连打:面赞、转收战正在瞅。若能够再给尔减个🌟,感谢您瞅尔的文章,咱们下篇再会!

拆修完善的写做情况:东西篇(12 章)图解机械进修 - 华文版(72 弛 PNG)ChatGPT、年夜模子系列钻研陈述(50 个 PDF)108 页 PDF 小册子:拆修机械进修开辟情况及 Python根底 116 页 PDF 小册子:机械进修中的几率论、统计教、线性代数 史上最齐!371 弛速查表,涵盖 AI、ChatGPT、Python、R、深度进修、机械进修等

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )