开启左侧

别再糜费工夫了!5分钟读懂各大AI模型优劣,一文搞懂那个大模型最好用?

[复制链接]
在线会员 fSh5o 发表于 2025-3-2 07:54:46 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
年夜模子终归用哪一个才是最劣解?

2025年的秋节,DeepSeek-R1的出生避世如同哪吒闹海一般,将逼着许多关源的厂商皆开端准备启源一部门代码(没有针关于closeAI)。

松交着奥特曼的逝世仇家马斯克公布了号称史上最强的Grok3,Claude家属也革新了3.7-Sonnet,前二天OpenAI公布了GPT-4.5,以下情商低价格下姿势的三下特性引起了齐网群嘲。

今年必定是海内外洋年夜模子年夜混战的一年,但是动作一般人,一般开辟者,却陷入了焦炙取苍茫:

"旗哥,写文章修饰哪一个模子更佳用?"

"写代码用GPT?仍是Gemini?仍是用Claude?"

那篇文章,尔戴着各人共同中断苍茫,曲奔中心,颠末海内中测评网站的排名战甚么场景下甚么模子最适宜的角度,给各人实在测评一下最适宜某个场景的年夜模子。

年夜模子竞技园地址、场景和适宜的模子,尔搁到末端了。中心的部门嫌烦琐的话,能够间接跳转到末端~
1、年夜模子的排名

停止到2025-02-07,齐网总计272w+人投票
一、齐网排名

image.png
此中,老马的Grok-3正在分析才气上得到了第一位。Gemini家属松跟厥后,能够瞅到咱们的国产启源之光Deepseek-R1松跟厥后。
二、代码场景排名:

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w2.jpg
image.png
前三名别离是Grok-三、Gemini2.0-pro战Claude3.7-Sonnet,其余的皆不消存眷了,写代码便间接用那个三个,但是今朝用的至多的是Gemini Flash 2.0 战 Claude 3.7 Sonnet,逐日的挪用Token质间接甩了其余模子多少条街。
三、华文场景:

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w3.jpg
image.png
正在华文场景,瞅到了多少个熟谙的面目面貌,别离是智谱的GLM4-plus、阿里的Qwen千问系列和阶跃星辰的step-2,但是居榜尾的仍是Gemini-2.0-Flash-Thinking模子。相信没有暂的未来,国产年夜模子有一天必然会登顶天下之巅!

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w4.jpg
image.png2、差别场景下的真测

咱们正在语言的理解才气、写做才气、代码才气,和常识储蓄拉理才气多少个圆里,将上述多少个排名靠前的年夜模子截至一个比力。
2.1 写代码

咱们去尝尝齐网比力水爆的弹跳小球尝试。

让差别的年夜模子写一个Python法式,原次拔取的为DeepSeek-V三、Claude3.7-Sonnet、Grok-三、GPT4o、Gemini-2-Flash。

思考拉理版的年夜模子没有正在原次测评内乱(一般咱们写代码的时候,没有使用拉理年夜模子,太缓了)

提醒词汇:
write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically
Deepseek-V3

代码胜利运行

但是球出弹跳起去。。。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w5.jpg
image.pngGrok-3

胜利运行

但是球飞了。。。。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w6.jpg
image.pngClaude-3.7-Sonnet

代码胜利运行

六边形转起去了,但是球体的弹跳没有是很佳。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w7.jpg
PixPin_2025-03-01_15-53-49.gifGemini-2-Flash

结果战Claude-3.7好未几

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w8.jpg
PixPin_2025-03-01_15-55-17.gifGPT-4o

施行代码的过程当中报错。。。。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w9.jpg
image.png
成果显现:

正在写代码的过程当中,和作家远1年多的Ai编程经历去瞅,写代码用Claude 3.7 Sonnet系列战Gemini 2.0 Flash 便可。
2.2 写做场景真测

正在写做的过程当中,不论是写计划、写公家号、写小白书籍,再没有颠末提醒词汇调学的条件下,年夜模子写进去的皆是一股Ai味。

上面咱们去尝尝各个年夜模子谁写进去的Ai味最沉。

提醒词汇:
以《梦想一下2045年的社会》为题,写一段200字的小做文

请求:
一、要分离野生智能对于社会构造的作用
二、实质输出尽可以契合野生撰写,制止机器化的复兴
Deepseek-R1

拽的词汇太多,没有交天气鼓鼓。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w10.jpg
image.pngGrok3-Thing

瞅完Grok3的复兴,中规中矩,可读性仍是比力下的。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w11.jpg
image.pngClaude-3.7-Sonnet-Think

没有愧是最佳用的年夜模子之一,写进去的实质能够间接抄到做文原上了。

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w12.jpg
image.pngGemini-2.0-Flash-think

e妹妹m。。。如何道呢,一般般吧~
别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w13.jpg

GPT4.5

别再糜掷时间了!5分钟读懂各年夜AI模子好坏,一文弄懂谁人年夜模子最佳用?w14.jpg
image.pngGPT-o3-high

image.png
GPT系列的仍是Ai味道很沉。

从统一套成就的答复结果去瞅:写做场景借患上瞅Grok3 战 Claude。
3、写到最初

手艺永久正在迭代,但是掌握中心场景需要,才是您操作把持AI的枢纽。

目前AI年夜模子万马齐喑,各有千秋。从各年夜模子的真测表示去瞅,写代码尾选Claude 3.7战Gemini Flash,写做场景则是Grok3战Claude更胜一筹。

国产模子如DeepSeek、GLM4战千问系列也正在疾速兴起。

挑选适宜自己场景的年夜模子,才气真实阐扬AI的最年夜代价,提拔事情服从,处置理论成就。

尔是旗哥,年少的能够嚷尔小王,码字不容易,以为有代价的话请面个正在瞅~或许 转收一下。

存眷尔,理解最新的Ai趋势,进修Ai妙技,理解Ai给一般人戴去的副业时机,咱们下篇文章再会👋🏻

您更瞅佳哪一个年夜模子?挨正在批评区~

Chatbot Arena 年夜模子竞技场:https://lmarena.ai/?p2l

OpenRouter Rankings 年夜模子排名 :https://openrouter.ai/rankings
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )