开启左侧

横评Kimi K2、DeepSeek、Grok 4、Claude 4四款大模型,谁是真王者?

[复制链接]
在线会员 6KjHg7gd 发表于 2025-7-26 18:15:29 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
各人佳,那里是K姐。

一个助您跟踪最新AI使用的男子。(启奖已经搁正在文终)

头几天,月之暗里突然扔下沉磅消息:Kimi K2 邪式公布。总参数 1T,激活参数 32B,间接启源,借能免费商用。

参数一口气卷到万亿级,革新了今朝启源模子的记载。

正在一堆声威基准里,K2 拿到了启源模子的最佳成就,特别正在编程、东西挪用、数教拉理那多少个标的目的,表示患上十分软。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w2.jpg

现在正在Kimi民网默认使用的即是新模子 K2。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w3.jpg

API 也共步上线,撑持 128K 少高低文。订价没有下,输出每一百万 tokens 4 元,输出 16 元,好未几是 Claude本钱 的五分之一。

那多少天尔也上脚体会了一轮,尝试了多少个典范的使用场景,借推上 Claude 4 Opus、DeepSeek R1 0528 、Grok 4 干了一轮横评。

没有瞅榜单,没有道参数,间接用起去瞅结果。终归谁能用,谁佳用,上面一项项道分明。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w4.jpg

四年夜支流年夜模子横评真测

尔选了多少款支流的年夜模子取K2截至比照,用异常的提醒词汇,别离比照年夜模子的可望化页里,网页设想,3D游玩,华文写做的才气。

(此中 DeepSeek 尔别离尝试了 DeepSeek R1 0528 战 DeepSeek V3 0324,真测展示挑选了部分结果更佳的 DeepSeek R1 0528 。)

    case 1 可望化页里

尔先尝试了一个尺度化的通用任务——可望化数据瞅板。任务没有庞大,但是很能瞅出模子的多少个枢纽才气:能不克不及读懂用户的设想企图,模块之间构造微风格可否分歧,天生的代码能不克不及间接跑起去。

提醒词汇:天生一个网页数据瞅板页里,包罗如下模块:
贩卖趋势合线图(远30天)
地域散布饼图(差别省分)
用户活泼度冷力争(日-小时候布)
顶部汇总目标(用户数、转移率、日均收入)
使用 Chart.js 或者 Plotly,请求款式分歧、卡片气势派头繁复现代。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w5.jpg

Claude 4 Opus 任务完毕了一半,款式上是出成就的,根据尔的提醒词汇去了,可惜佳多少个图表皆是空缺的。有模板观点,但是理论实质缺位。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w6.jpg

Grok 4 该有的实质实在也皆有,可是那好术气势派头有面上个世纪的觉得,只可道能用。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w7.jpg

DeepSeek R1 0528 部分的图表战页里的完毕度没有错。可是多出了一点儿尔提醒词汇中不说起的接互选项,并且仍是不克不及接互的选项,只干了个揭图。冷力争计划庞杂。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w8.jpg

K2 部分气势派头借没有错,构造清新,配色瞅着很温馨。卡片战图表的制作皆很精致。意料以外,K2绘对于了冷力争的模子,不外也有一面小瑕疵——有一点儿数据超越了卡片范畴。

往常干编程任务,即使列队、付费,许多人也会劣先思考外洋的年夜模子,究竟结果颠簸、佳用,早即是默认选项;

但是那个case呈现了少睹的一幕——国产模子的表示,反而更稳、更揭开需要。有面意外。

    case 2 闹钟

那个需要实在挺罕见的,许多人第一次用 AI 干名目,皆是从“复刻番茄钟”开端。

一个小小的闹钟网页,实在能瞅出许多工具。有无动效,设想有无审好,按钮面上来有无反响,代码写患上稳没有稳……它没有是拼功用,而是真实磨练模子“能不克不及把事干佳”。

尔此次换了种气势派头,也试着跑了一版。

提醒词汇:请设想一个pop art气势派头的闹钟网页界里,包罗:以后 时间显现(年夜字),增加闹钟功用、计时功用

Claude 4 Opus 的审好很正在线,页里计划很都雅,细节功用也多,有闹钟标签,卡片战按钮的联动结果。遗恨的是,它没有会显现及时的时间,输出闹钟树立不照应,计时器功用也没法使用。

Grok 4 接纳了静态的突变色布景,端赖 Comic Sans 战跳色去撑住 Pop Art 的壳。接互比力粗拙,不形状联动,可是功用残破,到达了可用的尺度。

DeepSeek R1 0528 的Pop Art 的味女险些推谦了,配色战笔墨阴影共同的很奇妙。按钮无形态联动,可是不及时时间显现,闹钟战计时器功用也不克不及用。

K2 的页里颇有漫绘感,从配色到动效皆挺抓眼的。时间显现便像正在呵责吸一致,跳动的颇有节奏感,按钮也无形态联动。功用上,闹钟战计时器皆能一般使用。

部分瞅下来,Grok 4 战 K2 是一次天生了“能用”的网页。可是 K2 的页里更具好感、动效也更棒。

    case 3 射打游玩3D版

那个任务磨练模子可否分析使用 Three.js 拆修残破 3D 游玩场景,完毕望角掌握、接互射打、粒子殊效战界里逻辑,天生可运行的网页本型。

提醒词汇:请使用 Three.js创立 一个第一人称望角的简朴 3D 空间射打游玩,弄法以下:
玩野正在星空布景中自由望角挪动鼠标面打收射激光,打中漂泊的小止星减分
参加打中粒子爆炸殊效
显现计分器 +时间 倒计时 + 胜利提醒
可用 BoxGeometry 假造小止星,页里需能运行。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w9.jpg

Grok 4 一片空缺

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w10.jpg

Claude 4 Opus 页里显现笔墨

Claude 4 Opus 战 Grok 4 天生的代码连跑皆跑没有起去。尔把那个代码收给其余年夜模子助尔阐发,Claude 4 Opus 天生的代码属于“衬着器出初初化+望角逻辑毛病+中心逻辑缺得”的三沉成就,相称于写一半便接卷了。。。

Grok 4 则是布置方法没有匹配。改正布置相干的部门代码后,确实能够翻开了。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w11.jpg

咱们能够瞅到布景设想是星空的模样,比力有代进感。但是一瞅小止星,满是灰色圆块,不准心,也没法射打。页里能瞅,实质杂安排。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w12.jpg

DeepSeek R1 0528 加之了一个游玩开端页里,射打功用也能用了,页里上小圆块的3D结果仍是没有错的,可是望角没法掌握,也无法玩。运行多少秒后,页里便间接卡逝世,动也没有动了。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w13.jpg

K2 是唯一一个能玩的。星空布景、差别巨细的小止星、准心、射打,功用根本到位。该有的 UI 也出漏,以至借知心减了弄法提醒,没有至于一翻开没有明白干吗。那便没有是“能写代码”这样简朴了,更像是一个具备产物观点的模子输出。

    cese 4 华文写做

案牍输出也这天经常使用的比力多的一个场景。此次,尔间接让4个年夜模子共时写一篇故事,共同去瞅瞅,谁写的变动人。

提醒词汇:请写一篇以孙悟空取林黛玉为配角的共人故事,融合古典气味取奇异色彩,字数3000字以上。

<面打图片高低滚动检察局部实质>

Grok 4 写了约4200字,实质比力套路化,小说情节有面流火账的觉得,对于感情崎岖的形貌很少,瞅起去出甚么代进感。

<面打图片高低滚动检察局部实质>

Claude 4 Opus 写了3200字阁下。章回体方法明了,文章部分构造没有错。语言水平一般。

<面打图片高低滚动检察局部实质>

DeepSeek R1 0528 间接便肝到了6800字,文笔很佳,读起去有种瞅专科的少篇故事的觉得。布景展垫、人物形貌皆十分到位。

<面打图片高低滚动检察局部实质>

Kimi K2 写了5100字。Kimi先部分计划了实质战情节,小说情节没有算出格出彩,但是文风仍是很没有错的。

横评Kimi K二、DeepSeek、Grok 四、Claude 4四款年夜模子,谁是实王者?w14.jpg

一点儿分享

测完那多少项,尔以为差异仍是有面清楚的。

有的模子一脱手就可以用,有的借停止正在“瞅下来好未几”。页里跑没有起去、逻辑断层、构造紊乱,那成就一测便明白。

巧的是,便正在K2公布多少小时后,Sam Altman便把本定原周启源的 GPT-4o-mini “内部再挨磨一下”。

但是瞅过 K2 的表示,再瞅那波临时踏刹车的操纵,各人内心实在皆大白——国产模子第一次果然迫近了“启源年夜战”的主场。

比拼借正在持续,棋局已经变了。

END

上期启奖

祝贺如下小同伴得到18.88微疑白包!

感谢您瞅到最初,K姐会持续跟踪最新AI使用战止业静态。

假设您以为实质借没有错,有一面启迪或者辅佐?

期望小同伴们多多👍面赞、❤举荐、批评、转收。

K姐按期从四连中分析抽一名同伴奉上🧧白包,帮力您购置AI会员战册本,💗感谢撑持~(必然要⭐星标公家号,才气第一时间支到拉收哦~)

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )