开启左侧

OpenAI 的智能体,在 Manus 面前就是个弟弟?

[复制链接]
在线会员 kGADorA3 发表于 2025-7-18 15:55:12 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
面上圆蓝字存眷尔并星标⭐才气天天支到尔的文章哦!👉面此参加 C 哥的社群(限时)

北京时间来日诰日黄昏,OpenAI CEO 奥特曼(Sam Altman)切身戴队,公布了ChatGPT 智能体(ChatGPT Agent)。

公布会没有少,便25分钟,奥特曼第 N 次冲动天暗示,那让他“真实感受到了 AGI(通用野生智能)的时候”。道谎话,尔已经对于他道的 AGI 来魅了。

瞅完公布会齐程,觉得如何道呢……有面庞大。

近来 OpenAI 人材流逝严峻,风浪不竭,各人原觉得会憋个年夜招,成果搁进去的那个智能体,仿佛不设想中那末冷傲。究竟结果市情上已经有太多的通用智能体,Manus、天工、Genspark、扣子空间皆很佳用,ChatGPT 的那个 Agent 去的有面太早了。

以至许多人以为,OpenAI 的智能体正在 Manus 眼前即是个弟弟:公布早、功用也其实不冷傲。

那个被奥特曼寄与薄视的新工具,究竟是反动性的突破,仍是雷声年夜雨面小?它战市情上已经有的智能体终归有甚么差别?
那个新智能体,终归能干嘛?

简朴来讲,ChatGPT 智能体让 AI 教会了间接操纵您的电脑。

您能够给它一个庞大的任务,而后瞅着它正在您的电脑上翻开网页、写法式、阐发数据、干图表,最初把废品接给您。

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w2.jpg

民间示范了多少个例子:
    • 糊口帮理:“助尔方案一个四小我私家的日式早饭,并把需要的食材皆购佳。”•任务 秘书籍:“瞅瞅尔的日历,分离最新的往事,给尔归纳一下下战书要启的客户集会重心。”• 贸易阐发师:“来网上搜刮尔三个合作敌手的质料,阐发一下,而后干个 PPT 给尔。”

正在那些任务里,ChatGPT 会自己上彀搜刮、选择疑息。当需要截至登录时会提醒您,最初能间接天生可编纂的 PPT 战 Excel。

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w3.jpg
图:ChatGPT Agent 天生的 PPT
为了展示出那个智能体战幻想的强大接互才气,民间借示范了如许一个场景:上传一弛公司不祥物的图片,让 AI 设想成漫绘风的揭纸,而后间接下单 500 弛,寄到指定地点。

全部历程趁热打铁:理解指令 → 上彀搜刮 → 挪用东西天生图片 → 设想揭纸 → 挪用买物网站 API 下单。

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w4.jpg
图:ChatGPT Agent中止 文献处置
那面前 ,实际上是 OpenAI 把以前的多少个钻研名目“缝”到了共同。

今年 1 月,他们弄了个嚷 Operator 的工具,能让 AI 瞅懂图形界里,而后模仿用户的面打战输出。

出过二周,他们又出了个 Deep Research,善于正在齐网搜刮各类疑息,而后给您写一份深度阐发陈述。

但是成就去了,他俩各有各的“冷炙徐”:
    • Operator 只可瞅屏幕内乱的疑息,以是碰到一个少文章,患上一页一页朝下翻,服从极高。• DeepResearch 呢,只会瞅笔墨,出法子助用户施行任务。

因而 OpenAI 的工程师决定让他俩开体。

以是,来日诰日咱们瞅到的 ChatGPT 智能体,即是这样去的。它正在一个假造的电脑情况里,共时具有了文原浏览器、图形界里浏览器战代码末端那三样兵器。
瑞士军刀 vs 东西箱

瞅到那里,您可以会以为,那功用听着战 Manus 好未几啊?皆能上彀,能处置文献。

出错,各人干的工作皆类似。以是此次公布会上的功用示范可以并非最主要的吗,主要的是他们干那个智能体的下层路子。OpenAI 战 Manus 走的是二条完整差别的路。

那才是此次公布最值患上存眷之处。

Manus 的逻辑,更像一个“内部缝开”的超等东西箱。

您能够把它设想成一个智慧的名目司理。当交到一个庞大任务时,它没有会自己重新搞到尾,而是把任务装解,而后来挪用市情上最牛的“外助”:需要写文章?它来挪用一个写做年夜模子;需要干图?它又来挪用一个图画年夜模子。

它的中心才气是“调整”战“调理”,把各个范围的顶尖东西串连起去,完毕任务。这类方法的益处是吹糠见米,因为每一个单项东西皆很强,拉拢起去的终极结果(好比干的PPT便很精致)天然没有会好。

而 ChatGPT 智能体,走的是一条更易、也更具家心的“端到端”门路。

OpenAI 的目标是把统统的智能体才气皆“内乱化”到模子自己。他们颠末大批的加强进修锻炼,学会一个分歧的年夜模子自己来使用东西。它没有需要把任务中包,而是模子自己已经理解了怎样浏览、怎样阐发、怎样操纵电脑。用户瞅到的是 AI 正在一个假造情况里,间接完毕统统操纵。

那是二种下层形而上学的底子差别:
    • Manus 是“模子拉拢”,寻求的是多种东西拉拢的最劣解。• OpenAI 是“才气内乱化”,寻求的是通朝 AGI 的最终形状。

能够道,ChatGPT 智能体是第一个真实意思上的“端到端通用智能体”雏形。它的意思,弘远于今朝的功用自己。
纸里数据 vs 实在体会

聊完毕下层逻辑,咱们再去瞅瞅理论表示。

从跑分数据瞅,ChatGPT 智能体确实能挨,险些正在统统基准尝试上皆革新了 SOTA(State-of-the-Art,即目前最好水平)。

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w5.jpg

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w6.jpg
    • 正在号称“人类最初测验”的 HLE 尝试中,患上分 41.6%。Grok 4 拉出时引觉得傲的 HLE成果 便霸榜了一周便被逃仄,堪称此次公布会的最年夜输野。• 正在超易的 FrontierMath 数教尝试中,精确率到达 27.4%,近超晚辈。• 正在数据科学任务 DSBench 上,阐发战修模的精确率以至清楚逾越了人类均匀水平。• 正在最能表示“挨工才气”的电子表格编纂尝试 SpreadsheetBench 中,患上分 45.5%,间接把 Excel Copilot(20.0%)按正在天上磨擦。

纸里数据很美好,但是实在体会便有面骨感了。

公布调演出示的 PPT,又艳又丑恶,一股浓浓的理工风。OpenAI自己 也挺谦虚,认可今朝天生幻灯片的功用借不过 Beta 版,主要劣化的是疑息构造,美妙度另有待进步。

再归纳多少个各人关心的合用疑息:
    1. 谁能用? 本日起,ChatGPT Pro、Plus 战 Team 用户连续盛开。Pro 用户每个月撑持 400 次挪用,Plus 战 Team 用户每个月 40 次。2. 要费钱吗?包括 正在定阅费里。ChatGPT Plus 每个月 20 美圆,而 Manus根底 版是 19 美圆,价钱上好未几。3.动摇 吗? OpenAI 一收新品便宕机的“优良保守”也持续了,公布会当早效劳器因没有其然又崩了。4.平安 吗? 欠好道。奥特曼特地收了个少文提醒危急:AI 会打仗您的敏感数据,也可以被网页上的“歹意提醒”进犯。因而,统统枢纽操纵(如购置、收邮件)前皆必需获得您的大白受权,像银止转账这类下危急任务则会被间接拒绝。
一小步,但是标的目的对于了

总的来讲,ChatGPT 智能体的公布,最年夜的立异正在于,初度正在一个分歧的模子里,散成为了残破的假造操纵情况,让咱们瞅到了“模子即智能体,智能体即模子”的未来标的目的。

那便像苹因公布第一代 iPhone。其时它功用没有齐,以至没有撑持复造粘揭,但是它用一齐触摸屏界说了未来十年的智妙手机。

ChatGPT 智能体也是云云,它的代价没有正在于当下有多佳用,而正在于它指清楚明了一条通朝 AGI 的门路。

可是正在 OpenAI 的批评区里,各人会商最强烈热闹的,仍是:

“以是,GPT-5究竟 啥时候收?”

尔是 C 哥,一个 AI 超等个别

尔是 C 哥,一个 AI 时期的超等个别。动作守业者、老板,干过准独角兽企业;动作法式员战手艺大师,干过量野公司 CTO,恳求过多少十个手艺博利;写过 AI滞销 书籍,为大批小我私家战企业辅导 AI 降天,也是齐网六位数粉丝自媒介人。

OpenAI 的智能体,正在 Manus 眼前即是个弟弟?w7.jpg

假设您也念成为 AI 时期的超等个别,能够减尔微疑,收您一份下品质 AI 常识库及 2025 女伶 href="https://www.taojin168.com" target="_blank">AIGC 齐景使用图谱:

您面打的“爱心赞”战“拇指赞”是尔创做最年夜的能源欢送存眷 C 哥并星标⭐️天天瞅到尔的下品质本创做品
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )