开启左侧

AutoGLM是对Manus的东施效颦

[复制链接]
在线会员 OZQ 发表于 2025-8-21 05:33:37 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
导读 | 正在部分坐意上,AutoGLM战Manus根本不合,皆是颠末模子自立计划,掌握云装备完毕,为什么一上一下,批评南北极崩溃?

AutoGLM于8月20日公布后,尔第一时间下载截至了试用,也正在各个仄台听到了许多差别的声音,许多人把存眷面集合到隐衷上,可是幻想倒是AutoGLM使用云脚机/云电脑,受权账号虽有危急,但是您能够挑选没有受权。正在部分坐意上,AutoGLM战Manus根本不合,皆是颠末模子自立计划,掌握云装备完毕,为什么一上一下,批评南北极崩溃?原文测验考试会商此启事:


1 设想观念:本创取跟风的形而上学分家正在AI智能体的开展门路上,设想观念的差别间接决定了产物的魂灵下度。Manus动作华夏守业公司“胡蝶效力”拉出的环球尾款通用Agent产物,其推丁文名意为“脚”,表示着常识不但存留于思惟中,借应能颠末举措患上以完毕的中心思念。这类从供给疑息到施行任务的素质退阶,代表了AI智能体手艺的底子性突破。而智谱AI的AutoGLM固然挨着“环球尾个脚机通用AI智能体”的旗号,但是其部分设想思路清楚持续了Manus的“举措型AI”观点,缺少本创性的形而上学思考。Manus接纳的是端到端任务关环的设想思路,其中心正在于建立一个能够自力完毕从计划到施行齐过程的自立智能体。这类设想观念寻求的是下度自立性,让AI能够像人类一致合成任务、订定战略、施行操纵并托付终极功效。比拟之下,AutoGLM固然也夸大任务施行,但是其云端依靠架构表露了设想观念上的让步性。AutoGLM不能不接纳云脚机计划,颠末从腾讯推销 的云脚机效劳去操纵第三圆App,这类设想素质上是因为手艺架构没法完整完毕当地化自立施行,不能不干出的折衷挑选。加入到AutoGLM以后,起首挑选二小我私家物,女性是用脚机操纵,分析是糊口帮忙;男性是电脑操纵,分析是事情帮忙。岂非女死即是糊口帮理,男死才气当事情帮理?岂非只需电脑能够事情,脚机没法事情?岂非只需脚机代表糊口,用电脑没法糊口?岂非没有是哪一个装备适宜完毕那个任务便用哪一个装备么?险些没有知所云,那面皆弄没有分明,分析连Agent的一般观点皆出理解,Agent是需要能鉴别甚么时候用甚么才气的OK?

表:Manus取AutoGLM设想观念中心比照
特征ManusAutoGLM
中心思念端到端自立任务关环云端帮助的任务施行
自立水平下自立性,无限野生干预依靠云端架构,用户需频仍接收
立异性本创性的“举措型AI”观点持续性改良,缺少观念突破
施行范畴200+东西深度调整40余款支流APP撑持

从死态建立角度瞅,Manus展示出盛开性仄台思惟,颠末多代办署理架构(计划、施行、考证代办署理合作)完毕类人类事情流。这类设想许可第三圆开辟者战企业用户按照自己需要定造化扩大功用,组成了活泼的开辟者死态。反不雅AutoGLM,固然智谱AI也供给API交心,但是其部分死态建立仍然环绕着自己手艺栈睁开,盛开性绝对无限。这类差别体现在理论使用中,Manus能够处置从德克萨斯州学堂建立计划的19份文档主动天生,到Python假造情况的自立拆修等百般化任务,而AutoGLM则更多范围于预设的40余款APP的操纵场景。更深条理的设想观念差别体现在对于野生智能演退路子的理解上。Manus勤奋于挨制的是能够真实替换人类完毕庞大认知事情的数字职工,其设想形而上学成立正在通用野生智能(AGI)的持久愿景上。而AutoGLM则更偏重于一定场景下的东西性帮助,其设想思路更像是初级主动化东西而非真实意思上的智能体。这类观念差别使患上二款产物正在手艺演退标的目的上显现出底子性不合——Manus不竭加强其自立计划战决议计划才气,而AutoGLM则散焦于劣化一定场景下的操纵胜利率。

2 产物界里:通明化取乌箱化的体会边界产物界里是用户感知AI智能体才气的最间接窗心,也是评判产物老练度的主要维度。Manus接纳共同的阁下分栏设想,左边对于话框具体展示AI施行任务的步调分析,右边假造电脑地区直觉呈幻想际操纵情况。这类设想没有是偶尔的界里挑选,而是源于其“通明化操纵”的接互形而上学——用户有权理解AI每步的思考历程战施行细节,进而成立对于主动化过程的信赖感。这类设想观念面前 是对于用户心机的深化洞悉:当AI替换人类施行庞大任务时,历程可回溯性比成果托付更加主要。AutoGLM的界里设想则采纳了判然不同的路子。鉴于云脚机架构的设想观念,其界里更可能是长途桌里镜像的投射,用户瞅到的是另外一个“脚机”的操纵历程。这类设想固然手艺上完毕了装备断绝(用户可正在AI操纵时一般使用脚机),但是也构成了清楚的感情断绝——用户像是正在监控另外一个装备的操纵,而非切身到场智能历程。更主要的是,这类乌箱化设想躲藏了AI的决议计划历程,用户只可瞅到终极成果而没法理解AI的思考逻辑,进而易以成立真实的信赖干系。正在理论体会中,Manus的界里许可用户及时监控任务平息,并正在须要时截至干预调解3。比方,正在处置少文章时,用户能够随时停息AI的操纵,改正中心成果后再持续施行。这类“人类正在环”的设想观念均衡了主动化服从取人类掌握权,出格适宜庞大决议计划任务。反不雅AutoGLM,用户只可主动 等候任务完毕,半途易以截至干预或者调解。一朝任务指令下达,用户便获得了对于历程的掌握才气,只可等候终极成果——而这类成果常常因为缺少半途改正时机而招致品质良莠不齐。
AutoGLM是对于Manus的东施效颦w2.jpg

AutoGLM是对于Manus的东施效颦w3.jpg
本来三步走的Workflow便嚷干Agent了,能冠以Auto之名,脑仁痛!
表:Manus取AutoGLM界里接互特性比照
接互特征ManusAutoGLM
历程可望化残破展示拉理历程战东西挪用仅显现云脚机界里操纵
用户干预撑持半途调解战干预任务开端后易以干预
形状反应及时任务形状革新战退度提醒无限的形状反应体制
多任务办理撑持并止任务办理战切换单任务核心,多任务撑持无限
进修本钱是另外一个表示设想观念差别的枢纽维度。Manus接纳的是“诚笃”的接互设想——它背用户展示了AI事情的局部庞大性,包罗任务计划、东西挪用、施行形状等具体疑息。这类设想固然早期进修直线较高峻陡峭,但是一朝用户把握,就可以充实阐扬AI的局部后劲。AutoGLM则接纳了“简化”的接互设想——用户只要输出指令,其余历程局部躲藏。这类设想瞅似低落了使用门坎,但是理论上因为缺少通明度战可控性,招致用户正在面临庞大任务时常常感应挫败战无帮。从好教角度评介,Manus界里固然被部门用户觉得“朴实”8,但是其功用劣先的设想观念契合消耗力东西的素质需要——下效、明了、间接。AutoGLM则试图正在美妙性上与胜,接纳了更多现代化UI元艳,但是这类美化的外表常常袒护了手艺深度的不敷。邪如一名用户体会钻研者所指出的:“Manus像是工程师设想的东西——合用但是粗拙;AutoGLM像是设想师设想的玩具——精致但是无限。”这类评介大概过于锋利,但是却讲出了二款产物正在界里设想形而上学上的底子差别。


3 手艺才气:自立退步取内部依靠的路子差别手艺才气是评介AI智能体产物的中心维度,间接决定了产物的功用鸿沟战商场合作力。Manus接纳PEV多代办署理架构(计划、施行、考证代办署理合作),调整200+东西深度,完毕了类人类事情流的庞大任务处置才气。这类架构设想的劣势正在于能够将庞大任务合成为多身材任务,并由特地的智能体模块担当施行战考证,进而完毕真实意思上的端到端任务关环。正在GAIA基准尝试中,Manus得到了SOTA成就:根底任务患上分86.5%,中级任务70.1%,庞大任务57.7%,功用清楚劣于OpenAI共级别年夜模子。AutoGLM的手艺架构则成立正在智谱AI自研的GLM-4.5取GLM-4.5V模子根底上,接纳云脚机/云电脑架构完毕装备断绝。这类设想固然制止了当地权力的敏感成就,但是也引进了新的手艺挑战——云端操纵提早、收集依靠性增强和跨装备配合庞大度。其望觉拉理模子GLM-4.5V(1060亿参数)特地针对于GUI元艳恍惚匹配取静态界里理解截至了劣化,正在VAB-WebArena-Lite尝试中操纵胜利率到达59.1%。那一数据固然没有错,但是取Manus正在实在场景中的表示比拟仍存留清楚差异。任务施行才气是最能表示手艺差异的范围。Manus展示出了惊人的多范围适应性:从游玩开辟等下阶任务,到金融修模、企业过程主动化,再到旅游计划8战教术钻研3。这类普遍的任务范畴面前 是其强大的通用拉理才气战东西使用活络性。出格使人影像深化的是,Manus正在40分钟连续功课中展示的自尔纠错才气,已经逾越Cursor等东西的时间阈值10。AutoGLM则更多范围于一定场景的任务施行,特别是脚机APP操纵类任务,如面中买、订机票、查房源等。正在庞大任务处置上,AutoGLM常常需要5-30分钟完毕庞大任务(如天生万字研报),且撑持超少步调(如54步无中断操纵),但是理论尝试中屡次呈现没法完毕任务的情况。

真测底子出法子完毕操纵,连弹窗皆面没有失落啊!手艺自研水平是另外一个枢纽差别面。Manus从下层架构到基层东西链皆展示出下度的手艺自立性,其多代办署理架媾和任务计划体系清楚是针对于通用智能体场景的本创性处置计划。AutoGLM则更多成立正在现有手艺根底之上:云脚机计划去自腾讯,假造机镜像取阿里云等协作同伴配合建立,MCP和谈尺度化兼容下德舆图、淘宝等支流API。这类手艺调整路子固然放慢了产物上市时间,但是也限定了手艺深度战差别化立异。从久远手艺演退角度瞅,Manus展示出更强的自立退步才气。其框架颠末WEBRL自退步框架战KL集度掌握战略革新,处置了保守RL采样服从高的成就2。尝试显现,该框架使Llama-3.1-8B模子正在WebArena-Lite上的胜利率从4.8%提拔至42.4%,逾越GPT-4-Turbo2。这类自尔改良才气使患上Manus能够连续提拔功用鸿沟。AutoGLM则更依靠根底模子的升级迭代——其功用提拔更多与决于GLM模子的后绝版原,而非架构层里的底子性立异。可靠性是评判手艺才气的终极尺度。多位用户反应指出,Manus固然功用强大,但是仍存留瓦解战没有颠簸性的成就。代码天生毛病频收、庞大任务野生干预率下,那些成就暴显现手艺老练度的短板。AutoGLM则面对着更根本的功用性成就——正在真测中,AutoGLM客户端尝试仅输出实质,已理论施行操纵;浏览器插件尝试能启用浏览器但是半途停止;庞大任务尝试虽能会见网站并进修实质,但是终极仅天生课件设想,已完毕预设的主动化过程1。这类水平的功用可靠性明显易以满意消耗力场景的宽苛请求。论断:立异取模仿的最终评判分析设想观念、产物界里战手艺才气三个维度的比照阐发,能够患上出一个大白论断:AutoGLM确实是对于Manus的“东施效颦”,缺少本创性战手艺深度。这类模仿没有是简朴的表面借鉴,而是从观念到架构的齐方向跟从,却又已能把握中心精华。Manus代表的是本创性手艺立异路子,从第一性道理动身从头思考AI智能体的素质,建立了残破的手艺栈战产物形而上学。其端到端任务关环设想、通明化界里观念战多代办署理架构,皆是针对于通用智能体挑战的本创性处置计划。固然产物借存留颠簸性不敷、当地化水平没有高档成就10,但是其手艺标的目的战观念下度已经得到了商场承认——估值拉下至5亿美圆,并得到硅谷风投Benchmark发投的7500万美圆融资。AutoGLM则代表了快速跟退战略,颠末正在已经有手艺根底上的调整劣化,快速拉出合作性产物。其云脚机架构、望觉拉理模子战MCP和谈调整确实有必然立异性,但是部分去瞅仍缺少突破性奉献。特别是正在产物观念层里,AutoGLM已能提出逾越Manus的愿景战标的目的,只可正在后者的设想框架内乱截至无限改良。从止业开展趋势瞅,通用智能体赛讲邪处于枢纽爆发期9。OpenAI拉出Operator并公布了ChatGPT Agent,字节则公布了UI-TARS-1.5定位GUI启源计划7。正在这类合作格式下,纯真模仿易以成立耐久合作力。AutoGLM需要突破Manus的思惟框架,找到共同的手艺路子战代价主意,不然很易正在日趋剧烈的合作中崭露头角。终极,AI智能体产物的评判尺度该当是为用户缔造的理论代价。Manus颠末其强大的任务施行才气战通明化操纵界里,为用户供给了真实意思上的“数字职工”体会,固然另有改良空间,但是已经展示了未来事情方法的反动性变革。AutoGLM则更多天停止正在手艺示范阶段,其云脚机架媾和无限的任务范畴易以支持庄重的消耗力场景。只需当AI智能体能够可靠天处置幻想天下的庞大成就,而不但是完毕手艺示范时,才气真实赢得用户战商场耐久的承认。那场“东施效颦”的戏码终极会给止业戴去甚么启迪?立异者的嘉奖是商场份额战手艺指点力,而模仿者的运气则常常是电光石火。AutoGLM借有机会从头界说自己的手艺路子战代价主意,但是时间已经未几了——正在AI智能体快速演退的时期,窗心期弹指即逝,惟有真实本创性战深度手艺才气赢得未来。
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

avatar

关注0

粉丝0

帖子215

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )