职贝云数AI新零售门户
标题:
【论文分享】通用Agent(Manus):人工智能的消费力革命
[打印本页]
作者:
bNu6V5zl
时间:
7 小时前
标题:
【论文分享】通用Agent(Manus):人工智能的消费力革命
通用Agent:人工智能的“消费力革命”
General Agent: The “Productivity Revolution” of Artificial Intelligence
01
技术打破:从被动应对到自动执行
传统LLM仅提供建议,但通用Agent可直接交付成果,如自动预订酒店,完成从建议到执行的跨越。在GAIA基准测试中,Manus在Level1义务完成率高达86.5%,远超GPT的74.3%
传统LLM仅提供建议,但通用Agent可直接交付成果,如自动预订酒店,完成从建议到执行的跨越。在GAIA基准测试中,Manus在Level1义务完成率高达86.5%,远超GPT的74.3%
同步操作形式下,用户在线时Agent可实时交互,即时响运用户需求;异步执行形式则允许Agent在用户离线后云端自主完成义务。
02
架构解析:多Agent协作的技术革命
核心组成部分
1.核心执行模块
经过规划代理、执行代理和验证代理完成义务拆解、工具调用与结果校验,确保义务从规划到交付的残缺闭环。
2.支持系统模块
提供记忆存储、工具集成与动态调度,为Agent的高效执行提供底层支撑。
3.扩展才能模块
支持多代理协作与云边协同,推进Agent向多场景延伸,完成复杂义务的分布式处理与专业化分工。
03
首个通用agent:manus
Manus由LLM、Web Agent、命令行和编程Agent组成。manus的巧妙之处在于充分发挥了大模型对文本的处理优势,将执行各种复杂操作都经过代码来完成。
下面是它的技术道路:
(, 下载次数: 0)
上传
点击文件名下载附件
Manus虽然功能非常弱小,但他也存在一定的成绩:
多个agent的简单堆叠
manus将几个特定agent停止了组合(如web agent,编程agent),虽然可以应对多样的义务,但agent互相调用的过程中会加重LLM幻觉成绩,当数据很准确时,很易出错。
大模型对上下文了解长度的局限性
受限于模型架构、计算资源和训练数据分布,大模型在处理长上下文义务时表现不佳。导致manus在面对复杂义务时无法停止片面了解。
技术壁垒和发展潜力
manus对现有的技术停止无机结合,来完成通用agent,这种技术道路并没有太多技术壁垒,发展潜力也非常有限。
04
总结
当前通用型Agent存在的技术瓶颈
1.长链条义务的不确定性累积
多步骤义务中,每个环节的宏大误差会随执行步骤呈指数级放大。例如20步以上的市场调研义务,即便单步误差率仅5%,最终结论能够完全偏离真实需求
2.上下文的连接性
复杂义务需携带大量历史会话信息,现有模型难以处理超长轮次交互,导致义务执行割裂或中缀
3.义务规划的脆弱性
“多代理协同架构”可以较好的完成预先定义义务(如网页翻页),但难以应对非预定义义务(如操控PowerPoint)
4.成本难以控制
复杂义务需频繁调用大模型,单次成本能够高达2美元,远高于传统自动化工具
Bilibili视频链接:https://www.bilibili.com/video/BV1i7oqYLE5w/?share_source=copy_web&vd_source=dbd24e884786a486c343dede12d67d8b
图文|王星童
编辑/审校|王闪闪、张一
(, 下载次数: 0)
上传
点击文件名下载附件
公众号
丨LOCI Lab
课题组官网丨http://loci.ujn.edu.cn
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5