职贝云数AI新零售门户
标题:
Manus 官方深夜更新了一篇“外部踩坑笔记”
[打印本页]
作者:
WijgmVR
时间:
昨天 13:19
标题:
Manus 官方深夜更新了一篇“外部踩坑笔记”
7月19日,Manus 官网更新了一篇题为“AI代理的上下文工程:构建Manus的阅历教训”文章。文章作者季逸超(Peak)——Manus 的结合创始人、首席迷信家。文章把他们过去两年踩过的坑、重写的四次架构、以及每一点血泪教训,一次性摊在了阳光下。
假如你正在做 AI Agent,或者正被“上下文爆炸、KV-Cache 命中率掉成狗、工具多到模型直接失忆”折磨,这篇万字长文几乎是一份可以直接照抄的“逃坑指南”。
我把文章的次要的六条阅历整理出来,分享给大家,假如需求看原文,可以点击链接:https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
上下文工程的六大核心准绳
1.围绕KV缓存设计
KV缓存命中率是消费阶段AI代理最重要的目的,直接影响延迟和成本。典型代理在接收用户输入后,会经过一系列工具运用来完成义务,每一步都会将动作和观察结果追加到上下文中。Manus的平均输入输入令牌比约为100:1,这使得前缀填充与解码的比例严重倾斜。
提高KV缓存命中率的关键实际:
保持提示前缀波动,避免包含工夫戳等动态信息
确保上下文仅追加不修正,保证序列化的确定性
必要时显式标记缓存断点,特别是系统提示结束处
2.掩码而非移除工具
随着代理功能的加强,工具数量会爆炸式增长,导致模型更能够选择错误动作或低效途径。动态添加或删除工具会毁坏KV缓存并导致模型混淆。Manus采用上下文感知形态机管理工具可用性,经过掩码令牌日志来限制动作选择,而非修正工具定义。
(, 下载次数: 0)
上传
点击文件名下载附件
函数调用的三种形式:
自动形式:模型可选择调用或不调用函数
必需形式:模型必须调用函数,但选择不受限制
指定形式:模型必须从特定子集中选择函数
Manus经过分歧的动作称号前缀(如browser_、shell_),完成了在特定形态下轻松限制工具选择范围。
3.运用文件系统作为上下文
虽然古代LLM提供128K令牌的上下文窗口,但在实践代理场景中仍显不足。观察结果能够非常庞大,超出上下文限制;模型功能在特定长度后会下降;长输入即便有前缀缓存也很昂贵。
(, 下载次数: 0)
上传
点击文件名下载附件
Manus将文件系统视为终极上下文:
有限大小且持久化
模型可按需读写文件
完成可恢复的紧缩策略,如保留URL而移除网页内容
4.经过背诵操纵留意力
Manus在处理复杂义务时会创建todo.md文件并逐渐更新,这一行为实践上是经过背诵来操纵留意力的机制。平均每个义务需求约50次工具调用,长工夫循环容易导致模型偏离主题或遗忘早期目的。
(, 下载次数: 0)
上传
点击文件名下载附件
经过不断重写待办事项列表,Manus将全局计划推入模型的近期留意力范围,避免"中间遗忘"成绩,减少目的偏离,无需特殊架构更改。
5.保留错误信息
代理犯错是常态,隐藏错误解导致信息丢失,使模型无法顺应。Manus故意保留上下文中的"错误转弯",让模型看到失败动作及其结果,从而内隐地更新外部决计,减少反复犯错的机会。
(, 下载次数: 0)
上传
点击文件名下载附件
错误恢复才能是真正代理行为的明晰目的之一,但在大多数学术研讨和公开基准中仍未得到充分表现。
6.避免大批样本偏向
大批样本提示在代理系统中能够适得其反。模型擅长模拟上下文中的行为形式,假如上下文充满相似的过去动作-观察对,模型会倾向于遵照该形式,即便它不再是最优选择。
(, 下载次数: 0)
上传
点击文件名下载附件
Manus经过引入结构化变化(不同的序列化模板、替代措辞、顺序或格式的宏大变化)来添加多样性,打破形式,调整模型留意力。
结语
上下文工程仍是一门新兴迷信,但对代理系统已至关重要。模型能够变得更弱小、更快、更便宜,但无论原始才能多强,都无法替代对内存、环境和反馈的需求。如何塑造上下文最终决议了代理的行为:运转速度、恢复才能和扩展才能。
Manus团队经过数百万用户的反复重写、失败尝试和真实世界测试,总结出这些阅历教训。虽然这些并非普遍真理,但它们是在实际中被证明有效的形式。正如文章所言:"代理的将来将一次一个上下文地构建。精心设计它们。"
希望这些来自一线实际的阅历,能协助AI代理开发者们避免痛苦的迭代,更快地构建出更弱小、更牢靠的智能代理系统。
END
(, 下载次数: 0)
上传
点击文件名下载附件
往期引荐:
(, 下载次数: 0)
上传
点击文件名下载附件
2025年10款抢手AI IDE精简指南:从收费到付费,总有一款合适你
豆包AI播客实测:公众号文章秒变双人脱口秀,字节再造音频新物种
AI指挥官上线!Roo Code一键统筹前端+后端+测试,复杂项目自动拆解交付!
从“赛博茶馆”到飞书表格:看扣子空间如何用AI搞定复杂义务(附5个约请码)
扣子空间(Coze Space)正式开启内测!
腾讯要发力了,微信接入元宝可以直接聊天了。
即梦3.0摄影密码:用这7个参数让你的AI作品秒变专业大片
一文读懂MCP:OpenAI力挺的下一代AI交互协议,到底强在哪?
AutoGLM 沉思:阅读器智能助手的全新体验
干中学!我用AI工具处理实践工作难题,你也可以复制这个方法!
Hunyuan-T1?真正好玩的是腾讯的这个3D模型
「AI开发进入USB时代!」Cherry Studio+MCP协议实测:3分钟连通本地/云端/API,效率飙升10倍!
OpenManus:解锁相似Manus功能的开源宝藏,30.8k星背后的机密大公开
通用智能体OWL:多智能体协作的前沿探求
获取不到Manus约请码?那可以先玩玩Flowith——用「有限画布+知识资产化」重构你的AI工作流
让知识活动起来!腾讯ima助手已支持deepseek R1,开启全场景智能办公新时代
清华大学Deepseek学习指南五套材料,收费支付!(附PDF下载)
WPS收费接入DeepSeek大模型,AI一键排版+公式秒解,效率翻倍教程!
DeepSeek官方AI工具集,开发者必备神器都在这!
从0到1掌握DeepSeek:角色设定+进阶Prompt全攻略
大模型蒸馏 | 当代AI"灌顶大法":让小白模型一夜获得十年功力
中国AI的“东方奥秘力气”:DeepSeek如何震撼世界?
应用腾讯元器,将公众号变身绘画提示词智能体
智能新伙伴:探求Coze智能体,用coze手搓一个项目小助理
Kimi视觉思索版还可以这样玩?
豆包:大模型范畴的领航者
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5