职贝云数AI新零售门户

标题: Manus 官方深夜更新了一篇“外部踩坑笔记” [打印本页]

作者: WijgmVR 时间: 昨天 13:19
标题: Manus 官方深夜更新了一篇“外部踩坑笔记”
7月19日，Manus 官网更新了一篇题为“AI代理的上下文工程：构建Manus的阅历教训”文章。文章作者季逸超（Peak）——Manus 的结合创始人、首席迷信家。文章把他们过去两年踩过的坑、重写的四次架构、以及每一点血泪教训，一次性摊在了阳光下。

假如你正在做 AI Agent，或者正被“上下文爆炸、KV-Cache 命中率掉成狗、工具多到模型直接失忆”折磨，这篇万字长文几乎是一份可以直接照抄的“逃坑指南”。

我把文章的次要的六条阅历整理出来，分享给大家，假如需求看原文，可以点击链接：https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

上下文工程的六大核心准绳

1.围绕KV缓存设计

KV缓存命中率是消费阶段AI代理最重要的目的，直接影响延迟和成本。典型代理在接收用户输入后，会经过一系列工具运用来完成义务，每一步都会将动作和观察结果追加到上下文中。Manus的平均输入输入令牌比约为100:1，这使得前缀填充与解码的比例严重倾斜。

提高KV缓存命中率的关键实际：

2.掩码而非移除工具

随着代理功能的加强，工具数量会爆炸式增长，导致模型更能够选择错误动作或低效途径。动态添加或删除工具会毁坏KV缓存并导致模型混淆。Manus采用上下文感知形态机管理工具可用性，经过掩码令牌日志来限制动作选择，而非修正工具定义。

(, 下载次数: 0)

函数调用的三种形式：

Manus经过分歧的动作称号前缀（如browser_、shell_），完成了在特定形态下轻松限制工具选择范围。

3.运用文件系统作为上下文

虽然古代LLM提供128K令牌的上下文窗口，但在实践代理场景中仍显不足。观察结果能够非常庞大，超出上下文限制；模型功能在特定长度后会下降；长输入即便有前缀缓存也很昂贵。

(, 下载次数: 0)

Manus将文件系统视为终极上下文：

4.经过背诵操纵留意力

Manus在处理复杂义务时会创建todo.md文件并逐渐更新，这一行为实践上是经过背诵来操纵留意力的机制。平均每个义务需求约50次工具调用，长工夫循环容易导致模型偏离主题或遗忘早期目的。

(, 下载次数: 0)

经过不断重写待办事项列表，Manus将全局计划推入模型的近期留意力范围，避免"中间遗忘"成绩，减少目的偏离，无需特殊架构更改。

5.保留错误信息

代理犯错是常态，隐藏错误解导致信息丢失，使模型无法顺应。Manus故意保留上下文中的"错误转弯"，让模型看到失败动作及其结果，从而内隐地更新外部决计，减少反复犯错的机会。

(, 下载次数: 0)

错误恢复才能是真正代理行为的明晰目的之一，但在大多数学术研讨和公开基准中仍未得到充分表现。

6.避免大批样本偏向

大批样本提示在代理系统中能够适得其反。模型擅长模拟上下文中的行为形式，假如上下文充满相似的过去动作-观察对，模型会倾向于遵照该形式，即便它不再是最优选择。

(, 下载次数: 0)

Manus经过引入结构化变化（不同的序列化模板、替代措辞、顺序或格式的宏大变化）来添加多样性，打破形式，调整模型留意力。

结语

上下文工程仍是一门新兴迷信，但对代理系统已至关重要。模型能够变得更弱小、更快、更便宜，但无论原始才能多强，都无法替代对内存、环境和反馈的需求。如何塑造上下文最终决议了代理的行为：运转速度、恢复才能和扩展才能。

Manus团队经过数百万用户的反复重写、失败尝试和真实世界测试，总结出这些阅历教训。虽然这些并非普遍真理，但它们是在实际中被证明有效的形式。正如文章所言："代理的将来将一次一个上下文地构建。精心设计它们。"

希望这些来自一线实际的阅历，能协助AI代理开发者们避免痛苦的迭代，更快地构建出更弱小、更牢靠的智能代理系统。

END
(, 下载次数: 0)

往期引荐：

(, 下载次数: 0)

2025年10款抢手AI IDE精简指南：从收费到付费，总有一款合适你

豆包AI播客实测：公众号文章秒变双人脱口秀，字节再造音频新物种

AI指挥官上线！Roo Code一键统筹前端+后端+测试，复杂项目自动拆解交付！

从“赛博茶馆”到飞书表格：看扣子空间如何用AI搞定复杂义务（附5个约请码）

扣子空间（Coze Space）正式开启内测！

腾讯要发力了，微信接入元宝可以直接聊天了。

即梦3.0摄影密码：用这7个参数让你的AI作品秒变专业大片

一文读懂MCP：OpenAI力挺的下一代AI交互协议，到底强在哪？

AutoGLM 沉思：阅读器智能助手的全新体验

干中学！我用AI工具处理实践工作难题，你也可以复制这个方法！

Hunyuan-T1？真正好玩的是腾讯的这个3D模型

「AI开发进入USB时代！」Cherry Studio+MCP协议实测：3分钟连通本地/云端/API，效率飙升10倍！

OpenManus：解锁相似Manus功能的开源宝藏，30.8k星背后的机密大公开

通用智能体OWL：多智能体协作的前沿探求

获取不到Manus约请码？那可以先玩玩Flowith——用「有限画布+知识资产化」重构你的AI工作流

让知识活动起来！腾讯ima助手已支持deepseek R1，开启全场景智能办公新时代

清华大学Deepseek学习指南五套材料，收费支付！（附PDF下载）

WPS收费接入DeepSeek大模型，AI一键排版+公式秒解，效率翻倍教程！

DeepSeek官方AI工具集，开发者必备神器都在这！

从0到1掌握DeepSeek：角色设定+进阶Prompt全攻略

大模型蒸馏 | 当代AI"灌顶大法"：让小白模型一夜获得十年功力

中国AI的“东方奥秘力气”：DeepSeek如何震撼世界？

应用腾讯元器，将公众号变身绘画提示词智能体

智能新伙伴：探求Coze智能体，用coze手搓一个项目小助理

Kimi视觉思索版还可以这样玩？

豆包：大模型范畴的领航者

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)