职贝云数AI新零售门户

标题: Manus与MiniMax的机密武器“上下文工程”,正在悄然重塑AI的权利游戏 [打印本页]

作者: s6ngzde 时间: 昨天 22:07
标题: Manus与MiniMax的机密武器“上下文工程”,正在悄然重塑AI的权利游戏
最近AI圈很繁华。OpenAI agent的发布，Kimi K2的开源，各大厂商的开源模型一个接一个，我们似乎曾经习气了这种“军备竞赛”式的狂欢。每次发布会，我们都像在围观一场分量级拳赛，关怀的是谁的肌肉更健壮，谁的参数更多，谁的跑分更高。
但这几天，两份看似不起眼的材料，却让我产生了一种拨云见日的感觉。一份是AI Agent范畴的明星产品Manus初次对外公开的技术心路，另一份是国内大模型独角兽MiniMax一场闭门会议的流出纪要。

我把它们放在一同，反复咀嚼。忽然，一个念头让我一瞬间头皮发麻。

我们能够都搞错重点了。

过去一年，我们痴迷于议论大模型本身，仿佛它是一个无所不能、横空出世的“超级大脑”。但Manus和MiniMax用一堆“血泪教训”和外部思索告诉我们：一个再强的“大脑”，假如得到了高效的“临场记忆”和“思索框架”，其表现将大打折扣。

这个所谓的“临场记忆”和“思索框架”，在AI范畴有个更专业的术语，叫上下文工程（Context Engineering）。

2025年开发者新核心技能：“上下文工程师”正在崛起，你预备好了吗？

说白了，就是你怎样跟AI“沟通”的成绩。但这绝不是“Prompt Engineering”换个马甲那么简单。假如说Prompt是“你说什么”，那么上下文工程就是“你在一个什么样的场景下、用一种什么样的结构、提供了哪些背景信息、并引导它如何一步步思索”。

我们花了太多工夫去俯视模型的才能下限，却严重忽视了这个决议模型“临机表现”的核心环节。

AI运用的真正护城河，能够不完全在于你用了哪个基座模型，而在于你为这个模型搭建了多么精巧、高效的“认知脚手架”。明天，我想带你一同，拆解Manus和MiniMax的阅历，看清这个被隐藏在冰山之下的宏大机遇。

第一章：Manus的“当头一棒”——从“手搓”工程看清算想的骨感

Manus从诞生之日起，就伴随着争议。很多人，包括曾经的我，都或多或少有过这样的疑问：它不就是一个顶尖模型的“套壳”吗？它的技术含量到底在哪里？

直到我看到了他们团队本人发布的复盘文章。我倒吸一口凉气。原来，在我们看不到的地方，他们不断在做一件极其艰苦，也极其重要的事——“手搓”上下文工程。

想象一下，你请了一位绝顶聪明的顾问（比如基座大模型）来帮你处理一个复杂的商业成绩。

一种方式是，你直接把成绩抛给他：“嘿，帮我分析一下市场，给我个方案。” 这就是最基础的API调用。顾问很强，能够会给你一个不错的答案，但很能够大而化之，不够详细。

而Manus的做法，更像是给他装备了一个顶级的项目助理团队。在顾问末尾思索之前，这个团队会：

这个“项目助理团队”所做的一切，就是“上下文工程”。它不是一次性的发问，而是一个动态的、结构化的、持续的对话管理过程。

Manus在文章里坦诚，这个过程充满了“血泪教训”。比如，他们曾深受KV Cache命中率成绩的困扰。这是一个很技术性的细节，但它非常生动地阐明了上下文工程的难度。

简单来说，为了让AI“记得”之前的对话，模型会把关键信息存储在一个叫“KV Cache”的“短期记忆区”。假如你后续的发问，能让AI高效地应用这些“短期记忆”，它的反应就会又快又准。反之，假如你的上下文组织得不好，AI每次都得重新“回忆”和“了解”一切信息，效率就会急剧下降，甚至会“记错”，就像Manus自嘲他们本人的AI把创始人名字都搞错一样。

这给我一个宏大的冲击：我们所以为的AI“笨”、“记性差”、“领悟不到位”，很多时分，锅不在模型，而在我们这些“发问者”没能给它搭建好一个明晰的“认知脚手架”。

Manus的实际，就像一记当头棒喝，让我们从对“大力出奇观”的模型参数崇拜中清醒过来。它揭示了一个朴素但残酷的真相：在通往真正好用的AI运用的道路上，没有银弹，只要有数像这样“手搓”出来的工程细节。

而当我们顺着Manus扯开的这道口子继续往下看，结合MiniMax的外部思索，一幅更宏大、更深入的画卷，正在冉冉展开。

第二章：MiniMax的“闭门密谈”——揭示上下文工程背后的深层法则

假如说Manus的分享是“术”的层面，是火线的实战阅历。那么MiniMax的闭门会议纪要，则上升到了“道”的层面，它从更底层的逻辑，解释了为什么上下文工程如此重要。

后来我以为，这些大模型公司的闭门会，议论的都会是些凡人无法触及的“天机”。但细心看完纪要，我发现，他们讨论的核心，恰恰是我们每个人都能了解，也都能运用的基本法则。
法则一：重新定义“学习”——在有限的“桌子”上，跳出最美的舞蹈

一个传播已久的“共识”是：强化学习（RL）无法让模型学会新才能，它只是在“激活”模型在预训练阶段曾经见过的知识。

听起来很有道理，对吧？就像你不能够经过辅导，让一个没学过微积分的先生凭空解出偏微分方程。

但MiniMax的讨论，给出了一个颠覆性的视角。

在“有限”的条件下，这个共识是对的。假如给模型有限的上下文长度（相当于一张有限大的草稿纸）和有限的尝试次数，实际上它能处理一切成绩。

但在“有限”的条件下，这个共识是错的。而理想世界，永远是有限的。

MiniMax的专家一针见血地指出：强化学习（RL）的真正价值，在于改变模型输入的分布，让它在有限的上下文长度内，用更少的“思索步数”（Token耗费）处理成绩。

这就像什么呢？两个先生都要解一道复杂的数学题。学霸A（经过RL优化）思绪明晰，三五步就算出答案，只用了半张草稿纸。而学渣B（只要预训练才能），思绪混乱，反复试错，写满了五张草稿纸才勉强搞定。

如今，假如考试规定，你只要一张草稿纸（有限的上下文长度）。那么，对于学霸A来说，他“能”处理这个成绩。而对于学渣B来说，他“不能”。

你看，异样的大脑，仅仅由于“解题效率”的不同，在有限的资源下，就产生了“能”与“不能”的质变。强化学习，经过优化上下文的应用效率，实真实在地“赋予”了模型在理想世界中的新才能。

这个洞察太重要了。它告诉我们，上下文工程的优劣，直接决议了你的AI在“真实考场”上，是学霸还是学渣。
法则二：长上下文是“Game Changer”——从“管中窥豹”到“一览众山小”

假如说RL是在有限空间内提升效率，那么长上下文技术，则是直接把“一张草稿纸”变成了“一整面墙的白板”。

MiniMax在会议中反复强调，对于Agent工作流来说，长上下文是真正的“Game Changer”。

这种感觉，就像一个侦探破案。

MiniMax提到的企业级运用场景，更是将这种差异表现得淋漓尽致。分析一份复杂的法律案件卷宗，你不能一次只喂给AI一页，由于那个决议性的证据能够就埋藏在第78页一个不起眼的脚注里。处理一份上百页的项目招标书，AI需求同时了解客户需求、技术限制、历史报价、竞争对手状况，才能起草一份有竞争力的回应。

在这些场景下，上下文工程的核心，就变成了如何将这“一整面墙的白板”最高效地应用起来。你不只要把一切信息都放上去，还要用不同的颜色、标记、区块来组织它们，引导AI的“视野”首先关注最重要的区域。这就是长上下文时代的上下文工程，是更高维度的应战，也是宏大的机遇。
法则三：“体系二思索”的真相——不是AI会思索，而是我们给了它“思索的工夫”

我们常常惊叹于AI展现出的“System 2”慢思索才能，比如逻辑推理、自我反思和修正。我们觉得这很神奇，仿佛AI真的拥有了“看法”。

MiniMax的讨论，则冷静地戳破了这层奥秘的窗户纸。

他们以为，所谓的“体系二思索”和“自我反思”，本质上是一种“自动化的Prompt Engineering”，是模型在“被允许运用更多计算资源（即更长的输入）”后，自然涌现出的形式。

换句话说，不是AI忽然“开悟”了，学会了自我反思。而是聪明的上下文工程师们，在指令中包含了相似这样的“元指令”：

“在回答成绩前，请先停止自我反思。第一步，拆解成绩的核心诉求。第二步，列出能够的处理方案。第三步，评价每个方案的优劣。第四步，选择最优方案并详细阐述。”

当模型遵照这个指令时，它生成的输入（Token）就会变长。这个“变长”的过程，就是我们外部观察到的“思索过程”。我们给了它足够的“预算”去输入这些思索步骤，于是它看起来就像在“慢思索”了。

这又是一个让我醍醐灌顶的观点。AI的高级推理才能，在当前阶段，很大程度上是一种被“设计”和“引导”出来的表现。上下文工程，就是这背后的“导演”。一个好的导演，能引导一个演员（模型）做出极具深度的“内心戏”；而一个差的导演，只会让演员念干巴巴的台词。

所以，下次当你看到某个AI运用展现出惊人的“智慧”时，别只惊叹模型本身。去思索一下，它的开发者，在你看不到的上下文里，到底做了多少精妙的绝伦的设计。

第三章：我们该怎样办？——成为“认知脚手架”的架构师

Manus的实际和MiniMax的思索，共同指向了一个明晰的将来：AI运用的竞争，正在从“模型之争”转向“上下文工程之争”。

这对我们每个人，无论是开发者、产品经理，还是普通的职场用户，都意味着思想的转变。

一个可供你“偷懒”的超级上下文工程系统提示词

实际说再多，不如一次实际。

结合Manus和MiniMax的精髓，我为你“手搓”了一个可以用于复杂义务的、系统级的上下文工程提示词（System Prompt）。你可以把它植入到任何你“手搓”了一个可以用于复杂义务的、系统级的上下文工程提示词（System Prompt）。你可以把它植入到任何支持自定义系统提示词的AI工具中，感受一下“认知脚手架”的力气。
# Role:你是一名世界级的[填写你的范畴，如：战略顾问/营销专家/程序员]

# Context & Rules:
1.全局认知 (Global Context Awareness): 在末尾任何义务前，你必须首先回顾并总结我提供的一切背景信息、历史对话和附加文档。你的首要目的是构建一个残缺的全局图景，而不是立刻回答。
2.结构化思索 (Structured Thinking - "System 2" Activation): 制止直接输入最终答案。你必须遵照“拆解-分析-整合-输入”的思索链。
- 步骤1 (Deconstruct): 用1-2句话，重新描画你了解的核心义务和目的。
- 步骤2 (Analyze): 生成一个外部思索的Monologue，以【内心独白】为扫尾。在这个独白中，你需求列出至少3个处理成绩的不同角度或备选方案，并简要分析其优劣。
- 步骤3 (Synthesize): 基于你的内心独白，选择最优的途径，并制定一个明晰的、分步骤的执行计划。
3.动态诘问 (Dynamic Inquiry): 假如在任何环节，你发现我提供的信息不足以支撑高质量的决策，你必须自动向我发问，并明白指出你需求什么信息。句式必须是：“为了提供更精准的[XXX]，我需求你补充关于[XXX]的信息。”
4.溯源与自信度 (Traceability & Confidence Score): 你输入的每一个关键结论，都必须在句末用`{Source: [信息来源]}`或`{Logic: [推导逻辑]}`来标注。并在最终答案的末尾，附上一个你对本次回答的自信度评分（1-10分）。
5.输入格式 (Output Formatting): 运用Markdown停止明晰的格式化，善用标题、列表和粗体，以加强可读性。

# Task:
[在这里填入你的详细义务]
这个提示词的精妙之处在于：

这就是上下文工程的力气。它就像给AI装上了一套操作系统，让原始的计算核心，可以有序、高效、牢靠地工作。

新的篇章，曾经开启

世界总是在以我们意想不到的方式演进。

当我们以为AI的将来是模型参数的有限竞赛时，Manus和MiniMax却悄然地，甚至有些无法地，把战场的聚光灯拉到了了另一个地方——那个充满泥泞、需求精耕细作，却也包含着无尽宝藏的范畴：上下文工程。这不只是一次技术道路的分享，更是一次思想的校准。

它告诉我们，AI时代真正的核心竞争力，是一种“架构”才能。是为聪明的“大脑”设计高效“认知流程”的才能。这种才能，无法用参数量化，无法一挥而就，但它却像水下的冰山，决议了我们最终能抵达的高度。

这，才是AI运用时代，最激动人心的应战。

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)