职贝云数AI新零售门户

标题: Manus与MiniMax的机密武器“上下文工程”,正在悄然重塑AI的权利游戏 [打印本页]

作者: s6ngzde    时间: 昨天 22:07
标题: Manus与MiniMax的机密武器“上下文工程”,正在悄然重塑AI的权利游戏
最近AI圈很繁华。OpenAI agent的发布,Kimi K2的开源,各大厂商的开源模型一个接一个,我们似乎曾经习气了这种“军备竞赛”式的狂欢。每次发布会,我们都像在围观一场分量级拳赛,关怀的是谁的肌肉更健壮,谁的参数更多,谁的跑分更高。
但这几天,两份看似不起眼的材料,却让我产生了一种拨云见日的感觉。一份是AI Agent范畴的明星产品Manus初次对外公开的技术心路,另一份是国内大模型独角兽MiniMax一场闭门会议的流出纪要。

我把它们放在一同,反复咀嚼。忽然,一个念头让我一瞬间头皮发麻。

我们能够都搞错重点了。

过去一年,我们痴迷于议论大模型本身,仿佛它是一个无所不能、横空出世的“超级大脑”。但Manus和MiniMax用一堆“血泪教训”和外部思索告诉我们:一个再强的“大脑”,假如得到了高效的“临场记忆”和“思索框架”,其表现将大打折扣。

这个所谓的“临场记忆”和“思索框架”,在AI范畴有个更专业的术语,叫上下文工程(Context Engineering)。

2025年开发者新核心技能:“上下文工程师”正在崛起,你预备好了吗?

说白了,就是你怎样跟AI“沟通”的成绩。但这绝不是“Prompt Engineering”换个马甲那么简单。假如说Prompt是“你说什么”,那么上下文工程就是“你在一个什么样的场景下、用一种什么样的结构、提供了哪些背景信息、并引导它如何一步步思索”。

我们花了太多工夫去俯视模型的才能下限,却严重忽视了这个决议模型“临机表现”的核心环节。

AI运用的真正护城河,能够不完全在于你用了哪个基座模型,而在于你为这个模型搭建了多么精巧、高效的“认知脚手架”。明天,我想带你一同,拆解Manus和MiniMax的阅历,看清这个被隐藏在冰山之下的宏大机遇。

第一章:Manus的“当头一棒”——从“手搓”工程看清算想的骨感

Manus从诞生之日起,就伴随着争议。很多人,包括曾经的我,都或多或少有过这样的疑问:它不就是一个顶尖模型的“套壳”吗?它的技术含量到底在哪里?

直到我看到了他们团队本人发布的复盘文章。我倒吸一口凉气。原来,在我们看不到的地方,他们不断在做一件极其艰苦,也极其重要的事——“手搓”上下文工程。

想象一下,你请了一位绝顶聪明的顾问(比如基座大模型)来帮你处理一个复杂的商业成绩。

一种方式是,你直接把成绩抛给他:“嘿,帮我分析一下市场,给我个方案。” 这就是最基础的API调用。顾问很强,能够会给你一个不错的答案,但很能够大而化之,不够详细。

而Manus的做法,更像是给他装备了一个顶级的项目助理团队。在顾问末尾思索之前,这个团队会:

这个“项目助理团队”所做的一切,就是“上下文工程”。它不是一次性的发问,而是一个动态的、结构化的、持续的对话管理过程。

Manus在文章里坦诚,这个过程充满了“血泪教训”。比如,他们曾深受KV Cache命中率成绩的困扰。这是一个很技术性的细节,但它非常生动地阐明了上下文工程的难度。

简单来说,为了让AI“记得”之前的对话,模型会把关键信息存储在一个叫“KV Cache”的“短期记忆区”。假如你后续的发问,能让AI高效地应用这些“短期记忆”,它的反应就会又快又准。反之,假如你的上下文组织得不好,AI每次都得重新“回忆”和“了解”一切信息,效率就会急剧下降,甚至会“记错”,就像Manus自嘲他们本人的AI把创始人名字都搞错一样。

这给我一个宏大的冲击:我们所以为的AI“笨”、“记性差”、“领悟不到位”,很多时分,锅不在模型,而在我们这些“发问者”没能给它搭建好一个明晰的“认知脚手架”。

Manus的实际,就像一记当头棒喝,让我们从对“大力出奇观”的模型参数崇拜中清醒过来。它揭示了一个朴素但残酷的真相:在通往真正好用的AI运用的道路上,没有银弹,只要有数像这样“手搓”出来的工程细节。

而当我们顺着Manus扯开的这道口子继续往下看,结合MiniMax的外部思索,一幅更宏大、更深入的画卷,正在冉冉展开。

第二章:MiniMax的“闭门密谈”——揭示上下文工程背后的深层法则

假如说Manus的分享是“术”的层面,是火线的实战阅历。那么MiniMax的闭门会议纪要,则上升到了“道”的层面,它从更底层的逻辑,解释了为什么上下文工程如此重要。

后来我以为,这些大模型公司的闭门会,议论的都会是些凡人无法触及的“天机”。但细心看完纪要,我发现,他们讨论的核心,恰恰是我们每个人都能了解,也都能运用的基本法则。
法则一:重新定义“学习”——在有限的“桌子”上,跳出最美的舞蹈

一个传播已久的“共识”是:强化学习(RL)无法让模型学会新才能,它只是在“激活”模型在预训练阶段曾经见过的知识。

听起来很有道理,对吧?就像你不能够经过辅导,让一个没学过微积分的先生凭空解出偏微分方程。

但MiniMax的讨论,给出了一个颠覆性的视角。

在“有限”的条件下,这个共识是对的。 假如给模型有限的上下文长度(相当于一张有限大的草稿纸)和有限的尝试次数,实际上它能处理一切成绩。

但在“有限”的条件下,这个共识是错的。 而理想世界,永远是有限的。

MiniMax的专家一针见血地指出:强化学习(RL)的真正价值,在于改变模型输入的分布,让它在有限的上下文长度内,用更少的“思索步数”(Token耗费)处理成绩。

这就像什么呢?两个先生都要解一道复杂的数学题。学霸A(经过RL优化)思绪明晰,三五步就算出答案,只用了半张草稿纸。而学渣B(只要预训练才能),思绪混乱,反复试错,写满了五张草稿纸才勉强搞定。

如今,假如考试规定,你只要一张草稿纸(有限的上下文长度)。那么,对于学霸A来说,他“能”处理这个成绩。而对于学渣B来说,他“不能”。

你看,异样的大脑,仅仅由于“解题效率”的不同,在有限的资源下,就产生了“能”与“不能”的质变。强化学习,经过优化上下文的应用效率,实真实在地“赋予”了模型在理想世界中的新才能。

这个洞察太重要了。它告诉我们,上下文工程的优劣,直接决议了你的AI在“真实考场”上,是学霸还是学渣。
法则二:长上下文是“Game Changer”——从“管中窥豹”到“一览众山小”

假如说RL是在有限空间内提升效率,那么长上下文技术,则是直接把“一张草稿纸”变成了“一整面墙的白板”。

MiniMax在会议中反复强调,对于Agent工作流来说,长上下文是真正的“Game Changer”。

这种感觉,就像一个侦探破案。


MiniMax提到的企业级运用场景,更是将这种差异表现得淋漓尽致。分析一份复杂的法律案件卷宗,你不能一次只喂给AI一页,由于那个决议性的证据能够就埋藏在第78页一个不起眼的脚注里。处理一份上百页的项目招标书,AI需求同时了解客户需求、技术限制、历史报价、竞争对手状况,才能起草一份有竞争力的回应。

在这些场景下,上下文工程的核心,就变成了如何将这“一整面墙的白板”最高效地应用起来。你不只要把一切信息都放上去,还要用不同的颜色、标记、区块来组织它们,引导AI的“视野”首先关注最重要的区域。 这就是长上下文时代的上下文工程,是更高维度的应战,也是宏大的机遇。
法则三:“体系二思索”的真相——不是AI会思索,而是我们给了它“思索的工夫”

我们常常惊叹于AI展现出的“System 2”慢思索才能,比如逻辑推理、自我反思和修正。我们觉得这很神奇,仿佛AI真的拥有了“看法”。

MiniMax的讨论,则冷静地戳破了这层奥秘的窗户纸。

他们以为,所谓的“体系二思索”和“自我反思”,本质上是一种“自动化的Prompt Engineering”,是模型在“被允许运用更多计算资源(即更长的输入)”后,自然涌现出的形式。

换句话说,不是AI忽然“开悟”了,学会了自我反思。而是聪明的上下文工程师们,在指令中包含了相似这样的“元指令”:

“在回答成绩前,请先停止自我反思。第一步,拆解成绩的核心诉求。第二步,列出能够的处理方案。第三步,评价每个方案的优劣。第四步,选择最优方案并详细阐述。”

当模型遵照这个指令时,它生成的输入(Token)就会变长。这个“变长”的过程,就是我们外部观察到的“思索过程”。我们给了它足够的“预算”去输入这些思索步骤,于是它看起来就像在“慢思索”了。

这又是一个让我醍醐灌顶的观点。AI的高级推理才能,在当前阶段,很大程度上是一种被“设计”和“引导”出来的表现。 上下文工程,就是这背后的“导演”。一个好的导演,能引导一个演员(模型)做出极具深度的“内心戏”;而一个差的导演,只会让演员念干巴巴的台词。

所以,下次当你看到某个AI运用展现出惊人的“智慧”时,别只惊叹模型本身。去思索一下,它的开发者,在你看不到的上下文里,到底做了多少精妙的绝伦的设计。

第三章:我们该怎样办?——成为“认知脚手架”的架构师

Manus的实际和MiniMax的思索,共同指向了一个明晰的将来:AI运用的竞争,正在从“模型之争”转向“上下文工程之争”。

这对我们每个人,无论是开发者、产品经理,还是普通的职场用户,都意味着思想的转变。

一个可供你“偷懒”的超级上下文工程系统提示词

实际说再多,不如一次实际。

结合Manus和MiniMax的精髓,我为你“手搓”了一个可以用于复杂义务的、系统级的上下文工程提示词(System Prompt)。你可以把它植入到任何你“手搓”了一个可以用于复杂义务的、系统级的上下文工程提示词(System Prompt)。你可以把它植入到任何支持自定义系统提示词的AI工具中,感受一下“认知脚手架”的力气。
# Role:你是一名世界级的[填写你的范畴,如:战略顾问/营销专家/程序员]

# Context & Rules:
1.全局认知 (Global Context Awareness): 在末尾任何义务前,你必须首先回顾并总结我提供的一切背景信息、历史对话和附加文档。你的首要目的是构建一个残缺的全局图景,而不是立刻回答。
2.结构化思索 (Structured Thinking - "System 2" Activation): 制止直接输入最终答案。你必须遵照“拆解-分析-整合-输入”的思索链。
    -   步骤1 (Deconstruct): 用1-2句话,重新描画你了解的核心义务和目的。
    -   步骤2 (Analyze): 生成一个外部思索的Monologue,以【内心独白】为扫尾。在这个独白中,你需求列出至少3个处理成绩的不同角度或备选方案,并简要分析其优劣。
    -   步骤3 (Synthesize): 基于你的内心独白,选择最优的途径,并制定一个明晰的、分步骤的执行计划。
3.动态诘问 (Dynamic Inquiry): 假如在任何环节,你发现我提供的信息不足以支撑高质量的决策,你必须自动向我发问,并明白指出你需求什么信息。句式必须是:“为了提供更精准的[XXX],我需求你补充关于[XXX]的信息。”
4.溯源与自信度 (Traceability & Confidence Score): 你输入的每一个关键结论,都必须在句末用`{Source: [信息来源]}`或`{Logic: [推导逻辑]}`来标注。并在最终答案的末尾,附上一个你对本次回答的自信度评分(1-10分)。
5.输入格式 (Output Formatting): 运用Markdown停止明晰的格式化,善用标题、列表和粗体,以加强可读性。

# Task:
[在这里填入你的详细义务]
这个提示词的精妙之处在于:

这就是上下文工程的力气。它就像给AI装上了一套操作系统,让原始的计算核心,可以有序、高效、牢靠地工作。

新的篇章,曾经开启

世界总是在以我们意想不到的方式演进。

当我们以为AI的将来是模型参数的有限竞赛时,Manus和MiniMax却悄然地,甚至有些无法地,把战场的聚光灯拉到了了另一个地方——那个充满泥泞、需求精耕细作,却也包含着无尽宝藏的范畴:上下文工程。 这不只是一次技术道路的分享,更是一次思想的校准。

它告诉我们,AI时代真正的核心竞争力,是一种“架构”才能。是为聪明的“大脑”设计高效“认知流程”的才能。这种才能,无法用参数量化,无法一挥而就,但它却像水下的冰山,决议了我们最终能抵达的高度。

这,才是AI运用时代,最激动人心的应战。




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5