2024 年:Andrej Karpathy 明白提出“上下文工程”概念 Andrej Karpathy,作为特 斯拉前 AI 总监和 OpenAI 的创始成员之一,明白提出了“上下文工程”(Context Engineering)这一概念,并强调其在构建工业级 LLM 运用中的核心肠位。他指出,上下文工程远超提示词优化,它是一门精妙的艺术与迷信,触及对 LLM 运用中一切输入信息的精细化管理,包括义务描画、大指示例、检索加强生成(RAG)、相关(能够是多模态的)数据、工具、形态与历史记录、信息紧缩。提供太少或方式不当,LLM 就缺乏最优表现所需的上下文;过量或相关性不足,则会导致成本上升功能下降。做好这件事绝非易事。
而称之为艺术,则源于对人类心思与 LLM 行为之间巧妙互动的直觉把握。这一提法迅速引发了行业共识,标志着 AI 运用开发进入了更注重系统性、动态性和全体性的新阶段,将 AI Agent 的构建推向了新的高度。
LangChain、LlamaIndex 等框架的兴起与贡献以 LangChain 和 LlamaIndex 为代表的开源框架的出现,为开发者提供了构建复杂 AI Agent 和完成上下文工程的弱小工具集。这些框架经过笼统化 RAG、记忆管理、工具调用、Agent 协调等复杂功能,极大地降低了上下文工程的完成门槛,加速了 AI 运用的落地和创新。它们将本来分散的技术模块整合为一个一致的开发范式,使得开发者可以更专注于业务逻辑而非底层技术细节。这些关键事情共同描画了从单一提示词优化到片面上下文管理的宏伟演进途径,展现了 AI 范畴在提升大模型适用性、牢靠性和智能化程度方面的不懈探求与持续创新。
上下文工程作为驱动大型言语模型向更高级智能演进的核心技术,其将来发展将围绕以下几个关键趋向展开,旨在构建愈加智能、自主、牢靠且普惠的 AI Agent 系统:
(1)更深层次的上下文感知与动态自顺应管理: 将来的上下文工程将超越当前基于规则或预设策略的形式,完成真正意义上的“上下文感知”。这意味着 AI Agent 将可以自主判别当前义务的复杂性、范畴特性和用户意图,并据此动态地调整上下文的检索、挑选、紧缩和整合策略。例如,在处理法律咨询时,系统会自动加载法律条文和判例;在停止创意写作时,则会侧重于风格和情感的上下文。这种自顺应才能将使 Agent 在各种复杂场景下表现出更高的灵敏性和鲁棒性。
(2)多模态上下文的无缝深度交融: 随着多模态大模型的疾速发展,文本、图像、音频、视频、甚至触觉和传感器数据等多种模态的上下文信息可探求更深层次、更无缝的交融。将来的上下文工程将不只可以处理单一模态的信息,更将可以了解和应用跨模态的语义关联和互补性。例如,经过分析视频中的肢体言语和语音语调来补充文本对话的情感信息,或根据用户提供的图片自动生成相关描画并停止后续交互。这将使得 AI Agent 可以更片面地感知世界,提供更丰富、更自然的交互体验。
(5)可解释性、可控性与透明度的片面提升: 为了满足高牢靠性、高风险运用场景的需求,将来的上下文工程将努力于提升系统的可解释性、可控性和透明度。研讨将探求如何可视化上下文的活动途径、模型对不同上下文信息的权重分配,以及其决策过程中的关键推理步骤。同时,将提供更精细、更直观的控制接口,允许开发者和用户对上下文管理停止干涉、修正和调试,从而加强用户对 AI Agent 的信任和决计。
(6)边缘计算与隐私保护的深度交融: 随着 AI 运用向边缘设备(如智能手机、物联网设备)的扩展,如何在资源受限的环境下高效管理上下文,以及如何在本地停止敏感数据的处理以最大程度地保护用户隐私,将成为重要的研讨方向。联邦学习、差分隐私、安全多方计算等隐私加强技术将与上下文工程深度交融,确保 AI 在提供智能服务的同时,严厉遵守数据隐私和安全法规。
(7)朝向高度模块化、范畴有关的 Agent 框架演进: 最终目的是构建可以处理各种范畴、各种义务的通用 AI Agent,并为此开发普适性的上下文管理框架。这个框架将具有高度的笼统性和灵敏性,可以顺应不同行业、不同运用场景的上下文需求,完成 AI 才能的广泛赋能,推进通用人工智能(AGI)的完成。