基于大模型的AI Agent规划模块详解

NWI · 发表于昨天 04:56

前叙文章「AI Agent影象模块使用取实践」「AI Agent东西使用模块使用取实践」已经将AI Agent的影象模块及东西模块截至了介绍，原文将介绍其计划模块。AI Agent的计划模块是一个庞大但是极具代价的体系，颠末公道的架构设想、得当的手艺选型战连续的劣化迭代，能够建立出下效、颠簸、智能的计划体系。

1、计划模块概括

1.1 甚么是计划模块

计划模块是AI Agent的“年夜脑决议计划中间”，担当将庞大任务合成为可施行的子任务序列，并静态调解施行战略。它使Agent能够处置多步调、需要拉理的庞大成就。
1.2中心工作

（1）任务理解：剖析用户企图战目标

（2）任务合成：将庞大任务装分为子任务

（3）战略天生：订定施行方案温顺序

（4）静态调解：按照施行成果劣化方案

（5）资本和谐：办理东西战数据资本
1.3 为何主要

计划模块的品质间接决定了：

（1）任务完毕的胜利率

（2）施行服从战资本消耗

（3）毛病处置战规复才气

（4）用户体会战趁心度
2、计划模块架构详解

2.1 部分架构图

鉴于年夜模子的AI Agent计划模块详解w2.jpg

2.2中心组件分析

2.2.1 任务理解取阐发

（1）剖析用户企图战目标

（2）识别任务范例战庞大度

（3）提炼枢纽束缚前提
2.2.2战略天生器

（1）天生多种可以的施行战略

（2）评介差别战略的可止性

（3）挑选最劣战略
2.2.3方案合成器

（1）将庞大任务合成为子任务

（2）界说每一个子任务的输出输出

（3）肯定施行挨次
2.2.4 任务调理器

（1）办理任务施行行列

（2）和谐资本分派

（3）处置并收战串止逻辑
2.3完整施行过程

鉴于年夜模子的AI Agent计划模块详解w3.jpg

2.4 枢纽决议计划面

（1）方案考证：保证逻辑残破性战依靠准确性

（2）施行监控：及时检测非常战功用成就

（3）沉计划触收：鉴别什么时候需要调解战略

（4）升级处置：正在没法完善完毕时供给备选计划
3、支流完毕计划

3.1 ReAct范式（Reasoning + Acting）

中心思惟

分离拉理战举措的瓜代施行情势：
思考 → 举措 →察看 → 思考 → 举措 → ...施行示例步调1: 思考:"用户念查定单形状，需要先获得定单号" 举措:从输出中提炼定单号ABC123察看 :胜利提炼到定单号步调2: 思考:"现在挪用定单盘问API" 举措:OrderAPI.query(ABC123)察看 : 前去定单形状为"已经收货" 步调3: 思考:"用户可以借念明白物流疑息" 举措:LogisticsAPI.track(ABC123)察看 :获得到物流概略劣缺点

劣势	劣势
活络性下，可静态调解	Token消耗较年夜
适宜庞大拉理任务	施行时间较少
历程可注释性强	可以陷入思考轮回

合用场景

（1）需要多轮接互的对于话任务

（2）庞大的拉理战决议计划场景

（3）静态变革的情况

3.2 Plan-and-Execute范式

中心思惟

先一次性计划残破计划，再批质施行：
残破计划 → 批质施行 →后果考证施行示例计划阶段（一次性天生）：步调1:减载数据库数据步调2:洗濯战预处置步调3:统计阐发步调4:天生可望化步调5:输出陈述施行阶段（按方案施行）： [施行步调1]→ [施行步调2] → ... → [施行步调5] 考证阶段：反省统统步调可否胜利完毕劣缺点

劣势	劣势
服从下，Token本钱高	缺少静态调解才气
施行可猜测	依靠初初计划品质
易于并止劣化	易以应付意外情况

合用场景

（1）过程绝对牢固的任务

（2）对于服从请求下的场景

（3）肯定性强的营业过程
3.3 分层计划（Hierarchical Planning）

中心思惟

多条理的计划构造：
下层目标 → 中层战略 → 下层操纵施行示例下层目标：完毕用户数据阐发陈述中层战略：战略 1:数据准备模块战略 2:阐发计较模块战略 3:可望化模块下层操纵：战略 1.1:跟尾数据库战略 1.2:施行SQL盘问战略 1.3:数据洗濯战略 2.1:描绘性统计战略 2.2:趋势阐发 ...劣缺点

劣势	劣势
构造明了，易于办理	完毕庞大度下
撑持庞大庞大任务	层级和谐本钱年夜
可复用中心层战略	需要经心设想层级

合用场景

（1）庞大名目战体系

（2）多模块配合任务

（3）需要模块化办理的场景
3.4 深思式计划（Reflexion）

中心思惟

戴有自尔深思战改良体制：
计划 → 施行 → 深思 →改良计划 → 从头施行施行示例第一轮：计划:[步调A] → [步调B] → [步调C] 施行:正在步调B失利成果:任务已完毕深思阶段：剖析失利启事： -步调B的API超时 -不树立超时庇护 -缺少备用计划天生改良倡议： -增加3秒超时限定 -准备升级计划（盘问数据库） -增加沉试体制第两轮：改良计划:[步调A] → [步调B1（戴超时）] → [步调B2（升级）] → [步调C] 施行:胜利完毕成果:任务完毕，并记载劣化计划劣缺点

劣势	劣势
从失利中进修	多轮迭代本钱下
连续劣化改良	施行时间少
组成可复用经历	需要屡次残破施行

合用场景

（1）对证质请求极下的任务

（2）有充沛时间估算的场景

（3）期望连续劣化的体系
3.5 挑选倡议

场景范例	举荐计划	启事
正在线客服	ReAct	需要快速照应，及时接互
代码天生	Reflexion	品质请求下，可屡次迭代
数据阐发	Plan-Execute	过程牢固，服从劣先
庞大名目	分层计划	需要模块化办理

4、中心手艺重心
4.1 Prompt工程设想

4.1.1 任务合成Prompt模板

TASK_DECOMPOSITION_PROMPT = """您是一个任务计划大师。请将如下任务合成为可施行的子任务序列。 ## 任务描绘{task_description} ## 可用功具{available_tools} ## 束缚前提{constraints} ##输出格局请以JSON格局输出计划计划：{ "goal": "任务整体目标", "reasoning": "计划思路", "steps": [       {          "step_id": 1,          "action": "具体行动",          "tool": "使用的东西",          "input": "输出参数",          "expected_output": "期望输出",          "dependencies": []  // 依靠的前置步调ID       } ], "fallback_strategy": "失利处置战略"} ## 计划重心1. 保证步调之间的逻辑依靠准确2. 思考非常情况的处置3. 只管削减没必要要的步调4. 大白每一步的胜利尺度"""4.1.2 沉计划Prompt模板REPLANNING_PROMPT = """施行过程当中碰到了成就，需要从头计划。 ## 本初方案{original_plan} ## 已经完毕步调{completed_steps} ## 碰到的成就{error_info} ##以后形状{current_state} 请阐发成就启事，并供给调解后的施行方案。重心存眷：1.成果泉源是甚么2. 哪些步调需要改正3. 可否需要替换计划4. 怎样制止类似成就输出格局取初初计划差异。"""4.1.3方案考证Prompt模板PLAN_VALIDATION_PROMPT = """请考证如下施行方案的开理性： ##方案实质{plan} ## 考证尺度1. 逻辑残破性：可否能告竣目标2. 依靠准确性：步调挨次可否公道3. 东西使用：东西挪用可否准确4. 非常处置：可否思考了失利场景输出考证成果战改良倡议：{ "is_valid": true/false, "issues": ["成就列表"], "suggestions": ["改良倡议"]}"""4.2方案施行器完毕

class PlanExecutor: """方案施行器"""
def execute_plan(self, plan):       """施行计划计划"""       results = []             for step in plan['steps']:          try:             # 1.反省依靠             if not self._check_dependencies(step, results):                   raise Exception(f"依靠步调已完毕: {step['dependencies']}")                               # 2. 施行步调             result = self._execute_step(step)                               # 3.记载胜利成果             results.append({                   'step_id': step['step_id'],                   'status': 'success',                   'output': result             })                               # 4. 革新汗青             self.execution_history.append({                   'step': step,                   'result': result,                   'timestamp': self._get_timestamp()             })                         except Exception as e:             # 5.记载失利             results.append({                   'step_id': step['step_id'],                   'status': 'failed',                   'error': str(e)             })                               # 6. 鉴别可否需要沉计划             if self._should_replan(step, e):                   new_plan = self._replan(plan, results, e)                   return self.execute_plan(new_plan)             else:                   raise             return results       def _execute_step(self, step):       """施行单个步调"""       ...             def _check_dependencies(self, step, results):       """查抄依靠可否满意"""       ...             def _should_replan(self, step, error):       """鉴别可否需要沉计划"""       ...       def _replan(self, original_plan, completed_steps, error):       """触收沉计划"""       ...4.3 东西备案取办理

class ToolRegistry: """东西备案取办理体系""" ...具体可参照AI Agent东西使用模块使用取实践
4.4 依靠干系阐发

def topological_sort(steps): """拓扑排序 - 保证按依靠挨次施行"""       # 建立图 ...       #树立依靠干系 ...
#反省可否存留轮回依靠 ... return sorted_steps5、数据阐发Agent案例阐发

5.1 场景描绘

用户需要：“阐发近来一个月的贩卖趋势，找出top 3产物，并猜测下个月销质”
5.2 任务计划

5.2.1 任务合成

鉴于年夜模子的AI Agent计划模块详解w4.jpg

5.2.2 施行过程

鉴于年夜模子的AI Agent计划模块详解w5.jpg

5.3 东西完毕

5.3.1 DataLoader - 数据减载东西

class DataLoader: """数据减载东西"""       description = "从数据库或者文献减载数据"       def execute(self, query):       """施行数据减载"""       ...       return data5.3.2 TrendAnalyzer - 趋势阐发东西

class TrendAnalyzer: """趋势阐发东西"""       description = "阐发时间序列趋势，识别增加/降落情势"       def execute(self, data):       """施行趋势阐发"""       ...       return result5.3.3 TimeSeriesPredictor -时间序列猜测

class TimeSeriesPredictor: """时间序列猜测东西"""       description = "使用统计模子截至时间序列猜测"       def execute(self, trend_data):       """猜测未来值"""       ...       return result5.4 施行成果示例

施行日记：==================================================[Agent] 支到任务:剖析近来一个月的贩卖趋势，找出top 3产物，并猜测下个月销质[计划] 任务阐发: 用户需要贩卖数据阐发战猜测[计划] 天生方案，同6个步调 [施行] 步调1: 减载数据  [DataLoader] 施行盘问: SELECT * FROM sales WHERE date >= ...  [DataLoader] 减载了 30 笔记录[施行] ✓ 完毕 [施行] 步调2: 洗濯数据  [DataCleaner] 洗濯前: 30 条  [DataCleaner] 洗濯后: 29 条[施行] ✓ 完毕 [施行] 步调3:剖析趋势  [TrendAnalyzer]剖析趋势...  [TrendAnalyzer] 趋势: increasing, 增加率: 87.23%[施行] ✓ 完毕 [施行] 步调4: 统计TOP产物  [Aggregator] 施行聚拢...  [Aggregator] TOP 3产物: ['智妙手表', '无线耳机', '仄板电脑'][施行] ✓ 完毕 [施行] 步调5: 猜测未来销质  [TimeSeriesPredictor] 建立猜测模子...  [TimeSeriesPredictor] 猜测完毕，均匀猜测值: 32450.00[施行] ✓ 完毕 [施行] 步调6: 天生可望化  [Visualizer] 天生可望化...  [Visualizer] 天生了 3 个图表[施行] ✓ 完毕 ==================================================终极陈述==================================================主要发明：- 贩卖额呈升高趋势，月增加率约87%- 智妙手表是最脱销产物，销质争先-估量下月贩卖将持续增加枢纽目标：- 总贩卖额: ¥450,000- 日均贩卖: ¥15,000- TOP产物: 智妙手表倡议：- 减年夜智妙手表库存- 劣化供给链以应付增加- 思考促销举动退一步提拔销质具体可参照AI Agent正在数据阐发范围的使用根究

6、智能客服Agent案例阐发

6.1 场景描绘

用户征询：“尔的定单如何借出收货？定单号是ABC123”
6.2零碎架构

6.3中心完毕

6.3.1 企图识别取真体抽与

def understand_query(message, conversation_history): """理解用户盘问"""       prompt = f""" 剖析如下客服征询，识别用户企图战枢纽真体。       用户消息: {message} 对于话汗青: {conversation_history[-3:]}       请识别： 1. 用户企图（定单盘问/物流跟踪/进款恳求/产物征询/歌颂/罕见成就） 2. 枢纽真体（定单号、产物称呼、时间等） 3.成果告急水平（1-5）       输出JSON格局。 """       response = llm.generate(prompt) return json.loads(response) # 示例输出{ "intent": "定单盘问", "entities": {       "order_id": "ABC123" }, "urgency": 4, "keywords": ["定单", "收货", "物流"]}6.3.2心境阐发

def analyze_emotion(message): """阐发用户表情"""       #心境枢纽词汇 negative_keywords = ['如何借', '为何', '太缓', '没有趁心', '歌颂'] angry_keywords = ['进款', '骗子', '残余', '好评']       score = 5  # 中性       # 肯定表情品级 ...6.3.3照应战略计划

def plan_response(understanding, emotion): """计划照应战略"""       #依据企图挑选战略 ... #心境严峻时，劣先抚慰 ...6.3.4 野生转交鉴别

def should_transfer_to_human(emotion, results): """鉴别可否需要转野生"""       #心境极端反面 ... # 盘问失利或者非常 ... # 涉及进款金额较年夜 ... # 持续多轮已处置 ...6.4完整对于话过程示例

用户: "尔的定单如何借出收货？定单号是ABC123" [Agent处置过程] 1. 企图识别 - 企图: 定单盘问 - 真体: order_id=ABC123 - 告急度: 4/5 2.心境阐发 - 品级: NEGATIVE - 分数: 6/10 - 枢纽词汇: ["如何借"] 3. 计划照应 -战略 : 盘问疑息型 - 步调: [查定单] → [查物流] → [天生复兴] 4. 施行方案 [施行] 盘问定单疑息    成果: 定单ABC123，形状"已经收货"    [施行] 盘问物流疑息    成果: 逆歉速运，输送中，估量10月11日投递    [施行] 天生复兴    成果: 天生友好复兴文原 5.输出复兴Agent复兴：您佳！尔已经为您盘问到定单ABC123的情况： **定单形状：已经收货**- 下单时间：2025-10-05 14:30- 收货时间：2025-10-06 09:00- 物流公司：逆歉速运- 运单号：SF1234567890 **物流退度：输送中**目前职位：广州转运中间估量投递：2025-10-11 您的包袱在快速配收中，估量先天（10月11日）便可投递。若有所有耽搁，咱们会第一时间报告您。您能够颠末逆歉民网或者APP及时跟踪包袱静态。假设到期已支到或者有其余成就，请随时联系尔，尔会为您实时处置。叨教另有甚么尔能够助您的吗？6.5 特别场景处置

场景：用户表情冲动歌颂用户: "皆一周了借没有收货，那甚么破店，尔要进款！" [表情阐发] - 品级: ANGRY - 分数: 9/10 - 触收野生转交 [Agent复兴]十分抱愧给您戴去欠好的体会！尔完整理解您的着急心情。尔已经告急为您盘问定单情况：[定单概略...] 对于您提到的进款需要，尔已经为您创立劣先处置工单。因为您的情况比较特别，尔已经为您转交资深客服博员，工单号是 TK20251010153045，客服职员会正在3分钟内乱取您联系。共时，动作抵偿，咱们将为您供给： - 原单免运费 - 下次定单9合劣惠券再次为给您戴去的未便道歉，咱们会尽量为您处置成就。7、归纳取瞻望

7.1中心重心

1.计划是Agent的中心才气：计划模块间接决定任务完毕的品质战服从，是AI Agent智能化的枢纽。

2.不银弹：差别的任务场景需要挑选适宜的计划范式，活络使用才气到达最好结果。

3.鲁棒性相当主要：完美的毛病处置体制是消耗情况的必须品，决定体系的颠簸性。

4.连续劣化：颠末监控数据精益求精Prompt战战略，组成邪背迭代轮回。

5.人机合作：正在枢纽节面保存野生决议计划权，均衡主动化战可控性。
7.2 支流计划归纳

计划范式	中心体制	劣势	劣势	合用场景
ReAct	思考→举措→察看轮回	活络性下可静态调解适应性强	Token消耗年夜施行时间少可以陷入轮回	庞大拉理任务、需要多轮接互的场景
Plan-and-Execute	一次性计划后批质施行	服从下Token本钱高施行可猜测	缺少活络性易以应付意外依靠初初计划品质	肯定性强的任务、过程牢固的场景
分层计划	下层→中层→下层多级计划	构造明了易于办理撑持庞大任务	完毕庞大层级和谐本钱下	庞大名目、多模块配合任务
Reflexion	施行→深思→改良轮回	自尔劣化从失利进修品质连续提拔	迭代本钱下需要多轮施行	品质请求下、有时间估算的任务

- End -

朝期举荐

AI年夜模子使用架构图年夜齐鉴于Dify的RAG常识库拆修鉴于 Dify 的 Text2SQL 使用拆修AI Agent正在数据阐发范围的使用根究AI Agent架构综述：从Prompt到ContextAI Agent影象模块使用取实践AI Agent东西使用模块使用取实践Agent正在银止业的降天实践年夜模子高低文工程（Context Engineering）详解MCP正在数据范围的使用根究鉴于DeepSeek+RAGFlow的企业常识库拆修鉴于DeepSeek的MCP使用开辟实践RAG中心根底 Embedding 观点取手艺详解DeepSeek根底：PPO、DPO、GRPO观点详解DeepSeek根底：MoE观点详解DeepSeek根底：模子蒸馏观点取手艺详解DeepSeek根底：模子预锻炼观点取手艺详解DeepSeek根底：模子微调观点取手艺详解年夜模子根底：模子质化观点取手艺详解MCP根本观点取中心道理详解

AI 大模型的演进与将来：从 ChatGPT 到通用

基于大模型的AI Agent规划模块详解

浏览过的版块

以AIGC技术推进传统文明“两创”——鲁台港

关于我们

产品与服务

全网营销

加盟与合作