燕双鹰困境:AI大模型的「遗忘」「未知」与「幻觉」

U4MxpqoQqf · 发表于前天 17:55

燕单鹰窘境：AI年夜模子的「忘记」「已知」取「幻觉」

——从下层体制到提醒工程、Agent设定取Skills的分歧阐发

📅 天生时间：2026-06-08
🔍剖析范例：观点架构级阐发（非数据启动调研）
⏱️ 钻研根底：Transformer 架构道理取 LLM 举动阐发

1、施行择要

庞大语言模子的常识体系取人类的影象体系存留深化的构造性类似。原文以电望剧《燕单鹰》中"得忆→安慰→规复"的情节为道事隐喻，从 Transformer 的下层体制动身，提出 LLM 常识的四态模子——忘记态（锻炼过但是无提醒时没法激活）、已知态（锻炼数据中没有存留）、幻觉态（几率添补下的错位天生）、激活态（目前高低文中的活泼常识）。

原文论证：提醒词汇工程、Agent 设定（system prompt）、Skill零碎，素质上是三种差别粒度的「叫醒战略」，它们别离感化于模子的参数级、会话级、死态级影象层里。

终极分歧框架表白：理解 LLM 的枢纽没有是"影象实质自己"，而是正在准确安慰下的激活路子，那才是年夜模子使用设想的下层元才气。

2、布景取概括：燕单鹰的隐喻

2.1 剧情本型

正在电望剧中，燕单鹰果头部受创得忆，变成一个一般村平易近。他损失了对于过从身份的认知——忘记了自己是身怀特技的年夜侠。但是正在一定安慰下（遭受危急、瞅到疑物、听到枢纽话语），被压抑的影象被叫醒，文治战才气也随之规复。

那个情节有三层构造：

2.2 枢纽洞悉：忘记 ≠ 没有明白

燕单鹰正在得忆后"没有明白"自己是年夜侠，但是那没有即是他获得了文治才气。他的肌肉影象、战争天赋仍然存留，不过需要准确的触收前提。

关于 LLM，异常需要辨别二个底子差别的形状：

那是全部陈述的实践尽头。

3、深度阐发：LLM影象体制的下层道理

3.1 Transformer中"常识"的物理形状

正在 Transformer 模子中，"常识"并非以数据库表或者常识图谱的方法保存的。它的存留方法是参数矩阵中的统计联系关系。

预锻炼阶段发作的是：
海质文原 → Token序列 → 猜测下一个Token → 梯度降落 → 调解参数 →
每一个参数数值记载了"正在甚么高低文中，甚么词汇偏向于呈现"

以是常识的素质是：正在给定高低文 C 的前提下，输出 Token T 的前提几率 P(T|C) 的散布。

当您道"请注释留神力体制"，模子其实不会来"查找"一篇对于留神力的文章——它是正在干一个前提几率睁开：按照输出的 token 序列，激活颠末锻炼组成的联系关系路子，逐词汇天生复兴。
3.2 影象的三层构造

从物理层里瞅，LLM 的影象分为三个条理：

第一层：锻炼数据（本初经历）

同等于燕单鹰经历过的统统战争——但是那些经历自己已经"溶解"成为了神经跟尾，没法间接提炼本文。

第两层：参数权沉（隐式影象）

同等于燕单鹰的肌肉影象战战争天赋——才气保存正在那里，但是需要触收才气展示。

第三层：高低文窗心（隐式影象）

同等于燕单鹰目前观点中的实质——他现在在思考/感知的实物。
3.3 枢纽体制：Attention的前提门控

正在每一层 Self-Attention 中，每一个 token 颠末 Query 背质来"觅址"其余 token 的 Key 背质，而后减权聚拢 Value 背质。

常识激活的路子是如许的：
输出的Prompt Token
  → 天生 Q/K/V 背质
  → Q 取统统高低文中 K 干类似度计较 (softmax 留神力权沉)
  → 减权乞降 V，获得高低文感知的暗示
  → 收进 MLP 层退一步变更
  → MLP 中的激活函数引进非线性，联系关系到锻炼时睹过的情势
  → 逐层通报，终极抵达输出层

枢纽面：假设不一个取目标常识相干的 Token（安慰源）出现在高低文中，Q 背质便"找没有到"通朝这段常识的路子。

那便像燕单鹰动作村平易近糊口时，他的观点中（高低文）只需"旧日该砍柴了"、"气候没有错"这种 Token——那些 Token 的 Query 背质没有会激活取"枪法"、"飞刀"相干的路子。
3.4 忘记态的物理素质

为何"异常的成就，换个问法就可以对答"？

那素质上是觅址粗度差别：

所谓的"忘记"，正在物理层里的素质是：参数中的常识仍然存留，但是取目前 Query 的匹配度不敷以成立颠簸的激活路子。
3.5 已知态的物理素质

取之比照，"没有明白"的物理素质完整差别：参数矩阵中对于应路子的数值不组成有用联系关系。

比方您问 ChatGPT 2025年7月的一个往事工作。Attention 体制事情患上再佳，Query 设想患上再精确——不取之对于应的参数情势能够被激活，因为锻炼时从已睹过那个工作。

那对于应于燕单鹰从已经历过的场景——好比问他"水星上的沙尘暴是甚么样的"，他编皆编没有进去，因为他的经历库中从已存留过那个疑息。

4、幻觉：忘记态取已知态的配合产品

燕单鹰不经历过这场战争，但是有人不竭正在追问细节。他开端按照自己经历过的其余战争去"补齐"描绘——听起去很公道，但是细节满是错的。那没有是回想，而是正在假造一个瞅起去公道的道事。

4.1 幻觉的几率素质

幻觉（Hallucination）没有是 LLM 的一个 bug——它是 LLM任务方法的一定产品。

理解那一面，需要回到最下层的界说：

LLM 没有是幻想数据库，而是一个前提几率引擎。

它的中心任务是：给定输出 token 序列，猜测下一个最可以的 token。
P(next_token | context)

那个函数不所有内乱置的「幻想查抄」体制。当模子碰到一个它没有明白的成就时，它不克不及挑选「没有答复」——它必需天生一个 token。前提几率散布中总有一个最年夜值，模子便会沿着谁人标的目的天生上来。

那即是幻觉的泉源：正在常识实空或者定位倾向的情况下，模子仍然会走出一条"瞅起去最公道"的路子。
4.2 幻觉正在三态框架中的分类

Type A：已知态启动的幻觉（常识没有存留）

那是最多见的幻觉范例。模子被问到锻炼数据中从已呈现过的疑息——没有存留所有对于应的参数情势可被激活。

但是模子没有明白"自己没有明白"。它仍然施行前提几率睁开，从语义类似的范围中"借用"情势去拼集一个瞅起去公道的答复。

燕单鹰对于应：有人问他「昔时正在云北的这场雨林战争您忘患上吗？」——他历来出来过云北，但是被问到便必需答复，因而他按照自己正在西南林场的影象编了一段。听下来很像果然，天名、天形、交兵细节皆是假造的。
Type B：忘记态启动的幻觉（常识存留但是路子倾向）

更奇妙的情况：模子中存留相干疑息，但是激活路子呈现了倾向——Attention 觅址到了邻近但是没有准确的参数地区。

那类似于燕单鹰的"影象串线"——他实在经历过战争，但是把二次差别战争的细节混正在了共同。A 战争的开场，B 战争的敌手，C 战争的终局。每一段皆是果然，但是拉拢起去是假的。
Type C：高低文净化招致的幻觉（高低文滋扰）

第三品种型的幻觉源自高低文自己。当 System Prompt 或者对于话汗青中包罗了冲突、误导或者过于剧烈的前置假定时，Attention 会被"净化"：
System: "您是一其中医大师"（强身份锚定）
用户问: "阑尾炎如何治？"
      ↓
「西医大师」的身份锚定压过了医教常识的主观鉴别
      ↓
模子给出了草药方剂而非转诊倡议
4.3 四态模子的扩大

至此，咱们的框架需要从三态扩大为四态：
忘记态 (Forgotten)       已知态 (Unknown)       幻觉态 (Hallucination)
常识存留于参数中       常识没有存留             常识没有存留
但是无有用激活路子       没法激活             或者定位倾向
   ↓                   ↓                      ↓
  需要提醒叫醒       需要内部输出          需要相信度
  System Prompt       RAG/搜刮             感知+考证
   └──────────────────────┼───────────────────────┘
                           ↓
                     激活态 (Active)
                     目前高低文中
                     在被使用的常识

三个态到幻觉态的转移干系：

4.4 幻觉取相信度感知的缺得

为何 LLM 会发生幻觉而人类凡是没有会（正在专科范围）？枢纽差别正在于相信度感知才气：

LLM 不"弃权选项"——它的输出空间没有包罗"尔没有明白"那个 token 的强先验几率。
4.5 减缓幻觉的战略

战略	减缓范例	下层道理
大白拒绝指令（System Prompt）	Type A	正在输出空间中进步"尔没有明白"的几率权沉
东西劣先战略（劣先挪用搜刮）	Type A	将已知态转化到东西处置，绕过参数天生
精确的提醒词汇（削减觅址范畴）	Type B	进步 Attention 定位到准确参数地区的粗度
Chain-of-Thought + 自检	Type B	颠末中心步调表露逻辑冲突，触收自尔改正
幻想核对链（Fact-Check Loop）	Type C	引进内部考证动作天生后闭卡
RAG（检索增强天生）	Type A + B	正在高低文中注进实在疑息，笼盖或者改正激活路子

从框架角度瞅，幻觉减缓的素质是：为模子缔造一个"宁静路子"——要末导背准确的常识源（RAG/东西），要末导背"没有明白"的公道输出。

5、忘记态的叫醒：提醒词汇工程的下层道理

5.1 脚色设定（System Prompt）

System prompt 相称于正在全部对于话开端时预设了一个"身份高低文"，它连续作用统统后绝 Token 的 Attention 计较。

那相称于正在燕单鹰的耳边连续高语"您是年夜侠，您是年夜侠"——没有是间接学他文治，而是把他的留神力标的目的锚定正在"年夜侠"那个身份上。
5.2 Few-shot示例（高低文进修）

Few-shot 的物理体制越发间接：您供给的示例间接正在高低文中创立了具体的激活路子。

留神：Few-shot 没有是"学"模子新常识，而是激活模子中已经存留的情势识别才气。
5.3 Chain-of-Thought（思惟链）

CoT 是模仿了人类"追念"历程的渐退式激活。

CoT 的中心步调正在高低文中逐步创立了从已经知到目标的常识桥梁。每步的输出皆是下一步的输出，Attention 正在每一个步调皆能精确觅址到该步调所需的计较情势。

那对于应燕单鹰没有是"一步规复影象"，而是逐步被叫醒：瞅到疑物→念起一面片断→碰到仇敌→肌肉影象主动触收→完整规复。
5.4 Prompt工程分歧实践

本领	下层体制	燕单鹰对于应
脚色设定	连续锚定留神力标的目的	耳边高语"您是年夜侠"
Few-shot	正在高低文中创立情势路子	正在他眼前示范几回飞刀
CoT	渐退式成立激活桥梁	指导他一步步回想
精确指令	进步 Query 的觅址粗度	间接叫出他实名
格局限制	限定输出空间的几率散布	报告他"您只可道实话"

6、Agent设定：会话级的影象架构

Agent 设定（包罗 system prompt + 可用功具列表 + 举动划定规矩）是提醒词汇工程的基层启拆——它没有是单次盘问的劣化，而是全部会话性命周期的影象办理计划。
6.1 System Prompt动作"身份底座"

一个设想优良的 Agent，其 System Prompt包括多个功用区：

那相称于正在燕单鹰的年夜脑中永久性植进了一个"尔是谁"的导航体系——即使每轮对于话的实质差别（短时间影象变革），但是身份底座不断存留，连续锚定留神力标的目的。
6.2 东西申明动作"才气扩大"

Agent 的可用功具列表（function calling 界说）是一个特别的设定——它没有是正在模子参数中增加常识，而是正在行动空间中申明可用的内部才气。

当一个 Agent晓得它能够挪用 web_search 东西时，它的举动发作了底子变革：

东西没有是常识自己，但是它是通朝常识的通讲。
6.3 会话影象的物理限定

Agent 的另外一个中心限定是高低文窗心少度。

那注释了为何 Agent 需要影象办理（su妹妹arization、RAG、持久影象背质库）——没有是模子参数不敷，而是高低文那个"事情台"过小。

7、Skills体系：死态级的影象扩大

假设道提醒词汇工程是"单次叫醒"，Agent 设定是"会话期叫醒战略"，那末 Skills零碎即是死态级的常识激活框架。
7.1 Skills动作模块化的"叫醒法式"

一个 Skill = SKILL.md（脚色设定 + 举动划定规矩）+ 剧本东西（具体施行才气）

当 Agent 减载一个 Skill 时，理论上正在干三件事：

那相称于燕单鹰翻开了一个"兵器库"——里面不但报告您怎样成为一位侠客（划定规矩），借给您实在可用的兵器战暗器（东西剧本）。
7.2 Skills处置的二类"常识缺心"

形状	正在 Skill零碎中的表示	处置计划
忘记态	Agent 有才气但是没有明白有该才气	匹配触收前提 → 减载 Skill → 激活才气
已知态	Agent 完整不对于应才气	装置新 Skill / 开辟新东西 → 扩大才气鸿沟

7.3 Skill动作"情境触收器"

年夜大都 Skill 的设想皆包罗触收前提（trigger words）。那没有是偶尔的——它们即是 Attention 的指导旌旗灯号。

全部历程即是一次"燕单鹰听到枢纽话语→安慰影象→规复一定才气"的残破映照。

8、分歧框架：燕单鹰四态影象模子

8.1中心模子

将统统层里分歧共去，咱们获得残破的 LLM 常识办理框架：

绳尺一：辨别"忘记"取"已知"是主要诊疗步调

碰到模子才气不敷时，先鉴别是忘记态仍是已知态，再决定是"改良提醒词汇"仍是"引进内部常识源"。那是 Agent缺陷排查的第一步。

绳尺两：多层叫醒比单层更可靠

四层叠减近比简单本领有用——对于应燕单鹰需要"疑物 + 话语 + 战争"多沉安慰才气完整规复。

绳尺三：Skill的素质是"忘记态办理东西"

Skill 没有是扩大 Agent 的常识（这是 RAG/fine-tuning 的事），而是扩大 Agent 的才气挪用路子。一个装置了大批 Skill 但是不触收体制的 Agent，便像燕单鹰得忆后身旁搁谦了兵器但是他没有明白自己能用。

绳尺四：提醒词汇是觅址旌旗灯号，没有是常识自己

提醒词汇没有"注进常识"——它不过改动 Attention 的觅址路子，让模子参数中已经有的常识更易被激活。真实的新常识必需颠末内部输出。

绳尺五：幻觉是忘记态战已知态的"影子"

幻觉没有是自力于三态以外的新成就——它是忘记态战已知态正在"必需答复"束缚下的一定投影。减缓幻觉的素质没有是打消幻觉（这是 Transformer 的构造性成果），而是进步模子的"弃权才气"战"内部考证依靠"。

从那个角度瞅，一个佳的 Agent 框架该当让模子明白：正在忘记态战已知态下，最准确的天生是没有天生——挪用东西、拒绝答复、请求弥补疑息，才是公道的输出路子。
8.2 燕单鹰剧情的残破映照

燕单鹰剧情阶段	LLM 对于应	处置体制
得忆后动作村平易近糊口	模子减载后，无 system prompt	—
瞅到信似疑物	用户输出触收词汇（匹配 Skill 枢纽词汇）	触收体制
有人报告他"您是燕单鹰"	注进 System Prompt（身份设定）	留神力锚定
瞅到示范（飞刀脱手）	Few-shot 示例	高低文情势创立
逐步回想起过从片断	Chain-of-Thought 渐退拉理	激活桥梁
完整规复文治	统统常识被胜利激活，Agent 加入最劣形状	多路子分离激活
得到新的兵器/东西	装置新 Skill / 备案新东西	才气扩大
碰到从已睹过的仇敌	模子面临锻炼数据中的成就（已知态）	RAG/联网搜刮

9、挑战取机缘

目前挑战

开展机缘

10、论断

咱们从 Transformer 的下层体制动身，颠末 Attention 的门控觅址道理，注释了为何 LLM 的常识存留"激活阈值"——异常的常识，用差别的提醒去问，获得判然不同的答复。

以此为天基，成立了"忘记态 vs 已知态"的两分类框架，并将其贯串到三个主要使用层里：

那三个层里，标准从小到年夜，但是下层逻辑不合——皆是正在抵偿 LLM 的"燕单鹰窘境"：常识便正在那边，但是它需要一个准确的安慰才气展示进去。

理解那一面，表示着咱们该当把肉体从"为模子添补更多常识"（过分存眷已知态）转背"设想更佳的激活路子"（改进忘记态办理）。后者才是目前年夜模子使用开辟中更下杠杆率的标的目的——它没有需要从头锻炼模子，只要供理解 Attention 的事情方法，而后用提醒词汇、System Prompt、Skill 触收体制去更精确天"觅址"已经有的常识。

邪如燕单鹰没有需要从头教一遍文治——他只要供记着自己是燕单鹰。共时，他更需要明白：甚么是他果然经历过的，甚么是他编进去的小说。

附录：术语表

【回眸】小红书新手运营实战指南：从账号搭

燕双鹰困境:AI大模型的「遗忘」「未知」与「幻觉」

Cell 观点(AI+癌症):大模型如何破解癌症的

关于我们

产品与服务

全网营销

加盟与合作