AI人工智能大模型

2025-3-4 21:19| 发布者: RB8UyE| 查看: 105| 评论: 0

摘要: AI人工智能大模型大模型的介绍1、大模型的演变人工智能：人工智能是一个广泛涉及计算机科学、数据分析、统计学、机器工程、语言学、神经科学、哲学和心理学等多个学科的领域；机器学习：机器学习可以分为监督学习、 ...

AI野生智能年夜模子

年夜模子的引见

一、年夜模子的演化

野生智能：野生智能是一个普遍触及计较机迷信、数据阐发、统计教、机械工程、言语教、神经迷信、形而上学战心思教等多个教科的范畴；

机械进修：机械进修能够分为监视进修、无监视进修战加强进修；

监视进修：报告儿童甚么是苹因、甚么是喷鼻蕉，间接给机械形貌特性，让机械记着；监视进修需求正在机械停止进修时报酬供给数据工具的种别。

无监视进修：给儿童形貌苹因、喷鼻蕉的特性，让儿童本人按照特性来婚配。报告机械一个范畴，让机械本人进修分类；普通不预设的种别标记，经由过程机械主动进修数据的散布并将类似的数据工具回为共类

加强进修：没有会间接学儿童甚么是苹因喷鼻蕉，而是让儿童本人来猜，假如猜对于了便赐与嘉奖。

深度进修：深度进修是机械进修的一个分收，次要利用神经收集模子(由多个躲藏层构成)对于数据停止进修战暗示；

经由过程对于大批数据的进修，主动提炼出数据的下条理特性战形式，进而完成图象辨认、语音辨认、天然言语处置等。根据架构的差别，神经收集能够分为：卷积神经收集(CNNS)、轮回神经收集(RNNS)、Transformer收集等：

天生式野生智能：天生式野生智能又是深度进修中疾速增加的子散，他们利用了年夜模子供给撑持，正在大批本初、已标识表记标帜的数据根底上对于深度进修模子停止预锻炼，使患上机械可以了解言语以至图象，并可以按照需求主动天生实质；

年夜模子的锻炼

一、预锻炼

预锻炼的历程相似于人类由婴女生长为中门生的阶段，正在那个阶段咱们会进修林林总总的常识，关于年夜模子来讲，那个阶段他会进修各类差别的语料，进修到言语的统计纪律战普通常识；

二、SFT(监视微调)

SFT的历程相似于从中门生生长为年夜门生的阶段，正在那个阶段咱们会进修到专科常识，好比金融、法令等。关于年夜模子来讲，正在那个阶段他能够进修人类的各类对于话语料，以至十分专科的笔直范畴常识，正在监视微调历程以后，他能够根据人类的企图来答复专科范畴的成绩。

三、RLHF(鉴于人类反应加强进修)

RLHF的历程相似于年夜门生离职场的阶段，咱们会按照指导或者共事的反应停止人为办法的调理前进。关于年夜模子来讲，正在那个阶段他会针对于统一个成绩停止屡次答复，人类会对于那些答复挨分，年夜模子会正在此阶段进修到怎样输入分数最下的答复，使患上答复更契合人类的偏偏佳；

年夜模子的特性取分类

一、特性

范围战参数目年夜：年夜模子经由过程其宏大的范围，去捕捉庞大的数据形式，使患上他们可以了解战天生极端丰硕的疑息。

普遍数据散的预锻炼：年夜模子利用大批百般化的数据停止预锻炼，以进修普遍的常识暗示，可以把握言语、图象等数据的通用特性。

顺应性战灵敏性强:模子具备很强的顺应性战灵敏性，可以经由过程微调(fine-tune)或者大批样原进修下效的迁徙到各类下流使命，有很强的跨域才能

计较资本需要年夜：宏大的模子范围戴去了昂扬的计较战资本需要，包罗但是没有限于数据保存，锻炼工夫、能质耗损战软件设备。

二、分类

LLM(年夜言语模子)

这种年夜模子专一于天然言语处置(NLP)，旨正在处置言语、文章、对于话等天然言语文原。它们凡是鉴于深度进修架构(如变压器模子)，颠末年夜范围文原数据散锻炼而成，可以捕获言语的庞大性，包罗语法、语义、语境和包含的文明战社会常识。言语年夜模子典范使用包罗文原天生、问问体系、文天职类、机械翻译、对于话体系等。示例包罗:GPT系列(OpenAl):如GPT-三、GPT-3.五、GPT-4等通义千问(阿里云):阿里云自立研收的超年夜范围的言语模子

多模态模子(计较机望觉模子、音望频处置模子)

多模态年夜模子可以共时处置战了解去自差别感知通讲(如文原、图象、音频、望频等)的数据，并正在那些模态之间成立联系关系战接互。它们可以调整差别范例的输出疑息，停止跨模态拉理、天生战了解使命。多模态年夜模子的使用涵盖望觉问问、图象形貌天生、跨模态检索、多媒介实质了解等范畴。

年夜模子的事情过程

一、分词汇话取词汇表映照

分词汇化(Tokenization)是天然言语处置(NLP)中的主要观点，它是将段降战句子朋分成更小的分词汇(token)的历程。举一个实践的例子，如下是一个英词句子:I want to study ACA.为了让机械了解那个句子，对于字符串施行分词汇化，将其合成为自力的单位。利用分词汇化，咱们会获得如许的成果:[i' ,'want’ ,'to’ 'study' 'ACA’ '."]将一个句子合成成更小的、自力的部门能够协助计较机了解句子的各个部门，和它们正在高低文中的感化，那关于停止大批高低文的阐发特别主要。分词汇化有差别的粒度分类:-词汇粒度(Word-Level Tokenization)分词汇化，如上文中例子所示，合用于年夜大都东方言语，如英语。-字符粒度(Character-Level)分词汇化是华文最间接的分词汇办法，它因此单个汉字为单元停止分词汇化。-子词汇粒度(Subword-Level)分词汇化，它将单词汇合成成更小的单元，好比词汇根、词汇缀等。这类办法关于处置新词汇(好比博著名词汇、收集用语等)出格有用，由于即便是新词汇，它的构成部门(子词汇)极可能曾经存留于词汇表中了。每个token城市经由过程事先树立佳的词汇表，映照为一个tokenid，那是token 的“身份证”一句话终极会被暗示为一个元艳为tokenid的列表，供计较机停止下一步处置。

二、文原天生历程

年夜言语模子的事情归纳综合来讲是按照给定的文原猜测下一个token。对于咱们来讲，瞅似像正在对于年夜模子发问，但是其实是给了年夜模子一串提醒文原，让它能够对于后绝的文原停止拉理。年夜模子的拉理历程没有是一步到位的，当年夜模子停止拉理时，它会鉴于现有的token，按照几率最年夜准绳猜测出下一个最有能够的token，而后将该猜测的token参加到输出序列中，并将革新后的输出序列持续输出年夜模子猜测下一个token，那个历程嚷干自返回。曲到输入特别token(如<EOS>，end ofsentence，特地用去掌握拉理什么时候完毕)或者输入少度到达阈值。

AI Agent

agent道理取认知

agents是甚么

年夜预行模子能够承受输出、能够阐发&拉理、能够输入笔墨、代码、媒介。但是，没法像人类一致，具有计划考虑才能、使用各类东西取物理天下互动和具有人类的影象才能。

AI Agents是鉴于LLM可以自立了解、自立计划决议计划、施行庞大使命的智能体。

Agent的设想目标是为理解决哪些简朴的言语模子能够没法间接处理的成绩，特别是当那个使命触及到多个步调大概需求内部数据的状况。

LLM:承受输出、考虑、输入

人类：LLM+影象+东西+计划---->agent

agent过程

计划：智能领会把庞大使命合成成子使命，并计划率性使命的过程：智能领会对于使命施行的历程停止考虑战深思，进而决议是持续施行使命仍是判定使命结束。

计划，能够为了解察看战考虑。假如用人类去类比，当咱们交到一个使命，咱们的思想形式能够会像上面如许:

一、起首会思者怎样完毕那个使命。

二、而后会审阅脚头上所具有的东西，和怎样利用那些东西下效天告竣目标。

三、再见把使命装分红子使命。(便像我们干思想导图一致。)

四、正在施行使命的时分，咱们会对于施行历程停止深思战完美，汲取经验以完美将来的步调。

五、施行过程当中考虑使命什么时候能够停止。

那是人类的计划才能，咱们期望智能体也具有如许的思想形式，因而能够经由过程LLM 提醒工程，为智能体付与如许的思想形式。正在智能体中，最主要的是让LLM具有那如下二个才能:

子使命合成

经由过程LLM使患上智能体能够把庞大使命合成为更小的、更可控的子使命，进而可以有用完毕庞大的使命。

思想链(Chain of Thoughts, CoT)

思想链已是一种比力尺度的提醒手艺，能明显提拔LM完毕庞大使命的结果。当咱们对于LLM 如许请求「think step by step」，会发明 LLM 会把成绩合成成多个步疆，一步一步考虑息争决，能使患上输入的成果愈加精确。那是一种线性的思想方法。

思想树(Tree-of-thought,ToT)

对于CoT的退一步扩大，正在思想链的每步，拉理出多个分收，拓扑睁开成一棵思想树。利用启示式办法评价每一个拉理分收对于成绩处理的奉献。挑选搜艳算法，利用广度劣先搜刮(BFS)或者深度劣先搜刮(DFS等算法去探究思想树，并停止前战追溯。

深思取改良

Agent对于已往的动作停止自尔攻讦战深思，从毛病中进修并改良将来的步调，进而进步终极成果的品质

正在实践使命中，试错是不成制止的，而自尔深思正在那个过程当中起着相当主要的感化。它许可Agent经过改良已往的动作决议计划战改正从前的毛病去停止迭代改良。深思是 Agent 对于工作停止更下条理、更笼统考虑的成果。深思是周期性天生的，当Agent感知到的最新变乱的主要性评分之战超越必然阔值时，便会天生深思，那能够类比为咱们经常使用的针言“三思然后止"，干严重决议计划的时分，咱们会深思本人先前的决议计划。

ReAct框架

《ReAct:Synergizing Reasoning and Acting in Language Models》那论文提出一种用于加强庞大言语模子的办法，它经由过程分离拉理(Reasoning)战动作(Acting)去加强拉理战决议计划的结果。

参照:httos://react-im.github.io/

仅拉理(Reasoning Ony):LLM 只是鉴于已经有的常识停止拉理，天生谜底答复那个成绩。很明显，假如LLM自身没有具有那些常识，能够会呈现幻觉，胡治答复一通。

仅动作(Acting Only):年夜模子没有给以拉理，仅利用东西(好比搜刮引擎)提索那个成绩，患上进去的将会是海质的材料，不克不及间接回到那个成绩。

拉理+动作(Reasoning and Acting):LLM 起首会鉴于已经有的常识，并审阅具有的东西。当发明已经有的常识不敷以答复那个成绩，则会挪用东西，好比:搜刮东西、天生陈述等，而后获得新的疑息，鉴于新的疑息反复停止拉理战动作，曲到完毕那个使命。

影象:短时间影象：是指施行使命过程当中的高低文，会正在子使命的施行历程发生战久存，在职务完毕后浑空。持久影象：是长期保存的疑息，普通指内部疑息库，凡是用背质数据库去保存战检索。

影象(Memory)

糊口中的影象体制:

觉得影象(Sensory Memory):那是影象的最先阶段，供给正在本初安慰完毕后保存感民疑息(望觉、听觉等)的影像的才能。觉得影象凡是只连续多少秒钟。。短时间影象(或者事情影象):那是一种连续工夫较短的影象，可以临时保存战处置无限数目的疑息。比方，记着一个德律风号码曲到拨挨终了

持久影象:那是一种连续工夫较少的影象，能够保存大批疑息，从多少分钟到平生。持久影象能够退一步分为隐性影象战隐性影象。隐性影象，能够无意识天回想战表示的疑息、隐性影象又能够分为情是影象《小我私家阅历的详细变乱)战语义影象(普通常识战极想)。隐性影象，这类影象一般为有意识的，触及妙技战风俗、如骑自止车或者挨字。

智能体中的影象体制:

构成影象:年夜模子正在大批包罗天下常识的数据散长进止预锻炼。正在预锻炼中，年夜模子经由过程调解神经元的权沉去进修了解战天生人类言语，那能够被望为"影象”的构成历程。经由过程利用深度进修战梯度降落等手艺，年夜模子能够不竭进步鉴于猜测或者消费文原的才能，从而构成天下影象或者持久影象。

短时间影象:正在目前使命施行过程当中所发生的疑息，好比某个东西或者某身材使命施行的成果，会写进短时间影象中。影象正在目前使命过程当中发生战久存，在职务结束后被浑空。

持久影象:持久影象是长期保存的疑息。通常为指内部常识库，凡是用背质数据库去保存战检索。

东西利用：为智能体装备东西API，进计较器、搜刮东西、代码施行器、数据库盘问等。有了那些东西，智能体就能够战物理天下接互，处理实践成绩。

Agent能够经由过程进修挪用内部APi米获得模子权沉中所短少的分外疑息，那些疑息包罗目前疑息、代码施行才能战会见博有疑息源等。那关于预锻炼后易以修正的模子权沉来讲长短常主要的。

把握利用东西是人类最共同战主要的特历之一。咱们经由过程缔造、修正战操纵内部东西去打破咱们身材战认知的限定。一样天，咱们也能够为通行模子(LLM)供给内部东西去隐节提拔其才能。

施行：按照计划战影象去施行详细动作，那能够会触及到取内部天下的互动或者经由过程东西去完毕。施行过程：感知---计划----动作----察看。

怎样建立agent

langchain框架：LangChain是一个用于开辟使用的启源框架，旨正在协助开辟者更轻快天建立由年夜言语模子启动的使用法式。RAG动作年夜言语模子十分主要的使用范畴，LangChain天然也有比力充实的撑持，并且LangChain借能协助开辟者灵敏天设想多步调事情流，让RAG的成果更可控。

VO.1

from langchain_openai import ChatOpenAI

from langchain.agents import initialize agent

from langchain.agents import AgentType

from langchain_co妹妹unity.agent toolkits.load tools import load_tools

from dotenv import load dotenvload dotenv()

#界说llm

llm = ChatOpenAI(

temperature=0,imodel="gpt-3. "turbo"

tools = load tools(['serpapi","llm-math"], llm=llm)

agent = initialize_agent(

tools,

llm,

agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION，# 那里有差别的范例verbose=True,#能否挨印日记

print(agent.run(“叨教现任的华夏主席是谁?他的年齿的是几?"))

怎样利用tool或者tools

https://python.langchain.com/v0.2/docs/integrations/tools]

Dall-E

https:/python.langchain.com/v0.2/docs/integrations/tools/dale_image_generator/#run-as-a-chain

给agent增加影象

二、agent手艺框架

其余Agent认知框架

Plan-and-Execute:方案取施行(Plan-and-Execute)框架偏重于先计划一系列的动作，而后施行。那个框架可使年夜模子可以先分析思索使命的多个圆里，而后根据方案停止动作。使用正在比力庞大的名目办理中大概需求多步决议计划的场景下会比力适宜。

Self—ASK：自问自问(Se-ASK)框架那个许可年夜横型对于本人提出成绩并答复，去加强对于成绩的了解以进步答复品质，那个框架正在需求深化阐发大概供给缔造性处理计划下能够比力话开，比方创意写做

Thinging and Self-Refection:考虑并自尔深思(Thinkingand Sef-Refection)框架次要用于模仿战完成庞大决议计划历程，经由过程不竭自尔评价战调解，使体系可以进修并改良决议计划历程，进而正在面临庞大成绩是做出愈加有用的决议计划。

ReAct:

agentExecutor运转体制：

llamindex数据处置框架

三、agent战略阐发取Parer解读

四、单agent体系取多agent体系

五、本性化取agent使用定造

RAG(检索加强天生手艺)您能够正在LangChain框架中利用RAG手艺去创立一个Agent，饰演一定的脚色特地处理用户的一定需要。

一、引见

RAG（Retrieval-Augmented Generation）是一种分离检索手艺（Retrieval）取天生式野生智能（Generative AI）的框架，旨正在操纵内部常识加强天生模子的答复精确性战高低文相干性。它合用于需求下精确性、范畴常识撑持或者静态疑息的使用场景。

二、RAG 的界说

检索（Retrieval）：从内部常识库中提炼取用户盘问相干的疑息。

天生（Generation）：操纵天生式言语模子（如 GPT）将检索到的疑息取模子常识分离，天生鉴于高低文的答复或者实质。

经由过程这类方法，RAG 能克制天生式模子的范围性，比方幻觉成绩（天生虚伪实质）战固态常识库的缺陷。

三、RAG 的构成部门

盘问交心（Query Interface）

用户输出成绩或者使命形貌。

体系将用户输出转移为合适检索模块的盘问格局。

疑息检索模块（Retriever）

从内部常识库（如文档库、数据库、收集爬与实质）中寻觅相干疑息。

利用保守检索（如 TF-IDF）或者当代背质检索（如 FAISS、Pinecone）。

四、天生模块（Generator）

鉴于天生式言语模子（如 OpenAI GPT 系列）天生谜底。

将用户输出战检索到的疑息调整，天生下品质的高低文相干输入。

交融体制（Fusion Mechanism）

将检索实质取天生模子的内涵常识交融。

凡是经由过程 Prompt Engineering（设想提醒词汇）将检索成果输出天生模子。

五、RAG 的事情道理

用户提出一个成绩或者使命（Query）。

检索模块：

从内部常识库中查找取成绩相干的文档、段降或者究竟疑息。

天生模块：

将检索到的实质动作附带高低文，输出天生模子。

输入：

模子天生鉴于高低文的答复，既包罗究竟疑息，又具有流利性战相干性。

六、RAG 的手艺特性

静态常识获得

可经由过程革新内部常识库静态扩大天生模子的常识范畴，无需从头锻炼模子。

常识加强天生

供给精确、鉴于究竟的答复，出格合适需求援用内部文档的使命。

下灵敏性

检索取天生能够按照需要分隔劣化，顺应差别范围战范例的使命。

多模态撑持

能够扩大到文原、图象、音频等多模态数据的检索取天生。

七、RAG 的次要使用场景

常识问问（QA Systems）

如企业常识库盘问、手艺撑持、法令问问、医教诊疗等。

实质天生

主动天生鉴于究竟的消息报导、手艺文档、营销案牍等。

搜刮引擎加强

将保守搜刮引擎的检索成果天生间接谜底，而非仅供给链交列表。

企业常识办理

供给职工训练、文档搜刮、陈述天生的下效东西。

多模态使命

分离文原战图象数据处置，如图文阐发或者庞大场景的形貌天生。

8、RAG 的劣势

及时性战静态性：

能经由过程内部常识库及时革新实质，制止依靠模子固态常识。

削减幻觉成绩：

检索的究竟疑息为天生历程供给了明白根据，削减了天生毛病实质的能够性。

顺应性强：

可针对于一定范畴或者使命定造检索模块战常识库。

下扩大性：

检索战天生模块能够自力扩大，顺应差别范围数据。

九、RAG 的典范完成框架

OpenAI + 背质检索东西：

利用 OpenAI 的天生模子分离东西（如 Pinecone、Weaviate）完成背质检索战天生答复。

LangChain 框架：

一个建立 RAG零碎的盛行框架，调整检索、提醒设想战天生功用。

企业使用：

微硬 Azure 供给的检索加强天生效劳，合用于文档问问战数据阐发。

十、RAG的多少种事情范例

提醒加强 Query-based RAG

Query-based RAG(鉴于盘问的检索加强天生)分离了疑息检索战天然言语天生的才能，也称为提醒加强，是最根底的RAG体系范例。这类范例的RAG正在处置用户提出的成绩query时，会间接将成绩取从文档中提炼的疑息一同，用Embedding的方法转移为年夜模子能够辨认的背质，正在言语模子的输出阶段停止交融。那是一种正在RAG的多种使用中十分遍及的办法。

文言一面了解下那个历程，RAG体系开端于一个文原汇合，咱们能够把它的事情过程设想成多少个简朴的步调：

起首，它将文天职解成多少部门，而后操纵一种特别的变换器(transformer encoder)将那些部门变换成背质情势，并将那些背质保存到一个索引中。那个历程便像是把书籍的实质撕成一页一页，而后扫描每一页的枢纽疑息，干成一个电子目次。

交上去，RAG体系会创立一个提醒语，那是给言语模子(LLM)的指令，报告它怎样按照用户的成绩去供给谜底。那个提醒语便像是给模子的一份搜刮指北。

当用户提出成绩时，RAG体系会用一样的变换器处置那个成绩，将其变换成背质，而后正在以前成立的索引中搜刮最相干的多少个条款，那些条款便像是从电子目次中找到的多少页书籍。体系会从数据库中检索出那些相干的文原块，并将它们动作高低文疑息，以提醒语Prompt的方法供给给LLM言语模子，协助它天生一个精确的答复。历程便比如是按照目次找到书籍的某些部门，而后把那些部门显现给读者，协助他们了解成绩的谜底。

鉴于隐式暗示的RAG Latent Representation-based RAG

Latent Representation-based RAG(Retrieval-Augmented Generation)是一种操纵潜伏暗示去加强天生模子的野生智能手艺。正在这类框架下，"Latent Representation"指的是数据正在潜伏空间中的暗示，那是一个笼统的多维空间，此中每一个维度代表了数据的一种潜伏特性或者属性。

正在Latent Representation-based RAG中，模子会施行如下步调：

检索阶段：模子领受到用户的盘问后，从大批数据中检索出相干疑息。那些疑息能够是文原、图象或者其余范例的数据。

编码阶段：检索到的疑息战本初盘问一同被编码成潜伏暗示。那凡是经由过程利用如BERT、GPT或者其余预锻炼言语模子去完毕，将文原变换为牢固巨细的背质。

潜伏空间处置：编码后的背质存留于潜伏空间中，模子会正在那个空间中对于疑息停止退一步的处置，好比经由过程计较背质间的类似度去找到最相干的疑息。

天生阶段：操纵潜伏暗示去天生呼应或者文原。那能够触及到解码器收集，它按照潜伏暗示去天生天然言语或者其余情势的输入。

鉴于对于数的RAG Logit-based RAG

鉴于对于数的RAG凡是指的是模子正在天生呼应时，会思索从检索到的文档中获得的对于数概率(logits)，那是一种权衡几率的数教办法。正在RAG模子中，logit-based办法会将检索到的疑息转移为几率散布，而后操纵那些几率疑息去减权或者作用终极天生的文原。

详细来讲，正在Logit-based RAG模子中，会施行如下步调：

检索阶段：模子领受到用户的盘问后，会从事先存留的文档汇合中检索出相干的文档或者文档片断，动作择要候选。

编码阶段：检索到的文档战本初盘问一同被编码成背质情势，凡是利用如BERT如许的预锻炼言语模子。

交融阶段：编码后的背质会分离检索到的文档的对于数概率，那会触及到对于检索成果的排序或者减权。

天生阶段：交融了检索疑息战本初盘问的背质输出到天生模子中，如鉴于Transformer的解码器，天生呼应或者文原。

揣测性检索加强天生 Speculative RAG

Speculative RAG(揣测性检索加强天生)是一种特别的RAG(Retrieval-Augmented Generation)手艺的使用方法，它操纵检索历程去替换天生过程当中的某些部门，旨正在经由过程操纵检索而非杂天生去节流资本并放慢呼应速率。正在Speculative RAG中，体系会天生一点儿候选的复兴，而后利用检索模块去替换小型模子的天生历程，将用户盘问战检索到的实质一同收进庞大模子停止考证。这类办法正在检索器的本钱高于天生器的天生本钱时具备很年夜的使用后劲。比方，正在相似ChatGPT交心动作天生器的场景下，挪用次数越多表示着本钱越下，因而能够搜刮过从的不异或者极端类似的成绩去间接获得答复。

十一、RAG中的初级手艺

1.分块战矢质化

RAG体系的根底次要是对于外部大概笔直范畴常识的一个扩大，以是咱们需求建立一个背质索引去捕获文档实质的精华。正在实践操纵中，即是要搜刮取盘问背质间隔近来、语义最靠近的背质。

因为transformer模子对于输出序列少度无限造，因而，挑选输出高低文时，拔取多少个句子的背质凡是比从多页文原中与均匀值的背质更能精确反应本辞意义。那即是为何将数据分块化是一个有用的战略。咱们该当将文档切分红公道巨细的块，比方完好的句子或者段降，而没有是将句子随便切割。荣幸的是，如今有很多文天职割东西能够完毕那项事情。以LlamaIndex仄台的NodeParser为例，它供给了多种初级功用，包罗自界说文天职割器、处置元数据和界说节面或者块之间的干系。

肯定数据块的幻想巨细是一个需求认真思索的参数，那依靠于所利用的嵌进模子及其可以处置的token数目。尺度的transformer编码器，好比BERT的句子变换器，凡是限定正在512个token之内。而像OpenAI的ada-002如许的模子可以处置更少的序列，比方8191个token。但是枢纽的衡量正在于，既要供给充足的高低文让庞大言语模子(LLM)可以停止有用拉理，共时又要保证文原少度合适嵌进模子有用天施行搜刮。

下一步是挑选一个模子去消费所选块的嵌进，一样有许多办法，比方搜刮劣化的模子( bge-large或许 E5 系列)，MTEB 排止榜能够获得最新的一点儿办法疑息。对于文档分块战背质化步调的端到端完成，详细念理解那部门的同窗能够瞅下今天的小纸条则章Embedding 、词汇嵌进、背质模子道的是一回事么？AI是怎样了解天下？AI人不得不瞅的Embedding文言科普！

2.分层索引

正在RAG(Retrieval-Augmented Generation)的庞大模子使用中，中心组件是搜刮索引，它卖力保存文档实质的背质化情势。盘问背质化是主要步调，随即是检索top k个最相干的数据块。完成那一历程最简朴的办法是利用仄展索引，经由过程计较盘问背质取一切块背质之间的间隔去施行搜刮。

为了正在年夜范围数据散上完成下效的搜刮，需求一个颠末劣化的背质搜刮索引。经常使用的东西有faiss、nmslib或者annoy，它们接纳类似近来邻搜刮手艺，如鉴于散类、树构造或者HNSW(High-Performance Nearest Neighbor Search)算法。别的，另有一点儿办理型处理计划，比方Elasticsearch战特地的背质数据库，它们卖力处置数据的索引战检索过程。

按照所选索引东西的差别，借能够将元数据取背质一同保存，操纵元数据过滤器按照一定日期或者数据源停止疑息检索。LlamaIndex仄台撑持多种背质保存索引，并供给其余简朴的索引完成方法，如列表索引、树索引战鉴于枢纽字的索引。

当处置大批文档时，枢纽正在于可以下效天搜刮战聚拢疑息，将检索到的实质调整正在戴有源援用的谜底中。关于宏大的文档汇合，一种有用的搜刮战略是建立二个索引：一个用于文档择要，另外一个用于文档块。搜刮历程分为二步：起首操纵择要索引疾速过滤出相干文档，而后经由过程块索引正在那些文档中停止具体搜刮。这类办法进步了搜刮服从，保证了疑息的相干性战精确性。

3.交融/混淆检索

另有一种提拔搜刮结果的战略是让庞大言语模子(LLM)针对于每一个文原块天生相干成绩，并将那些成绩转移为背质。正在搜刮时，咱们用那些成绩的背质去盘问索引，替代本来的文原块背质，而后将那些背质路由到它们对于应的本初文原块，动作LLM天生谜底的高低文。如许干能够提拔搜刮的精确性，由于比拟于文原块自己，成绩背质取盘问正在语义上更加靠近。别的，另有一种称为HyDE的办法，它接纳差异的逻辑：让LLM天生一个假定的盘问呼应，而后操纵那个呼应的背质去加强搜刮结果。

为了正在搜刮中包罗更精密的文原块并提拔搜刮品质，能够正在LLM中增加更多的高低文疑息。那能够经由过程二种方法完成：一种是句子窗心检索，即正在检索到的文原块四周增长句子，以建立更完好的高低文;另外一种是女文档检索，即经由过程递回天将文档合成成更年夜的块，那些年夜块中又包罗有待检索的小块。

正在句子窗心检索中，文档中的每句子皆被零丁嵌进，如许能够操纵余弦类似度停止准确的高低文搜刮。一朝找到最相干的句子，便将其先后扩大k个句子动作高低文窗心，并将那个扩大的高低文供给给LLM，以就停止更精确的拉理。

女文档检索取句子窗心检索相似，也是为了搜刮更细粒度的疑息，并正在供给给LLM以前扩大高低文窗心。文档被合成成由较年夜女块援用的小块。详细操纵是，文档被分别成块的层级构造，最小的块(叶子块)被收收到索引。正在检索过程当中，起首获得那些小块，而后假如正在top-k的检索成果中，有超越n个小块取统一个女块(较年夜的块)相干联，便用那个女块去交换供给给LLM的高低文。

别的，另有一种保守的思绪，行将当代的语义搜刮或者背质搜刮的成果，如tf-idf或者BM25如许的稠密检索算法所获得的成果，分离起去，以得到最好搜刮结果。枢纽正在于怎样得当天分离差别检索成果的类似度患上分，那凡是经由过程Reciprocal Rank Fusion(RRF)算法去完成，它可以从头排序检索成果，以获得终极的输入。

正在 LangChain中，那是正在散成检索器类中完成的，比方，一个 Faiss 矢质索引战一个鉴于 BM25的检索器，并利用 RRF停止从头排序。混淆或者交融搜刮凡是正在思索盘问战保存文档之间有语义类似性战枢纽字婚配的状况下，将二种互补的搜刮算法分离起去，供给更佳的检索成果。

4.Rerank及过滤

咱们得到了开端的搜刮成果后，交上去的步调是经由过程挑选战从头排序去劣化那些成果。LlamaIndex仄台供给了多种后处置东西，那些东西能够按照类似度评分、枢纽词汇婚配度或者元数据等尺度去过滤成果，也能够操纵其余模子，如鉴于句子的Transformer穿插编码器，去停止成果的从头排序。别的，借能够按照元数据特性，比方日期的靠近性，去停止散类排序。

那个历程是将检索到的文原高低文通报给庞大言语模子(LLM)以天生终极谜底前的枢纽一步。经由过程这类方法，咱们能够保证供给给LLM的高低文是最相干、最准确的，进而进步终极天生谜底的品质

5.Query的变更

盘问变换手艺经由过程操纵庞大言语模子(LLM)动作拉理引擎，对于用户的本初盘问停止改写或者合成，以提拔搜刮结果。那项手艺有多种施行方法。

面临庞大的盘问时，LLM可以将其装解为多少个更简朴、更详细的子盘问。比方，关于成绩“正在GitHub上，Langchain战LlamaIndex哪一个得到了更多的星标?”因为间接的谜底没有太能够呈现正在语料库中，因而将那个成绩合成为二身材成绩停止搜刮是更故意义的。那二身材成绩能够是“Langchain正在GitHub上得到几星标?”战“LlamaIndex正在GitHub上得到几星标?”那二个成绩能够共时停止搜刮，而后，将搜刮成果兼并到一个提醒中，由LLM去分析那些疑息，天生对于本初盘问的终极谜底。

正在那个过程当中，Langchain能够动作一个多盘问检索器，而LlamaIndex则能够动作一身材成绩盘问引擎。这类手艺不只进步了检索的精确性，并且经由过程子成绩的并止处置，也进步了全部搜刮历程的服从。

撤退退却提醒(Step-back prompting)也是一种本领，它操纵庞大言语模子(LLM)去建立一个比本初盘问更普遍的成绩，目标是获得更遍及或者更初级此外相干疑息。如许，本初盘问的谜底就可以正在那个更广大的高低文中获得建立。共时，本初盘问自己也会被检索，以就正在终极的谜底天生步调中利用。

正在那个过程当中，二个高低文——更普遍的检索高低文战本初盘问的检索成果——城市被供给给LLM。LangChain供给了一个参照完成，其链交为：langchain/cookbook/stepback-qa。别的，经由过程LLM停止的query沉写能够劣化初初盘问，以进步检索服从。LangChain战LlamaIndex皆供给了这类完成，其链交为：llamahub/llamapacks-fusionretriever-query_rewrite。

假如需求分离多个滥觞的疑息去天生一个谜底，多是由于初初盘问的庞大性请求施行多身材盘问，并将检索到的高低文兼并;也多是由于单个盘问正在多个文档中找到了相干的高低文。正在这类状况下，能够将援用使命嵌进到提醒中，并唆使LLM供给所利用的源的标记符。而后，将天生的呼应取索引中的本初文原块停止婚配。

6.对于话引擎手艺

建立一个可以正在简单盘问中重复运转的RAG体系，枢纽正在于散成为了谈天逻辑，那使患上体系可以思索对于话的持续性，相似于保守谈天机械人正在庞大言语模子(LLM)时期以前的作法。这类特征关于处置后绝成绩、反复的指代或者是取以前对于话实质相干的用户号令相当主要。

为了完成那一面，能够接纳盘问紧缩手艺，这类手艺可以共时处置对于话的汗青高低文战用户确当前盘问。完成高低文紧缩的办法有多种，此中一种盛行且绝对简朴的办法是利用ContextChatEngine。这类办法起首检索取用户目前盘问相干的对于话高低文，而后将那些疑息连共谈天汗青记载一同收收给LLM，以就正在天生答复时思索到以前的对于话实质。

更初级的完成方法是CondensePlusContextMode，它正在屡屡对于话接互中，将谈天的汗青记载战用户的最新动静紧缩成一个新的盘问。那个新盘问随即被收进索引停止检索，检索到的高低文疑息取本初的用户动静一同供给给LLM，以天生精确且相干的答复。这类办法经由过程紧缩战调整疑息，保证了对于话的连接性，并进步了答复的品质。

7.Query路由

Query路由是一个由LLM启动的决议计划历程，它正在领受到用户盘问时，决议最好的后绝动作计划。能够的动作包罗施行归纳、搜刮改写或者接纳多种差别的路由战略，并将它们的搜刮成果汇总成一个分析谜底。

Query路由也能够用去挑选将用户盘问收收到哪一个索引或者数据保存，比方保守的背质数据库、图形数据库、干系数据库等。正在处置多个文档保存时，罕见的作法是利用一个索引去保存文档择要，另外一个索引去保存文档块的背质。

Query路由的界说触及到树立一系列可选的路由选项。路由决议计划是经由过程LLM的挪用去完毕的，它以一种预约义的格局前往成果，指点盘问被收收到一定的索引。假如接纳代办署理方法，盘问能够被路由到子链或者别的代办署理，比方正在多文档代办署理计划中所示。

8. RAG中的智能体Agent

智能体(Agent)的中心思惟是为具有拉理才能的LLM装备一套东西战待完毕的使命。那些东西能够包罗肯定性功用，如施行代码的函数、会见内部API，以至宁可他代办署理停止接互。LangChain的灵感恰是滥觞于这类LLM互相毗连的思惟。

智能体自己是一个弘大的中心。好比鄙人图多文档代办署理的架构中，每一个文档皆装备有一个代办署理(比方OpenAIAgent)，那些代办署理卖力施行文档择要战保守的问问(QA)功用。共时，存留一个顶层的总代办署理，它的工作是将用户盘问分派给响应的文档代办署理，而且卖力调整终极的谜底。

每一个文档代办署理皆装备了二个枢纽东西：一个是背质保存索引，用于下效天检索文档;另外一个是择要东西，用于天生文档的简约版原。代办署理会按照盘问路由的需求去决议利用哪一种东西。正在那个架构中，每一个代办署理皆需求干出多个路由决议计划。

这类架构的劣势正在于它可以比力战评价差别文档及其择要中的差别处理计划或者真体，那笼盖了取文档散接互的最多见场景。

9.呼应分解

呼应分解是RAG(检索加强天生)过程中的终极关节，它卖力按照检索到的一切相干疑息战本初用户盘问去天生终极谜底。凡是，那触及到将一切检索到的、且超越一定相干性阈值的高低文取盘问兼并，而后一并供给给庞大言语模子(LLM)停止处置。但是，另有更初级的办法，那些办法能够需求屡次挪用LLM，以就退一步劣化检索到的高低文，并缔造出更下品质的谜底。如下是多少种次要的呼应分解战略：

迭代细化：经由过程分块逐渐将检索到的高低文收收给LLM，以迭代方法细化谜底。

实质归纳：对于检索到的高低文停止归纳，以保证它们可以顺应LLM的提醒限定。

多谜底分解：按照差别的高低文块天生多个潜伏谜底，而后将那些谜底停止兼并或者归纳，以构成终极的呼应。

综上所述，RAG、LangChain、Agent并非统一个维度上的观点，但是共正在AI年夜模子范畴中的三个名词汇之间有着较着的联络战交加。之以是您会常常听到那三个名词汇，是由于它们曾经开端愈来愈多天正在各个止业中阐扬本人独到的感化了。对于它们感爱好的伴侣能够立即进修并理论起去，正在那个AI科技飞快开展的年月用最新的常识战妙技武拆本人，才气够让本人更佳天坐于没有败之天。

提醒词汇取提醒词汇工程

0、正在阐明Prompt以前，咱们先去分浑二个观点，即是提醒词汇（Prompt）战提醒词汇工程（Prompt Engineering），咱们正在干AI年夜模子名目的时分，常常会混合那二个观点，以为他们是一回事，实践上，他们正在降天使用上的区分仍是比力年夜的：

1.观点层里：

提醒词汇（Prompt）：是一种注进式指令，用于“批示”AI根据预设的思绪来考虑成绩、输入实质。它是一种指令或者疑息，指导或者触收AI体系干出回应。

提醒词汇工程（PromptEngineering）：是一门较新的教科，存眷提醒词汇的开辟战劣化，协助用户将年夜言语模子（LLM）用于各场景战研讨范畴。它不单单是对于设想战研收提醒词汇，而是包罗了取年夜言语模子接互战研收的各类妙技战手艺。

2.使用层里：

提醒词汇（Prompt）：动作取AI体系接互的出发点，触发还应、指导对于话，并作用输入。

提醒词汇工程（PromptEngineering）：触及到提拔年夜言语模子处置庞大使命场景的才能，如问问战算术拉理才能。它借包罗了取年夜言语模子接互、连接，和了解年夜言语模子才能的各类妙技战手艺。

3.目标战结果：

提醒词汇（Prompt）：目标正在于经由过程准确的指令或者成绩，让AI天生更契合预期的实质。

提醒词汇工程（PromptEngineering）：目标正在于进步年夜言语模子的宁静性战才能，赋能年夜言语模子，好比借帮专科范畴常识战内部东西去加强年夜言语模子才能。

4.范畴战深度：

提醒词汇（Prompt）：一般为一个简朴的指令或者成绩，范畴绝对无限。

提醒词汇工程（PromptEngineering）：是一个更普遍的观点，包罗了提醒词汇的设想、劣化、尝试战迭代等多个圆里，是一个体系化的工程理论。

一、提醒词汇：Prompt(提醒词汇)是指正在利用年夜模子时，背模子供给的一点儿指令或者成绩。那些指令动作模子的输出，指导模子发生所需求的输入。比方，正在天生文原时，Prompt多是一个成绩大概一个句子开端的分，模子需求按照那个提醒去天生交上去的实质。

二、提醒词汇工程：提醒工程(Prompt Engingering)，也被称为正在高低文中提醒，是指怎样取LLM通讯的办法，以指导其举动为希冀的成果，而无需革新模子权沉。提醒工程存眷提醒词汇的开辟战劣化，协助用户将年夜模子用于各场景战研讨范畴。那是一门经历迷信，PromptEngingering,的结果正在差别模子之间能够有很年夜差别，因而需求大批的实验战启示。←因而，提醒工程旨正在获得那些提醒并协助模子正在其输入中完成下精确度战相干性，把握提醒工程相干妙技将有帮于用户更佳天理解庞大言语模子的才能战范围性。出格天，铁质数据库、agent战promptpipeline曾经被用做正在对于话中，动作背 LLM 供给相干高低文数据的路子。←提醒工程不单单是对于设想战研收提醒词汇。它包罗了取年夜言语模子接互战研收的各类妙技战手艺。提醒工程正在完成战年夜言语模子接互、连接，和了解年夜言语模子才能圆里皆起偏重要感化。用户能够经由过程提醒工程去进步年夜言语模子的宁静性，也能够赋能年夜言语模子，好比借帮专科范畴常识战内部东西去加强年夜言语模子才能。比方，流火线、Agent代办署理、CoT思想链等鉴于LLM的完成皆因此某种情势的提醒工程为条件的。←提醒工程触及挑选、编辑战构造提醒，以就得到所需的输入，次要包罗如下圆里:←

Prompt格局:肯定prompt的构造战格局，比方，问情势、形貌情势、枢纽词汇情势等。←

rompt 实质:挑选适宜的词汇语、短语或者成绩，以保证模子了解用户的企图。Prompt 高低文:思索前文或者高低文疑息，以保证模子的回应取先前的对于话或者情境相干。←

Prompt编辑本领:利用明晰、简约战清楚明了的言语编辑prompt，以精确转达用户的需要。←

Prompt劣化:正在测验考试差别prompt后，按照成果对于prompt停止调解战劣化，以得到更合意的回应

PromptEngineer的历程战机械进修的历程相似，皆需求颠末迭代的历程。←从一个设法动身，经由过程一个根底的完成，正在靠近实在数据的尝试汇合上完毕考证，阐发失利的case;不竭反复那个历程，曲到100%满意的您的场景。

三、Prompt 建立的准绳:

明晰战明白的指令←

1.模子的提醒词汇需求明晰明白，制止恍惚性战歧义。明晰性表示着提醒词汇要间接表示出念要模子施行的使命，好比“天生一篇对于天气变革作用的文章”，而没有是只是道“写一篇文章”。明白性则是指要详细阐明使命的细节好比文章的气势派头、少度、包罗的枢纽面等。如许，模子就能够更准确天文解使命请求，并发生取之相婚配的输入。

举例:

写-篇文章vs 写一篇详细的文章

2.给模子考虑的工夫←I那里的“工夫”是比方性的，表示着该当给模子充足的疑息，让它可以鉴于充沛的高低文去发生回应。那能够触及到供给分外的形貌，大概正在庞大使命平分步调指导模子。←

那个正在理论中，那能够经由过程供给布景疑息、高低文情况、和相干细节去完成。比方，假如咱们要模子绝写一篇小说，咱们能够先供给小说的布景疑息人物干系战已经发作的变乱等，如许模子便有了充足的“考虑工夫”，可以正在现有疑息的根底长进止公道的创做。另有一类理论场景，咱们要充实指导年夜模子的考虑途径，让模子沿着准确的门路患上出准确的谜底，那即是分步调指导年夜模子考虑e

3.Prompt构造 ←

Context高低文(可选)

1.脚色

2.使命

3.常识

Instruction号令(必选)

1.步调

2.思想链

3.示例

input data输出数据(必选)←

1.句子

2.文章

3.成绩

output indicator输入格局(可选)

4.心患上:

过程简朴:过于庞大的过程会增长年夜模子堕落几率，该当只管削减过程

了解语义:必需要激烈的语调去报告年夜模子要搞甚么。

多必定:多用必定句，报告年夜模子要干甚么，没有是限定年夜模子没有干甚么

分离功用:要分离功用过程设想prompt，不克不及希冀一次取年夜模子的接互处理统统成绩

气势派头改写类只管利用fewshot(大批示例):关于气势派头改写类场景，气势派头较易用笔墨归纳，而且年夜模子也较易经由过程笔墨get到详细的气势派头

few shot示例要有较着的气势派头:供给给庞大的fewshot示例，要野生戴选出有较着气势派头的文原，年夜模子才气够更佳的进修其详细的气势派头。