24张图解AI大模型通识:从人工智能、深度学习、机器学习到AI大模型的细分知识点全解析

o9WJWZs · 发表于 6 天前

媒介

年夜模子手艺开展患上缓慢，各类新观点一个交一个冒进去。刚刚初学的朋友便像走退了一野超年夜的“手艺超市”：来日诰日被Transformer的留神力体制勾住了眼光，来日诰日又迷上Prompt的“邪术咒语”，先天LangChain又像推链一致把各类工具串正在共同。到头去，买物车里塞患上谦谦铛铛，可实要入手用的时候，殊不知讲该如何配搭拉拢。教年夜模子很简单陷入常识碎片化的窘境，不残破的系统，很易干到真实理解，也忘没有坚固。更让人头痛的是，年夜模子革新的速率，比咱们收拾整顿进修质料的速率借要快！那篇文章即是念用可望化图解的方法，把相干观点梳理分明，助各人拆修起从AI根底到Agent使用的残破常识系统，让各人能体系吃透年夜模子手艺的中心逻辑战开展眉目。1、野生智能手艺根底：从标记主义到深度进修

1.1 野生智能手艺架构

教AI的时候，假设能先弄分明全部手艺范围的大抵框架，大白每一个常识面正在甚么职位、属于哪一个条理，进修服从会下许多。野生智能是个十分宏大的常识系统，毫不是多少弛图大概多少个专科名词汇就可以道完的。实在许多人脑筋里已经积聚了很多AI相干的常识，那篇文章即是念用一个明了的框架助您梳理一遍，相称于给您的“年夜脑常识库”干一次小小的劣化调解。

图 1：野生智能范围架构图1.2 野生智能的分层范围

中心干系：野生智能（AI）包罗机械进修（ML），机械进修（ML）又包罗深度进修（DL）。开展过程：标记主义时期（1950s-1980s）：主要是靠划定规矩去运行的大师体系，统统划定规矩皆需要人脚动写佳。机械进修时期（1990s-2000s）：能够从数据里自己进修纪律，再也不那末依靠野生写划定规矩。深度进修时期（2010s-2020s）：用年夜范围神经收集，正在语音、图象、天然语言处置等范围普遍使用。年夜模子时期（2020s 于今）：超年夜范围预锻炼模子、天生式模子大批呈现，晨着通用智能的标的目的开展。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w2.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w2.jpg

图 2：深度进修取年夜模子的干系1.3 深度进修的中心：神经收集家属

神经收集的根底实在即是简朴的感知机模子，它主要包罗输出层、躲藏层战输出层，一般用去干通用的情势识别任务。跟着深度进修不竭开展，市情上也呈现了许多典范的收集架构：
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w3.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w3.jpg

Transformer战CNN、RNN属于统一级别，皆是神经收集里的根底架构范例。而Transformer最具反动性之处正在于：它再也不依靠序列挨次，能够完毕完整并止化锻炼；能够更佳天处置少距离依靠成就；共时也为年夜模子的退一步拓展供给了其实可止的工程思路。1.4 机械进修的范式：监视 / 无监视等进修方法

深度进修实际上是机械进修里面的一个分收，而监视进修、无监视进修、加强进修那些，是根据进修方法去给机械进修干的分类。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w4.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w4.jpg

它们最中心的区分正在于，监视进修战无监视进修主要瞅有无用到戴标签的数据，而加强进修是靠不竭试错，再分离嘉奖旌旗灯号去进修如何干出决议计划的。1.5 为何需要年夜模子？

从保守模子到年夜模子，素质上即是从大师体系转背通用智能的历程。保守模子便像是颠末特地锻炼的止业大师，只正在简单任务上干粗调，泛化才气比力无限。而年夜模子更像是学识博识的通才，能用统一个模子，弄定多种任务、笼盖多个范围。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w5.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w5.jpg

图 3：保守模子 vs 年夜模子比照图2、年夜模子手艺：从 Transformer 到模子使用

2.1 年夜模子范围常识框架

年夜模子那个范围里的观点出格多，像架构、锻炼范式、拉理方法、使用形状那些皆属于此中。咱们能够从那多少个层里去弄懂它：下层根底圆里，主要是算力、数据另有模子架构，好比Transformer。锻炼取对于齐那块，包罗预锻炼、微调、指令微调，另有RLHF这种对于齐方法。才气扩大上，有东西挪用、RAG、少高低文、代码才气、多模态。使用形状则包罗谈天帮忙、代码帮忙、搜刮增强、Agent、Multi-Agent等等。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w6.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w6.jpg

图 4：年夜模子范围架构图2.2 年夜模子开展过程

年夜模子的开展过程，实在能够简朴归纳成：从最开端的预锻炼语言模子，一步步开展到现在的通用多模态 Agent 仄台。最先的时候，用的是鉴于统计战n-gram的语言模子。到了中期，便酿成了鉴于RNN、LSTM的语言修模。真实的起色面，是Transformer架构被提进去以后，各人才开端干年夜范围的预锻炼。再今后便加入了年夜模子时期，GPT系列、BERT系列，另有各个国度战厂商自己研收的年夜模子，皆纷繁开展起去了。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w7.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w7.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w8.jpg

2.3 Transformer 架构：并止化的反动

以前咱们道过，RNN 战 LSTM 存留二个主要成就：一个是易以并止，因为它们有严峻的序列依靠，无法很佳天阐扬现代软件的并止劣势；另外一个是少距离依靠才气强，关于时间距离比力暂的疑息，很简单呈现“忘记”的情况。而 Transformer 给出的中心处置法子，即是 Self-Attention 体制。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w9.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w9.jpg

1）Self-Attention（自留神力）概括：简朴来讲，即是让序列里的每个元艳，皆能战序列中其余统统元艳发生联系关系，相称于相互“相同交换”。再颠末计较相互之间的类似度，给差别元艳分派对于应的留神力权沉，如许就可以精确捕获到序列内部的依靠干系，另有深层的语义联系。比方：便跟咱们平常读一段话一致，瞅到每个词汇的时候，没有会零丁只瞅那个词汇自己，而是会下观点把它战整段话里其余统统词汇联系关系起去，分离高低文才气搞懂它真实的意义。2）多头留神力（Multi-Head Attention）概括：把输出的背质装分红佳多少个“头”，每一个头城市零丁来进修一套属于自己的留神力权沉，别离从纷歧样的望角来抓与战存眷枢纽疑息，没有会范围正在简单角度。比方：便比如找去佳多少位专科人士，让他们别离从差别维度阐发统一段笔墨，最初再把统统人的阐发成果调整到共同，患上出更全面的论断。3）职位编码（Positional Encoding）成就：Self-Attention那个体制自己，出法子感知到元艳的前后挨次，对于序列的职位疑息没有敏感。处置法子：颠末分外加之天位编码的方法，把每一个token对于应的职位疑息大白传给模子，让模子分明明白每个token正在序列里处正在甚么职位。4）编码器-解码器架构（Encoder-Decoder）概括：编码器的主要感化，是吃透输出的疑息，再把那些疑息收缩提取进去；解码器则是依靠编码器处置佳的疑息，一步步天生对于应的输出序列。比方：编码器便像是担当“读懂实质”的理解者，解码器更像是担当“把意义道进去”的表示者，那套架构经常用正在机械翻译、文原择要这种任务傍边。Transformer 的反动性意思：完全突破了RNN模子出法子并止处置的瓶颈，年夜幅提拔了运算服从；为年夜范围的模子预锻炼拆修了下效可止的根底架构；现现在已经成为各种现代年夜模子通用的中心尺度架构。2.4 年夜模子的锻炼三阶段：预锻炼、微调、对于齐

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w10.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w10.jpg

2.5 年夜模子的分类取使用

年夜模子实在能从佳多少个角度去分别，好比道从模态去瞅，能够分红文原模子、图象模子、语音模子、多模态模子等等。从用处上辨别，又有通用对于话模子、编程模子、搜刮增强模子、Agent 型模子那些范例。如果根据布置形状去分的话，借能分为云端年夜模子、当地沉质模子、端侧模子等。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w11.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w11.jpg

2.6 Prompt Engineering：取 AI 对于话的艺术

Prompt 即是人战年夜模子之间的相同桥梁，写患上分明大白，才是让模子听话的枢纽。佳的 Prompt，目标大白、束缚分明、步调装分公道、借能给到适宜的高低文。欠好的 Prompt，则是指令模糊、不鸿沟前提、没有给参照示例、也没有设定脚色。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w12.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w12.jpg

2.7 RAG：检索增强天生

RAG（Retrieval-Augmented Generation）是把内部常识检索战年夜模子天生分离正在共同的手艺思路：正在挪用年夜模子以前，先从背质数据库大概搜刮引擎里找出相干的文档；再把找到的实质战用户的成就共同输出给模子；模子正在参照那些质料的根底上给出答复，进而进步答复的精确性战实效性。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w13.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w13.jpg

3、智能体（Agent）手艺：让 AI 具备举措才气

3.1 智能体（Agent）的界说

许多人对于AI Agent的观点皆有面恍惚，实在最主要的启事是：Agent正在差别场景下，道法纷歧样。咱们能够从三个角度去理解它：（1）教术望角所谓AI Agent，即是具备那些才气的智能真体：感知才气（Perception）、决议计划才气（Decision Making）、举措才气（Action）、目标启动（Goal Oriented）。它没有是一个简朴的模子，而是能正在情况里自立运行的智能体。（2）现代年夜模子时期的望角到了年夜模子的时期，AI Agent凡是包罗那多少个部门：年夜模子（LLM / 多模态模子），那是它的中心，担当拉理、理解战天生实质；影象（Memory），用去存持久的常识、高低文和战人接互的汗青；东西使用（Tool Use / Function Calling），即是能挪用API、数据库、搜刮引擎、代码施行器那些内部功用；计划（Planning），能把庞大的任务装成一步步能施行的步调，借能深思调解、重复劣化；举措（Action），根据计划佳的步调挪用东西、操纵体系或者使用，不竭到完毕目标为行。（3）产物 / 工程望角从产物战工程理论使用去瞅，AI Agent即是一个能不竭运行、能够重复施行任务、借能自立完毕事情的硬件智能体。好比：能主动写代码、运行代码、建设毛病的AI Dev Agent；能主动处置客户征询、流转工单的AI客服Agent；能主动阐发营业数据、天生论断的AI阐发Agent等等。归纳界说：狭义来讲，AI Agent是一种能正在情况中自立感知、思考、计划并施行举措，进而告竣一定目标的智能体系。取年夜模子干系：Agent纷歧定非患上有年夜模子，但是现在支流的Agent，根本皆以LLM或者多模态模子为中心，再配搭上东西挪用、影象战计划体制，组成一套像人类施行任务这样的残破关环才气。更容易降天确当下界说：现在咱们道的AI Agent，实在即是鉴于年夜模子的自立智能体系，能感知情况、记着疑息、干佳计划、挪用东西，借能施行举措，终极完毕大白的目标。3.2 智能体战年夜模子：从年夜脑到残破的身材

狂言语模子（LLM），便相称于一个“超等勇猛的年夜脑”，懂的常识多、拉理才气也强，但是它自己不“四肢举动”，无法间接感知天下，也无法间接施行操纵。而智能体（Agent），即是正在具有“年夜脑”（也即是LLM）的根底上，再给它加之“四肢举动”（Tool）战“影象”（Memory），如许它就可以主动来感知、计划、举措，借能深思调解。3.3 智能体的四年夜中心组件

最多见的一种装解方法，是把智能体分红四个中心组件：
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w14.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w14.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w15.jpg

3.4 智能体的事情过程：感知 - 决议计划 - 举措 - 深思

原文偏重的是鉴于年夜模子的智能体（LLM Agent），其典范过程包罗：
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w16.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w17.jpg

智能体轮回的枢纽步调：感知（Perception）：借帮传感器（好比 API 监听、用户输出交心）获得中界的输出疑息，那些疑息即是察看（Observation）。思考（Thought）：由狂言语模子动员的内部拉理关节，借能细分红二部门：计划（Planning）：分离当下的察看战过从影象，革新对于任务战情况的认知，订定或者改正施行计划，把庞大目标装分红一个身材任务。东西挑选（Tool Selection）：正在现有的东西库里选择最适配的东西，并肯定佳挪用的参数。举措（Action）：颠末施行器（Actuators）完毕具体操纵，一般是挪用某类东西（好比代码注释器、搜刮 API 等），对于情况发生感化。察看取深思：按照举措的成果革新影象战方案，启开下一轮轮回。从理论使用去瞅，Agent Loop 一般即是连续按照用户需要战情况的反应，重复施行任务曲到完毕目标。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w18.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w18.jpg

3.5 MCP 和谈

MCP也即是Model Context Protocol，属于一种盛开尺度和谈，主要用去把AI使用战内部的数据源、东西跟尾起去。它会供给分歧的交心，便利AI模子宁静天会见文献体系、数据库、API等各种资本，共时撑持当地战长途效劳器，借具备东西挪用战资本会见的才气，能够简化AI使用战内部体系散成开辟的过程。MCP是由Anthropic等公司配合促进的，目标即是为了尺度化AI使用的高低文办理和内部接互事情。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w19.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w19.jpg

3.6 智能体设想的参照过程

设想一个 AI Agent 时，凡是会经历如下步调：
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w20.jpg

4、多智能体（Multi-Agent）手艺：AI 合作的新范式

4.1 多智能体简介为何咱们需要多智能体呢？

（1）单智能体的范围性：才气比力简单，很易共时把握多种专科妙技；碰到庞大任务时便费力了，有些任务需要多步调、多范围共同着完毕；服从没有下，只可一步步串止施行，无法充实使用并止的资本；扩大起去也省事，应付没有了年夜范围的散布式场景。（2）多智能体的劣势：能完毕专科化合作，每一个智能体皆专一于自己善于的范围；能够并止处置任务，多个智能体共同搞活，能放慢部分任务的退度；能把庞大的年夜任务装解启，分红一个身材任务，别离去向理；体系扩大性佳，能按照需要随时增加大概交流智能体。多智能体（Multi-Agent）情势，实在即是智能系统统从“一小我私家单挨独斗”酿成“一群人团队合作”的中心开展标的目的：靠多个专科的智能体，再加之相互的通信体制战和谐战略，完毕从“甚么皆念干的万能帮忙”到“各有千秋的大师团队”的改变。4.2 多智能体的合作情势

罕见的多智能体合作情势有那多少种：主从情势：一个主Agent去调理多身材Agent，分派佳各自的任务；仄止合作：多个Agent职位平等，共同合作，颠末和谐体制分歧终极的成果；乌板情势：统统Agent皆颠末一齐同享的“乌板”去交流疑息、共步退度；构造/脚色情势：根据“部分-脚色”的方法去分派任务，便像公司里各部分各司其职一致。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w21.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w21.jpg

4.3 A2A 和谈

A2A（Application to Application）和谈是一种企业级散成和谈，用于完毕差别使用体系之间的间接通信战数据交流。正在 AI 取多智能体场景下，A2A 和谈可用于：界说差别 AI 智能体之间的消息格局取接互划定规矩；撑持任务分派体制战合作过程；完毕智能体之间的常识同享、才气互补取散布式成就供解
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w22.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w22.jpg

4.4 多智能体的中心体制

多智能系统统的中心体制主要有那多少个圆里：任务合成，即是把庞大的成就装成多身材任务，再根据每一个智能体的专科特长截至公道分派。智能体和谐，借帮任务调理、劣先级办理和背载均衡等方法，避免呈现资本争抢战重复事情的情况。通信和谈，拆修起分歧标准的疑息交换方法，既撑持共步通信，也撑持同步通信，保证数据战形状能够精确、实时天传输。决议计划融合，把多个智能体患上出的决议计划成果截至汇总，颠末投票、减权均匀大概大师体系等办法，患上出终极的决议计划成果。
24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w23.jpg

24弛图解AI年夜模子通识:从野生智能、深度进修、机械进修到AI年夜模子的细分常识面齐剖析w23.jpg

4.5 支流多智能体框架

多智能体框架是拆修庞大AI体系的枢纽根底，比力罕见的框架有那些（举例）：主要用于科研范围的多智能体仿实仄台；战年夜模子相分离的多Agent合作框架；能够撑持东西编排取事情流运行的Agent仄台等等。

感谢浏览！跟AI年夜模子相干的进修艳材望频学程进修门路名目资本等等的尔皆收拾整顿佳了，已经上传至尔的网盘，需要的思尔一下复兴【02】便可主动失落降~

支付宝新出的财富黑卡是什么，推出这个的目

24张图解AI大模型通识:从人工智能、深度学习、机器学习到AI大模型的细分知识点全解析

浏览过的版块

AI大模型在测试范畴运用案例拆解：大模型驱

关于我们

产品与服务

全网营销

加盟与合作