开启左侧

人工智能大模型 | 粗浅讲解AI基础概念

[复制链接]
在线会员 WYW6u9 发表于 2025-2-19 15:20:29 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
LLM
LLM(Large Language Models)指的是庞大语言模子。那些模子是天然语言处置(NLP)手艺的一部门,使用深度进修锻炼去理解、天生、翻译文原,以至施行一定的语言相干任务,如问问、文原择要、编程代码天生等。LLM按照大批文原数据截至锻炼,以理解语言的构造、寄义战高低文。
LLM的枢纽特性之一是其范围,即模子中包罗的参数数目十分宏大。那些参数辅佐模子捕捉语言的庞大性战细微不同。跟着模子范围的增加,它们的理解才气战天生文原的品质也会进步,但是共时也会增加所需的计较资本战锻炼时间。
AGI

AGI(Artificial General Intelligence)也称为通用野生智能,指的是一种具备普遍智能的机械,能够理解、进修战使用常识,并能够正在广阔范畴的情况战任务中截至自立进修、拉理、适应战缔造,取人类智能类似或者同等的水平。
区分于今朝普遍使用的专科野生智能(AI)体系,那些体系凡是劣化战设想用去处置一定成就(如图象识别、语言翻译等),AGI能够跨范围事情,不但范围于一个具体范围或者任务。
AGI的完毕将标记着一个严峻科技平息,但是共时也激发了很多伦理战宁静的考质。今朝AGI仍然是野生智能范围的一个持久目标,而且还没有完毕。
女伶 href="https://www.taojin168.com" target="_blank">AIGC

女伶 href="https://www.taojin168.com" target="_blank">AIGC(Artificial Intelligence Generated Content)即为野生智能天生实质,是一种实质消耗方法。比方AI笔墨绝写,笔墨转像的AI图、AI垄断人等,皆属于女伶 href="https://www.taojin168.com" target="_blank">AIGC的使用。
AI Agent

AI Agent 即智能代办署理,是一种鉴于野生智能手艺的硬件真体,它能够正在必然的情况下自立感知疑息、处置数据、并采纳举措以完毕一定目标。这类智能代办署理能够模仿人类的事情战思考方法,颠末类似人类的自力思考战举措去完毕一系列简朴或者庞大的任务。
狂言语模子 (LLM) 仅限于它们所锻炼的常识,而且那些常识很快便会过期(天天用最新疑息从头锻炼这样年夜的模子是不成止的),LLM的一点儿范围主要包罗:
    会发生幻觉成果其实不老是真正的对于时局的理解无限或者一窍不通很易应付庞大的计较。
那即是AI Agent的用武之天,它能够使用内部东西去抑制那些限定。能够将Agent望为野生智能年夜脑或者LLM操纵体系,它使用LLM截至拉理、方案战采纳举措。
智能体 Bot

是仄台对于AI Agent的抽象界说,即野生智能代办署理,是一个能够按照人类目标自立思考战计划任务的法式或者真体。能够将智能体望为野生智能年夜脑或者LLM操纵体系,它使用LLM截至拉理、方案战采纳举措(挪用东西)。
理论使用过程当中,咱们更倡议为某个具体的使用场景创立特地的智能体,而没有是甚么事情皆接给统一个智能体,只需让智能体干更专一的工作才气干的越发专科。
提醒词汇 Prompt

简朴的理解它是给 AI 模子的指令。它能够是一个成就、一段笔墨描绘,以至能够是戴有一堆参数的笔墨描绘。AI 模子会鉴于 prompt 所供给的疑息,天生对于应的文原大概图片。
针对于智能体的提醒词汇可以战对于话的提醒词汇略有差别,对于话过程当中的提醒词汇高低文至多只需5条,智能体的编排提醒词汇能够不竭生效,并且凡是具备必然的格局标准,更好处智能体施行任务。仄台也预设了一点儿经常使用的智能体提醒词汇可供用户挑选。
RAG

RAG(Retrieval-Augmented Generation 检索增强天生)是一种分离了疑息检索战文原天生手艺的天然语言处置办法,它颠末检索相干疑息去帮助天生更精确战丰硕的文原输出。
RAG的一个枢纽劣势是它能够有用天处置这些不但依靠于通用常识,并且借需要一定疑息源或者文档中的常识才气答复的成就。颠末间接使用那些滥觞中的疑息,RAG能够供给越发精确战疑息露质更下的输出。
常识库 Knowledge Base

常识库指用于供给疑息检索撑持的年夜范围数据汇合,包罗用户上传到仄台的各种文档、表格、数据表等质料,就于用户构造、办理范围常识,常识库能够理解为数据源。
常识库正在RAG计划中的感化是多圆里的:
    疑息源:为天生模子供给丰硕的布景疑息战幻想按照,使天生实质越发丰硕战精确。提拔服从:颠末事先成立的常识库截至检索,能够削减天生模子需要重新计较或者拉理的疑息质,提拔处置速率战服从。增强精确性战相干性:鉴于检索到的取盘问间接相干的疑息,天生的实质越发切近用户的理论需要,提拔了答复的精确性战相干性。
因而,正在RAG计划中,常识库的建立战品质间接作用到体系的部分功用,包罗天生实质的精确度、丰硕性战用户趁心度。
多模态 Multi Modal

多模态指的是分离使用二种或者二种以上差别范例的情势或者旌旗灯号去截至疑息的表示、交换或者处置。正在计较机科学战野生智能范围,多模态凡是涉及到分离文原、图象、音频、望频和其余传感器数据去提拔算法的理解、阐发战天生才气。
多模态办法能够辅佐体系更全面天理解庞大的疑息场景,进步疑息处置的服从战结果。
多路召回 Multi-channel Recall

多路召回是天然语言处置(NLP)战举荐体系中的一种罕见战略,旨正在从多个维度或者渠讲共时检索疑息或者东西,以进步召回品质战笼盖率。正在这类战略中,体系会使用多个自力的算法或者模子,每一个算法或者模子专一于从一个一定的角度或者按照一个一定的特性去检索疑息。
那些差别的召回渠讲以后能够被兼并或者退一步处置,以天生一个分析的、百般化的成果散,进而进步终极举荐或者检索成果的精确性战百般性。多路召回正在提拔用户体会战满意差别用户需要圆里阐扬偏重要感化。
微调 Fine-Tuning

模子微调(Model Fine-tuning)是一种机械进修办法,出格是正在深度进修范围中罕见。这类办法涉及到正在一个预锻炼的模子根底上,颠末对于模子截至分外的锻炼(或者“微调”),使其更佳天适应于一定任务或者数据散。正在模子微调过程当中,凡是会接纳较小的进修率,对于预锻炼模子的权沉截至小幅度调解,以到达进步模子正在一定任务上表示的目标。
模子微调的特性是能够使用预锻炼模子已经教到的常识,进而正在数据质较少的情况下也能到达较佳的功用,加快模子的锻炼历程并进步模子的泛化才气。
对于齐Alignment

野生智能中的对于齐是指挥导野生智能体系的举动,使其契合设想者的长处战预期目标。一个已经对于齐的野生智能的举动会背着预期标的目的开展;而已对于齐的野生智能的举动固然也具备一定目标,但是此目标并不是设想者所预期。
Token

正在天然语言处置中,咱们凡是将文原装分为一个个团聚的token,以就于计较机理解战处置正在GPT模子中,token是模子领受的最小单元。模子正在锻炼战天生文原时,将输出的文原序列分别为一系列的token,并颠末对于那些token截至处置战阐发去天生照应。
比方:正在一个对于话中,一句话能够被分别为多个token,包罗单词汇、标面标记等。每一个token皆有一个对于应的编码暗示,一般为一个整数。那些编码将文原变换为模子能够处置的数值方法。正在使用ChatGPT时,用户凡是需要理解自己的输出文原中有几个token,以保证没有超越模子的最年夜输出限定。
需要留神的是,差别的模子战东西可以对于token的界说战处置方法有所差别但是整体来讲token是指文原处置战阐发的最小单元,凡是1Token的实质为5 字节的文原,但是因为字符编码成就,差别华文字符的token数目并非牢固的,普通通过类OpenAI的交心挪用会前去目前实质的token数目巨细。
背质 Vector

背质,物理、工程等也称做矢质、欧多少里患上背质(Euclidean vector) 是数教、物理教战工程科学等多个天然科学中的根本观点。指一个共时具备巨细战标的目的,且满意仄止四边形法例的多少工具。实践数教中背质的界说为所有正在称为背质空间的代数构造中的元艳。
一般天,共时满意具备巨细战标的目的二本性量的多少工具便可觉得是背质。背质经常正在以标记减箭头标示以区分于别的质。取背质绝对的观点称标质、杂质、数目,即只需巨细、尽年夜大都情况下不标的目的(电流是惯例)、怨恨脚仄止四边形法例的质。
背质数据库 Vector Database

背质数据库是鉴于智能算法提炼需保存实质的特性,改变成具备巨细界说、特性描绘、空间职位的多维数值截至背质化保存的数据库,使实质不但可被保存,共时可被智能检索取阐发。
东西 Tool

是仄台对于智能体才气的抽象,颠末东西的设置战拉拢能够完毕多种营业场景需要,东西能够被理论联系关系到智能体的扩大才气,今朝仄台供给的东西包罗年夜模子才气(文死图等)、联网盘问(必应搜刮)、常识库检索(常识办理检索)、函数挪用(各类交心)等范例,未来借会拓展更多的东西范例。
怎样体系的来进修AI年夜模子LLM ?

动作一位热情肠的互联网老兵,尔观点到有许多经历战常识值患上分享给各人,也能够颠末咱们的才气战经历解问各人正在野生智能进修中的许多猜疑,以是正在事情忙碌的情况下仍是对峙各类收拾整顿战分享。
但是甘于常识传布路子无限,许多互联网止业朋友没法得到准确的质料获得进修提拔,故此将并将主要的 AI年夜模子质料 包罗AI年夜模子初学进修思惟导图、佳构AI年夜模子进修册本脚册、望频学程、真战进修等录播望频免费分享进去
统统质料 ⚡️ ,朋友们假设有需要齐套 《LLM年夜模子初学+退阶进修资本包》,扫码获得~
👉CSDN年夜礼包🎁:齐网最齐《LLM年夜模子初学+退阶进修资本包》免费分享(宁静链交,定心面打)👈

野生智能年夜模子 |深刻  解说AI根底观点-1.jpeg


1、齐套AGI年夜模子进修门路

AI年夜模子时期的进修之旅:从根底到前沿,把握野生智能的中心妙技!
野生智能年夜模子 |深刻  解说AI根底观点-2.png


2、640套AI年夜模子陈述开散

那套包罗640份陈述的开散,涵盖了AI年夜模子的实践钻研、手艺完毕、止业使用等多个圆里。不管您是科研职员、工程师,仍是对于AI年夜模子感兴致的喜好者,那套陈述开散皆将为您供给贵重的疑息战启迪。
野生智能年夜模子 |深刻  解说AI根底观点-3.png


3、AI年夜模子典范PDF籍

跟着野生智能手艺的飞快开展,AI年夜模子已经成了现今科技范围的一年夜热门。那些庞大预锻炼模子,如GPT-三、BERT、XLNet等,以其强大的语言理解战天生才气,在改动咱们对于野生智能的观点。 这如下那些PDF籍即是十分没有错的进修资本。
野生智能年夜模子 |深刻  解说AI根底观点-4.png


野生智能年夜模子 |深刻  解说AI根底观点-5.jpg


4、AI年夜模子贸易化降处所案

野生智能年夜模子 |深刻  解说AI根底观点-6.png


阶段1:AI年夜模子时期的根底理解

    目标:理解AI年夜模子的根本观点、开展过程战中心道理。
  • 实质
      L1.1 野生智能简述取年夜模子滥觞L1.2 年夜模子取通用野生智能L1.3 GPT模子的开展过程L1.4 模子工程
      - L1.4.1 常识年夜模子
      - L1.4.2 消耗年夜模子
      - L1.4.3 模子工程办法论
      - L1.4.4 模子工程实践L1.5 GPT使用案例

阶段2:AI年夜模子API使用开辟工程

    目标:把握AI年夜模子API的使用战开辟,和相干的编程妙技。
  • 实质
      L2.1 API交心
      - L2.1.1 OpenAI API交心
      - L2.1.2 Python交心交进
      - L2.1.3 BOT东西类框架
      - L2.1.4 代码示例L2.2 Prompt框架
      - L2.2.1 甚么是Prompt
      - L2.2.2 Prompt框架使用近况
      - L2.2.3 鉴于GPTAS的Prompt框架
      - L2.2.4 Prompt框架取Thought
      - L2.2.5 Prompt框架取提醒词汇L2.3 流火线工程
      - L2.3.1 流火线工程的观点
      - L2.3.2 流火线工程的长处
      - L2.3.3 流火线工程的使用L2.4 归纳取瞻望

阶段3:AI年夜模子使用架构实践

    目标:深入理解AI年夜模子的使用架构,并能够截至私有化布置。
  • 实质
      L3.1 Agent模子框架
      - L3.1.1 Agent模子框架的设想观念
      - L3.1.2 Agent模子框架的中心组件
      - L3.1.3 Agent模子框架的完毕细节L3.2 MetaGPT
      - L3.2.1 MetaGPT的根本观点
      - L3.2.2 MetaGPT的事情道理
      - L3.2.3 MetaGPT的使用场景L3.3 ChatGLM
      - L3.3.1 ChatGLM的特性
      - L3.3.2 ChatGLM的开辟情况
      - L3.3.3 ChatGLM的使用示例L3.4 LLAMA
      - L3.4.1 LLAMA的特性
      - L3.4.2 LLAMA的开辟情况
      - L3.4.3 LLAMA的使用示例L3.5 其余年夜模子介绍

阶段4:AI年夜模子私有化布置

    目标:把握多种AI年夜模子的私有化布置,包罗多模态战一定范围模子。
  • 实质
      L4.1 模子私有化布置概括L4.2 模子私有化布置的枢纽手艺L4.3 模子私有化布置的施行步调L4.4 模子私有化布置的使用场景

进修方案:

    阶段1:1-2个月,成立AI年夜模子的根底常识系统。阶段2:2-3个月,专一于API使用开辟才气的提拔。阶段3:3-4个月,深入实践AI年夜模子的使用架媾和私有化布置。阶段4:4-5个月,专一于初级模子的使用战布置。
那份残破版的统统 ⚡️ 年夜模子 LLM 进修质料已经上传CSDN,朋友们假设需要能够微疑扫描下圆CSDN民间认证两维码免费付出【包管100%免费】

齐套 《LLM年夜模子初学+退阶进修资本包↓↓↓获得~
👉CSDN年夜礼包🎁:齐网最齐《LLM年夜模子初学+退阶进修资本包》免费分享(宁静链交,定心面打)👈

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )