开启左侧

中国人工智能大模型技术白皮书,从0入门大模型,附文档+LLM实战教程

[复制链接]
在线会员 EHNvg3 发表于 2025-1-25 20:13:45 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
短期,华夏野生智能教会公布了《华夏野生智能年夜模子手艺利剑皮书籍》,体系梳理了年夜模子手艺演退,深入会商枢纽手艺因素,并阐发目前挑战及未来瞻望。 尔为各人干了扼要归纳,并附上文档分享给各人。
PDF:残破版原链交获得
👉[CSDN年夜礼包🎁:<华夏野生智能年夜模子手艺利剑皮书籍> PDF免费 分享 面打免费获得]👈
😝有需要的小同伴,能够V扫描下圆两维码付出==🆓
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-1.png


目次

第 1 章 年夜模子手艺概括 …5

    1.1 年夜模子手艺的开展过程 …5
    1.2 年夜模子手艺的死态开展 …9
    1.3 年夜模子手艺的危急取挑战 …11
第 2 章 语言年夜模子手艺 …13

    2.1 Transformer 架构…13
    2.2 语言年夜模子架构 …17
    2.2.1 掩码语言修模 …17
    2.2.2 自返回语言修模 …18
    2.2.3 序列到序列修模 …18
    2.3 语言年夜模子枢纽手艺 …19
    2.3.1 语言年夜模子的预锻炼 …19
    2.3.2 语言年夜模子的适配微调 …21
    2.3.3 语言年夜模子的提醒进修 …24
    2.3.4 语言年夜模子的常识增强 …26
    2.4.5 语言年夜模子的东西进修 …27
第 3 章 多模态年夜模子手艺 …29

    3.1 多模态年夜模子的手艺系统 …29
    3.1.1 里背理解任务的多模态年夜模子… 29
    3.1.2 里背天生任务的多模态年夜模子 …31
    3.1.3统筹 理解战天生任务的多模态年夜模子…33
    3.1.4 常识增强的多模态年夜模子 …35
    3.2 多模态年夜模子的枢纽手艺 …36
    3.2.1 多模态年夜模子的收集构造设想 …363
    3.2.2 多模态年夜模子的自监视进修劣化 …37
    3.2.3 多模态年夜模子的下流任务微调适配 …39
第 4 章 年夜模子手艺死态 …41

    4.1 典范年夜模子仄台 …41
    4.2 典范启源年夜模子 …44
    4.2.1 典范启源语言年夜模子 …44
    4.2.2 典范启源多模态年夜模子 …53
    4.3 典范启源框架取东西 …57
    4.4 年夜模子的锻炼数据 …60
    4.4.1 年夜模子的锻炼数据处置过程战特性 …60
    4.4.2 年夜模子经常使用的公然数据散 …63
第 5 章 年夜模子的开辟锻炼取拉理布置 …66

    5.1 年夜模子开辟取锻炼 …66
    5.2 年夜模子拉理布置 …68
    5.2.1 年夜模子收缩 …69
    5.2.2 年夜模子拉理取效劳布置 …70
    5.3 硬软件适配取配合劣化 …71
    5.3.1 年夜模子的硬软件适配 …72
    5.3.2 年夜模子的硬软件配合劣化 …72
第 6 章 年夜模子使用 …74

    6.1 疑息检索 …74
    6.2 往事媒介 …75
    6.3 聪慧都会 …76
    6.4 死物科技 …76
    6.5 聪慧办公 …77
    6.6 影望制作 …78
    6.7 智能教诲 …78
    6.8 聪慧金融 …79
    6.9 聪慧调理 …79
    6.10 聪慧工场 …79
    6.11 糊口效劳…80
    6.12 智能机械人 …80
    6.13 其余使用 …80
第 7 章 年夜模子的宁静性 …82

    7.1 年夜模子宁静危急激发环球普遍存眷 …82
    7.2 年夜模子宁静办理的策略法例战尺度标准 …83
    7.3 年夜模子宁静危急的具体表示 …85
    7.3.1 年夜模子自己的宁静危急 …85
    7.3.2 年夜模子正在使用中衍死的宁静危急 …86
    7.4 年夜模子宁静钻研枢纽手艺 …88
    7.4.1 年夜模子的宁静对于齐手艺 …88
    7.4.2 年夜模子宁静性评测手艺 …91
第 8 章 归纳取思考 …94

    8.1 配合多圆协作,配合促进年夜模子开展 …95
    8.2树立 年夜模子开规尺度战评测仄台 …96
    8.3 应付年夜模子戴去的宁静性挑战 …97
    8.4 睁开年夜模子普遍适配,促进年夜模子手艺栈自立可控…98
年夜模子开展过程
自2006年Geoffrey Hinton提出颠末逐层无监视预锻炼霸占深层收集锻炼困难此后,深度进修正在浩瀚范围均得到了清楚的突破,其开展过程从最初的标注数据监视进修,逐步演退到预锻炼模子,终极迈背年夜模子的新纪元。2022年末,OpenAI**公布的ChatGPT凭仗其出色的功用激发了普遍的存眷,充实展示了年夜模子正在处置多场景、多用处、跨教科任务时的强大才气。因而,年夜模子被遍及觉得是未来野生智能范围不成或者缺的枢纽根底装备。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-2.png


正在那场手艺高潮中,语言年夜模子动作发军者,颠末年夜范围预锻炼进修了丰硕的语言常识取天下常识,从而具有了里背多任务的通用供解才气。其开展眉目明了看来,历经统计语言模子、神经语言模子、预锻炼语言模子,曲至现在的语言年夜模子(根究阶段)的四个阶段。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-3.png


    统计语言模子固然鉴于马我可妇假定,但是因为数据稠密成就的作用,其才气无限;神经语言模子颠末神经收集对于语义同现干系截至修模,胜利天捕捉了庞大语义依靠;预锻炼语言模子接纳“预锻炼+微调”的范式,颠末自监视进修使模子能够适配各类下流任务;而年夜模子则鉴于缩搁定律。简朴来讲即是,跟着模子参数战预锻炼数据范围的不竭增加,模子的才气取任务结果会连续提拔,以至展示出了一点儿小范围模子所没有具备的共同“出现才气”
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-4.png


年夜模子使用
年夜模子时期邪逐步掀启尾声,其发军者如ChatGPT在经济、法令、社会等范围阐扬着相当主要的感化。OpenAI凭仗其GPT-一、GPT-2和GPT-3等语言模子,展示了差别范围参数下的强大才气,而google也拉出了范围宏大的PaLM模子,具有5400亿参数。当模子参数范围跃降至千亿质级,语言年夜模子所展示出的百般化才气使人瞩目。GPT-3仅凭提醒词汇或者大都样例,就能超卓天完毕浩瀚任务。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-5.png


自Transformer架构表态此后,OpenAI拉出了一系列争先的语言年夜模子手艺,如GPT-一、GPT-二、GPT-3等,它们正在天然语言任务中展示了出色功用。CodeX颠末微调GPT-3,提拔了代码战庞大拉理才气;InstructGPT战ChatGPT则使用人类反应的加强进修手艺,增强了依照人类指令的才气战对于人类偏偏佳的理解。GPT-4则更退一步,处置更少的高低文窗心,具备多模态理解才气,逻辑拉理、庞大任务处置才气清楚改良,为多模态范围开辟了新六合。
年夜模子手艺死态在兴旺开展,多种效劳仄台背小我私家用户战贸易使用盛开。OpenAI API让用户轻快会见差别GPT模子以完毕任务。Anthropic的Claude系列模子夸大有效性、诚笃性战无害性。baidu文心一行鉴于常识增强的年夜模子,供给盛开效劳战插件体制。讯飞星水认知年夜模子具备盛开式常识问问、多轮对于话、逻辑战数教才气,和对于代码战多模态的理解才气。讯飞战华为分离公布了撑持年夜模子锻炼私有化的“星水一体机**”。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-6.png


年夜模子的启源死态异常丰硕多彩,涵盖了启源框架战启源年夜模子。启源框架如PyTorch战飞桨撑持年夜范围散布式锻炼,OneFlow则撑持消息态图的活络变换,而DeepSpeed则颠末削减冗余内乱存会见以锻炼更年夜模子。启源年夜模子如LLaMA、Falcon战GLM则低落了钻研门坎,增进了使用的繁华。Baichuan系列模子撑持中英单语,使用下品质锻炼数据,表示出色,并启源了多种质化版原。CPM系列正在华文NLP任务上表示超卓。
年夜模子手艺的使用场景普遍非常,为各止各业注进了新的生机。不管是往事、影望、营销、娱乐、军事、教诲、金融仍是调理等范围,年夜模子皆能清楚低落消耗本钱,进步做品质质,帮力产物营销,增强决议计划才气,使教诲方法越发本性化战智能化,进步金融效劳品质,赋能调理机构诊断齐历程。更主要的是,年夜模子被觉得是未来野生智能使用中的枢纽根底装备,能够动员高低游财产的改革,组成配合开展的死态,对于经济、社会战宁静等范围的智能化升级组成枢纽支持。
年夜模子的危急战挑战
可是,年夜模子手艺仍然面对诸多危急取挑战。其可靠性还没有获得充实保证,分解实质无理念性战实效性上仍存留缺点。年夜模子的可注释性绝对较强,其事情道理易以透辟理解。别的,使用年夜模子的布置本钱昂扬,涉及大批锻炼战拉理计较,罪耗下,使用本钱下,且端侧拉理存留提早等成就。正在年夜数据缺乏的情况下,年夜模子的迁徙才气受到限制,鲁棒性战泛化性面对严重挑战。更加严峻的是,年夜模子借存留被滥用于天生虚假疑息、歹意指导举动等衍死手艺危急,和宁静取隐衷成就。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-7.png


归纳
年夜模子手艺,以其宽广的使用远景战弘大后劲,无信成了手艺开展的核心。可是,随之而去的挑战亦阻挡无视:可靠性、可注释性的困难需要咱们来霸占,数据品质取数目的提拔成为火急需要,使用布置本钱的低落取迁徙才气的增强异常主要,而宁静取隐衷庇护的加强更是枢纽中的枢纽。别的,根究更加揭开理论、具备降天代价的使用场景,亦是咱们需要勤奋的标的目的。 那些挑战取机缘并存,将决定年夜模子手艺未来的普遍使用取开展运气。
怎样体系的来进修年夜模子LLM ?

动作一位热情肠的互联网老兵,尔观点到有许多经历战常识值患上分享给各人,也能够颠末咱们的才气战经历解问各人正在野生智能进修中的许多猜疑,以是正在事情忙碌的情况下仍是对峙各类收拾整顿战分享。
但是甘于常识传布路子无限,许多互联网止业朋友没法得到准确的质料获得进修提拔,故此将并将主要的 AI年夜模子质料 包罗AI年夜模子初学进修思惟导图、佳构AI年夜模子进修册本脚册、望频学程、真战进修等录播望频免费分享进去
😝有需要的小同伴,能够V扫描下圆两维码免费付出🆓
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-8.png


1、齐套AGI年夜模子进修门路

AI年夜模子时期的进修之旅:从根底到前沿,把握野生智能的中心妙技!
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-9.png


2、640套AI年夜模子陈述开散

那套包罗640份陈述的开散,涵盖了AI年夜模子的实践钻研、手艺完毕、止业使用等多个圆里。不管您是科研职员、工程师,仍是对于AI年夜模子感兴致的喜好者,那套陈述开散皆将为您供给贵重的疑息战启迪。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-10.png


3、AI年夜模子典范PDF籍

跟着野生智能手艺的飞快开展,AI年夜模子已经成了现今科技范围的一年夜热门。那些庞大预锻炼模子,如GPT-三、BERT、XLNet等,以其强大的语言理解战天生才气,在改动咱们对于野生智能的观点。 这如下那些PDF籍即是十分没有错的进修资本。
华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-11.png


华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-12.png


4、AI年夜模子贸易化降处所案

华夏野生智能年夜模子手艺利剑皮书籍,从0初学年夜模子,附文档+LLM真战学程-13.png


阶段1:AI年夜模子时期的根底理解

    目标:理解AI年夜模子的根本观点、开展过程战中心道理。
  • 实质
      L1.1 野生智能简述取年夜模子滥觞L1.2 年夜模子取通用野生智能L1.3 GPT模子的开展过程L1.4 模子工程
      - L1.4.1 常识年夜模子
      - L1.4.2 消耗年夜模子
      - L1.4.3 模子工程办法论
      - L1.4.4 模子工程实践L1.5 GPT使用案例

阶段2:AI年夜模子API使用开辟工程

    目标:把握AI年夜模子API的使用战开辟,和相干的编程妙技。
  • 实质
      L2.1 API交心
      - L2.1.1 OpenAI API交心
      - L2.1.2 Python交心交进
      - L2.1.3 BOT东西类框架
      - L2.1.4 代码示例L2.2 Prompt框架
      - L2.2.1 甚么是Prompt
      - L2.2.2 Prompt框架使用近况
      - L2.2.3 鉴于GPTAS的Prompt框架
      - L2.2.4 Prompt框架取Thought
      - L2.2.5 Prompt框架取提醒词汇L2.3 流火线工程
      - L2.3.1 流火线工程的观点
      - L2.3.2 流火线工程的长处
      - L2.3.3 流火线工程的使用L2.4 归纳取瞻望

阶段3:AI年夜模子使用架构实践

    目标:深入理解AI年夜模子的使用架构,并能够截至私有化布置。
  • 实质
      L3.1 Agent模子框架
      - L3.1.1 Agent模子框架的设想观念
      - L3.1.2 Agent模子框架的中心组件
      - L3.1.3 Agent模子框架的完毕细节L3.2 MetaGPT
      - L3.2.1 MetaGPT的根本观点
      - L3.2.2 MetaGPT的事情道理
      - L3.2.3 MetaGPT的使用场景L3.3 ChatGLM
      - L3.3.1 ChatGLM的特性
      - L3.3.2 ChatGLM的开辟情况
      - L3.3.3 ChatGLM的使用示例L3.4 LLAMA
      - L3.4.1 LLAMA的特性
      - L3.4.2 LLAMA的开辟情况
      - L3.4.3 LLAMA的使用示例L3.5 其余年夜模子介绍

阶段4:AI年夜模子私有化布置

    目标:把握多种AI年夜模子的私有化布置,包罗多模态战一定范围模子。
  • 实质
      L4.1 模子私有化布置概括L4.2 模子私有化布置的枢纽手艺L4.3 模子私有化布置的施行步调L4.4 模子私有化布置的使用场景

进修方案:

    阶段1:1-2个月,成立AI年夜模子的根底常识系统。阶段2:2-3个月,专一于API使用开辟才气的提拔。阶段3:3-4个月,深入实践AI年夜模子的使用架媾和私有化布置。阶段4:4-5个月,专一于初级模子的使用战布置。
那份残破版的年夜模子 LLM 进修质料已经上传CSDN,朋友们假设需要能够微疑扫描下圆CSDN民间认证两维码免费付出【包管100%免费】

😝有需要的小同伴,能够Vx扫描下圆两维码免费付出🆓
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )