职贝云数AI新零售门户
标题:
深度解析:中国人工智能大模型技术发展白皮书
[打印本页]
作者:
ZqUIC
时间:
6 天前
标题:
深度解析:中国人工智能大模型技术发展白皮书
近期,中国人工智能协会发布了《中国人工智能大模型技术白皮书》,系统梳理了
大模型技术演进,深化讨论关键技术要素,并分析当前应战及将来展望
。我为大家做了简要总结,并附上原文供深化阅读。
目录
第 1 章 大模型技术概述 ...................................5
1.1 大模型技术的发展历程 ......................5
1.2 大模型技术的生态发展 ......................9
1.3 大模型技术的风险与应战 ................11
第 2 章 言语大模型技术 .................................13
2.1 Transformer 架构.................................13
2.2 言语大模型架构 ................................17
2.2.1 掩码言语建模 .............................17
2.2.2 自回归言语建模 .........................18
2.2.3 序列到序列建模 .........................18
2.3 言语大模型关键技术 ........................19
2.3.1 言语大模型的预训练 .................19
2.3.2 言语大模型的适配微调 .............21
2.3.3 言语大模型的提示学习 .............24
2.3.4 言语大模型的知识加强 .............26
2.4.5 言语大模型的工具学习 .............27
第 3 章 多模态大模型技术 .............................29
3.1 多模态大模型的技术体系 ................29
3.1.1 面向了解义务的多模态大模型 .29
3.1.2 面向生成义务的多模态大模型 .31
3.1.3 兼顾了解和生成义务的多模态大模型............................33
3.1.4 知识加强的多模态大模型 .........35
3.2 多模态大模型的关键技术 ................36
3.2.1 多模态大模型的网络结构设计 .36
33.2.2 多模态大模型的自监督学习优化 ....................................37
.2.3 多模态大模型的下游义务微调适配 ................................39
第 4 章 大模型技术生态 .................................41
4.1 典型大模型平台 ................................41
4.2 典型开源大模型 ................................44
4.2.1 典型开源言语大模型 .................44
4.2.2 典型开源多模态大模型 .............53
4.3 典型开源框架与工具 ........................57
4.4 大模型的训练数据 .............................60
4.4.1 大模型的训练数据处理流程和特点 ................................60
4.4.2 大模型常用的公开数据集 .........63
第 5 章 大模型的开发训练与推理部署 .........66
5.1 大模型开发与训练 ............................66
5.2 大模型推理部署 ................................68
5.2.1 大模型紧缩 .................................69
5.2.2 大模型推理与服务部署 .............70
5.3 软硬件适配与协同优化 ....................71
5.3.1 大模型的软硬件适配 .................72
5.3.2 大模型的软硬件协同优化 .........72
第 6 章 大模型运用 ..746.1 信息检索 .....74
6.2 旧事媒体 .....756.3 智慧城市 .....76
6.4 生物科技 .....766.5 智慧办公 .....77
6.6 影视制造 .....786.7 智能教育 .....78
46.8 智慧金融 .....796.9 智慧医疗 .....79
6.10 智慧工厂 ...796.11 生活服务....80
6.12 智能机器人 ......................................80
6.13 其他运用 ...80
第 7 章 大模型的安全性 .................................82
7.1 大模型安全风险引发全球广泛关注 82
7.2 大模型安全管理的政策法规和标准规范 ...............................83
7.3 大模型安全风险的详细表现 ............85
7.3.1 大模型本身的安全风险 .............85
7.3.2 大模型在运用中衍生的安全风险 ....................................86
7.4 大模型安全研讨关键技术 ................88
7.4.1 大模型的安全对齐技术 .............88
7.4.2 大模型安全性评测技术 .............91
第 8 章 总结与思索 94
8.1 协同多方合作,共同推进大模型发展 ...................................95
8.2 建立大模型合规标准和评测平台 ....96
8.3 应对大模型带来的安全性应战 ........97
8.4 展开大模型广泛适配,推进大模型技术栈自主可控...........98
复制代码
大模型发展历程
自2006年Geoffrey Hinton提出经过逐层无监督预训练攻克深层网络训练难题以来,深度学习在众多范畴均获得了分明的打破,其发展历程从最后的标注数据监督学习,逐渐演进到预训练模型,最终迈向大模型的新纪元。2022年底,OpenAI发布的ChatGPT仰仗其杰出的功能引发了广泛的关注,充分展现了大模型在处理多场景、多用途、跨学科义务时的弱小才能。因此,大模型被普遍以为是将来人工智能范畴不可或缺的关键基础设备。
(, 下载次数: 1)
上传
点击文件名下载附件
在这场技术热潮中,言语大模型作为领军者,经过大规模预训练学习了丰富的言语知识与世界知识,进而拥有了面向多义务的通用求解才能。其发展头绪明晰可见,历经统计言语模型、神经言语模型、预训练言语模型,直至如今的言语大模型(探求阶段)的四个阶段。
(, 下载次数: 1)
上传
点击文件名下载附件
统计言语模型虽然基于马尔可夫假设,但由于数据稀疏成绩的影响,其才能有限;神经言语模型经过神经网络对语义共现关系停止建模,成功地
捕获了复杂语义依赖
;预训练言语模型采用“
预训练+微调
”的范式,经过自监督学习使模型可以适配各种下游义务;而大模型则
基于缩放定律。简单来说就是,随着模型参数和预训练数据规模的不断添加,模型的才能与义务效果会持续提升,甚至展现出了一些小规模模型所不具有的独特“涌现才能
”。
(, 下载次数: 1)
上传
点击文件名下载附件
大模型运用
大模型时代正逐渐揭开序幕,其领军者如ChatGPT正在经济、法律、社会等范畴发挥着至关重要的作用。OpenAI仰仗其GPT-1、GPT-2以及GPT-3等言语模型,展现了不同规模参数下的弱小才能,而谷歌也推出了规模庞大的PaLM模型,拥有5400亿参数。当模型参数规模跃升至千亿量级,言语大模型所展现出的多样化才能令人注目。GPT-3仅凭提示词或多数样例,便能出色地完成众多义务。
(, 下载次数: 1)
上传
点击文件名下载附件
自Transformer架构亮相以来,OpenAI推出了一系列抢先的言语大模型技术,如GPT-1、GPT-2、GPT-3等,它们在自然言语义务中展现了杰出功能。CodeX经过微调GPT-3,提升了代码和复杂推理才能;InstructGPT和ChatGPT则运用人类反馈的强化学习技术,加强了遵照人类指令的才能和对人类偏好的了解。GPT-4则更进一步,处理更长的上下文窗口,具有多模态了解才能,逻辑推理、复杂义务处理才能分明改进,为多模态范畴开拓了新天地。
大模型技术生态正在蓬勃发展,多种服务平台向个人用户和商业运用开放。OpenAI API让用户轻松访问不同GPT模型以完成义务。Anthropic的Claude系列模型强调有用性、诚实性和有害性。百度文心一言基于知识加强的大模型,提供开放服务和插件机制。讯飞星火认知大模型具有开放式知识问答、多轮对话、逻辑和数学才能,以及对代码和多模态的了解才能。讯飞和华为结合发布了支持大模型训练公有化的“星火一体机”。
(, 下载次数: 1)
上传
点击文件名下载附件
大模型的开源生态异样丰富多彩,涵盖了开源框架和开源大模型。开源框架如PyTorch和飞桨支持大规模分布式训练,OneFlow则支持动静态图的灵敏转换,而DeepSpeed则经过减少冗余内存访问以训练更大模型。开源大模型如LLaMA、Falcon和GLM则降低了研讨门槛,促进了运用的繁荣。Baichuan系列模型支持中英双语,运用高质量训练数据,表现杰出,并开源了多种量化版本。CPM系列在中文NLP义务上表现出色。
大模型技术的运用场景广泛无比,为各行各业注入了新的活力。无论是旧事、影视、营销、文娱、军事、教育、金融还是医疗等范畴,大模型都能分明降低消费成本,提高作质量量,助力产品营销,加强决策才能,使教育方式愈加个性化和智能化,提高金融服务质量,赋能医疗机构诊疗全过程。更重要的是,大模型被以为是将来人工智能运用中的关键基础设备,可以带动上下游产业的革新,构成协同发展的生态,对经济、社会和安全等范畴的智能化晋级构成关键支撑。
大模型的风险和应战
但是,大模型技术依然面临诸多风险与应战。其牢靠性尚未得到充分保障,合成内容在理想性和时效性上仍存在缺陷。大模型的可解释性相对较弱,其工作原理难以透彻了解。此外,运用大模型的部署成本高昂,触及大量训练和推理计算,功耗高,运用成本高,且端侧推理存在延迟等成绩。在大数据匮乏的状况下,大模型的迁移才能遭到制约,鲁棒性和泛化性面临严峻应战。更为严重的是,大模型还存在被滥用于生成虚伪信息、恶意引导行为等衍生技术风险,以及安全与隐私成绩。
(, 下载次数: 1)
上传
点击文件名下载附件
总结
大模型技术,以其广阔的运用前景和宏大潜力,无疑成为了技术发展的焦点。但是,随之而来的应战亦不容忽视:****牢靠性、可解释性的难题需求我们去攻克,数据质量与数量的提升成为迫切需求,运用部署成本的降低与迁移才能的加强异样重要,而安全与隐私保护的强化更是关键中的关键。此外,探求更为贴合实践、具有落地价值的运用场景,亦是我们需求努力的方向。****这些应战与机遇并存,将决议大模型技术将来的广泛运用与发展命运。
关于Python学习指南
学好 Python 不论是失业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后给大家分享一份全套的 Python 学习材料,给那些想学习 Python 的小伙伴们一点协助!
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、自动化办公等学习教程。带你从零基础系统性的学好Python!
如何学习大模型 AI ?
由于新岗位的消费效率,要优于被取代岗位的消费效率,所以实践上整个社会的消费效率是提升的。
但是详细到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的残局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指点过不少同行后辈。协助很多人得到了学习和成长。
我看法到有很多阅历和知识值得分享给大家,也可以经过我们的才能和阅历解答大家在人工智能学习中的很多困惑,所以在工作繁忙的状况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业冤家无法获得正确的材料得到学习提升,故此将并将重要的AI大模型材料包括AI大模型入门学习思想导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频收费分享出来。
(, 下载次数: 1)
上传
点击文件名下载附件
第一阶段(10天):初阶运用
该阶段让大家对大模型 AI有一个最前沿的看法,对大模型 AI 的了解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
大模型 AI 无能什么?大模型是怎样获得「智能」的?用好 AI 的核心心法大模型运用业务架构大模型运用技术架构代码示例:向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思想链和思想树Prompt 攻击和防备…
第二阶段(30天):高阶运用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造公有知识库,扩展 AI 的才能。疾速开发一个残缺的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术停顿,合适 Python 和 JavaScript 程序员。
为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示(Embeddings)向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…
第三阶段(30天):模型训练
恭喜你,假如学到这里,你基本可以找到一份大模型 AI相关的工作,本人也能训练 GPT 了!经过微调,训练本人的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的工夫。你曾经成为了一名“AI小子”。那么你还想往下探求吗?
为什么要做 RAG什么是模型什么是模型训练求解器 & 损失函数简介小实验2:手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…
第四阶段(20天):商业闭环
对全球大模型从功能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到合适本人的项目/创业方向,做一名被 AI 武装的产品经理。
硬件选型带你了解全球大模型运用国产大模型服务搭建 OpenAI 代理热身:基于阿里云 PAI 部署 Stable Diffusion在本地计算机运转大模型大模型的公有化部署基于 vLLM 部署大模型案例:如何优雅地在阿里云公有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…
学习是一个过程,只需学习就会有应战。天道酬勤,你越努力,就会成为越优秀的本人。
假如你能在15天内完成一切的义务,那你可谓天赋。但是,假如你能完成 60-70% 的内容,你就曾经末尾具有成为一名大模型 AI 的正确特征了。
这份残缺版的大模型 AI 学习材料曾经上传CSDN,冤家们假如需求可以微信扫描下方CSDN官方认证二维码收费支付【保证100%收费】
(, 下载次数: 1)
上传
点击文件名下载附件
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5