职贝云数AI新零售门户
标题:
AIGC发展简史:算力醒悟与格局演化
[打印本页]
作者:
xxryxaK
时间:
4 小时前
标题:
AIGC发展简史:算力醒悟与格局演化
点击蓝字
关注我们
(, 下载次数: 0)
上传
点击文件名下载附件
引言
北京大学信息技术高等研讨院数字创意实验室(PKU AIIT DCL) 倾力打造《美美与共:2026 AI赋能文明产业发展报告》,现已正式面向公众收费发布。
报告由《AI创意业态透视》与《AI工具全景指南》两部分构成,共计300余页,分别从实际框架与实际工具切入,为行业提供体系化参考。文末附残缺报告获取方式。
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
本文摘选自《AI创意业态透视》,重点聚焦于2023年以来全球AIGC的发展头绪,以及AI在文明产业各种范畴带来的严重变革。以下为精髓内容呈现:
(, 下载次数: 0)
上传
点击文件名下载附件
全球AIGC技术演进道路图
(2023-2025)
回顾AIGC的发展历程,我们看到的是一条指数级跃升的技术曲线。这不只仅是参数量的堆叠,更是模型架构、训练方法与推理才能的质变。
1.1
2023-2024
大模型的“百模大战”与多模态打破
以OpenAI发布的GPT-4 为标志7,2023年确立了Transformer架构在自然言语处理范畴的统治地位。
(, 下载次数: 0)
上传
点击文件名下载附件
GPT-4 相较于GPT-3.5
展现出更强的推理才能
随后,Anthropic推出的Claude系列,以其“宪法 AI”(Constitutional AI)的安全性和超长上下文窗口 (Context Window),在长文本分析与文学创作范畴占据一席之地。
(, 下载次数: 0)
上传
点击文件名下载附件
Claude主页面
Google 的 Gemini 系列则展现了原生多模态 (Native Multimodal)的潜力,打通了文本、图像与视频的了解壁垒。
(, 下载次数: 0)
上传
点击文件名下载附件
Gemini的工作流程图示
这一阶段的特征是“深度神经网络疾速发展”。各大科技巨头竞相经过添加参数量(Scaling Law)来提升模型才能,导致训练成本高企,最终仅头部企业能充分受益。
1.2
2025:推理模型崛起
赋能多模态“深度了解”
2025年是人工智能从“快思索”转向“慢思索”的分水岭。
1.2.1 “慢思索”的醒悟(System 2)
随着 DeepSeek-R1 等推理模型(Reasoning Models)的发布,AI 末尾展现出相似人类“系统2”的慢思索才能。这种才能对于文明产业至关重要——它意味着AI不再只是经过概率“猜”下一个字,而是末尾“推演”剧情的逻辑闭环、计算游戏的数值平衡。
1.2.2 推理才能“外溢”至少模态
(Visual Reasoning)
学术界正在尝试将这种“严密的逻辑推理”引入视觉生成范畴。以往的AI绘图往往“手还是画不对”,正是由于缺乏对物理世界的逻辑了解。2024—2025年的技术打破,正是为了处理这个成绩:
一致多模态生成的新范式(Liquid模型): 2024年12月,字节跳动等机构提出的Liquid模型,初次尝试将“视觉”和“言语”完全一致。它让AI像了解代码一样了解图像token。这意味着,AI在生成视频时,能更好地了解物体之间的互动逻辑,减少了画面的崩坏和干扰。
视觉自回归建模(VAR): 获得NeurIPS 2024 最佳论文奖的VAR模型,提出了一种“从全体到细节”的生成方式。这证明了GPT式的自回归模型在图像生成上也能超越分散模型,为视觉模型提供了Scale Up(做大做强)的实际基础。
分散模型与自回归的交融(DiffusionVL): 2025年1月,华中科技大学提出的DiffusionVL,证明了可以将推理才能强的自回归模型,经过微调转换为视觉生成模型。这完成了功能与效率的双赢——既有推理模型的逻辑脑,又有分散模型的艺术手。
1.2.3 算力普惠与运用迸发
DeepSeek-R1经过混合专家 (MoE)架构,将成本紧缩到OpenAI同类模型的几分之一。这种算力普惠使得中小微文创企业也能用得起顶级模型,推进了AIGC在剧本、NPC、音乐等范畴的疾速落地。
1.3
技术演进工夫轴
为了更直观地展现2023-2025年间AIGC技术的关键演进,下表梳理了代表性模型/事情及其关键技术特征和对文明产业的影响。
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
中国力气的崛起
DeepSeek与国产大模型方阵
在2023年至2024年间,中国AI产业一度面临算力芯片受限的严峻应战。但是,这种外部压力倒逼出了极致的算法创新。以杭州深度求索(DeepSeek)为代表的中国AI公司,走出了另一条技术途径。
2.1
DeepSeek的技术包围与产业意义
DeepSeek在2025年终发布的R1模型及V3版本,不只在呼应方式和推理才能上对标 OpenAI的o1系列,但更重要的是其极致的成本控制。经过混合专家架构 (Mixture-of-Experts,MoE)和多头潜在留意力机制 (MLA),DeepSeek将训练成本和推理成本紧缩到了竞争对手的几分之一 。
开源生态的成功:DeepSeek采取了相似Meta Llama的开源策略(MIT协议),这使得大量中国文明科技公司可以基于其基座模型停止垂直范畴的微调(Fine-tuning)。例如,阅文集团可以基于此训练懂“网文梗”的写作模型,游戏公司可以训练懂“金庸武侠”的NPC对话模型。
打破算力封锁:虽然面临英伟达高端芯片(H100/H800)的出口管制,DeepSeek经过算法优化和软硬件协同,证明了在受限算力下依然可以训练出世界级模型。这一成就极大地提振了中国文明产业在智能化转型中的“技术自信”。
2.2
国产大模型的多样化格局
除了DeepSeek,2025年的中国AI版图呈现出百花齐放的态势:
Kimi(月之暗面):在长上下文处理上保持优势,成为学术研讨和材料整理的首选工具。
(, 下载次数: 0)
上传
点击文件名下载附件
月之暗面Kimi,图源于网络
混元(腾讯):腾讯的AI模型正在整合进其运用中,如微信与QQ等腾讯内容生态,赋能泛文娱社交与内容分发。
(, 下载次数: 0)
上传
点击文件名下载附件
腾讯混元,图源于网络
通义千问(阿里):在电商文案与图像生成范畴展现出弱小的商业落地才能,将多模态生成技术深度融入实践业务流程,推进电商内容创作从人工驱动向智能化、自动化转型。
(, 下载次数: 0)
上传
点击文件名下载附件
阿里通义千问,图源于网络
这一自主可控的模型生态,为2026年中国文明产业的片面增长奠定了坚实的“数字底座”。
(, 下载次数: 0)
上传
点击文件名下载附件
学术前沿
推进AIGC 跨越式发展的关键研讨
2023—2025年,国际学术界在生成式AI范畴获得了一系列打破性停顿,为AIGC技术的演进提供了坚实的实际基础和实验支撑。以下精选了部分具有代表性的研讨成果:
3.1
分散模型与自回归模型的交融
DiffusionVL(2025):华中科技大学提出的将恣意自回归模型转换为分散视觉言语模型的方法,经过简单的分散微调完成了功能的飞跃,在多模态基准上达到SOTA程度。
Scaling Diffusion Language Models(2024):Shansan Gong等人的研讨系统讨论了分散言语模型的Scaling特性,发如今数据受限条件下,分散 模型优于自回归模型,为资源受限环境提供了新的生成范式。
3.2
一致多模态生成的新范式
Liquid(2024):字节跳动等结合提出的一致多模态生成器,初次将言语模型作为多模态生成器,经过共享特征空间完成视觉与言语的无缝交融,分明降低了模型复杂度并提高了功能。
3.3
视觉自回归建模的新打破
FoundationVision/VAR(2024): 获得NeurIPS2024最佳论文奖的视觉自回归建模方法,重新定义了图像生成的自回归学习方式,初次证明了GPT风格自回归模型在图像生成上可以超越分散模型,并发现了视觉生成中的 Scaling Laws。
3.4
分散模型在视觉生成中的运用
Masked Diffusion Models(2024):Liu 等人的研讨系统比较了分散模型与自回归模型在数据受限条件下的功能,表明分散模型在图像生成义务上具有分明优势,为在有限数据条件下部署AIGC提供了新思绪。
3.5
其他重要研讨
此外,还有许多研讨在AIGC的不同方向上获得了停顿,例如Efficient Training of Language Models to Fill in the Middle (2022)经过在模型中插入“填充”token来加速训练,提高了模型的推理效率。这些研讨成果共同推进了AIGC 技术的边界不断扩展。
(, 下载次数: 0)
上传
点击文件名下载附件
小结
综上所述,2023—2025年是AIGC技术从“质变”到“质变”的关键时期。在全球范围内,以OpenAI、Anthropic、Google 等为代表的科技巨头推进了多模态大模型的发展;在中国,以DeepSeek为代表的团队经过算法创新和开源生态,打破了算力封锁,完成了低成本高功能模型的打破。与此同时,国际学术界在分散模型、自回归模型、一致多模态生成等范畴的研讨成果,为 AIGC技术的演进提供了坚实的实际基础和实验支撑。标志着AIGC正式从“玩具”变成了文明产业的“消费工具”。
(, 下载次数: 0)
上传
点击文件名下载附件
关于我们
(, 下载次数: 0)
上传
点击文件名下载附件
北京大学信息技术高等研讨院数字创意实验室(PKU DCL)是设立在北京大学信息技术高等研讨院数字经济研讨中心的重点实验室,以前沿交叉为特征、以实际实际为导向。实验室由国家“万人计划”哲社科领军人才、北京大学艺术学院教授、北京大学文明产业研讨院院长向勇担任主任。
(, 下载次数: 0)
上传
点击文件名下载附件
报告收费获取方式
本报告曾经面向公众收费发布。若您希望获取残缺PDF版本,请按以下步骤操作:
关注本公众号
在首页对话框回复关键词“2026AI赋能文明产业报告”,系统自动推送百度网盘下载链接
留意:关键词输入需完全分歧,否则系统无法正确婚配
END
(, 下载次数: 0)
上传
点击文件名下载附件
求点赞
(, 下载次数: 0)
上传
点击文件名下载附件
求分享
(, 下载次数: 0)
上传
点击文件名下载附件
求喜欢
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5