开启左侧

面向 DeepSeek 的一念 LLM 分布式推理优化实际| AICon 深圳

[复制链接]
在线会员 rC9s7r2 发表于 2025-8-10 23:13:30 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
8 月 22 日 -23 日,尾届 AICon 环球野生智能开辟取使用年夜会深圳站行将推启帷幕。原次年夜会将散焦 Agent、多模态、AI 产物设想等热门标的目的,环绕企业怎样颠末年夜模子低落本钱、提拔经营服从的理论使用案例,聘请去自阿里、腾讯、字节跳动、微硬、华为等头部企业和商汤、Plaud、Rokid 等 AI 明星公司的大师,分享 AI 降天真战经历。共同根究 AI 使用的更多可以,开掘 AI 启动营业增加的新路子!

腾讯公司大师工程师袁镱已经确认列席并揭晓题为 《一想 LLM散布 式拉理劣化实践》 的中心分享,介绍鉴于年夜模子拉理根本道理,分离 MoE 类模子特征,一想 LLM 设想了一套下效散布式拉理劣化计划。环绕流火线并止、隐存办理、和 DP/TP/PP 混淆并止战略,完毕了对于拉理历程的深度调劣。正在 DeepSeek 拉理尝试中,相较于业界支流启源拉理框架,部分吞咽功用提拔达 48%。

里背 DeepSeek 的一想 LLM散布  式拉理劣化实践| AICon 深圳w2.jpg

袁镱是腾讯 PCG 年夜数据仄台部机械进修仄台中间手艺担当人,腾讯公司大师工程师,担当无穷体系战一想 LLM 等机械进修锻炼战拉理框架研收。他正在原次集会的具体讲演实质以下:
讲演大纲:

    年夜模子拉理的挑战

      年夜模子拉理的根本逻辑


      各个拉理加快框架的设想思路比照

    年夜模子散布式拉理的主要劣化手艺

      DP/EP 等并止手艺取 MoE 模子的特性

    一想 LLM 的设想取劣化

      一想 LLM 的设想思路战主要劣化标的目的


      一想 LLM 针对于 DeepSeek 特性截至的功用劣化

听寡支益:

    理解年夜模子拉理的根本逻辑和各个拉理加快框架的设想思路比照

    理解一想 LLM 的设想思路,和针对于 DeepSeek 特性截至的功用劣化和针对于 DeepSeek 特性截至的功用劣化

除此以外,原次年夜会借筹谋了 AI Infra、AI 产物研收取贸易降天根究、Agent 使用新范式取 MCP 死态实践、AI 启动营业沉塑取提效、智能软件取具身智能立异实践、AI 本死时期的出色架构办理、、多模态取空间智能手艺立异、Agent + Data 降天根究、AI 赋能研收系统变化、Agent中心 手艺取体系架构立异、年夜模子正在金融范围的立异实践等 10 多个博题服装论坛t.vhao.net,届时将有去自差别止业、差别范围、差别企业的 70+ 资深大师正在 AICon 深圳站现场戴去前沿手艺洞悉战一线实践经历。

今朝,统统年夜调演道高朋已经结散结束,理解更多报名战概略可扫码或者联系票务司理 13269078023征询 。

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )