开启左侧

DeepSeek致谢腾讯技术团队:这是一次“宏大的加速”代码贡献!

[复制链接]
在线会员 BacQ 发表于 18 小时前 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
快科技5月7日消息,DeepSeek称谢腾讯手艺团队,那是一次“弘大的加快”代码奉献。

据新浪报导,腾讯手艺团队针对于DeepSeek启源的DeepEP通信框架截至深度劣化,使其正在多种收集情况下均完毕清楚功用提拔。

经尝试,劣化后的通信框架功用正在RoCE收集情况提拔100%,IB收集情况提拔30%,为企业睁开AI年夜模子锻炼供给更下效的处置计划。

该手艺计划得到了DeepSeek公然称谢,称那是一次“huge speedup(弘大的加快)”代码奉献。

据理解,自今年2月DeepSeek启源包罗DeepEP正在内乱的五年夜代码库此后,该团队就背业界展示了怎样使用无限的软件资本完毕靠近万卡散群的功用。

正在那些手艺中,DeepEP凭仗突破性的办法提拔了300%的通信服从,胜利处置了MoE架构年夜模子对于英伟达NCCL的依靠成就。但是该手艺正在本钱较高、合用里更广的RoCE收集情况中表示欠安,限定了其正在更普遍场景的使用。那一痛面激发了启源社区的连续会商。

据悉,腾讯星脉收集团队正在DeepEP启源后就睁开手艺攻闭,发明二年夜枢纽瓶颈:一是关于单端心网卡戴严使用率不敷,两是CPU掌握里接互存留时延。

正在腾讯的手艺劣化下,DeepEP不但正在RoCE收集完毕功用翻倍,反哺到IB(InfiniBand)收集时更使本有通信服从再提拔30%。

今朝,该手艺已经全面启源,并胜利使用于腾讯混元年夜模子等名目的锻炼拉理,正在腾讯星脉取H20效劳器建立的下功用情况中,那套计划展示出超卓的通用性。

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )