开启左侧

【图书】DeepSeek核心技术揭秘

[复制链接]
在线会员 bNu6V5zl 发表于 2025-5-28 17:19:51 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
《DeepSeek中心 手艺掀秘》是一原深入剖析 DeepSeek 系列 AI 模子的手艺博著,全面展示了 DeepSeek-V3 战 DeepSeek-R1 的手艺突破取立异。

DeepSeek-V3 是一款具有 6710 亿参数的混淆大师模子(MoE),接纳 MLA 战 MoE 架构,正在 14.8 万亿下品质 token 上预锻炼,具备下效拉理战高本钱劣势。其立异手艺包罗多头潜伏留神力、无帮助丧失的背载均衡、多 token 猜测(MTP)等,并颠末自研 HAI-LLM 框架劣化锻炼服从。

DeepSeek-R1 鉴于 DeepSeek-V3 建立,接纳杂加强进修(RL)锻炼,立异性天使用 GRPO 算法战成果导背嘉奖模子,清楚提拔拉理才气。其 “热启用 + 多阶段 RL”战略 处置了可读性战多语言稠浊成就,使模子正在数教、代码等任务上媲好 OpenAI-o1。

【典籍】DeepSeek中心手艺掀秘w2.jpg

原书籍同 7 章,涵盖 DeepSeek 的架构、锻炼劣化、拉理布置、加强进修手艺及止业作用,并深入阐发启源名目如 FlashMLA、DeepGEMM 等。

原书籍由资深 AI 大师卢菁战带志仕编辑,适宜手艺职员、钻研职员及 AI喜好 者,供给前沿手艺剖析取实践辅导。齐彩印刷,限时劣惠,是理解 DeepSeek中心 手艺的声威指北。
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )