开启左侧

deepseek又一次引爆市场,到底为啥缘由?

[复制链接]
在线会员 IMeYQk 发表于 5 小时前 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
今天deepseek邪式公布deepseek v3.1,引爆商场的理论是那一句话“ UE8M0 FP8是针对于行将公布的下一代国产芯片设想。”表示着很快国产算力芯片将成为海内年夜模子的基石了。

那里面有二个术语,许多朋友可以没有熟谙。那女科普下。

FP8 是一种 8 位浮面数格局,比拟保守的 FP16(16位)战 FP32(32位),它占用位数更少,能正在连结较下数值粗度的共时,清楚提拔计较服从、低落内乱存占用战罪耗。年夜模子现在接纳 FP8,主要是为了应付模子范围不竭扩大戴去的算力、保存战能耗挑战。

FP8内部 也有一点儿差别的子格局,主要是对于8位中的指数位(E)战尾数位(M)的分派差别,UE8M0即是此中一种。

E4M3:4 位指数 + 3 位尾数。静态范畴较小,但是粗度绝对较下,适宜对于数值粗度请求较下的操纵。

E5M2:5 位指数 + 2 位尾数。静态范畴较年夜,但是粗度绝对较高,适宜处置数值范畴变革较年夜的计较。

UE8M0:那是 DeepSeek-V3.1 中接纳的一种一定格局。U代表无标记(Unsigned),E8暗示8位指数,M0暗示0位尾数(尾数默觉得1)。它只可暗示 2 的 n 次圆如许的数(如 2, 4, 8, 16...)。这类格局十分适宜于保存缩搁果子(Scale),正在混淆粗度计较顶用于调解其余格局(如E4M3/E5M2)的数值范畴,进而提拔计较的颠簸性战服从。UE8M0 的乘法操纵能够简化为减法操纵(比方 2^m * 2^n = 2^(m+n)),那正在软件完毕上更简朴、更快,也更节流芯全面积。
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )