职贝云数AI新零售门户
标题:
DeepSeek V3.1 引入的UE8M0 FP8为何会将寒武纪推上王座?
[打印本页]
作者:
ebE3N
时间:
昨天 14:06
标题:
DeepSeek V3.1 引入的UE8M0 FP8为何会将寒武纪推上王座?
最近中国的A股市场屡创新高,尤其是一众芯片股将科创50指数爆拉,市场心情之高昂,可见一斑!这其中尤其是寒武纪,股价从800多一路高歌到1500多,短短一周工夫,翻了快一倍,超过茅台成为了中国股市的新股王!这其中缘由如何?这还得从DeepSeek刚发布的V3.1版本中提到的UE8M0 FP8说起。
我们先从UE8M0 FP8说起。那么UE8M0 FP8是什么呢,为何会有如此大的魔力?
UE8M0 FP8是 DeepSeek V3.1 引入的一种专为 AI 计算优化的 8 位浮点数格式,其设计核心是经过牺牲部分数值精度来换取极致的计算效率和存储紧缩,尤其针对国产 AI 芯片的硬件特性停止优化。
详细如下:
FP8:即 8 位浮点数,相比传统的 FP16(16 位)或 FP32(32 位),分明减少了内存占用和计算开支,适用于对精度要求适中但对效率要求极高的 AI 场景。
UE8M0:
U(Unsigned):无符号,仅表示非负数,节省 1 位符号位。
E8(Exponent):8 位全部用于指数部分,提供极大的动态范围(2⁻¹²⁷ 到 2¹²⁸),能同时表示非常大和非常小的数值。
M0(Mantissa):尾数位为 0,即不存储小数部分,数值固定为 2 的整数次幂(如 2、4、8、16 等)。由于尾数固定为 1,硬件只需经过位移操作即可反量化,完全省去了浮点乘法、舍入等复杂逻辑,极大简化了计算途径。
技术意义:
算力密度倍增:在相反芯片面积下,FP8 计算单元数量可达 FP16 的两到三倍。
功耗减半:能耗仅为 FP16 的四分之一。
端侧部署:存储开支降低一半以上,使得大模型在端侧(如手机)部署成为能够。
国产芯片适配:目前国产 AI 芯片普遍采用 FP16/INT8,尚未广泛集成 FP8。UE8M0 FP8 的设计正是为了与下一代国产芯片(如摩尔线程 MTT S500、沐曦 C500 系列等)构成“中国式协同”,推进国产芯片生态发展。
与英伟达 FP8 的区别:
英伟达的 FP8 次要有 E4M3(4 位指数 + 3 位尾数,侧重精度)和 E5M2(5 位指数 + 2 位尾数,侧重动态范围)两种格式。
而 DeepSeek 的 UE8M0 FP8 则完全舍弃尾数和符号位,仅保留 8 位指数,进一步紧缩数据,换取更高的计算效率和更低的功耗,但精度牺牲较大。
总结来说,UE8M0 FP8 是 DeepSeek 为打破算力瓶颈、适配国产芯片而提出的一种极致紧缩、极致高效的 AI 数值格式,代表了国产 AI 生态在“算法换算力”途径上的重要探求。
我们了解了什么是UE8M0 FP8后,下面我们再从以下三条主线拆解为何资本市场如此亢奋!
一、技术线:UE8M0 FP8 把“功能/成本”曲线拉出了代差
极致低精度:8 bit 无符号、无尾数,计算密度≈FP16 的 3×、功耗≈FP16 的 1/4。
带宽瓶颈解除:32 路 FP8 数据共用 1 Byte 缩放因子,显存带宽需求骤降 75%,国产卡最缺的正是带宽而非 raw FLOPS。
软硬协同:DeepSeek 把 UE8M0 FP8 写进官方代码途径,等于给国产芯片做了一次“系统级优化”,把单卡效率一次性抬升 60%–90%。
资本市场把它读成“国产卡一夜之间可跑更大模型”,等同于“需求曲线右移 + 供给曲线大幅下移”,估值双击。
二、产业线:需求真空 + 供应真空,国产替代“双杀”
需求真空:2025 年中国云厂商 CapEx 同比 +119%,大模型训练需求井喷。
供应真空:美对华禁售晋级、英伟达 H20 传停产,高端 GPU 断供预期强化。
政策加码:5000 亿元新型政策性金融工具,点名 AI 基础设备;运营商集采要求国产芯片比例 ≥60%。
寒武纪 MLU、海光 DCU、沐曦 GPU 等“有 FP8 储备”的厂商成为独一可选项,订单能见度瞬间被拉到 2027 年。
三、资金线:从“主题”到“权重”的接力
事情驱动:8 月 21 日晚 DeepSeek 官微留言;22 日收盘半导体 ETF 跳空 +6%,科创 50 指数三年半新高。
权重腾挪:寒武纪流通盘小(流通市值 < 2000 亿元)、机构低配,量化+游资疾速拔估值;随后被动资金因指数调仓被迫追高。
估值重锚:高盛把寒武纪目的价从 1223 元上调 50% 至 1835 元,对应 2026 年 30× EV/Sales,直接打开市值空间。
8 月 27 日盘中股价 1464.98 元,超越贵州茅台成为 A 股“新股王”
DeepSeek V3.1 的 UE8M0 FP8 并不是简单的“代码优化”,而是向资本市场发出了一个明晰的信号——“大模型时代的中国算力底座,将不再由英伟达垄断,而是由寒武纪、海光、沐曦等国产厂商主导。”
技术可行性 + 需求迸发 + 政策护航 + 供应缺口,四重共振下,芯片股大涨、寒武纪封王便瓜熟蒂落。
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5