DeepSeek V3.1发布及UE8M0 FP8技术影响 - DeepSeek V3.1发布提及"新的架构、下一代国产芯片",引发市场广泛关注 [2] - 国产芯片企业股价显著上涨,寒武纪早盘大涨近14%,总市值跃居科创板首位 [4] - 半导体ETF在半天内大涨5.89% [4] UE8M0 FP8技术解析 - UE8M0 FP8是MXFP8格式中的缩放因子,MXFP8由Open Compute Project在2023年定义,是一种8位微缩块格式 [7] - MXFP8将张量切分为固定长度的块,每个块单独指定2的整数次幂作为缩放因子,扩展动态范围数十倍 [8] - UE8M0表示无符号、8位指数位、0位尾数位,动态范围覆盖2^(−127)到2^128 [11][15] - 该格式无需浮点乘法或规格化逻辑,缩短时钟关键路径,减少信息损失 [15] - 相比传统FP32缩放,UE8M0 FP8节省75%流量 [18] 国产芯片厂商适配及市场反应 - 寒武纪MLU370-S4、思元590及690系列芯片支持FP8计算,架构设计和低精度优化领先 [22] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU、摩尔线程MTT S5000均支持FP8精度 [26] - 华为昇腾路线图显示2025Q4支持原生FP8,下一代芯片可能于2026年推出 [23] - 国产芯片概念集体高开,科创50大涨3%创近三年半新高 [24] 行业影响及生态协同 - UE8M0 FP8提升国产芯片性价比,同等硬件可运行更大模型,减少对英伟达、AMD等国外算力依赖 [27] - DeepSeek通过精度格式改动主动贴合国产芯片性能点,推动软硬协同生态建设 [28] - 这种模式类似"Wintel联盟",通过技术绑定构建生态护城河 [28]
DeepSeek V3.1 专为国产芯片设计的 UE8M0 FP8 到底是什么?