Workflow
DeepSeek的一串“符号”背后:对国产芯片意味着什么?
21世纪经济报道·2025-09-02 21:44

UE8M0 FP8 技术解析 - UE8M0 FP8 是一种无符号、8位指数、0位尾数的浮点参数格式 专为下一代国产芯片设计 [1][3] - 该格式通过牺牲局部精度换取全局稳定 特别适用于Transformer架构的AI大模型训练 能提供与FP32相近的数据范围但计算速度更快 [3] - 相比海外厂商采用的E3M4或E5M2等标准FP8格式 UE8M0 FP8是中国市场定制化方案 可有效降低计算功耗并适配国产芯片规格限制 [4] 国产芯片适配优势 - UE8M0 FP8通过简化计算为指数移位和加法操作 大幅降低算力负荷 弥补国产芯片在7nm及以下先进制程的算力密度短板 [5] - 该格式打破英伟达CUDA生态垄断 为国产芯片提供开源、无厂商绑定的新生态构建机会 [5] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦、燧原等国产AI芯片厂商均表态适配FP8 [8] 应用场景拓展 - 格式特别适用于多模态VLA模型 满足自动驾驶、人形机器人等场景对高效计算和大动态范围的需求 [6] - 在工业质检、政务文档处理等专用场景中 能实现低延迟、高准确率的AI推理 且对成本敏感 [6] - 深度求索通过本地化部署和语料后训练 推动UE8M0 FP8在企事业单位私有化AI应用中的落地 [5] 产业影响与竞争格局 - DeepSeek V3.1发布后 寒武纪8月股价涨幅达110% 引发资本市场对国产算力行业的高度关注 [8] - 深度求索凭借行业地位向芯片厂商输出标准 推动其根据自身生态系统定义芯片设计 [8] - 国产芯片(如寒武纪)在专用场景性能达英伟达H100的80% 但面对Blackwell系列FP4架构及特供中国B30a芯片 仍存在技术追赶空间 [8] 发展前景 - 国内芯片最终成功需依赖性能具备充分竞争优势 [9] - UE8M0 FP8配合混合参数精度 有望成为千行百业"AI+"的更优解决方案 [6]