Workflow
FP4精度
icon
搜索文档
V3.1适配了国产FP8 精度芯片
小熊跑的快· 2025-08-22 09:12
技术突破 - DeepSeek R1成功源于采用FP8数据格式的细粒度混合精度框架 大部分计算密集型操作在FP8精度下进行 少数关键操作保持原始数据格式 [1] - 国产芯片适配FP8后 效率损失从37%显著改善 降本优势惠及国产卡 [1] 行业趋势 - 国内下一代多家芯片厂商支持原生FP8 大模型基于FP8精度进行工程优化降本 [2] - 国产软硬件协同进步 推动低成本解决方案走向全球市场 [2][3] 竞争格局 - 英伟达GPU此前因CUDA优化及FP16适配占据优势 国产卡需升级至FP16导致效率损失37% [1] - 英伟达计划下放精度至FP4 国内厂商则聚焦FP8原生支持 形成差异化技术路径 [2]