Workflow
DeepSeek发布的这串符号,对国产芯片意味着什么
21世纪经济报道·2025-09-02 23:36

文章核心观点 - 深度求索公司在新模型DeepSeek V3 1文档中提及的"UE8M0 FP8"参数格式 是针对下一代国产芯片设计的创新计算格式 通过牺牲局部精度换取全局稳定性和计算效率 旨在适配国产芯片硬件短板并构建自主算力生态 引发资本市场对国产芯片行业的高度关注 [2][5][6][9] 技术定义与特性 - "FP8"代表8位浮点计算格式 适用于深度学习等场景 其中"UE8M0"特指无符号 8位指数 0位尾数的参数格式 通过纯指数编码简化计算操作 [5] - UE8M0格式数据范围与FP32相当 但计算速度更快 数值范围优于E5M2等FP8变体 有利于模型训练稳定性 但需以精度牺牲为代价 [6] - 该格式特别适配Transformer架构的AI大模型 因其自注意力机制依赖浮点大量程 实现"牺牲局部精度换取全局稳定" [6] 国产芯片适配逻辑 - 国产芯片在先进制程 算力密度和功耗方面存在短板 UE8M0 FP8通过算法创新降低算力负荷 简化指数移位和加法操作 弥补硬件差距 [9] - 该格式有助于打破英伟达CUDA生态垄断 其开源特性可成为国产芯片重建自主生态体系的关键 [9] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦 燧原等厂商也表态适配 但尚未明确使用UE8M0混合参数模型 [12] 应用场景与优势 - 除大语言模型外 UE8M0 FP8适用于明确定义的专用AI场景 如自动驾驶 人形机器人的多模态VLA模型 需大量程 高稳定性和高效率 [10] - 在工业质检 政务文档处理等低延迟 高准确率且成本敏感的场景中 该格式能发挥高效稳定特点 适配千行百业"AI+"需求 [10] 行业影响与竞争态势 - DeepSeek凭借行业地位向芯片厂商提出标准 推动国产芯片根据其生态系统定义设计 [12] - 国产芯片如寒武纪宣称新品在专用场景能力达英伟达H100的80% 但英伟达Blackwell系列采用FP4混合精度架构 国产芯片追赶仍需时间 [12] - 多数专家认为国产芯片需依靠性能竞争优势才能最终成功 [13]