Workflow
DeepSeek昨天悄悄扔的炸弹,今天爆了
虎嗅APP·2025-08-22 21:24

文章核心观点 - DeepSeek发布V3 1并补充UE8M0 FP8技术细节 引发资本市场强烈反应 算力与芯片板块大涨 反映国产芯片在算力赛道切入国际前沿的可能性 [5][6][15] - UE8M0 FP8格式通过创新数据压缩与动态范围管理 显著提升国产芯片在AI大模型训练与推理中的性能 降低对显存带宽的依赖 并减少75%带宽开销 [8][11][12] - 该技术突破被视为国产算力产业链的共振时刻 标志软硬件协同成果显现 为国产芯片生态提供差异化竞争力 并逐步减少对英伟达的依赖 [6][13][15] 技术解析:UE8M0 FP8 - FP8是一种8位浮点格式 用于压缩数据以减少AI大模型对显存带宽的压力 但国产芯片此前仅少数支持FP8 多数支持FP16导致性能折损一半 [8] - UE8M0是MX格式中的关键缩放因子 采用无符号8位指数表示法 无尾数设计 实现"只调档位不调微刻度"的高效数据管理 动态范围达2⁻¹²⁷至2¹²⁸ [10][11] - 该格式硬件执行简单 仅需整数次幂运算 避免复杂浮点操作 提升能效并几乎消除数值溢出或信息损失问题 错误率大幅降低 [11] - 相较于传统32位FP32缩放因子 UE8M0仅追加8位即可管理32个FP8数据 带宽开销降低75% 对HBM带宽受限的国产芯片至关重要 [12] 产业影响与市场反应 - DeepSeek官方表态触发A股市场超2800只个股上涨 算力股全线爆发 云天励飞等多股涨停 芯片股寒武纪涨停创历史新高 中芯国际大涨14% 海光信息涨停 [6] - 技术突破被视为国产芯片与国际前沿接轨的信号 头部国产芯片公司如摩尔线程 寒武纪等均已支持FP8 思元590及690系列均兼容 [13][14] - 摩尔线程MUSA架构原生支持硬件FP8张量加速 结合UE8M0 FP8 Scale可实现相对于FP16两倍的浮点算力提升 带宽效率及存储容量利用率优化 [14] - DeepSeek主动推动国产芯片生态发展 通过编译器优化 训练框架适配等全栈打通 实现渐进式对英伟达的生态解绑 [13][15]