分布式新核心方案5.5

搜索文档
华为宣布 AI 推理技术重大突破 有望彻底摆脱 HBM 依赖
是说芯语· 2025-08-10 10:30
华为AI推理技术突破 - 公司将于8月12日发布AI推理领域突破性技术成果 通过创新架构设计与存储技术融合降低对HBM依赖 提升国产AI大模型推理性能 [1] - 新技术涉及"硬件重构+软件智能"深度协同 可能通过超节点级联构建"超级AI服务器" 结合纳秒级通信网络和智能调度系统实现全维度优化 [4] - 华为云CloudMatrix384昇腾AI云服务已验证类似技术路径 单卡Decode吞吐突破1920 Tokens/s KV Cache传输带宽提升10倍 输出每个Token时延降至50ms [4] 行业现状与痛点 - 全球AI推理需求爆发式增长 高端AI服务器对HBM依赖度高达90%以上 但全球HBM产能被SK海力士、三星等垄断 国产替代率不足5% [3] - HBM垄断推高大模型训练和推理成本 阻碍中国在金融、医疗、工业等关键领域AI落地进程 [3] - 当前主流HBM3带宽超819GB/s 短期内难以被完全替代 [5] 技术细节与积累 - EMS弹性内存存储服务实现显存扩展、算力卸载、以存代算三大功能 使盘古大模型5.0的NPU部署数量降低50% 推理首Token时延降低80% [4] - 结合昇腾与鲲鹏算力深度协同 在MoE训练中实现吞吐提升20%、内存节省70% [4] - 分布式新核心方案5.5支撑超75%的大行和股份制银行核心转型 [5] 金融行业应用前景 - 金融行业将成为技术落地首站 已形成成熟AI布局体系 [5] - 智能体技术推动风控、审计等场景从单点智能向多体智能跃迁 与科大讯飞合作实现MoE模型推理吞吐提升3.2倍 端到端时延降低50% [5] - 新技术可支持高频交易毫秒级决策 支撑智能客服千万级用户实时交互 [5] - 与中国电信合作的AI智能体项目使故障处理时长缩短30% 无线网络优化任务大模型让用户体验提升10%-15% [5] 行业影响 - 技术突破可能重塑全球AI芯片竞争格局 推动从"硬件堆砌"转向"架构创新" [3][5] - 若找到性能与成本平衡点 可能打破"唯HBM论"产业惯性 [5]