Workflow
AI芯片峰会速递(1):昇腾全面开源与软硬协同战略亮相,生态加速与产业机遇显著提升
海通国际证券·2025-09-17 22:32

行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3][4] 核心观点 - 华为昇腾生态战略从"以硬件为中心"转向"软硬一体、全面开源" 明确 CANN 软件栈分层解耦与开放的演进路线 [1] - 昇腾软件生态全面覆盖 PyTorch/TensorFlow 等主流 AI 框架、GE 图引擎、HCCL 通信库、Ascend C 算子编程语言、毕昇编译器、Runtime/Driver 及 MindStudio 全链路工具 [1] - 华为与 DeepSeek 合作展示软硬协同优化成果 包括算子融合、通信-计算融合技术以及 MoE 双流并行架构等重要实践 [1] - AI 加速领域竞争焦点已从单芯片峰值算力转向端到端可用性 具体体现于算子库完备程度、编译器自动并行与 Layout 优化能力、通信与计算间高效流水协同等方面 [2] - 数据搬移已成为 AI 计算效能的核心瓶颈 通过算子融合、图调度层级流水重构及系统协同能有效提升理论峰值算力转化为实际可用吞吐量 特定场景下性能收益约10% [2][10] - 华为采取"高端立标、中高端走量"的差异化商业策略 通过"算子库→CANN 全栈→上市即开源"节奏降低开发者生态参与门槛 [3] - 当前处于关键发展窗口期 中美资本持续加码 AI 算力基础设施 竞争围绕"模型规模与结构创新"双重维度展开 [4][12] 战略转型与生态建设 - 昇腾明确"软件优先"核心战略 是对标并挑战 CUDA 生态体系的必然路径 [2][9] - 开源策略体现"开放代码、促进应用、保障稳定"三大要素 但成功取决于高质量文档、典型用例、性能基准、快速问题响应机制及清晰许可证体系等综合支持能力 [3][11] - 若能提供与 PyTorch 等主流框架深度耦合的原生后端支持、覆盖典型分布式训练与推理场景的完整样例及可复现实验脚本 将有望大幅缩小与 CUDA 生态在"可复用工程经验"方面的差距 [3][11] 技术优化与性能提升 - 通过算子融合(如前后处理操作合并)、图调度层级流水重构 并结合 HCCL 通信库、图引擎及 Runtime 的系统协同 能有效提升整体计算效率 [2][10] - 当前真正挑战在于优化需具备跨网络结构和动态输入形状的泛化能力 将特定场景下约10%性能收益转化为无需手工干预、普遍适用的底层库能力 [2][10] - 华为展示与 DeepSeek 合作的软硬协同优化成果 包括算子融合、通信-计算融合技术以及 MoE 双流并行架构等重要实践 [1] 产业发展与投资建议 - 建议国内开发者在昇腾生态 9 月 30 日及 12 月 30 日两个重要节点后 尽快开展针对主力工作负载(如 MoE、RAG、多模态视觉、MLA 推理等)的概念验证(PoC) [4][12] - 重点评估实际运行效率、系统稳定性及迁移成本 同时高度重视编译器前端接口、算子语义一致性以及通信库 API 的长期兼容性策略 [4][12] - 中美资本正持续加码 AI 算力基础设施 新一轮竞争围绕"模型规模与结构创新"双重维度展开 [4][12]