Workflow
最新消息:阿里巴巴三步走战略替代英伟达的,追加寒武纪GPU至15万片

新一代AI芯片开发 - 公司正在开发新一代AI芯片 聚焦多功能推理场景 核心目标是填补英伟达H20退出后的市场空白[1] - 芯片采用国产14nm或更先进制程 由长江存储等本土代工厂支持 通过异构计算架构集成高密度计算单元和大容量内存[1] - 预计LPDDR5X带宽超1TB/s 单卡算力目标达到300-400TOPS(INT8) 与H20约300TOPS基本持平[1] 技术优势与兼容性 - 芯片核心优势在于全场景兼容性 支持FP8/FP16混合精度计算 通过动态指令翻译层实现与CUDA生态无缝对接[3] - 工程师可直接复用现有代码 迁移成本降低70%以上[3] - 阿里云已在通义千问大模型推理环节部署寒武纪思元370芯片 通过MagicMind工具链实现模型转换效率提升3倍[3] 供应链与产能布局 - 公司紧急追加寒武纪思元370订单至15万片 该芯片基于7nm工艺采用Chiplet技术 集成390亿晶体管[5] - 实测算力达300TOPS(INT8) 在ResNet-50等典型模型性能与H20持平 能效比提升40%[5] - 采用双代工厂备份策略:中芯国际14nm产线良率稳定在95%以上 月产能达5万片[6] - 与华虹半导体合作开发7nm工艺 预计2026年量产 目标算力突破500TOPS 能效比提升30%[8] 存储技术突破 - 与长江存储合作研发基于国产制程的AI芯片 重点突破存储瓶颈[5] - 长江存储294层3D NAND技术实现20GB/mm²存储密度和7000MB/s读写速度 较上一代提升40%[5] - 使AI芯片本地存储容量扩大至128GB 减少对外部存储依赖[5] 市场应用进展 - 截至2025年Q2 思元370已覆盖阿里云60%的推理需求[5] - 通过PCIe 5.0接口实现多卡互联 支撑通义千问用户增长[5] 技术发展路线图 - 短期2025-2026:聚焦7nm/14nm工艺推理芯片 通过兼容生态快速抢占市场份额[10] - 中期2027-2028:推出4nm工艺训练芯片 支持千卡级集群互联 目标算力达1EFLOPS 对标英伟达H100[10] - 长期2030后:探索光子计算和存算一体等颠覆性技术[10] - 阿里云已发布全球首款商用光子AI芯片 速度较GPU提升1000倍 功耗降低90%[10] 战略意义与行业影响 - 公司国产算力突围本质是技术攻坚与生态重构双重战役 通过兼容-替代-超越三步走策略打破英伟达垄断格局[11] - 与寒武纪和长江存储等产业链伙伴深度协同 对RISC-V和光子计算等前沿技术布局 为中国AI芯片自主可控提供可行路径[11] - 未来两年是关键窗口期 若2026年前实现4nm训练芯片量产 有望在全球算力竞争中占据更主动地位[11]