Meta自研训练芯片要来了,集成RISC-V内核
Meta自研AI训练芯片进展 - 公司几年前已开始研发基于RISC-V架构的AI推理芯片以降低成本并减少对Nvidia依赖 现进一步设计出首款AI训练加速器 可能由博通协助开发 若成功将降低对Nvidia高端GPU(如H100/H200/B100/B200)的依赖[1] - 该芯片已与台积电合作完成首批样品生产并成功推出 目前处于有限部署阶段以评估性能 尚未公开基准测试结果 但确认芯片已投入实际应用[1] - 芯片设计可能采用"脉动阵列"架构 由行列排列的相同处理单元组成 专为矩阵/向量计算优化 预计配备HBM3或HBM3E内存以处理海量训练数据 定制化指令集可优化芯片尺寸、功耗及性能[1] - 性能目标需对标Nvidia最新AI GPU(如H200/B200及下一代B300)的每瓦特效能 公司自主定义数据格式和指令以实现差异化优化[1] MTIA项目历史与现状 - 该芯片属于Meta训练和推理加速器(MTIA)项目 此前项目曾因内部推理处理器未达性能/功耗目标而中止 导致公司2022年转向大规模采购Nvidia GPU[2] - 目前Nvidia GPU支撑公司核心AI业务 包括推荐系统、广告模型及Llama大模型训练 同时处理超30亿日活用户的推理需求 公司已成为Nvidia最大客户之一 采购量达数万台[2] 行业技术动态 - 行业趋势显示头部科技公司正加速自研AI芯片以降低对第三方供应商依赖 Meta的RISC-V架构方案与定制化设计代表这一方向的技术探索[1][2] - 台积电在先进制程上的制造能力成为AI芯片落地的关键环节 本次合作凸显其在高性能计算芯片代工领域的主导地位[1]