Workflow
CUDA - X
icon
搜索文档
突发,Meta放弃一颗自研芯片,拥抱谷歌TPU
36氪· 2026-02-27 09:53
Meta定制芯片战略与研发历程 - 公司进军定制芯片领域是旨在克服现成AI加速器在技术和财务方面局限性的战略 财务上 预计2025年研发投入约500亿美元 资本支出约660亿至720亿美元 收入约1900亿至2000亿美元 资本支出约占总收入的61% 因此基础设施成本降低几个百分点也能对盈利能力产生重大影响[2] - 公司希望采用开源RISC-V架构来构建其未来的计算引擎 跳过可授权但闭源的Arm架构[2] - 公司于2020年开始定制芯片研发 并于2023年5月推出第一代Meta训练和推理加速器 但该芯片仅能进行推理 不能进行训练[3] MTIA芯片技术规格与迭代 - MTIA v1芯片采用台积电7nm工艺 运行频率800 MHz 在INT8精度下提供102.4 TOPS运算能力 在FP16精度下提供51.2 TFLOPS运算能力 热设计功耗为25W[4] - MTIA v2芯片于2024年4月发布 采用5nm工艺 时钟频率提升68.8%至1.35 GHz 芯片面积增大12.9%至421平方毫米 功耗增加2.6倍至90瓦 矩阵运算性能提升近7倍[5] - MTIA v1芯片面积为373平方毫米 MTIA v2芯片面积为421平方毫米[5] - 两款芯片均采用基于RISC-V内核的处理单元阵列 由负责标量运算和向量运算的两个内核组成 MTIA v2部署规模更为庞大[9] 训练芯片研发受阻与外部合作 - 公司放弃了一款内部代号为Iris的第二代训练芯片 之后开始研发更先进的代号为Olympus的训练芯片 但该芯片也已被放弃[1] - 放弃Olympus芯片的原因是高管认为在与OpenAI和Google竞争之际 自研芯片的软件稳定性不如英伟达产品 且复杂设计可能导致难以大规模生产 会给新模型训练带来重大风险[1] - 公司已与谷歌签订一项价值数十亿美元的协议 租用谷歌的AI芯片来开发新的AI模型[1] - 公司近期与英伟达达成了数百万颗GPU的交易 并与AMD达成了6吉瓦的GPU交易[17] 收购Rivos以增强芯片能力 - 2025年10月 公司收购了人工智能芯片初创公司Rivos[12] - Rivos成功流片了3.1 GHz处理器 并构建了兼容CUDA的软件栈 使得为英伟达生态系统开发的AI工作负载能在RISC-V硬件上运行[14] - Rivos的设计为从模型训练到推理等工作负载提供可扩展性和能效 其架构旨在消除计算和内存资源之间的不平衡[15] - 通过收购 公司将获得一支能制造高端定制RISC-V芯片的团队[16] 行业竞争格局与影响 - 公司与谷歌的TPU协议 加剧了谷歌和英伟达在AI芯片领域的竞争[1] - 谷歌已证明其Gemini 3和4模型几乎完全在内部TPU上进行训练 英伟达GPU仅处理该工作负载的0-5% 在搜索和YouTube等推理任务中 TPU处理约85-90%的业务量[18] - 谷歌计划推出TPU即服务模式 作为GPU的替代方案 并与一家大型投资公司签署协议为租赁TPU的合资企业提供资金[19] - 谷歌与公司的合作为其TPU销售业务增添了知名客户 对英伟达在AI芯片市场的主导地位构成威胁[19]