CUDA - X软件栈 - 财报，业绩电话会，研报，新闻

CUDA - X软件栈

搜索文档

半导体行业观察· 2026-02-27 10:19

公司自研芯片战略与挑战 - Meta公司内部自研AI训练芯片项目屡次受挫，已放弃代号为Iris的第二代训练芯片和更先进的代号为Olympus的训练芯片[2] - 放弃Olympus芯片的原因在于，高管认为在与OpenAI和Google竞争时，使用自研芯片训练新模型存在重大风险，包括软件稳定性不如英伟达产品以及复杂设计难以大规模生产[2] - 作为替代方案，Meta已与谷歌签订一项价值数十亿美元的协议，租用谷歌的AI芯片（张量处理单元TPU）来开发新AI模型，此举将加剧谷歌与英伟达的芯片竞争[2] 公司自研芯片的财务与技术动因 - 公司自研芯片是旨在克服现成AI加速器在技术和财务方面局限性的深思熟虑战略[4] - 从财务角度看，鉴于公司预计2025年收入约为1900亿至2000亿美元，资本支出约为660亿至720亿美元（按中值计算约占总收入的61%），即使基础设施成本降低几个百分点也能对盈利能力产生重大影响[4] - 公司希望跳过Arm架构，直接采用开源但尚未成为主流的RISC-V架构来构建其未来的计算引擎[5] - 公司于2020年开始定制芯片研发，并于2023年5月推出第一代Meta训练和推理加速器（MTIA）v1，该芯片只能进行推理，不能进行训练[5] - 研发MTIA芯片的原因是GPU并非总能以其所需的效率水平高效运行公司的特定推荐工作负载，因此设计了一系列专用于推荐的ASIC芯片[5] MTIA推理芯片的技术演进 - MTIA v1是包含芯片、PyTorch和推荐模型在内的全栈协同设计解决方案，采用台积电7nm工艺制造，运行频率800 MHz，在INT8精度下可提供102.4 TOPS运算能力，在FP16精度下可提供51.2 TFLOPS运算能力，热设计功耗为25 W[6] - 2024年4月，公司发布了性能大幅提升的MTIA v2，其推理能力有所提高，但仍无法进行训练[6] - MTIA v2采用台积电5nm工艺制造，时钟频率提升68.8%至1.35 GHz，芯片面积从v1的373平方毫米增大12.9%至421平方毫米，功耗增加了2.6倍达到90瓦[7] - 在矩阵运算中增加了稀疏性支持，性能提升了近7倍，矢量核心上的SIMD操作性能提高了72.5%[7] - 两代芯片均采用基于RISC-V内核的处理单元阵列，由负责标量运算和向量运算的两个内核组成[9] 通过收购Rivos增强芯片能力 - 2025年10月，Meta收购了人工智能芯片初创公司Rivos[11] - Rivos成立于2021年9月，创始团队拥有丰富的芯片设计行业经验，来自苹果、博通、高通、英特尔等公司[12] - Rivos成功流片了3.1 GHz处理器，并构建了兼容英伟达CUDA的软件栈，使得为NVIDIA生态系统开发的AI工作负载能够在RISC-V硬件上无缝运行[13] - Rivos的设计为从模型训练到推理等一系列工作负载提供了可扩展性和能效，其架构通过最大限度地减少外部数据传输和降低功耗来消除计算和内存资源之间的不平衡[13] - Rivos提供的芯片结合了高性能服务器级RISC-V CPU和针对大型语言模型优化的数据并行加速器，CPU与并行计算紧密集成，并在DDR DRAM和HBM上共享统一内存[13] - 通过此次收购，Meta将获得一支能够制造高端RISC-V芯片的团队，这些芯片可根据其AI工作负载进行定制[14] 公司多元化的外部芯片采购策略 - 公司近期与英伟达达成了数百万颗GPU的交易，并与AMD达成了6吉瓦的GPU交易[16][17] - 通过与英伟达和AMD两大巨头的合作，公司在未来的算力竞争中获得了更多筹码，并分担了风险[17] - 谷歌已成功证明其Gemini 3和4模型几乎完全（95-100%）在内部TPU上进行训练，英伟达GPU仅处理该工作负载的0-5%，对于搜索和YouTube等内部推理任务，TPU处理约85-90%的业务量[18] - 谷歌正计划推出TPU即服务模式，作为GPU的可行替代方案[18] - Meta与谷歌洽谈购买TPU的协议，对谷歌而言是一项胜利，有助于其打造数十亿美元的TPU销售业务，同时对主导AI芯片市场的英伟达构成威胁[18] - 谷歌还与一家未透露名称的大型投资公司签署协议，为一家向其他客户租赁TPU的合资企业提供资金，并正在与其他投资公司洽谈资助其他类似合资企业[19]

Meta Platforms(US:META)