Workflow
Olympus芯片
icon
搜索文档
Meta(META.US)自研高阶芯片终止 扩大与英伟达、AMD合作
智通财经网· 2026-02-27 21:27
Meta自研AI芯片项目遭遇重大挫折 - 公司内部研发最先进AI模型训练芯片项目已正式终止 转而采用设计更简化的版本 上周已向人工智能基础设施部门员工同步了技术路线调整计划 [1] - 公司放弃使用代号为Iris的第二代训练芯片版本 随后启动研发的更先进训练芯片Olympus项目也已终止 [2] 自研芯片的战略初衷与当前困境 - 公司自研AI芯片隶属于MTIA项目体系 核心目标在于通过垂直整合芯片设计能力降低长期运营成本 并强化对数据中心基础设施的自主可控性 [2] - 公司内部对开发能与英伟达芯片性能匹敌的计划普遍持谨慎态度 主要担忧在于项目存在延期或需要重新设计的风险 [2] - Olympus芯片的复杂设计可能阻碍其大规模量产 且配套训练软件在稳定性上无法与英伟达产品相媲美 [4] 技术路线选择与面临的挑战 - 被放弃的Iris训练芯片采用单指令多数据(SIMD)计算架构 该架构对硬件工程师设计门槛较低 但软件工程师在训练模型时面临显著编程挑战 [3] - 原计划的Olympus芯片采用与英伟达同源的单指令多线程(SIMT)架构 这种架构便于软件工程师编程 但对硬件设计提出更高技术要求 [3] - Olympus中负责AI计算的GPU原计划采用被收购芯片初创公司Rivos的设计方案 Rivos曾宣称其GPU能够高效运行英伟达的CUDA软件代码 [3] 项目时间线与竞争压力 - 公司原计划最早于2026年第四季度完成Olympus芯片设计 但从初步研发到量产通常还需九个月甚至更长时间 意味着实际量产时间可能进一步延后 [3] - 公司高管认为 在急于与OpenAI和谷歌展开竞争的关键时期 利用Olympus构建大型服务器集群的举措可能对训练新模型构成潜在风险 [3] 转向外部合作与供应链多元化 - 公司芯片路线图调整紧随其与AMD、英伟达及Alphabet旗下谷歌达成新合作之后 [1] - 公司已签署价值数十亿美元的协议向谷歌租赁AI芯片 [1] - AMD宣布与公司合作部署高达6吉瓦的AMD Instinct芯片 为其下一代AI基础设施提供算力支持 [1] - 公司本月初与英伟达达成"跨代际"战略合作 承诺在其数据中心大规模部署英伟达芯片 [1] 行业普遍困境与未来计划 - 公司放弃自研芯片的决定 揭示了各公司在试图设计能与市场霸主英伟达抗衡的AI芯片时 所面临的普遍困境 [1] - 公司发言人表示将持续投入构建多元化的芯片供应组合 推进MTIA产品线是重要战略方向 今年内将披露更多关于该产品线的研发进展与落地计划 [2] - 公司当前计划继续采用其他厂商生产的训练芯片 因其配套软件更为成熟可靠 能够更好地支撑AI模型训练需求 [4]
突发,Meta放弃一颗自研芯片,拥抱谷歌TPU
36氪· 2026-02-27 09:53
Meta定制芯片战略与研发历程 - 公司进军定制芯片领域是旨在克服现成AI加速器在技术和财务方面局限性的战略 财务上 预计2025年研发投入约500亿美元 资本支出约660亿至720亿美元 收入约1900亿至2000亿美元 资本支出约占总收入的61% 因此基础设施成本降低几个百分点也能对盈利能力产生重大影响[2] - 公司希望采用开源RISC-V架构来构建其未来的计算引擎 跳过可授权但闭源的Arm架构[2] - 公司于2020年开始定制芯片研发 并于2023年5月推出第一代Meta训练和推理加速器 但该芯片仅能进行推理 不能进行训练[3] MTIA芯片技术规格与迭代 - MTIA v1芯片采用台积电7nm工艺 运行频率800 MHz 在INT8精度下提供102.4 TOPS运算能力 在FP16精度下提供51.2 TFLOPS运算能力 热设计功耗为25W[4] - MTIA v2芯片于2024年4月发布 采用5nm工艺 时钟频率提升68.8%至1.35 GHz 芯片面积增大12.9%至421平方毫米 功耗增加2.6倍至90瓦 矩阵运算性能提升近7倍[5] - MTIA v1芯片面积为373平方毫米 MTIA v2芯片面积为421平方毫米[5] - 两款芯片均采用基于RISC-V内核的处理单元阵列 由负责标量运算和向量运算的两个内核组成 MTIA v2部署规模更为庞大[9] 训练芯片研发受阻与外部合作 - 公司放弃了一款内部代号为Iris的第二代训练芯片 之后开始研发更先进的代号为Olympus的训练芯片 但该芯片也已被放弃[1] - 放弃Olympus芯片的原因是高管认为在与OpenAI和Google竞争之际 自研芯片的软件稳定性不如英伟达产品 且复杂设计可能导致难以大规模生产 会给新模型训练带来重大风险[1] - 公司已与谷歌签订一项价值数十亿美元的协议 租用谷歌的AI芯片来开发新的AI模型[1] - 公司近期与英伟达达成了数百万颗GPU的交易 并与AMD达成了6吉瓦的GPU交易[17] 收购Rivos以增强芯片能力 - 2025年10月 公司收购了人工智能芯片初创公司Rivos[12] - Rivos成功流片了3.1 GHz处理器 并构建了兼容CUDA的软件栈 使得为英伟达生态系统开发的AI工作负载能在RISC-V硬件上运行[14] - Rivos的设计为从模型训练到推理等工作负载提供可扩展性和能效 其架构旨在消除计算和内存资源之间的不平衡[15] - 通过收购 公司将获得一支能制造高端定制RISC-V芯片的团队[16] 行业竞争格局与影响 - 公司与谷歌的TPU协议 加剧了谷歌和英伟达在AI芯片领域的竞争[1] - 谷歌已证明其Gemini 3和4模型几乎完全在内部TPU上进行训练 英伟达GPU仅处理该工作负载的0-5% 在搜索和YouTube等推理任务中 TPU处理约85-90%的业务量[18] - 谷歌计划推出TPU即服务模式 作为GPU的替代方案 并与一家大型投资公司签署协议为租赁TPU的合资企业提供资金[19] - 谷歌与公司的合作为其TPU销售业务增添了知名客户 对英伟达在AI芯片市场的主导地位构成威胁[19]