Workflow
英伟达Vera Rubin芯片
icon
搜索文档
谷歌TPU助力OpenAI砍价三成,英伟达的“王座”要易主了?
36氪· 2025-12-02 16:19
公司战略转变 - 谷歌TPU战略从主要服务内部AI模型转向积极向第三方销售芯片,直接与英伟达竞争 [1] - 公司通过谷歌云平台向外部客户提供TPU,并作为商业供应商销售完整TPU系统,以成为差异化云服务提供商 [2] - 与Anthropic达成的合作是公司外部战略的标志性一步,涉及直接销售硬件和通过云平台租赁两种方式 [2][3] 重要客户与合作 - Anthropic成为谷歌TPU首批重要客户,交易涉及约100万颗TPUv7芯片 [1][3] - 交易分配为:博通直接向Anthropic出售内含40万颗TPUv7芯片的成品机架,价值约100亿美元 [3] - Anthropic还将通过谷歌云平台租用另外60万颗TPUv7芯片,预计产生约420亿美元履约价值,占GCP第三季度新增订单积压490亿美元的大部分 [3] - 谷歌在早期对Anthropic进行了积极投资,并设定了15%的股权上限以扩大TPU外部应用 [2] 技术规格与成本优势 - TPUv7 "Ironwood"在理论算力(FP8 TFLOPs达4,614)和内存带宽(7,380 GB/s)上已接近英伟达Blackwell架构产品 [5][6] - 对谷歌而言,每颗TPU的总拥有成本比英伟达GB200低约44% [6] - 即使对外部客户,每个有效计算单元的成本仍可能比英伟达系统低30%-50% [6] - 谷歌系统支持将9,216颗芯片互联为统一计算域,而英伟达系统通常只能连接64到72颗芯片,在分布式AI训练中更具扩展性 [8] 市场影响与竞争格局 - OpenAI凭借转向TPU或其他替代方案,在与英伟达的谈判中获得了约30%的价格折扣 [1] - TPU已成为顶级AI模型的首选,谷歌Gemini 3 Pro和Anthropic Claude 4.5 Opus主要依托TPU和亚马逊Trainium芯片训练 [4] - 分析预测谷歌云未来几个季度有望与Meta、OpenAI等更多AI巨头达成类似交易 [3] 软件生态与部署模式 - 谷歌正加大投入消除软件兼容性制约,开发对PyTorch框架的原生支持并集成vLLM等推理库,目标是不要求开发者重构整个工具链 [10][12] - 公司采用创新融资模式,与Fluidstack等云服务商及TeraWulf等加密矿企合作,谷歌常担任财务保障角色以快速转型现有设施为AI算力设施 [12] 未来竞争与风险 - 英伟达正筹备在2026到2027年推出"Vera Rubin"芯片,采用HBM4内存等激进设计 [13] - 谷歌的应对策略是TPUv8双线开发,但项目已有延迟,且未积极采用台积电2nm工艺或HBM4内存等前沿技术 [13] - 若英伟达成功实现Rubin芯片性能提升,TPU现有的价格优势可能不复存在,其系统甚至在谷歌内部工作负载中可能比TPUv8更具经济效益 [13]
“星际之门”在美国“新开5个数据中心”,投资额高达4000亿美元,目标“三年建成,7GW”
36氪· 2025-09-25 11:19
项目概述与最新进展 - OpenAI、甲骨文和软银宣布在美国新增五个“星际之门”项目站点,选址包括德克萨斯州、新墨西哥州、俄亥俄州以及一个未披露的中西部地点 [1] - 连同德克萨斯州阿比林的旗舰站点以及与CoreWeave的合作,该项目计划在未来三年投资4000亿美元,最终达到7吉瓦的容量 [1] - 位于德克萨斯州阿比林的旗舰站点已投入运营,该站点使用甲骨文的云基础设施和英伟达的芯片,最终有望扩展至超过1吉瓦容量,足以为约75万个美国家庭供电 [1] - OpenAI首席执行官表示项目旨在扭转美国在芯片工厂和新能源生产设施建设上落后于其他国家的趋势 [1] 甲骨文的核心角色与建设规模 - 甲骨文在此次扩张中扮演核心角色,根据今年7月与OpenAI达成的协议,双方将在未来五年合作开发高达4.5吉瓦的新增容量,合作价值超过3000亿美元 [2] - 甲骨文将出资并监督在德克萨斯州沙克尔福德县、新墨西哥州多尼亚安娜县以及一个中西部站点的三个新数据中心建设,之后OpenAI将从甲骨文购买计算能力 [2][3] - 仅由甲骨文开发的新站点就能提供超过5.5吉瓦的容量,公司正以前所未有的速度扩张其云基础设施以满足巨大的AI训练和推理需求 [3] 建设规模与算力需求 - 项目建设规模旨在应对大规模的算力紧缺,确保2026年能够上线采用英伟达下一代Vera Rubin芯片的算力 [4] - 人类历史上从未有人以如此快的速度建造数据中心,“星际之门”未来将成为OpenAI所有基础设施项目的代号,项目进度已领先于原定计划 [4] 融资模式与财务状况 - 项目融资结构复杂,甲骨文等公司帮助建设并提供资金,但OpenAI最终将以运营费用的形式为算力付费 [5] - OpenAI预计今年营收将达到130亿美元,公司计划利用自身现金流和债务融资来支付建设费用 [5] - 英伟达通过股权投资启动项目,并将为其提供的所有芯片获得报酬,这种模式引发了外界对于“循环融资”的质疑 [5] 政治与经济影响 - 项目具有显著的政治和经济色彩,最早于今年1月由OpenAI和甲骨文在白宫与美国总统特朗普共同公布 [7] - 从经济影响看,甲骨文表示该项目每天将雇用超过6000名建筑工人,并提供近1700个长期工作岗位 [7] - OpenAI指出其数据中心建设有助于通过新技术重塑美国电网,并帮助美国发挥全球影响力,愿景已超越技术本身 [7]
AMD将重启对华AI芯片出口,特朗普政策变了?
第一财经· 2025-07-16 11:17
美国AI芯片对华出口政策变化 - 美国商务部将对AMD的AI芯片MI308许可证重新审查 可能重启对华出口 AMD股价一度上涨超过7% [1] - 今年4月 AMD因MI308对华出口管制损失8亿美元 [2] - 英伟达CEO表示H20芯片将获得美国许可 重新启动对华销售 [2] 芯片厂商应对策略 - 英伟达和AMD均针对中国市场开发特定芯片 以应对美国出口管制规定 [2] - 英伟达为向中国销售H20芯片 取消了部分功能 包括减少GPU核心数量和降低带宽 [2] - 英伟达最新Blackwell Ultra芯片已开始安装 下半年批量出货 2027年将推出下一代Vera Rubin芯片 [3] 中国市场反应 - DeepSeek R1的成功推出意味着H20性能对中国公司已足够 [2] - 中国已具备自主研发AI芯片和构建AI基础设施的能力 多家企业有相关产品开发 [2] - 分析师建议中国企业继续多元化选择 以保护供应链安全性 [3] 美国政策意图 - 美国商务部长解释政策转向是为了让中国企业形成对美国技术依赖 [2] - 美国目前仅允许向中国出售性能"第四好"的芯片 [2] 行业观点 - 分析师认为美国AI芯片重启销售后仍将面临较大不确定性 [3] - 中国企业应保持供应链多元化 做到进退有余 [3]
计算机行业跟踪周报371期:华为与英伟达AI大会将召开,腾讯积极进行算力储备-2025-03-16
海通证券· 2025-03-16 21:04
报告行业投资评级 - 优于大市,维持 [2] 报告的核心观点 - 腾讯进行算力储备是AI发展大背景下必经之路,未来算力需求有望持续增长;华为和英伟达与AI相关会议召开,有望吸引市场对AI产业关注,相关新品发布将加速AI业界整体发展 [7] - 建议关注金山办公、虹软科技、合合信息、润泽科技、国能日新、通行宝、新大陆、赛意信息 [7] 根据相关目录分别进行总结 华为相关会议 - 华为昇腾AI大会与合作伙伴大会3月21日在深圳举行,昇腾峰会聚焦大模型对人工智能产业影响,涉及昇腾+伙伴DeepSeek一体机等内容;鲲鹏伙伴产业峰会以“智启鲲鹏新航道,共筑产业新动能”为主题,发布鲲鹏硬件新品等,展现各类网卡等产品 [6] 腾讯算力储备 - 腾讯向英伟达订购数十亿元芯片,2024年字节和腾讯分别订购约23万颗英伟达芯片,位列全球第二和第三,2025年腾讯旗下多个应用接入DeepSeek,加大算力投资或为提升C端体验,应对微信接入需求,且投资算力是腾讯2025年主基调之一 [6] 英伟达GTC 2025会议 - 英伟达GTC 2025于3月17至21日举行,将举行黄仁勋主题演讲和超1000场会议,展望AI多领域未来趋势,举办1000多场会议,邀请2000位演讲嘉宾和近400家参展商,展示NVIDIA AI和加速计算平台应对挑战能力;英伟达下一代AI芯片命名为Vera Rubin,黄仁勋料将揭晓细节 [6]