华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜~
搜狐财经·2025-11-29 16:47

市场反应与事件概述 - 市场消息称Meta与谷歌签订价值数十亿美元的TPU订单,导致英伟达股价盘中最大跌幅达7%,市值蒸发超3000亿美元 [1] - 谷歌股价在消息刺激下盘中涨幅一度达4%,市值增加约1500亿美元,折合人民币超1万亿元 [1] - 《华尔街日报》将此交易视为谷歌挑战英伟达市场主导地位的信号 [1] TPU的应用历史与市场认知 - 行业从业者指出,Meta、xAI等大型公司及学术界多年以来一直在使用TPU,市场近期反应被质疑为外行 [1] - OpenAI技术人员Clive Chan证实,谷歌Gemini、Claude、MidJourney、Ilya的SSI等模型均在TPU上完成训练 [1] - 谢赛宁证实Meta早在2020年就已开始使用TPU,何恺明领导的团队进行了相关代码库开发,MAE、MoCo v3、ConvNeXt v2和DiT等项目完全在TPU上开发 [2] - 纽约大学的许多研究工作也使用了TPU [2] 技术护城河与替代方案 - 观点认为谷歌与英伟达均未形成强有力的技术护城河 [12] - 例如OpenAI开发了Triton以绕过英伟达的CUDA,仅需25行Python代码即可达到cuBLAS的性能,对大型公司而言绕开英伟达在技术上并非难事 [7] - 英伟达宣称其产品是唯一能运行所有AI模型并应用于所有计算场景的平台 [4] 成本效益比较 - 性价比横评显示,在运行Llama 3 3模型时,从H100到B200,每1美元带来的Token收益是TPU v6e的5倍 [7] - 具体而言,以30Tokens每秒的速度处理输入输出各100万个Tokens,在H100上成本为1.06美元,而在TPU v6e上成本为5.13美元 [7] - 谷歌最新TPU v7的成本与英伟达B200大致相当 [10] - TPU v7的FP8运算速度为4.6 PFLOP/s,功耗约为1000瓦;对比英伟达GB200的FP8运算速度为5 PFLOP/s,功耗约为1200瓦 [11] 交易背后的战略意图 - 分析指出谷歌出售TPU的主要目的并非直接盈利,而是为了获取产能 [13] - 该交易可被视为谷歌利用Meta的出货量来换取芯片代工厂的排产和价格优惠,以对冲来自代工厂的风险 [15] - 代工厂需要获得切实有效的多年期合约才会启动新的2纳米生产线,谷歌可能利用与Meta、苹果等大客户的长期云服务合同作为抵押,预购未来尖端芯片供应 [16] - 此策略可能挤压小型芯片公司(如Groq、Cerebras、Tenstorrent)获得先进晶圆产能的空间,与苹果当年锁定优质手机面板的策略类似 [17] - 在代工厂层面,能与谷歌在产能上抗衡的仅有英伟达 [19] - Meta和苹果乐于签署此类协议,因为谷歌TPU是当前唯一可批量获得的替代芯片 [18]