Workflow
Rubin POD
icon
搜索文档
英伟达、阿里重估AI,把FLOPS“扔进垃圾堆”
36氪· 2026-03-18 17:08
文章核心观点 - 英伟达GTC 2026发布会的核心并非单一芯片性能,而是提出了“每瓦Token数”作为衡量AI工厂产出的新核心度量衡,这标志着行业竞争焦点正从芯片峰值参数转向系统级端到端能效,即在固定的能源约束下最大化智能产出 [1][2][4] - 行业对AI基础设施的认知正经历从“芯片中心主义”到“计算系统中心主义”的转变,竞争叙事边界已扩展至由计算、网络、存储、电力、冷却等共同构成的完整AI工厂系统 [4][11] - “每瓦Token数”这一度量单位的价值在于,它将电力输入到智能产出的完整链条连接起来,使行业能更直接地评估AI系统将能源转化为有效业务产出的效率,这比传统的部件层指标更具现实指导意义 [9][10] GTC 2026的核心变化与产业深意 - 发布会最值得重视的变化不在芯片本身,而是将算力竞争的叙事边界从单颗芯片推进到了算力基础设施级别,即完整的AI工厂系统 [4] - 英伟达展示的新产品如Vera Rubin、DSX AI Factory等,均强调其作为POD级平台或参考设计,目标是最大化每瓦Token数,体现了系统级竞争的思路 [4] - 这背后是一次“智能度量语言”的迁移,从衡量部件能力的芯片层指标,转向衡量整体产出的系统层指标,其打开的产业视角比任何单一新芯片都更值得深入讨论 [2][8] 度量体系的演进:从芯片到系统 - 芯片时代的度量体系关注峰值算力、显存带宽、FLOPS/W等部件能力边界指标 [6] - 当前智算中心缺乏客观、统一、通用的度量单位,使用兆瓦或基于FP16的PFlops等单位,但相同算力或电力的集群因内部组件不同,效能差异巨大 [7] - 系统层更合理的度量应是“每瓦Token数”,因为它能回答在固定功率、散热、机房约束下,AI系统能产出多少有效的AI结果,对应系统最优而非局部最优 [7][8] - 阿里巴巴在GTC前一天宣布成立“Alibaba Token Hub”,由CEO吴泳铭挂帅,将Token提升至公司AI战略高度,同样体现了行业向系统视角和以Token为核心度量转变的趋势 [2] Token/W 作为新度量衡的价值与影响 - Token被英伟达称为现代AI的基本单位,因其与模型推理过程、收入模型直接耦合,并能有效覆盖推理时代的新负载 [9] - AI基础设施的底层约束日益体现为能源约束,国际能源署报告预计到2030年全球数据中心用电将增长到约945TWh,AI是主要驱动因素之一,许多问题实质上是电力、散热和基础设施组织问题 [9] - Token/W的概念将电力输入,经过计算、网络、存储、调度和冷却,最终转化为Token产出的链条连接起来,衡量的是AI系统将多少能源转化成了多少智能产出 [10] - 产业进入大规模部署阶段后,决定胜负的往往是系统组织能力,而非部件参数,AI基础设施已到达此阶段 [11] 系统视角下光互连与光计算的产业地位提升 - 当度量体系迁移到系统层,过去被视为配套的环节如光互连的重要性会显著上升 [12] - 在Token/W框架下,光互连的价值在于降低数据搬运的能量代价,提升大规模AI计算系统将电力转化为Token的能力,英伟达基于光子的CPO相比光模块可实现最高5倍能效 [12] - 随着模型和集群规模扩大,系统能耗越来越多地发生在跨芯片、跨机柜的数据搬运上,提高Token/W不能只靠更强GPU,还需要更高效的互连,光互连正成为大规模AI系统的必要节能手段 [13][14] - 更前沿的光计算,其产业意义在系统层也更容易讲清,它不要求替代整个GPU,而是旨在通过在某些关键工作负载上降低能量消耗,从而提高系统层的Token产出效率 [15] - 当算力竞争迁移到AI大规模系统级基础设施,光互连与光计算因能解决数据搬运和高密度计算的单位能耗问题,从而从先进技术选项走向产业基础设施主线 [16][17] 对AI产业发展的整体启示 - AI基础设施正在变成一个用能源来衡量的系统工程,未来面临的约束包括电网接入、机房散热、园区能耗、机柜功率密度和投产速度等 [17] - 英伟达GTC 2026以及行业巨头的动向表明,需从系统思维的视角看待AI产业发展,关注芯片在网络中的协同、在机架中的部署、在园区的电力获取及最终的业务端产出 [10][18] - 这一转变与人类文明发展的主轴一致,即用更低的能量采集、传输和处理更多的信息,AGI的推进也将遵循这一逻辑 [18][19]