黄仁勋炸场GTC：2027算力需求破万亿美元，AI推理时代全面到来

公司战略定位与增长预期 - 公司正从一家“芯片公司”向“AI基础设施和工厂公司”蜕变 [2] - 公司创始人给出了极为强劲的增长预期，预计到2027年至少有1万亿美元（at least $1 trillion）的高确信度需求 [6] - 公司认为实际计算需求将远超1万亿美元，并会供不应求，因其系统是全球“成本最低的基础设施” [10] - 公司业务构成：60%来自全球前五大超大规模云服务商，40%来自主权云、企业、工业、机器人和边缘计算等领域 [10][56] 核心商业逻辑：Token工厂经济学 - 未来的数据中心是生产Token（AI生成的基本单位）的“工厂”，其核心指标是在固定电力（如1吉瓦）限制下的每瓦Token吞吐量 [11][13] - AI服务将根据Token生成速度分层定价：免费层（高吞吐、低速度）、中级层（约每百万token 3美元）、高级层（约每百万token 6美元）、高速层（约每百万token 45美元）、超高速层（约每百万token 150美元） [14] - 在固定的功率下，谁的每瓦Token吞吐量最高，谁的生产成本就最低，吞吐量和Token生成速度将直接转化为收入 [13][14] - 公司的架构能让客户在免费层实现高吞吐，并在最高价值的推理层级上将性能提升35倍 [15] 新一代AI计算系统：Vera Rubin与Groq整合 - Vera Rubin是公司有史以来最复杂的AI计算系统，是一个100%液冷、消灭传统线缆的端到端优化系统，机架安装时间从两天缩短至两小时 [17][63] - 通过极致的端到端软硬件协同设计，公司在两年内将1吉瓦数据中心的Token生成速率从2200万token/秒提升至7亿token/秒，实现了350倍的增长，远超摩尔定律同期的约1.5倍提升 [18][68] - 为解决极速推理的带宽瓶颈，公司整合了Groq技术，通过Dynamo软件系统实现“非对称式的分离推理”：将需要海量计算和显存的“预填充”阶段交给Vera Rubin，将对延迟极度敏感的“解码”阶段交给Groq [18][20][66] - 对于算力配置建议：工作负载以高吞吐为主则100%使用Vera Rubin；若有大量高价值编程级别的Token生成需求，可配置约25%的数据中心规模给Groq [20][67] - Groq LP30芯片由三星代工，已进入量产，预计第三季度出货；首个Vera Rubin机架已在微软Azure云上运行 [21][63] 软件生态与智能体革命 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”，仅用几周时间就超越了Linux过去30年的成就，本质上是Agent计算机的“操作系统” [23][71] - 公司断言，每一个SaaS（软件即服务）公司都将变成AaaS（Agent-as-a-Service，智能体即服务）公司 [24] - 为让智能体安全落地，公司推出了企业级的NeMo Claw参考设计，增加了策略引擎和隐私路由器 [24][77] - 智能体将重塑职场形态，未来工程师将拥有年度Token预算，其额度可能达到基础年薪的一半左右，以实现10倍的效率提升，“入职附带多少Token配额”已成为硅谷的新招聘筹码 [25][77] 技术平台与生态合作 - CUDA平台已诞生二十周年，拥有数千种工具、编译器、框架和库，在全球积累了数亿块运行CUDA的GPU和计算系统，庞大的装机量是其生态飞轮加速的根本原因 [28][29][30] - 公司构建了加速计算平台，其上汇聚了众多库（如RTX、cuDF、cuVS），并整合进全球云服务和OEM体系 [38] - 公司宣布与多家企业达成合作：IBM将使用cuDF加速其WatsonX Data平台；Dell联合打造了整合cuDF与cuVS的AI数据平台；Google Cloud方面，公司不仅加速Vertex AI，还加速BigQuery，并与Snapchat合作将其计算成本降低了近80% [37] - 公司与主要云服务商（Google Cloud、AWS、Microsoft Azure、Oracle、CoreWeave等）有深度合作，将客户引入云端，形成互利共赢的生态 [39][40][41][42][43] 垂直行业布局与市场突破 - 公司在多个垂直领域深度布局，包括自动驾驶、金融服务、医疗健康、工业、娱乐与游戏、机器人、电信等 [46] - 过去两年，风险投资流入AI初创企业的资金规模达到1500亿美元，创历史之最，单笔投资规模从数百万美元跃升至数亿乃至数十亿美元，因为每家公司都需要大量计算资源和Token [48] - 推动行业发展的三大历史性突破：1) ChatGPT开启生成式AI时代；2) 推理AI（以o1为代表）出现；3) Claude Code作为首个智能体模型，彻底革新了软件工程 [50][51][52] - 过去两年，推理所需的计算量增长了约10,000倍，使用量增长了约100倍，创始人认为整体计算需求增长了100万倍 [52] 产品路线图与未来愿景 - 公司技术路线图明确：当前在产Blackwell；当前推出Vera Rubin；即将推出Vera Rubin Ultra（集成NVFP4）；下一代架构为Feynman（集成NVFP4的全新GPU） [69] - 公司正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”，并已通过辐射认证的Thor芯片在卫星中运行，打开了AI算力向地球之外延伸的想象空间 [25][70] - 公司创建了基于Omniverse的NVIDIA DSX平台，用于所有合作伙伴在虚拟世界中共同设计和运营吉瓦级AI工厂，预计可将能源利用效率提升约2倍 [70] - 公司宣布成立Nemotron联盟，投资数十亿美元推进AI基础模型研发，联盟成员包括BlackForest Labs、Cursor、Mistral等众多企业 [79]