公司战略定位与业绩展望 - 公司正从一家“芯片公司”蜕变为“AI基础设施和工厂公司” [2] - 公司创始人给出了极为强劲的业绩预期,预计到2027年至少有1万亿美元的高确信度需求,并认为实际需求会更高 [5][9] - 这一乐观预期一度推动公司股价上涨超过4.3个百分点 [7] 核心商业模式:“Token工厂经济学” - 未来的数据中心是生产Token(AI生成的基本单位)的“工厂”,其核心经营指标是“token工厂效率” [12][62] - 在受电力限制(如1吉瓦)的数据中心内,每瓦Token吞吐量最高的平台将拥有最低的生产成本 [14] - AI服务将根据Token生成速度分层定价,从免费层到超高速层(约每百万token 150美元)不等 [18] - 公司的架构能让客户在免费层实现高吞吐量,同时在最高价值的推理层级将性能提升惊人的35倍 [16] 技术平台与产品进展 - CUDA平台是公司战略的核心,拥有20年历史、数亿块GPU的装机量,形成了强大的开发者生态飞轮 [31][32] - 公司推出了下一代AI计算系统Vera Rubin,这是一个100%液冷、端到端优化的完整系统,安装时间从两天缩短至两小时 [19][65] - Vera Rubin系统在两年内将1吉瓦AI工厂的Token生成速率从2200万token/秒提升至7亿token/秒,实现了350倍的增长,远超摩尔定律同期的约1.5倍提升 [20][70] - 公司整合了收购的Groq技术,通过Dynamo软件实现“非对称式分离推理”,将计算密集的预填充阶段交给Vera Rubin,将对延迟敏感的解码阶段交给Groq,以优化高性能推理 [21][23][68] - 公司展示了明确的技术路线图,包括当前在产的Blackwell、已发布的Vera Rubin、即将推出的Vera Rubin Ultra以及下一代Feynman架构 [71] - 公司推出了全球首款量产的共封装光学(CPO)交换机Spectrum X,并强调需要同时扩大铜缆、光芯片和CPO的产能 [24][72] 软件、生态与行业应用 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”,本质上是智能体计算机的“操作系统” [25][74][76] - 公司预测,每一家SaaS公司都将转变为AaaS(智能体即服务)公司,并为此推出了企业级的NeMo Claw参考设计,增加了安全策略引擎和隐私路由器 [26][79] - 公司的CUDA-X库覆盖了自动驾驶、金融服务、医疗健康、工业、机器人、电信等多个垂直行业,是公司作为算法公司的核心资产 [47] - 在自动驾驶领域,公司宣布了新的合作伙伴,其RoboTaxi Ready平台现有合作伙伴的年产量合计达到1800万辆 [83] - 本次GTC大会有110款机器人亮相,公司提供训练、仿真和机载三台计算机以及完整的软件栈 [47][83] 市场地位与合作伙伴 - 公司目前60%的业务来自全球前五大超大规模云服务商,另外40%的业务广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [11][57] - 公司声称其是目前全球唯一能够运行所有AI领域(语言、生物、图形、视觉、机器人等)模型的平台,这种通用性使其成为“成本最低、置信度最高的平台” [10][57] - 公司与主要云服务商(Google Cloud、AWS、Microsoft Azure、Oracle等)建立了深度合作关系,将客户引入云端,形成互利生态 [41][43] - 公司宣布成立Nemotron联盟,投资数十亿美元推进AI基础模型研发,联盟成员包括多家知名AI初创公司和实验室 [82] 未来愿景与新兴领域 - 公司创始人描绘了未来职场形态,工程师将拥有年度Token预算,其额度可能相当于基础年薪的一半,以实现10倍的效率提升,“入职附带多少token配额”已成为招聘新话题 [27][79] - 公司正在研发下一代计算架构Feynman以及部署在太空的数据中心计算机“Vera Rubin Space-1” [27][73] - 公司推出了数字孪生平台NVIDIA DSX,用于在虚拟世界中共同设计和运营吉瓦级AI工厂,预计可将能源利用效率提升约2倍 [73]
黄仁勋GTC演讲全文:龙虾就是新操作系统