公司战略定位与增长预期 - 公司正从一家“芯片公司”向“AI基础设施和工厂公司”蜕变 [2] - 公司创始人给出了极为强劲的增长预期,预计到2027年至少有1万亿美元(at least $1 trillion)的高确信度需求 [6] - 公司认为实际计算需求将远超1万亿美元,并会供不应求,因其系统是全球“成本最低的基础设施” [10] - 公司业务构成:60%来自全球前五大超大规模云服务商,40%来自主权云、企业、工业、机器人和边缘计算等领域 [10][56] 核心商业逻辑:Token工厂经济学 - 未来的数据中心是生产Token(AI生成的基本单位)的“工厂”,其核心指标是在固定电力(如1吉瓦)限制下的每瓦Token吞吐量 [11][13] - AI服务将根据Token生成速度分层定价:免费层(高吞吐、低速度)、中级层(约每百万token 3美元)、高级层(约每百万token 6美元)、高速层(约每百万token 45美元)、超高速层(约每百万token 150美元) [14] - 在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低,吞吐量和Token生成速度将直接转化为收入 [13][14] - 公司的架构能让客户在免费层实现高吞吐,并在最高价值的推理层级上将性能提升35倍 [15] 新一代AI计算系统:Vera Rubin与Groq整合 - Vera Rubin是公司有史以来最复杂的AI计算系统,是一个100%液冷、消灭传统线缆的端到端优化系统,机架安装时间从两天缩短至两小时 [17][63] - 通过极致的端到端软硬件协同设计,公司在两年内将1吉瓦数据中心的Token生成速率从2200万token/秒提升至7亿token/秒,实现了350倍的增长,远超摩尔定律同期的约1.5倍提升 [18][68] - 为解决极速推理的带宽瓶颈,公司整合了Groq技术,通过Dynamo软件系统实现“非对称式的分离推理”:将需要海量计算和显存的“预填充”阶段交给Vera Rubin,将对延迟极度敏感的“解码”阶段交给Groq [18][20][66] - 对于算力配置建议:工作负载以高吞吐为主则100%使用Vera Rubin;若有大量高价值编程级别的Token生成需求,可配置约25%的数据中心规模给Groq [20][67] - Groq LP30芯片由三星代工,已进入量产,预计第三季度出货;首个Vera Rubin机架已在微软Azure云上运行 [21][63] 软件生态与智能体革命 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”,仅用几周时间就超越了Linux过去30年的成就,本质上是Agent计算机的“操作系统” [23][71] - 公司断言,每一个SaaS(软件即服务)公司都将变成AaaS(Agent-as-a-Service,智能体即服务)公司 [24] - 为让智能体安全落地,公司推出了企业级的NeMo Claw参考设计,增加了策略引擎和隐私路由器 [24][77] - 智能体将重塑职场形态,未来工程师将拥有年度Token预算,其额度可能达到基础年薪的一半左右,以实现10倍的效率提升,“入职附带多少Token配额”已成为硅谷的新招聘筹码 [25][77] 技术平台与生态合作 - CUDA平台已诞生二十周年,拥有数千种工具、编译器、框架和库,在全球积累了数亿块运行CUDA的GPU和计算系统,庞大的装机量是其生态飞轮加速的根本原因 [28][29][30] - 公司构建了加速计算平台,其上汇聚了众多库(如RTX、cuDF、cuVS),并整合进全球云服务和OEM体系 [38] - 公司宣布与多家企业达成合作:IBM将使用cuDF加速其WatsonX Data平台;Dell联合打造了整合cuDF与cuVS的AI数据平台;Google Cloud方面,公司不仅加速Vertex AI,还加速BigQuery,并与Snapchat合作将其计算成本降低了近80% [37] - 公司与主要云服务商(Google Cloud、AWS、Microsoft Azure、Oracle、CoreWeave等)有深度合作,将客户引入云端,形成互利共赢的生态 [39][40][41][42][43] 垂直行业布局与市场突破 - 公司在多个垂直领域深度布局,包括自动驾驶、金融服务、医疗健康、工业、娱乐与游戏、机器人、电信等 [46] - 过去两年,风险投资流入AI初创企业的资金规模达到1500亿美元,创历史之最,单笔投资规模从数百万美元跃升至数亿乃至数十亿美元,因为每家公司都需要大量计算资源和Token [48] - 推动行业发展的三大历史性突破:1) ChatGPT开启生成式AI时代;2) 推理AI(以o1为代表)出现;3) Claude Code作为首个智能体模型,彻底革新了软件工程 [50][51][52] - 过去两年,推理所需的计算量增长了约10,000倍,使用量增长了约100倍,创始人认为整体计算需求增长了100万倍 [52] 产品路线图与未来愿景 - 公司技术路线图明确:当前在产Blackwell;当前推出Vera Rubin;即将推出Vera Rubin Ultra(集成NVFP4);下一代架构为Feynman(集成NVFP4的全新GPU) [69] - 公司正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”,并已通过辐射认证的Thor芯片在卫星中运行,打开了AI算力向地球之外延伸的想象空间 [25][70] - 公司创建了基于Omniverse的NVIDIA DSX平台,用于所有合作伙伴在虚拟世界中共同设计和运营吉瓦级AI工厂,预计可将能源利用效率提升约2倍 [70] - 公司宣布成立Nemotron联盟,投资数十亿美元推进AI基础模型研发,联盟成员包括BlackForest Labs、Cursor、Mistral等众多企业 [79]
黄仁勋炸场GTC:2027算力需求破万亿美元,AI推理时代全面到来