计算模型与平台转型 - 公司发明了60年来首个新的计算模型,即加速计算,旨在解决通用计算机无法处理的问题 [3] - 观察到晶体管性能提升因物理定律限制而放缓,摩尔定律已接近终结,加速计算的时代已经到来 [3] - 世界正经历两大平台转型:从通用计算转向加速计算,以及从传统手写软件转向人工智能 [48] - 加速计算需要全新的算法、库和应用程序重写,公司花费近30年时间分领域实现,其核心宝藏是CUDA编程模型及库生态系统 [3][4] CUDA生态系统与软件栈 - CUDA是公司的重要资产,包含350多个库,每个库都为加速计算重新设计了算法,并为生态系统合作伙伴打开了新市场 [4][5] - 库覆盖领域广泛,包括计算光刻(Qlitho)、稀疏求解器、数值优化、数据库加速(SQL、数据帧)、AI训练(CUDNN、Megatron core)、医疗影像(MonAI)、基因组学处理等 [4][5] - 软件栈已发生根本性改变,新的计算栈基于GPU构建,专注于处理数据密集型编程和生成AI tokens,而非传统的CPU和Windows系统 [13][14] - 保持CUDA跨代兼容性至关重要,目前已发展至CUDA 13/14,数亿GPU完美兼容,确保了开发者的平台粘性 [3][4] 人工智能(AI)工厂与规模化 - AI催生了新型基础设施——AI工厂,其本质是生产有价值tokens的工厂,专注于以高速率、低成本生成智能响应,而非运行多种应用的通用数据中心 [17][18] - AI模型智能化导致使用量激增,形成两个指数级需求:模型三个扩展定律(预训练、后训练、思考)对算力的需求,以及模型越智能使用越多带来的算力需求 [20][21] - AI已达到良性循环:模型足够智能使得用户愿意付费,产生的利润再投入算力建设,使模型更智能,应用更广泛 [21][22] - 为应对指数级算力需求并降低成本,公司采用极端协同设计方法,从芯片、系统、软件、模型架构到应用全栈重新设计,实现性能的指数级提升而非渐进式改善 [23][24] 产品与技术突破:Grace Blackwell 架构 - Grace Blackwell NVLink 72是极端协同设计的成果,通过将72个GPU连接成一个巨型GPU,专为未来拥有大量专家的AI模型设计 [25][26] - 相比前代H200 GPU,Grace Blackwell在每GPU性能上提升10倍,并生成全球最低成本的tokens,这得益于架构创新而非单纯晶体管数量增加 [27] - 公司已出货600万片Blackwell GPU,并拥有到2026年价值5000亿美元的累计订单可见性,Blackwell生命周期内预计将出货2000万GPU(每个封装含2个GPU),增长远超Hopper架构 [30] - 产品制造回归美国,涉及亚利桑那州、印第安纳州、德克萨斯州和加利福尼亚州的复杂供应链,单个Blackwell Ultra超级芯片包含1.2万亿个晶体管,重近2吨 [31][32] 行业应用与合作伙伴生态 - 宣布与诺基亚(Nokia)合作,推出NVIDIA ARC(Aerial Radio Network Computer)产品线,旨在基于加速计算和AI技术,让美国在6G革命中重回领导地位 [6][7] - ARC将支持AI for RAN(提高频谱效率)和AI on RAN(在电信网络上构建边缘工业机器人云),可升级全球数百万个基站 [7][8] - 在量子计算领域,推出NVQ-Link互联架构,直接将量子处理器与GPU连接,实现量子纠错、校准和混合模拟,并获得17家量子公司和8个美国能源部实验室支持 [9][10][11][12] - 与美国能源部合作建设7台新的AI超级计算机,以推动国家科学进步,认识到计算是科学的基础工具 [12] - 企业级合作包括与CrowdStrike合作加速网络安全AI代理,与Palantir合作加速其Ontology平台的数据处理能力 [41][42] 物理AI与机器人技术 - 物理AI需要三台计算机协同工作:用于训练的Grace Blackwell、用于数字孪生模拟的Omniverse计算机、以及用于机器人操作的Jetson Thor机器人计算机 [42][43] - 公司与富士康(Foxconn)合作在德克萨斯州建设机器人工厂,利用Omniverse数字孪生技术进行设计、模拟、训练和操作优化 [44] - 人形机器人(如Figure、Agility、Johnson & Johnson手术机器人)被视为未来最大的消费电子和工业设备市场之一,公司与迪士尼合作开发Newton模拟器用于机器人训练 [45][46] - 推出NVIDIA Drive Hyperion平台,为全球汽车制造商提供Robo-Taxi就绪的标准化传感器和计算底盘,并与Uber合作将其接入全球网络 [47][48] 基础设施与数字化(DSX) - 推出Omniverse DSX,这是一个用于设计和运营千兆级AI工厂的蓝图,实现建筑、电力和冷却与NVIDIA AI基础设施栈的协同设计 [37] - DSX利用数字孪生技术,在物理工厂建成前进行设计、规划、优化和操作模拟,可显著缩短建设时间,并为千兆级AI工厂每年带来数十亿美元的额外收入 [37] - 公司正在弗吉尼亚州建设一个AI工厂研究中心,使用DSX来测试和产品化Vera Rubin架构,从基础设施到软件 [38]
GTC October 2025 Keynote with NVIDIA CEO Jensen Huang
