Workflow
数据中心转型
icon
搜索文档
英伟达-GTC-2026-黄仁勋主题演讲
2026-03-18 10:31
NVIDIA GTC 2026 电话会议纪要分析 一、 公司概况与战略定位 * **公司定位**:公司是全球首家垂直整合且横向开放的公司[10] 其战略核心是构建一个由庞大安装基数驱动的加速计算平台[2] * **核心战略**:构建世界一流的基础模型,并在此基础上实现垂直整合与水平开放[37] 垂直整合旨在通过特定领域的加速实现应用加速并大幅降低成本[10] 横向开放体现在将技术集成到任何客户需要的平台上[10] * **飞轮效应**:公司通过20年投入建立的数亿台运行CUDA的GPU安装基数吸引了开发者[2] 开发者创造突破性算法催生新市场[2] 新市场吸引更多公司加入并再次扩大安装基数[2] 目前飞轮正加速转动,公司库的下载量正以创纪录的速度增长[2] 二、 市场前景与需求规模 * **需求规模**:截至2026年3月,所看到的需求覆盖至2027年,规模至少达到1万亿美元[1][14] 作为对比,2025年同期看到的需求规模约为5,000亿美元,覆盖至2026年[14] * **需求驱动**:需求激增的核心驱动力是AI推理业务的拐点已经到来[14] 2025年是公司的推理之年[14] 过去两年计算需求增长了约100万倍[13] * **行业变革**:AI原生企业的风险投资规模已飙升至1,500亿美元,创下历史纪录[12] 数据中心正在从传统的存储设施演变为生产tokens的“AI工厂”[17] 未来所有企业都将依赖AI工厂[44] 三、 核心技术:CUDA与平台生态 * **CUDA起源**:CUDA的征程始于25年前发明的可编程着色器[3] 20年前CUDA正式诞生[3] 公司当时将CUDA搭载在GeForce产品上,培养了庞大的用户群体和开发者[3] * **CUDA现状**:CUDA架构的核心是单指令多线程技术,并新增了分片功能、张量核心及数学结构[2] 公司提供了数千种工具、编译器、框架和库[2] 开源领域有数十万个基于CUDA的公开项目[2] * **CUDA X库**:CUDA X库是公司业务的核心,是激活计算平台的关键[12] 公司本质上是一家算法公司[12] 仅在本次展会就将发布70个算法库和约40个模型[12] 其中CUDA DNN库彻底革新了人工智能领域[12] 四、 产品迭代与性能突破 * **架构演进**:公司规划每年推出全新架构,并保持向后兼容[30] 从Hopper到Grace Blackwell,再到Vera Rubin,以及未来的Rubin Ultra、Fineman[1][30] * **性能飞跃**: * **推理吞吐量**:Blackwell较Hopper推理吞吐量提升35倍[1] Vera Rubin吞吐量再增10倍[1] * **能效与成本**:Grace Blackwell Envy 72在2025年实现了每瓦性能提升35倍的成果[16] 公司实现了全球领先的低每token成本[16] * **令牌生成速率**:在短短两年内,通过新架构在一个千兆瓦(1 GW)的工厂中,令牌生成速率将从2,200万提升至7亿,增幅达到350倍[29] * **具体产品**: * **Vera Rubin平台**:算力达3.6 Exaflops[1] 通过NVLink 72实现260TB/s带宽[1] 单机架可连接144个GPU[1] 实现100%液冷[1] 安装时间从两天缩短至两小时[20] * **Blackwell**:通过NVLink连接72块GPU,全互联带宽达到130TB/秒[18] 五、 关键收购与技术整合:Groq * **收购与整合**:公司收购Groq团队并集成其技术[1] 通过名为Dino的软件拆分推理流程[1][25] 在极高速度区间实现35倍性能提升[1] 解决了高吞吐量与低延迟之间的冲突[23] * **技术原理**:Grok是一种采用静态编译和编译器调度的确定性数据流处理器[24] 配备了海量的SRAM[24] 与Vera Rubin整合后,在主流工作负载由Vera Rubin处理,解码生成、低延迟工作负载则由Grok处理[25] * **生产进展**:Groq LP3芯片由三星负责生产[26] Grok LPX预计将于2026年下半年开始发货[26] 六、 软件与操作系统布局 * **智能体操作系统**:推出OpenClaw开源智能体操作系统[1] 它被视为“通用人工智能计算机的操作系统”,其意义可与Windows推动个人计算机普及相提并论[34] * **企业安全方案**:推出NeMo Claw企业级安全、私有部署解决方案[1][34] 该方案具备策略机制、网络防护措施和隐私路由器[34] * **对SaaS公司影响**:OpenClaw意味着SaaS公司将从传统的软件工具提供商转型为生成式AI服务公司[1][34] 七、 数据处理与加速 * **数据布局**:公司正全力加速结构化与非结构化数据的处理[6] 全球数据中约90%为非结构化数据[6] * **核心库**:创建了两个基础库:为数据帧和结构化数据开发的CUDF,以及为向量存储和语义数据开发的CUVS[6] * **合作案例**: * 与IBM合作,加速其Watsonx.data SQL引擎,帮助雀巢将工作负载运行速度提升了5倍,成本降低了83%[6] * 与谷歌云合作加速BigQuery,帮助Snapchat将计算成本降低了近80%[7] 八、 云计算与合作伙伴生态 * **合作模式**:与云服务提供商(CSP)的合作模式是互惠共赢的[8] 公司通过将加速库集成到云平台中来加速其工作负载,并为云服务商带来客户[8] * **主要合作伙伴**: * **AWS**:2026年将把OpenAI引入AWS[8] 公司加速了AWS的EMR、SageMaker和Bedrock[8] * **微软Azure**:首个为公司打造的A100超级计算机项目部署在Azure[9] 深度参与Azure的AI Foundry项目[9] * **谷歌云**:长期合作,加速其Vertex AI平台和BigQuery[8] * **甲骨文**:公司不仅是其供应商,更是其首个AI客户[9] * **垂直行业合作**:与Palantir和戴尔三方携手,为Palantir打造了全新的AI平台,能够在任何国家、任何物理隔离区域实现完全本地化部署[9] 九、 垂直行业应用与进展 * **金融服务**:该行业是本次GTC大会参会者中占比最大的群体[11] 算法交易正从传统量化交易转向由超级计算机自主分析海量数据的阶段[11] * **医疗健康**:医疗健康领域正经历类似ChatGPT的技术突破,公司在此开展了多项工作[11] * **汽车/自动驾驶**:公司认为自动驾驶的“ChatGPT时刻”已经到来[42] 自动驾驶出租车平台新增比亚迪、现代、日产和吉利四家合作伙伴,合计年产汽车1,800万辆[42] 宣布与优步达成重大合作[43] * **机器人技术**:公司已深耕机器人技术十年[11] 提供了三类核心计算机硬件和完整的软件栈[40] 推出开源的Isaac Lab用于机器人训练[41] 合作伙伴包括ABB、优傲机器人、库卡、卡特彼勒等[45] * **通信**:公司认为遍布各地的基站将从上一代计算基础设施重塑为AI基础设施平台[11] 公司的Ariel平台已与T-Mobile等企业建立了重要合作关系[11] * **零售与制造业**:在规模达35万亿美元的零售和快消行业,公司利用技术优化供应链[11] 在规模达50万亿美元的制造业领域有深入布局[11] * **太空计算**:公司正在将业务拓展至太空领域,目标是在太空建设数据中心[33] 正在开发名为Vera Rubin Space 1的新型计算机[33] 十、 AI模型与开放生态 * **开放模型计划**:公司是开源AI领域最大的贡献者之一[36] 构建并发布了六大系列开源前沿模型[36] 涵盖语言、视觉、物理AI、机器人、自动驾驶、数字生物学和AI物理等领域[36] * **核心模型**:Neonotron 3 Ultra被定位为目前世界上顶级的多模态基础模型之一[37] 推出了Earth Two气候预测模型[38] * **生态构建**:公司通过打造世界级的开放基因框架和推出名为NimbleClaw的参考设计来构建生态系统[39] 宣布成立联盟推动NemoTran 4模型发展,成员包括Blackforce Labs、Cursor、Perplexity等[39] 十一、 业务结构与客户分布 * **业务结构**:目前,公司60%的业务来自超大规模数据中心客户,包括全球前五大超大规模数据中心企业[15] 其余40%的业务覆盖了区域云、主权云、企业、工业、机器人、边缘计算等领域[16] * **客户选择**:Anthropic和MSL在2025年均选择了公司,这些客户占据了全球开源AI模型计算量的三分之一[14] 十二、 未来路线图 * **产品规划**:路线图规划每年推出全新架构[30] Rubin Ultra芯片已流片[1] 后续Fineman平台将联合Groq开发LP40芯片并配备Rosa CPU[1][30] * **网络与互联**:将推出用于Rosalind的Bluefield 5,连接新一代CPU与新一代SuperNIC CX 10[30] 互联方案将同时推进铜缆和共封装光学两种方案[30]