公司战略与市场展望 - 公司CEO黄仁勋宣布,公司正处于一个全新平台变革的开端,其重要性堪比个人电脑和互联网革命[3] - 公司预计,全球公司在Blackwell和Rubin系统上的支出市场将在2025年至2027年间达到1万亿美元,其中60%的业务将来自超大规模云计算[3] - 公司认为AI发展已到达“推理拐点”,从训练阶段全面进入“推理和生成”阶段,算力需求刚刚爆发[5] 新一代AI算力平台:Vera Rubin - 公司发布了基于全新Vera Rubin架构的NVL72系统,这是一个包含七款全新芯片的庞大复杂AI算力系统,旨在打造全球最大规模的AI工厂[12] - Vera Rubin NVL72集成了72个Rubin GPU和36个Vera CPU,通过NVLink 6连接,并配备ConnectX-9 SuperNIC和BlueField-4 DPU[13] - 与NVIDIA Blackwell平台相比,Vera Rubin NVL72使用四分之一数量的GPU即可训练大型混合专家模型,每瓦推理吞吐量提高了10倍,每token成本仅为十分之一[13] - 公司推出了更大型的“NVIDIA Vera Rubin Ultra NVL576”系统,通过双层全互连NVLink拓扑结构,可将系统纵向扩展至最多576块GPU[16] - Vera Rubin平台已在微软Azure上开始部署,落地速度相比上代架构显著加快[20] 全新AI推理芯片:LPU - 公司通过战略交易获得了Groq推理技术授权,并发布了NVIDIA Groq 3 LPX语言处理单元[21] - Groq LPX架构与Vera Rubin GPU协同工作,专门针对智能体系统所需的低延迟与超长上下文推理进行优化,每兆瓦推理吞吐量最高可提升35倍[21] - LPX机架采用全液冷设计,包含256个LPU处理器,提供128GB片上SRAM和640 TB/s的纵向互联带宽[24] - 当与Vera Rubin NVL72系统一同部署时,Rubin GPU与LPU协同计算,可显著提升解码性能[26] - Nvidia Groq 3 LPX预计将在2024年下半年正式推出[28] 智能体平台:NemoClaw - 公司推出了具有企业级安全保障的NemoClaw平台,旨在解决当前OpenClaw智能体平台在与外部通信时的安全隐患[29] - NemoClaw通过NVIDIA Agent Toolkit,让用户只需一条命令就能完成OpenClaw的安装和优化,同时自动部署提供开源模型支持和隔离沙箱环境的OpenShell运行时[31] - 该平台支持调用运行在用户本地专用系统上的开源模型(如NVIDIA Nemotron)以及通过隐私路由访问云端的前沿模型[33] - 公司CEO黄仁勋认为,OpenClaw以及更广义的Claw系统,未来的重要性将与Linux、Kubernetes、HTML等基础软件设施相提并论[29] 开源大语言模型:Nemotron - 公司发布了面向智能体场景的开源大语言模型Nemotron 3 Super,该模型专门针对长上下文任务进行了优化,参数规模为1200亿[33] - 结合NemoClaw提供的安全层以及Nemotron 3 Super本身的隐私优势,公司旨在解决边缘部署智能体时的关键隐私限制问题[35] AI在物理世界的应用 - 公司在GTC大会上展示了110台机器人,并宣布比亚迪、现代、日产和吉利成为其最新合作伙伴,这些车企将采用NVIDIA DRIVE Hyperion技术打造L4级自动驾驶汽车[38] - 公司与Uber计划在2028年于四大洲的28个城市推出完全由NVIDIA DRIVE AV全栈软件驱动的自动驾驶车队,预计2027年上半年在洛杉矶和旧金山湾区率先推出[40] - 公司发布了全新的NVIDIA Isaac仿真框架以及面向业界的Cosmos、Isaac GR00T开放模型,用于开发、训练和部署下一代智能机器人[40] - 公司推出了开放式物理AI数据工厂Blueprint,旨在对视觉AI智能体、机器人和自动驾驶车辆的物理AI模型进行大规模数据处理和管理[40]
黄仁勋抢吃龙虾:英伟达新核弹10倍算力提升,OpenClaw自由了