新一代Rubin AI平台发布与投产 - 公司宣布其新一代Vera Rubin AI平台已全面投产,该平台重量近2吨,通过集成六款新芯片设计,实现每秒千亿级别的AI运算,被形容为一座“人工智能工厂”[2] - Rubin平台的训练性能是前代Blackwell的3.5倍,运行AI软件的性能提升5倍,可将推理token生成成本降低至多10倍,训练混合专家模型所需GPU数量减少4倍[8] - 新平台包含五大创新技术:第六代NVLink互连、第三代Transformer引擎、第三代机密计算、第二代RAS引擎以及Vera CPU[9] - Vera CPU拥有88个定制核心,性能是替代产品的两倍,是专为代理推理设计的大规模AI工厂中能效最高的处理器[8] - Rubin GPU配备第三代Transformer引擎,具备硬件加速自适应压缩功能,可提供50 petaflops的NVFP4计算能力用于AI推理,每个GPU提供3.6TB/s带宽[8] - Vera Rubin NVL72机架级系统提供260TB/s带宽,采用模块化、无线缆托盘设计,组装和维护速度比Blackwell快18倍[8][9] - 公司CEO黄仁勋表示,全部六款Rubin芯片已从制造合作伙伴处返回,并已通过关键测试,正按计划推进,预计下半年发货[5][9] 生态系统与客户部署计划 - 微软、亚马逊AWS、谷歌云、甲骨文云等大型云计算提供商将在2026年率先部署基于Vera Rubin的实例[9] - 微软的下一代Fairwater AI超级工厂将配备英伟达Vera Rubin NVL72机架级系统,规模可扩展至数十万颗英伟达Vera Rubin超级芯片[6] - CoreWeave、Lambda、Nebius和Nscale等云合作伙伴也将是首批提供Rubin系统的供应商之一[6][9] - 思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器[10] - 包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI在内的AI实验室正期待利用Rubin平台训练更大型、更强大的模型[10] - OpenAI CEO Sam Altman表示,Rubin平台将帮助持续扩展计算和智能的进展[9] - Anthropic CEO Dario Amodei称,Rubin平台的效率提升代表了能够实现更长记忆、更好推理的基础设施进步[9] - Meta CEO扎克伯格表示,Rubin平台有望带来性能和效率的阶跃式变化,这是将最先进模型部署给数十亿人所需要的[10] 开源自动驾驶模型Alpamayo - 公司开源了其首个推理VLA模型Alpamayo 1,该模型旨在打造能在意外情况下“思考”解决方案的车辆,采用100亿参数架构,使用视频输入生成轨迹和推理过程[3][15] - 该模型标志着公司在无人驾驶领域迈出关键一步,旨在通过类人思维方式处理复杂驾驶场景,为解决自动驾驶长尾问题提供新路径[11][12] - 公司CEO黄仁勋称,“物理AI的ChatGPT时刻已到来”,Alpamayo为自动驾驶汽车带来推理能力,使其能够思考罕见场景并解释驾驶决策[17] - 该模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中[18] - 包括捷豹路虎、Lucid、Uber以及加州大学伯克利分校DeepDrive联盟在内的多家移动出行企业和研究机构表示,将利用Alpamayo开发基于推理的自动驾驶技术栈,推动L4级自动驾驶部署[13] - 首款搭载英伟达技术的汽车将于第一季度在美国上路,第二季度在欧洲上路,下半年在亚洲上路[4][17] 完整的自动驾驶开发生态系统 - 公司围绕Alpamayo构建了完整的开放生态系统,整合了开源模型、仿真框架和数据集三大支柱[14] - AlpaSim是一个完全开源的端到端仿真框架,用于高保真自动驾驶开发,提供真实的传感器建模和可扩展的闭环测试环境[21] - 公司提供了面向自动驾驶的大规模开放数据集,包含超过1700小时的驾驶数据,涵盖广泛的地理位置和条件,覆盖罕见且复杂的真实世界边缘案例[22] - 这些工具共同为基于推理的自动驾驶技术栈创建了一个自我强化的开发循环,开发者可利用这些资源在专有数据上微调模型,并通过仿真验证性能[22] 跨行业开源模型与工具发布 - 公司发布了推动各行业AI发展的多个新开源模型、数据和工具,涵盖代理AI、物理AI、机器人和生物医学等领域[4][24] - 用于代理AI的英伟达Nemotron家族发布了语音、多模态检索增强生成和安全相关的新模型,包含业界领先的开源实时语音识别模型[26] - 用于物理AI的英伟达Cosmos平台为加速物理AI开发带来类人推理和世界生成能力[26] - 用于机器人的英伟达Isaac GR00T N1.6是一个开放推理VLA模型,专为人形机器人打造,实现全身控制[26] - 公司提供了全球最大的开放多模态数据集合之一,包括10万亿语言训练标记、50万个机器人轨迹、45.5万个蛋白质结构和100TB的车辆传感器数据[26] - 博世、CrowdStrike、Palantir、Salesforce、ServiceNow、日立和Uber等科技业公司正在采用并基于英伟达的开源模型技术进行开发[27] - 这些开源模型、数据和框架已在GitHub和Hugging Face平台发布,并可通过云、推理和AI基础设施平台获取,许多还以英伟达NIM微服务的形式提供[27]
这不是显卡,是一座2吨重的AI工厂