Vera Rubin AI 平台
搜索文档
英伟达全新AI平台Vera Rubin亮相,单 Token 成本降至 1/10
环球网资讯· 2026-03-17 11:51
公司战略与产品发布 - 英伟达在GTC大会上正式发布专为智能体AI发展打造的Vera Rubin AI平台[1] - 该平台被视作公司在AI基础设施领域的代际飞跃,标志着其开启史上最大规模的AI基建布局[1] - 平台旨在全面覆盖从大规模预训练到实时智能体推理的AI全生命周期,为智能体AI技术发展提供算力与技术支撑[1] 平台核心技术突破 - 平台在核心算力、推理加速、数据存储等多个维度实现技术突破,从底层优化AI全流程运算效率[3] - 核心算力层面,新一代NVL72机架通过NVLink 6连接72块Rubin GPU与36块Vera CPU[3] - 相较于上一代Blackwell平台,新系统完成混合专家大模型训练仅需四分之一的GPU[3] - 新系统每瓦推理吞吐量提升10倍,成功将单Token成本降至原来的十分之一[3] - 专为验证AI模型结果设计的Vera CPU机架集成256块液冷CPU,运行效率达到传统CPU的两倍,运算速度提升50%[3] 推理加速与延迟优化 - 针对智能体系统低延迟、长上下文需求,公司同步推出Groq 3 LPX推理加速机架[4] - 该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍[4] - 该技术有效解决智能体AI运行过程中的延迟问题,适配长上下文的运算需求[4] 数据存储与架构升级 - 全新BlueField-4 STX机架构建起AI原生存储基础架构[4] - 依托全新的DOCA Memos框架,系统能高效处理大型语言模型生成的海量键值缓存数据[4] - 新存储系统在显著降低能耗的同时,将推理吞吐量最高提升5倍[4] - 该升级让AI多轮交互的响应速度大幅加快,更好地匹配智能体AI的实际应用场景[4]