Workflow
英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token
华尔街见闻·2025-09-10 08:22

英伟达CEO黄仁勋表示,Rubin CPX是首款专为百万级token处理而构建的CUDA GPU。他说: "正如RTX革命性地改变了图形和物理AI,Rubin CPX是首款专为大规模上下文AI而构建的CUDA GPU,模型可以同时进行数百万个知识token的推理。" 美东时间9月9日周二,英伟达发布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能力。 Rubin CPX定于2026年底上市,采用卡片形式,可集成到现有服务器设计中或作为独立计算设备在数据中心运行。 这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算能力(NVFP4精度),配备128GB GDDR7内存,支持视 频解码和编码的硬件,相比英伟达GB300 NVL72系统,注意力加速3倍。 完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供8 exaflops AI性能,性能为英伟达 GB300 NVL72系统的7.5倍 ...