Workflow
英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token
美股IPO·2025-09-10 07:36

Rubin CPX强化AI视频生成和软件开发能力,提供30 petaflops 算力,相比GB300 NVL72系统,注意力加速3倍,2026年底上市。黄仁勋说,Rubin CPX是首款专为大规模上下文AI而构建的CUDA GPU,模型可以同时进行数百万个知识token的推理。英伟达称,部署1亿美元的新芯片硬件将为客户 带来高达50亿美元收入。 美东时间9月9日周二,英伟达发布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能 力。 Rubin CPX定于2026年底上市,采用卡片形式,可集成到现有服务器设计中或作为独立计算设备在数据中心运行。 这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算能力(NVFP4精度),配备128GB GDDR7内存, 支持视频解码和编码的硬件,相比英伟达GB300 NVL72系统,注意力加速3倍。 完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供 ...