英伟达4B小模型击败GPT-5 Pro!成本仅1/36
英伟达英伟达(US:NVDA) 量子位·2025-12-08 14:07

英伟达小模型持续获胜。 ARC-AGI 2最新成绩,4B小模型 NVARC 以 27.64% 的公开榜成绩力 压GPT-5 Pro 18.3%登顶榜首。 且每任务成本仅20美分,大约是GPT-5 Pro单任务成本(超过7美元)的 1/36。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 据官方分析,此次NVARC夺冠的亮点在于 零预训练深度学习方法 ,没有依赖大规模通用数据集进行前期预训练, 规避了预训练模型的领域 偏见、数据依赖等问题。 而ARC-AGI 2确实是一个消除了与公共训练数据重叠的更高难度测试, 主要是看测试模型能否高效地获取超出其训练数据的新技能。 快来看看"性价比之王"是如何"练"成的? 不靠参数堆料 英伟达的策略是将复杂推理移至离线的合成数据管道, 训练能在评估时快速运行的较小模型。 简单来说就是 大规模合成高质量数据 ,然后对现有模型进行优化, 并且 将昂贵的计算工作转移到离线进行 。 为了确保数据质量,他们将复杂的推理管线拆分成不同的阶段,每个阶段都可以独立验证。 通过这种方式,他们建立了一个含320万+ 增强样本的合成数据集,其中每个样本最多有7对输入/输出。 | Sourc ...