Nvidia-NVIDIA Debuts Nemotron 3 Family of Open Models

文章核心观点 - NVIDIA发布全新Nemotron 3系列开源模型、数据和工具库，旨在为透明、高效和专业的智能体AI开发提供动力，以应对行业从单模型聊天机器人向协作式多智能体AI系统转变的挑战 [1][2] 产品发布与架构 - 推出Nemotron 3模型家族，包含Nano、Super和Ultra三种尺寸，采用突破性的混合潜在专家混合架构，帮助开发者大规模构建和部署可靠的多智能体系统 [1] - Nemotron 3 Nano是计算成本效益最高的模型，适用于软件调试、内容总结、AI助手工作流和信息检索等任务，其独特的混合MoE架构提升了效率和可扩展性 [7] - Nemotron 3 Super擅长需要多个协作智能体以低延迟完成复杂任务的应用 [9] - Nemotron 3 Ultra可作为需要深度研究和战略规划的AI工作流的高级推理引擎 [9] - Nemotron 3 Super和Ultra在NVIDIA Blackwell架构上使用超高效的4位NVFP4训练格式，显著减少内存需求并加速训练，使更大模型能在现有基础设施上训练而不损失精度 [10] 性能与效率 - Nemotron 3 Nano与Nemotron 2 Nano相比，令牌吞吐量最高提升4倍，推理-令牌生成减少高达60%，显著降低推理成本 [8] - Nemotron 3 Nano拥有100万令牌的上下文窗口，能记住更多信息，使其在长期、多步骤任务中更准确、更善于连接信息 [8] - 独立基准测试组织Artificial Analysis将该模型评为同尺寸模型中开放性和效率最高，且准确性领先 [9] 模型规格与数据 - Nemotron 3 Nano是一个小型模型，拥有300亿参数，每次激活高达30亿参数，用于针对性高效任务 [17] - Nemotron 3 Super是一个高精度推理模型，拥有约1000亿参数，每个令牌激活高达100亿参数，适用于多智能体应用 [17] - Nemotron 3 Ultra是一个大型推理引擎，拥有约5000亿参数，每个令牌激活高达500亿参数，适用于复杂AI应用 [17] - 发布了3万亿令牌的新Nemotron预训练、后训练和强化学习数据集，为创建高能力、领域专业化智能体提供丰富的推理、编码和多步骤工作流示例 [18] - Nemotron智能体安全数据集提供真实世界遥测数据，帮助团队评估和加强复杂智能体系统的安全性 [18] 生态系统与合作伙伴 - 早期采用者包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys和Zoom等，正在集成Nemotron系列模型，为制造业、网络安全、软件开发、媒体、通信等行业的AI工作流提供动力 [4] - ServiceNow表示，其智能工作流自动化与NVIDIA Nemotron 3结合，将继续以无与伦比的效率、速度和准确性定义标准 [5] - Perplexity表示，通过其智能体路由器，可将工作负载定向到最佳微调开源模型（如Nemotron 3 Ultra），或在任务受益时利用领先的专有模型，确保其AI助手以卓越的速度、效率和规模运行 [6] - 风险投资公司General Catalyst和Mayfield的投资组合公司正在探索使用Nemotron 3来构建支持人机协作的AI队友 [6] - Nemotron 3得到LM Studio、llama.cpp、SGLang和vLLM的支持 [20] - Prime Intellect和Unsloth正在将NeMo Gym的即用型训练环境直接集成到其工作流中，为团队提供更快、更便捷的强化学习训练访问 [20] 开发工具与可用性 - 发布了NeMo Gym和NeMo RL开源库，为Nemotron模型提供训练环境和后训练基础，并发布NeMo Evaluator以验证模型安全性和性能，所有工具和数据集现已在GitHub和Hugging Face上提供 [19] - Nemotron 3 Nano即日起可通过Hugging Face以及包括Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter和Together AI在内的推理服务提供商获取 [21] - Nemotron在企业AI和数据基础设施平台上提供，包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda和UiPath [22] - 对于公有云客户，Nemotron 3 Nano将通过Amazon Bedrock在AWS上提供，并即将在Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale和Yotta上获得支持 [22] - Nemotron 3 Nano可作为NVIDIA NIM微服务提供，用于在NVIDIA加速基础设施上任何地方进行安全、可扩展的部署，以实现最大隐私和控制 [23] - Nemotron 3 Super和Ultra预计在2026年上半年上市 [23] 战略意义与行业影响 - 公司CEO表示，开放创新是AI进步的基石，Nemotron正在将先进AI转变为一个开放平台，为开发者提供大规模构建智能体系统所需的透明度和效率 [3] - Nemotron支持公司更广泛的“主权AI”努力，使从欧洲到韩国的组织能够采用开放、透明和高效的模型，以构建符合自身数据、法规和价值观的AI系统 [3] - 随着多智能体AI系统扩展，开发者日益依赖专有模型进行前沿推理，同时使用更高效、可定制的开源模型来降低成本，在单一工作流中在前沿模型和Nemotron之间路由任务，可在优化令牌经济的同时赋予智能体最高智能 [5] - 开放模型栈和NVIDIA Inception计划为早期公司提供模型、工具和具有成本效益的基础设施，以进行实验、差异化并快速扩展 [7] - 公司是首个发布用于构建高精度、高效、专业化AI智能体的先进开源模型、训练数据集以及强化学习环境和库的厂商 [16]