英伟达叫板DeepSeek？怒投260亿美元，要打造最强开源模型

文章核心观点 - 英伟达正从人工智能算力供应商向全栈AI巨头战略转型，其目标直指前沿大模型领域 [14] - 公司通过巨额投资和发布顶级开源模型，积极进入其定义的AI基础设施“五层蛋糕”的每一层，特别是模型层 [4][6][14] - 这一“以模型带硬件”的策略旨在通过对芯片能力的极致优化，进一步巩固其在全球AI算力竞争中的主导地位 [15] 英伟达对AI基础设施的定位与战略 - 公司CEO黄仁勋认为，人工智能是塑造世界最强大的力量之一，是如同电力和互联网一般的关键基础设施，而非单一应用或模型 [2] - 公司将人工智能基础设施划分为“五层蛋糕”：能源 → 芯片 → 基础设施 → 模型 → 应用 [3] - 英伟达自身已成为AI时代基础设施的一部分，尤其在芯片和“AI工厂”类基础设施领域，但现在正尝试进入所有层级 [4] 英伟达在开源大模型领域的投入与进展 - 公司计划在未来五年内投入260亿美元用于构建开源人工智能模型 [6] - 近期发布了性能强大的开源模型Nemotron 3 Super，拥有1280亿个参数，体量相当于OpenAI的GPT-OSS，并在多项基准测试中表现更优 [9] - 公司应用深度学习研究副总裁表示，英伟达正以更严肃的态度对待开源模型开发并取得进步 [10] - 此前，公司已通过推出Nemotron系列模型（包括多种混合架构）正式尝试进入通用大模型领域，旨在将CUDA生态与自研模型深度结合 [4] 英伟达战略转型的驱动因素 - 开发AI模型能帮助公司改进芯片，并提升其构建的超算级数据中心能力，通过测试系统极限来指导硬件架构路线图 [13] - 当前前沿领先的开源模型几乎都集中在中国（如DeepSeek、Qwen等），全球许多开发者和研究者基于这些模型进行开发，这成为英伟达投入开放权重大模型研发的重要驱动力之一 [13][14] - 行业观察者认为，此举是公司对AI开放性抱有信念的空前信号，也标志着其从算力供应商向全栈AI巨头的转型 [14]