英伟达叫板DeepSeek?怒投260亿美元,要打造最强开源模型

文章核心观点 - 英伟达正从人工智能算力供应商向全栈AI巨头战略转型,其目标直指前沿大模型领域 [14] - 公司通过巨额投资和发布顶级开源模型,积极进入其定义的AI基础设施“五层蛋糕”的每一层,特别是模型层 [4][6][14] - 这一“以模型带硬件”的策略旨在通过对芯片能力的极致优化,进一步巩固其在全球AI算力竞争中的主导地位 [15] 英伟达对AI基础设施的定位与战略 - 公司CEO黄仁勋认为,人工智能是塑造世界最强大的力量之一,是如同电力和互联网一般的关键基础设施,而非单一应用或模型 [2] - 公司将人工智能基础设施划分为“五层蛋糕”:能源 → 芯片 → 基础设施 → 模型 → 应用 [3] - 英伟达自身已成为AI时代基础设施的一部分,尤其在芯片和“AI工厂”类基础设施领域,但现在正尝试进入所有层级 [4] 英伟达在开源大模型领域的投入与进展 - 公司计划在未来五年内投入260亿美元用于构建开源人工智能模型 [6] - 近期发布了性能强大的开源模型Nemotron 3 Super,拥有1280亿个参数,体量相当于OpenAI的GPT-OSS,并在多项基准测试中表现更优 [9] - 公司应用深度学习研究副总裁表示,英伟达正以更严肃的态度对待开源模型开发并取得进步 [10] - 此前,公司已通过推出Nemotron系列模型(包括多种混合架构)正式尝试进入通用大模型领域,旨在将CUDA生态与自研模型深度结合 [4] 英伟达战略转型的驱动因素 - 开发AI模型能帮助公司改进芯片,并提升其构建的超算级数据中心能力,通过测试系统极限来指导硬件架构路线图 [13] - 当前前沿领先的开源模型几乎都集中在中国(如DeepSeek、Qwen等),全球许多开发者和研究者基于这些模型进行开发,这成为英伟达投入开放权重大模型研发的重要驱动力之一 [13][14] - 行业观察者认为,此举是公司对AI开放性抱有信念的空前信号,也标志着其从算力供应商向全栈AI巨头的转型 [14]

英伟达叫板DeepSeek?怒投260亿美元,要打造最强开源模型 - Reportify