“龙虾热”席卷全球之际 黄仁勋携开源模型炸场! 英伟达(NVDA.US)全栈野心托起“AI牛市叙事”
英伟达英伟达(US:NVDA) 智通财经网·2026-03-12 16:16

公司核心战略与产品发布 - 公司推出专为超大规模AI智能体打造的开源大模型“Nemotron 3 Super”,旨在以可扩展方式运行复杂的代理式AI系统 [1] - 此举强化了公司从单纯的AI芯片供应商向“模型—工具链—云推理服务—AI生态系统”全栈平台转变的趋势 [1] - 该模型总参数为1200亿(120B),采用混合专家模型架构,推理时仅激活120亿(12B)参数,上下文窗口原生支持100万tokens [2][3] - 模型设计工程意义明确:用MoE控制激活开销,用Mamba拉长上下文和吞吐,用Attention保住精确检索与推理稳定性,更偏向于作为“代理编排主脑” [4] - 模型本身是公司释放的“全栈信号”,将模型、优化、微服务生态、云端算力与部署合作伙伴整合进一个软硬件一体化的AI生态产品体系 [8] - 公司的角色正从“卖AI算力加速卡”扩展到“定义 agent 模型、推理栈、部署路径和企业工作流入口”,越来越像AI基础设施总承包商 [8][10] 产品性能与技术细节 - 在Pinchbench基准测试中,该模型稳坐开源第一,在OpenClaw任务成功率上取得85.6%的高分,性能直逼Claude Opus 4.6、GPT-5.4两大闭源模型 [1][10] - 与上一代Nemotron Super模型相比,推理性能提升3倍有余,吞吐量最高可提升至5倍,准确率最高可提升至2倍 [2] - 在8k输入/64k输出设置下,其推理吞吐可达GPT-OSS-120B的2.2倍、Qwen3.5-122B的7.5倍 [4][11] - 在公司的Blackwell平台上以NVFP4精度运行时,推理速度最高可达到Hopper平台FP8的4倍,且不损失准确率 [6][11] - 模型采用LatentMoE+Mamba-2+少量Attention的混合架构,共有88层、模型维度4096 [3] - 模型设计旨在解决企业部署多代理应用时的“上下文爆炸”(token量可达标准聊天至少15倍)和“思考税”(成本过高、响应迟缓)两大限制 [5] 市场应用与合作伙伴 - AI搜索公司Perplexity已向用户提供该模型,用于AI智能体驱动的系统性搜索,并作为其20个编排模型之一 [2] - CodeRabbit、Factory、Greptile等科技公司正将该模型集成到其AI代理服务中,以在更低成本下实现更高准确率和经营效率 [2] - Edison Scientific、Lila Sciences等生命科学与AI研究机构将利用该模型支持代理模式,用于深度文献检索、数据科学和分子理解等复杂功能 [2] - Amdocs、Palantir、Cadence、达索系统、西门子等公司正在积极部署并定制化该模型,以实现电信、网络安全、半导体设计制造等领域工作流程的代理式自动化 [3] - AI服务器制造商戴尔科技正将该模型引入Hugging Face平台的Dell Enterprise Hub,以推进企业多代理AI工作流的本地化部署 [9] - 另一AI服务器领军者慧与科技也在将Nemotron引入其agents hub,以确保代理式AI在企业中的可扩展落地 [9] 行业趋势与市场前景 - 高通CEO预测2026年将是“AI代理之年”,数字生态系统将从以移动智能手机和应用程序为中心,转向以AI代理为中心 [4] - 全球科技巨头对AI算力的资本开支激增,亚马逊、谷歌、Meta、甲骨文、微软预计2026年AI相关资本支出合计约6500亿美元,部分分析师认为可能超过7000亿美元,同比增幅可能超过70% [18] - 2023年至2026年间,上述五大科技巨头为打造AI算力基础设施的累计投入预计约1.5万亿美元,远超2022年之前整个历史统计期间累计的约6000亿美元 [18] - 摩根士丹利渠道调查显示,全球“AI算力供需缺口每日以个位数级别大幅扩大”,云计算超级巨头对AI工作负载的增长依然极其激进 [14] - 即便部分客户自研AI ASIC或采购AMD AI GPU,预计这些超级客户在2026年对公司产品的采购量仍将大幅增长80%以上 [14] - 当模型规模、推理链路与多模态/代理式AI工作负载推动算力消耗呈指数型扩张时,AI算力基础设施成为科技巨头资本开支主线,并带动电力、液冷散热、光互连等供应链投资主题 [17] 财务表现与分析师观点 - 公司当前全球市值最高,约4.5万亿美元 [1] - 截至周三美股收盘,公司股价收于186.03美元,此前历史最高点位为212.167美元 [12] - 摩根士丹利重申公司为半导体板块“首选”股票,维持“增持”评级与260美元目标价 [12] - TipRanks汇编的华尔街分析师平均目标价显示,分析师普遍看好公司股价冲至273美元,意味着未来12个月上行潜力高达47% [12] - 即将到来的GTC 2026大会将展示公司领先的技术路线图,其Vera Rubin架构与在物理AI领域的最新布局将开辟全新的市场总值空间 [14]