Nemotron
搜索文档
直击CES|黄仁勋:英伟达在开放模型生态系统中处于领先地位
新浪财经· 2026-01-06 09:23
公司战略与定位 - 英伟达在2026年度国际消费电子展(CES)的新品发布会上,宣称其在开放模型生态系统中处于领先地位 [1] - 公司不仅开源了模型,还开源了用于训练这些模型的数据,旨在让用户信任模型的生成过程 [1] 产品与生态系统布局 - 公司展示了用于机器人的基础模型“GR00T” [1] - 公司展示了用于物理人工智能的“Cosmos” [1] - 公司展示了基于物理定律的数字孪生平台“Earth-2” [1] - 公司产品线还包括智能体AI模型Nemotron [1] - 公司产品线还包括用于生物医学AI的Clara [1] - 公司产品线还包括用于自动驾驶汽车的Alpamayo [1]
NVIDIA (NasdaqGS:NVDA) 2026 Conference Transcript
2026-01-06 06:02
NVIDIA CES 2026 主题演讲纪要分析 涉及的行业与公司 * 公司:NVIDIA (NVDA) [1] * 行业:人工智能、加速计算、半导体、云计算、自动驾驶汽车、机器人、工业设计与制造、EDA(电子设计自动化)[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41][42][43][44][45][46][47][48][49][50][51][52][53][54][55][56][57][58][59][60][61][62][63][64][65][66][67][68][69][70][71][72][73][74][75][76][77][78][79][80][81][82][83][84][85][86][87] 核心观点与论据 1. 人工智能引领双重平台变革 * 计算行业每10-15年发生一次平台转移,当前正同时经历向AI和基于AI构建应用的双重平台变革 [1][2] * 整个计算产业的五层堆栈(从芯片到应用)正在被重塑:软件从编程变为训练,计算从CPU转向GPU,应用从预编译变为实时生成 [2] * 过去十年价值约10万亿美元的计算基础设施正在向这种新计算方式现代化 [3] * 每年有数百亿至数千亿美元的VC资金投入这一现代化进程,同时数万亿美元产业(其中几个百分点是研发预算)的研发资金正转向人工智能 [3] 2. 2025年AI关键进展与趋势 * **推理模型与测试时扩展**:2023年ChatGPT O1模型引入“测试时扩展”(即思考),使AI能够实时推理 [5] * **智能体系统普及**:2024年开始出现,2025年广泛扩散,能够推理、查找信息、研究、使用工具、规划未来、模拟结果 [5][6] * **物理AI**:理解自然法则并与物理世界交互的AI [6][7] * **开源模型达到前沿水平**:以DeepSeek R1(首个开源推理系统)为代表,开源模型虽仍落后前沿专有模型约6个月,但每6个月就有新模型出现且越来越智能 [7][8] * **下载量激增**:开源模型下载量爆炸式增长,因为初创公司、大企业、研究人员、学生和各国都希望参与AI革命 [8] 3. NVIDIA作为前沿AI模型构建者的战略 * 公司运营着价值数十亿美元的DGX超级计算机用于开发自己的开源模型 [9] * 在多个领域进行前沿AI模型工作,包括: * **数字生物学**:La Protina(合成与生成蛋白质)、OpenFold3(理解蛋白质结构)、Evo2(理解与生成多种蛋白质) [9] * **物理AI**:Earth-2(理解物理定律)、FourCastNet和CorrDiff(革新天气预测) [10] * **基础模型**:Nemotron-3(首个混合Transformer SSM模型,速度极快)、Cosmos(前沿开放世界基础模型)、GR00T(人形机器人系统) [10] * **自动驾驶**:AlphaMyo [11] * 不仅开源模型,还开源用于训练模型的数据,并提供全套生命周期管理库(NeMo、Physics NeMo、Clara NeMo、Bio NeMo) [11] * 模型在多个排行榜上位居前列,包括PDF解析、语音识别、检索模型(语义搜索)等 [13][14] 4. 智能体(Agent)架构与AI应用未来 * AI智能体具备推理能力,能够将未知问题分解为已知步骤,无需在第一天就知晓一切 [15][16] * 未来AI应用架构是多模态、多云、混合云的,能够调用最适合任务的不同模型 [17][18] * 公司提供“蓝图”框架,集成到全球企业SaaS平台中,使企业能够构建既定制化又始终处于前沿的AI [19] * 现场演示了使用Brev、DGX Spark、前沿模型API、意图模型路由器和Hugging Face的Ricci机器人构建个人助理的示例 [20][21][22] * 这种基于语言模型(结合专有前沿模型与定制模型)的智能体框架,是现代AI应用的基本架构 [23] 5. 企业AI与物理AI的变革 * **企业AI**:与Palantir、ServiceNow、Snowflake、CodeRabbit、CrowdStrike、NetApp等领先企业平台合作,将智能体系统集成并加速其平台,智能体系统正成为新的用户界面,取代传统如Excel或命令行 [24][25] * **物理AI**:致力于让AI理解物理世界的常识(物体恒存性、因果关系、摩擦力、重力、惯性),这需要三个计算系统:训练AI的计算机、在边缘推理的计算机、以及用于模拟的计算机 [26][27][28][29] * **核心模拟与数据生成平台**: * **Omniverse**:数字孪生、基于物理的模拟世界 [29] * **Cosmos**:世界基础模型,通过对互联网规模视频、真实驾驶与机器人数据以及3D模拟进行预训练,学习世界的统一表征,能够生成物理上合理的合成数据以解决真实世界数据稀缺问题 [30][31] * Cosmos已被下载数百万次,公司也用它来创建自动驾驶汽车,进行场景生成和评估 [32] 6. 自动驾驶汽车:AlphaMyo与全栈整合 * **AlphaMyo发布**:全球首个具备思考、推理能力的自动驾驶汽车AI,端到端训练(从摄像头输入到执行机构输出) [33] * **数据来源**:结合自身驾驶里程、人类示范驾驶里程以及Cosmos生成的数据,并辅以数十万个精心标注的示例 [33] * **关键特性**:不仅处理传感器输入并控制车辆,还会推理即将采取的行动、解释原因并规划轨迹,通过处理“长尾”驾驶场景 [33][34] * **全栈整合示例**:以与梅赛德斯-奔驰的合作为例,展示了AI五层蛋糕在机器人领域的应用: * 底层:汽车(机器人本体) * 第二层:芯片(GPU、网络芯片、CPU) * 第三层:基础设施(Omniverse、Cosmos) * 第四层:模型(AlphaMyo) * 第五层:应用(梅赛德斯-奔驰汽车) [36][37] * **商业化进展**:首款NVIDIA自动驾驶汽车将于2026年Q1在美国上路,Q2进入欧洲,Q3/Q4进入亚洲,并将持续更新AlphaMyo版本 [38] * **安全架构**:采用双软件栈(AlphaMyo栈和经典AV栈)镜像运行,由策略与安全评估器决定使用哪个栈,确保安全冗余 [39][40] * **商业模式**:整个堆栈对生态系统开放,合作伙伴可根据需要采用全栈或部分技术,这已成为公司的巨大业务 [41][42] 7. 机器人技术的下一篇章 * 物理AI和模拟技术适用于所有形式的机器人系统(操纵器、移动机器人、人形机器人) [42] * 机器人通过Omniverse中的Isaac Sim和Isaac Lab模拟器进行训练 [43][44] * 众多合作伙伴正在构建各种机器人,包括Neurobot、Agibot、LG、卡特彼勒、Agility、Boston Dynamics、手术机器人、Franka、Universal Robots等 [44] 8. 赋能半导体与工业设计行业 * 物理AI和AI物理将革命性改变半导体设计(EDA)和系统设计行业 [45] * 与Cadence、Synopsys和西门子达成深度合作,将CUDA X库、物理AI、智能体AI、NeMo、Nemotron集成到其设计、仿真和数字孪生工具中 [45][46][49] * 未来将出现智能体芯片设计师和系统设计师,芯片和系统将在计算机中设计、制造、测试和评估 [46][47][48] * 与西门子的合作旨在将物理AI带入从设计、仿真到生产、运营的完整工业生命周期,开启新的工业革命 [49] 9. 下一代计算平台:Vera Rubin * **发布背景**:AI计算需求飙升,模型规模每年以10倍(一个数量级)增长,O1模型引入后,推理变为思考过程,测试时扩展导致生成的token数量每年增加5倍,同时AI token成本每年下降约10倍 [51][52] * **设计理念**:由于摩尔定律放缓,晶体管数量年增长有限(Vera Rubin GPU晶体管数量仅为Blackwell的1.6倍),必须通过极致的协同设计(重新设计所有芯片和整个堆栈)来实现性能飞跃 [57][58][60] * **系统组成**: * **Vera CPU**:定制设计CPU,性能是上一代的两倍,与Rubin GPU协同设计,双向一致共享数据 [55][59] * **Rubin GPU**:AI浮点性能是Blackwell的5倍,采用革命性的MVFP4张量核心,可动态自适应调整精度 [55][60][61][62] * **ConnectX-9 NIC**:为每个GPU提供1.6 terabits/秒的横向扩展带宽 [55] * **BlueField-4 DPU**:卸载存储和安全功能 [55] * **第六代NVLink交换机**:数据移动量超过全球互联网,连接18个计算节点,最多72个Rubin GPU协同工作 [56][68] * **Spectrum-X以太网光子交换机**:世界首个具有512端口、200 gigabits/秒能力的共封装光学器件以太网交换机,采用TSMC的COOP硅光子集成新工艺 [56][72] * **关键创新与性能**: * **能效**:功耗是Grace Blackwell的两倍,但进气流量相同,冷却水温仍为45摄氏度,无需冷水机,预计可节省全球数据中心约6%的电力 [71][80] * **机密计算安全**:所有总线(PCIe、NVLink)在传输、静态和计算过程中均加密 [81] * **功率平滑**:解决AI工作负载瞬时尖峰(可达25%)问题,避免过度配置造成的能源浪费 [82] * **性能数据(模拟预测)**: * **训练**:对于10万亿参数模型(DeepSeek Plus Plus),Rubin的吞吐量远高于Blackwell,只需1/4数量的系统即可在一个月内完成训练 [84][85] * **工厂吞吐量**:Rubin的吞吐量每瓦性能预计将比Blackwell再高10倍左右,直接影响数据中心收入 [85][86] * **Token成本**:Rubin生成token的成本效益约为Blackwell的十分之一 [86] * **规模化部署**:Vera Rubin已投入全面生产,一个Rubin Pod包含1,152个GPU(16个机架,每机架72个GPU) [54][56][57] 其他重要内容 * **公司定位演进**:NVIDIA不仅构建芯片,现在构建整个系统,AI是一个全栈事业,公司正在从芯片到基础设施、模型、应用等各个方面重塑AI [86] * **市场拐点**:自动驾驶汽车从非自动驾驶到自动驾驶的拐点可能正在此时发生,未来10年,全球很大比例的汽车将成为自动驾驶或高度自动驾驶 [42] * **生态合作广度**:演讲中提及大量合作伙伴,涵盖云计算、企业软件、数据平台、网络安全、工业设计、机器人等多个领域,凸显NVIDIA生态系统的广泛性和战略重要性 [24][41][44][45][46][49]
人均1个亿,黄仁勋拟砸下30亿美元,「买断」OpenAI昔日劲敌
36氪· 2025-12-31 19:50
文章核心观点 - AI行业竞争已从模型训练阶段进入推理与系统整合的终局之战,行业整合加速,独立创业公司的中间地带正在消失 [3][33] - 英伟达拟以20亿至30亿美元收购AI21 Labs,核心目的并非购买现有模型或业务,而是进行高价“人才收割”并锁定下一代AI推理技术的主导权 [1][3][17] - 大模型创业的规则已被重写,成功路径愈发集中于成为巨头或整体被巨头收编,出售成为许多创业公司最现实的退出机制 [32][33] 潜在收购交易分析 - 交易金额预计为20亿至30亿美元,若以30亿美元成交,将成为英伟达历史上金额最高的AI并购案 [1][3] - 收购目标AI21 Labs全职员工约200人,据此计算人均收购“身价”高达1000万至1500万美元,远超一般独角兽并购案例 [3] - 交易尚未官宣,但行业认为“大概率会发生” [3] 收购方:英伟达的战略意图 - 收购逻辑清晰:主要目的不是补齐产品线,而是获取大语言模型架构人才,以争夺推理市场的主动权 [17][19] - 英伟达在训练市场几乎没有对手,但在推理市场正面临定制ASIC、TPU、自研芯片的竞争,市场开始碎片化 [20] - 通过收购AI21,英伟达旨在直接掌控其高效的推理技术团队,特别是在以色列加强模型层与系统层的研发力量 [20][23][26] - 这是英伟达对推理市场的系统性整合,意在“提前锁定一代人才供给” [19][26] 被收购方:AI21 Labs的背景与现状 - AI21 Labs由Amnon Shashua教授等人于2017年联合创立,曾是以色列AI赛道的“门面担当” [4][6] - 在ChatGPT发布后,公司发展步履维艰,难以追上OpenAI等头部企业的进展 [11][14] - 公司已停止面向消费者的产品Wordtune研发,目前专注于面向企业客户的专业化语言模型 [14] - 旗舰企业产品Maestro旨在将语言模型准确率最高提升50%,并推出了据称速度更快、能效更高的新型推理模型 [16] - 公司当前年营收约5000万美元,但与高昂的研发成本和团队规模相比,业务可持续性面临挑战 [16] - 其核心技术价值在于Jamba混合架构(SSM-Transformer融合),该架构在长上下文处理速度上提升2.5倍,并较DeepSeek、Llama等模型实现2至5倍的能效优势 [20] 行业竞争格局与趋势 - 生成式AI爆发后,行业进入算力、数据、分发渠道的“军备竞赛”,OpenAI、Anthropic、Meta等巨头主导市场 [11] - 2025年10月,OpenAI跃升为全球估值最高的非上市科技公司 [12] - 大模型创业分为三阶段:第一阶段拼论文和参数,第二阶段拼算力和资本,第三阶段拼生态和并购对象 [32] - 当前,独立公司在“通用生成模型”赛道翻盘难度极高,做大模型创业的路径要么是做到OpenAI的体量,要么是被巨头整体收编,中间地带正在迅速消失 [32][33] - 市场暗流涌动,例如Meta与谷歌洽谈数十亿美元TPU交易的消息曾导致英伟达股价下跌4% [17] 创始人动向与行业隐喻 - AI21联合创始人Amnon Shashua已将主要精力转向其新创立的AI初创公司AAI,该公司聚焦于下一代AI推理模型与系统架构,成立不足两年已获数亿美元融资并跻身独角兽行列 [26][27][30] - 此次出售对创始人而言并非失败,而是一次“提前下车”或理性的退出机制 [26][32] - 收购案隐喻着AI淘金热或已近尾声,当英伟达这类“卖铲子”的巨头开始直接“买下挖矿的人”,标志着行业进入深度整合阶段 [33]
NVIDIA Corporation (NVDA) Launches a New Family of Open Source AI Models
Yahoo Finance· 2025-12-21 22:45
公司战略与产品发布 - 英伟达于12月15日发布了一个名为Nemotron的新系列开源AI模型 该系列模型比其以往所有模型更智能、更快且更便宜 [1] - Nemotron系列模型专长于写作、编码等任务 其中最小的模型Nemotron 3 Nano已发布 另外两个更大版本预计在2026年上半年推出 [2] - 尽管公司以制造并向其他AI模型公司提供芯片而闻名 但面对中国公司如深度求索、月之暗面及阿里巴巴的开源模型占据市场 公司也开始发布自己的开源模型 [2] 市场竞争格局 - 随着Meta Platforms据称转向闭源模型 英伟达有望成为该(开源模型)领域最大的参与者之一 [3] - 中国公司的开源模型(如深度求索、月之暗面、阿里巴巴)已在市场上大量涌现 [1][2] 市场观点与评级 - 华尔街对该科技巨头保持看涨 摩根士丹利的Joseph Moore于12月17日重申“买入”评级 目标价为250美元 [3] - 伯恩斯坦的Stacy Rasgon于12月15日同样重申“买入”评级 目标价为275美元 [3] - 有观点认为英伟达是2026年值得买入并持有的最佳股票之一 [1] 公司业务概览 - 英伟达设计并销售专用处理器 最初用于游戏 现在也对人工智能、数据中心、专业可视化及汽车行业至关重要 [4] - 公司开发了图形处理器以及CUDA并行计算平台 这使得其GPU能够执行图形处理以外的任务 [4]
Why Shares of UiPath Are Soaring Today
Yahoo Finance· 2025-09-30 23:40
公司股价表现 - 公司股价继昨日上涨2.9%后,今日延续上涨趋势,截至美国东部时间上午9点50分,股价上涨14.9% [1] 战略合作与产品创新 - 公司与英伟达合作,提供集成服务连接器,将UiPath平台与英伟达的NIM和Nemotron推理模型连接,以增强高信任度场景(如欺诈检测或医疗保健)中的自动化工作流程生成式AI能力 [3] - 公司与OpenAI合作开发ChatGPT连接器,将OpenAI的前沿模型与UiPath的企业级编排系统集成,以提升企业客户工作流程 [4] - 公司与Snowflake合作,将UiPath的Agentic Automation平台与Snowflake的Cortex AI平台结合,使客户能将可信的洞察转化为编排行动,而无需改造现有系统 [4] 市场定位与发展前景 - 多项合作公告表明公司致力于保持在人工智能创新前沿 [5] - 今日的公告增强了公司作为提供先进自动化能力平台行业领导者的看涨理由 [5][6]