Nemotron
搜索文档
NVIDIA (NasdaqGS:NVDA) Conference Transcript
2026-03-18 01:02
纪要涉及的行业或公司 * 公司为英伟达 (NVIDIA),行业涉及人工智能 (AI)、加速计算、半导体、云计算[4][5][6] * 讨论围绕英伟达的AI技术路线图、产品组合、市场战略和财务前景展开[6][14][15] 核心观点和论据 **1 技术拐点与产品路线图** * 当前AI发展处于第三个拐点,即“代理系统 (Agentic Systems)”阶段,其特点是能够自主执行任务,而不仅仅是回答问题[6] * 公司拥有对Blackwell和Rubin产品超过1万亿美元 (over $1 trillion plus) 的强劲需求和可见性,预计在2027年底前将持续获得、预订和交付更多业务[14][15] * 下一代Vera Rubin系统预计将在Groq之前开始发货[60][62] * 公司通过每年一次的产品发布节奏和全栈技术所有权(芯片、平台、软件、网络、存储),维持其竞争优势和快速交付能力[111][112][113] **2 商业模式与价值主张** * 客户购买计算机是为了生产“代币 (tokens)”,因此计算机的价值在于其生产代币的效率和成本,而非计算机本身的售价[17][18] * 公司通过每一代产品提供远超上一代的代币生产价值(每秒代币数、每瓦特代币数),使得客户宁愿以更高价格购买新一代产品,而非低价购买旧一代产品[18] * 公司与超大规模云服务提供商 (CSPs) 的关系是共生共赢:公司为CSPs带来客户(CUDA开发者、AI原生公司),是CSPs最好的销售力量之一[21][22][23] * 公司的业务构成可大致分为60%的超大规模云服务商和40%的区域云、工业、企业本地部署等,而后者完全离不开公司的全栈解决方案[23][24] **3 市场动态与增长驱动** * 2024年是“推理之年 (year of inference)”,公司展示了在推理领域的领导地位[19] * 公司覆盖的AI模型范围大幅扩大,包括OpenAI、开源模型、Anthropic、xAI等,这解释了公司在巨大体量下增速仍在加快[20][21] * 预计整个IT软件行业(约2万亿美元)将被AI改造和转型,未来的IT公司将通过集成AI模型并转售代币来改变商业模式,市场规模可能变得更大[39][40][41][45] * 随着市场成熟和细分,代币生产将出现不同层级和价格点,类似于iPhone或汽车行业的发展路径[68][75] * 物理AI(与实体世界交互)的拐点将在几年后到来,届时工业侧(目前占40%)的需求可能会增长,并最终超过数字AI相关的部分[51][52] **4 产品组合与架构演进** * Groq是一种专注于极低延迟、确定性响应的架构,其芯片上SRAM几乎占据整个芯片面积,但编程不易且不灵活[64][65] * 公司将Groq与Vera Rubin及GPU融合,用于处理自回归模型(如语言模型)的最后阶段,该阶段对带宽要求极高[66] * 增加Groq来处理25%的工作负载,将使客户在GPU计算上的支出增加约25%,这部分未包含在上述1万亿美元可见性中[89][90] * 与Grace Blackwell平台相比,Vera Rubin平台通过增加存储、CPU工具使用等,可能带来额外约50%的市场机会[91] * 公司是当今唯一能跨三种内存(HBM、LPDDR5、SRAM)优化AI工厂架构的公司[84] **5 财务与资本配置** * 公司目前每几天产生10亿美元现金 ($1 billion every couple of days)[93] * 现金使用的优先顺序是:1) 为增长提供资金,包括与供应链的长期合作和预付款;2) 投资生态系统(CUDA开发者、AI原生公司);3) 在完成前期投资承诺后,通过股票回购等方式回报股东[93][94][96][97] 其他重要内容 **关于训练与推理的展望** * 训练已从预训练 (pre-training) 发展到后训练 (post-training),后训练涉及的技能学习所需的计算强度可能是预训练的约100万倍[121] * 未来的预训练数据将主要来自合成数据,并且会加入多模态和物理交互[122] * 推理和训练之间的界限将变得越来越模糊,学习与应用将是连续的过程[123] * 公司的希望是未来99%甚至100%的计算资源用于产生经济价值的推理,而非训练[124] * 推理极其复杂且难度在不断上升,公司去年全力投入推理领域正是基于对此趋势的判断[125] **关于竞争与行业格局** * 公司的全栈能力(而不仅仅是芯片)是服务那40%非超大规模云客户的关键,这些客户购买的是平台而非芯片[24] * 公司根据客户意图将其分为三类:想自研芯片的(公司需与之竞争)、想在其云中托管英伟达客户的(公司为其带来客户)、需要购买完整系统的基础设施客户[105][106] * 公司认为其组织架构、使命和能力完全对齐于每年交付复杂AI工厂系统的承诺,这是其能够持续保持领先的原因[110][114] **具体数据与预测** * 工程师的“代币预算 (token budget)”已成为现实,公司认为雇佣年薪30万美元 ($300,000) 的工程师却不消耗代币是不合理的[7] * 有Reddit帖子提到某人的“Claw”一天消耗了5000万代币,成本约为50美元[53] * 公司希望日薪2000美元 ($2,000 a day) 的员工能每天消耗1000美元 ($1,000 a day) 的代币,因为这能极大提升生产力[54] * 当前代币的市场价格点大约在每百万代币6美元 ($6 per million tokens) 左右,但公司认为对于超大型、超快模型,客户愿意支付高得多的价格(如每百万代币50美元)[74] * AI公司(如Anthropic, OpenAI)正以史无前例的速度增长,营收每周增加10亿或20亿美元 ($1 billion or $2 billion a week)[39]
黄仁勋 GTC 2026 演讲实录:所有SaaS公司都将消失;Token成本全球最低;“龙虾”创造了历史;Feynman 架构已在路上
AI前线· 2026-03-17 07:30
公司战略定位 - 公司已从单一的图形处理器供应商转型为为“数万亿美元AI基建时代”提供完整技术栈的“总包工头” [2] - 公司的核心壁垒是CUDA软件生态及其庞大的安装基数,这形成了强大的“飞轮效应”,吸引了开发者、催生新市场并持续降低算力成本 [3][6] - 公司业务覆盖AI全领域,是全球唯一能运行语言、生物、图形、视觉、机器人、边缘及云端所有AI领域的平台 [18] CUDA生态与飞轮效应 - CUDA架构诞生20年,其单指令多线程(SIMT)架构和“tiles”功能降低了编程难度,并围绕其形成了包含数千种工具、编译器、框架和库的庞大生态 [4] - 公司在全球建立了数亿块运行CUDA的GPU和计算系统,服务每一朵云、每一家计算机公司和几乎每一个行业,构成了飞轮效应的基础 [6] - 飞轮效应表现为:安装基数吸引开发者,开发者创造新算法和技术突破,催生新市场并扩大生态,进而进一步扩大安装基数,同时使计算成本持续下降 [6][7] - 庞大的安装基数使得公司愿意持续优化软件,因为每项新优化都能让数百万用户受益,这延长了硬件(如六年前出货的Ampere架构)的生命周期,甚至在云上出现定价上涨 [6][7] 数据处理基础设施变革 - AI的快速发展正推动全球数据处理体系发生结构性变革,核心是结构化数据与非结构化数据的全面加速 [8] - 企业计算长期建立在结构化数据(数据框)之上,未来AI系统和智能体也将直接访问和使用这些数据库,要求数据处理基础设施获得数量级性能提升 [10] - 全球每年产生的数据中约90%是非结构化数据(如向量数据库、PDF、视频、语音),AI的多模态理解能力正将其转化为可计算的信息资源 [12] - 为支持这一转变,公司构建了两项关键基础技术:用于加速结构化数据处理的cuDF和用于处理非结构化数据及AI数据的cuVS [13] - 这些技术正逐步融入全球数据处理生态,例如IBM正利用cuDF加速其IBM watsonx.data平台 [13] AI原生行业爆发与市场前景 - 2025年风险投资对AI初创公司的投入高达1500亿美元,创历史之最,投资规模跃升至数十亿美元级,因为这些公司普遍需要海量算力和Token [15] - AI行业爆发源于三件大事:ChatGPT开启生成式AI时代、推理AI(如o1/o3)的出现以及Claude Code开启代理(Agentic)时代 [15] - AI已从“感知”进化到“生成”、“推理”,现在可以执行高效的实际工作,“推理拐点”已经到来,过去两年计算需求增长了约10,000倍,使用量增长约100倍 [17] - 公司预见通过2027年的营收将至少达到1万亿美元,2025年是公司的“推理之年” [17] - 公司业务中,60%来自顶级云服务商,40%来自区域云、主权云、企业级服务器及工业自动化 [18] AI推理性能与成本优势 - AI推理是最困难也是最关键的商业环节,它直接决定AI服务的收入来源 [22] - 衡量AI系统效率的关键指标是每瓦特生成多少token,公司从Hopper H200到Grace Blackwell NVLink 72架构,实现了每瓦特性能提升约35倍(分析师认为接近50倍),并带来更低的token成本 [22] - 通过极致的软硬件协同设计(如NVFP4计算架构、NVLink 72、Dynamo、TensorRT-LLM等),公司构建了完整的大模型推理技术体系 [20] - 仅通过更新软件栈,就能将部分AI推理平台的生成速度从约700 token/秒提升至接近5000 token/秒,性能提升约7倍 [25] - 公司的Token成本在全球范围内具有绝对优势,即便竞争对手的架构免费,其总成本(如1GW数据中心工厂15年摊销成本高达400亿美元)也不够便宜 [25] - 数据中心正从存储和计算中心转变为生产token的“AI工厂”,token成为新的数字商品 [27] Vera Rubin AI超级计算平台 - Vera Rubin是一个全新的计算平台,由七款芯片组成,涵盖计算、网络和存储,是目前最先进的POD规模AI平台 [28] - 该平台包含40个机架、1.2千万亿个晶体管、近2万个公司芯片、1152个NVIDIA Rubin GPU、60 exaflops运算能力以及10 PB/s总扩展带宽,目前已全面投产 [28] - 该平台得到了Anthropic、OpenAI、Meta、Mistral AI及所有主要云提供商的支持 [28] - 过去十年间AI计算能力实现了约4000万倍的提升,推动数据中心向“AI超级计算机”形态演进 [30] - Vera Rubin是一套从硬件到软件完全纵向整合的计算平台,专为智能体AI设计,重新设计了计算、存储和网络架构 [31] - 平台硬件包括全新的NVIDIA Vera CPU,该CPU针对高性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,并已开始单独销售,有望成为一项数十亿美元级业务 [33] - 系统采用100%液冷架构,通过45°C热水散热降低制冷成本,并将整机安装时间从两天缩短至约两小时 [33] - 网络互连采用第六代NVLink架构,并推出了全球首个CPO光电共封装的NVIDIA Spectrum-X以太网交换机 [35] - 通过Kyber机架架构的Rubin Ultra Compute System,可以在一个NVLink域中连接144个GPU,形成大规模统一计算机 [35] Feynman GPU架构与深度整合 - Feynman GPU架构将采用定制化HBM技术,可能基于HBM4E增强版或定制化HBM5方案,允许将部分GPU数据处理逻辑嵌入存储底层,实现超高带宽与低延迟 [41][42] - Feynman平台将搭载代号为Rosa的全新CPU,该CPU被设计为AI智能体的编排中枢,旨在高效调度GPU、存储与网络之间的Token流动 [43] - Feynman时代标志着公司将计算、存储和封装进行了深度耦合,正将数据中心演进为一台高度集成的“巨型超级计算机” [44] AI基础设施与数字孪生平台 - 公司推出NVIDIA DSX平台,这是一个面向“AI工厂”的基础设施平台,用于数据中心的数字仿真、虚拟调试和运行期动态优化 [46][47] - 数据中心建设阶段可通过工程仿真工具进行虚拟调试,大幅缩短建设周期;运行后其数字孪生系统可作为“操作系统”,由AI智能体动态调度冷却、电力和网络系统以优化效率 [46] - NVIDIA Omniverse平台被设计用于承载全球规模的数字孪生模型 [49] - 公司的AI计算基础设施正在向太空延伸,计划开发Vera Rubin Space One轨道数据中心 [49] 智能体操作系统与软件生态 - 公司高度评价并正式支持开源项目OpenClaw,其增长速度甚至超过了Linux,被视为智能体计算机的操作系统 [52][54] - OpenClaw能够连接大语言模型,管理计算资源,调用工具和服务,具备任务调度与多模态交互能力 [54] - 公司认为未来所有科技和软件公司都需要制定“OpenClaw战略”,因为企业软件正在从传统SaaS转向以智能体为核心的AaaS(Agentic as a Service) [55] - 公司与OpenClaw作者合作推出NVIDIA NemoClaw参考架构,增加了OpenShell安全组件,提供企业级安全扩展,使企业能安全部署智能体系统 [56][58] 开放模型生态与行业应用 - 公司推进开放模型生态,目前生态已包含接近300万个开放模型,覆盖语言、视觉、生物、物理和自动驾驶等多个领域 [59] - 公司已发布多条开放模型产品线(如Nemotron、Cosmos World Foundation Model、Project GR00T等),并开放训练数据和方法,策略是“纵向整合、横向开放” [59][60] - 公司宣布成立Nemotron Coalition联盟,与多家技术公司合作共同推进模型发展 [61] - 在物理AI领域,全球几乎所有机器人公司与公司合作,公司提供从训练平台、仿真到部署的完整技术体系 [62] - 自动驾驶的“ChatGPT时刻已经到来”,车辆具备推理和语音指令执行能力,公司宣布与比亚迪、现代、日产、吉利(合计年产量约1800万辆)以及Uber成为新的Robotaxi合作伙伴 [64] - AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命,以及物理AI与机器人时代 [65]
黄仁勋推出英伟达版“小龙虾”NemoClaw:支持“一键安装”
凤凰网· 2026-03-17 07:28
公司产品发布 - 英伟达在GTC大会上宣布推出全新的NemoClaw软件栈,旨在为“小龙虾”OpenClaw智能体平台提供“一键安装”体验 [1] - 公司CEO黄仁勋在主题演讲中通过一条指令快速部署了英伟达的Nemotron模型与新发布的OpenShell运行环境,展示了NemoClaw的便捷性 [1] - NemoClaw通过NVIDIA Agent Toolkit软件实现了对OpenClaw平台的“一键式”适配,其内置的OpenShell环境提供了一个隔离的沙箱 [1] 产品战略定位 - 黄仁勋将此次发布提升到战略高度,比喻称“正如Mac和Windows成为了个人电脑的操作系统,OpenClaw将成为‘个人AI的操作系统’” [1] - 此次发布不仅是产品的发布,更预示着软件行业一个新时代的开启 [1] 技术架构与特性 - 该架构允许AI智能体在严格确保数据隐私和网络安全的前提下灵活调用模型 [2] - 该架构既可以调用本地专属系统运行的开源模型(如Nemotron),也可以通过创新的“隐私路由器”安全地接入云端的前沿大模型,兼顾了性能与安全 [2] - NemoClaw展现了极强的硬件兼容性,能够充分利用广泛的专属算力硬件 [2] 硬件兼容性与支持 - 从搭载GeForce RTX的个人电脑和笔记本,到基于RTX PRO的专业工作站,乃至强大的DGX Station和新发布的DGX Spark AI超级计算机,NemoClaw都能够支持,确保AI智能体的流畅运行 [2]
英伟达计划推出面向企业的开源智能体平台NemoClaw
新浪财经· 2026-03-10 15:31
公司战略与产品发布 - 英伟达正计划推出一款名为NemoClaw的开源AI智能体平台,以顺应AI智能体工具日益高涨的流行趋势 [1][3] - 该平台将允许企业部署AI智能体为员工执行各类任务,且预计会搭载安全与隐私工具 [1][3] - 无论企业自身产品是否运行在英伟达芯片上,都可使用该平台 [1][3] 市场合作与商业模式 - 英伟达已开始向企业软件公司推介NemoClaw产品,寻求与Salesforce、思科、谷歌、奥多比、CrowdStrike建立合作关系 [1][3] - 由于平台预计为开源项目,合作伙伴或将免费使用,并可通过为项目贡献代码等方式获得提前访问权限 [1][3] - 目前尚不清楚是否已敲定任何正式合作,英伟达及其潜在合作伙伴尚未立即回应置评请求 [1][3] 行业趋势与竞争背景 - 随着企业从大语言模型转向更专业化、能独立推理、规划并执行复杂多步骤任务的工具,英伟达已开始加大对AI智能体的资源投入 [1][4] - 市场开始追捧所谓“Claw”类工具,这类开源AI工具可在用户设备本地运行,并执行连续任务 [2][4] - 此类AI智能体因OpenClaw(最初名为Clawdbot,后更名为Moltbot)在今年初走红而声名大噪,OpenAI最终收购了该项目并聘用了其开发者 [2][4] 公司技术布局与生态建设 - 近几个月来,英伟达已推出用于支撑AI智能体的基础模型,如Nemotron和Cosmos [1][4] - 英伟达扩展了NeMo平台,帮助客户管理AI智能体的完整生命周期——从数据整理、定制化,到监控与优化 [1][4] - 英伟达首席执行官黄仁勋在近期发言中称,OpenClaw“或许是有史以来最重要的软件发布之一” [3][4] 市场活动与时机 - 英伟达此举正值其下周将在圣何塞举办年度开发者大会之际,预计大会上将公布公司软硬件产品的相关发布与路线图 [3][4]
Nvidia plans open-source AI agent platform ‘NemoClaw' for enterprises: Wired
CNBC· 2026-03-10 13:52
公司战略与产品发布 - 英伟达计划推出名为“NemoClaw”的开源人工智能代理平台 以顺应AI工具日益增长的趋势 [1] - 该平台将使合作公司能够部署AI代理为员工执行任务 并预计包含安全和隐私工具 [3] - 无论公司的产品是否运行在英伟达芯片上 都能访问该平台 [4] 市场拓展与合作 - 公司已开始向企业软件公司推销该产品 寻求与Salesforce、思科、谷歌、Adobe和CrowdStrike建立合作伙伴关系 [2] - 由于平台预计开源 合作伙伴可能获得免费使用权 并以贡献项目换取早期访问权限 [3] - 目前尚不清楚是否已敲定任何正式合作伙伴关系 [2][3] 技术发展与行业背景 - 随着企业从大语言模型转向更专业化、能够对复杂多步骤任务进行推理、规划和独立行动的工具 英伟达已开始向AI代理投入更多资源 [4] - 公司近期发布了旨在驱动AI代理的基础模型 例如Nemotron和Cosmos [4] - 公司还扩展了其“NeMo”平台 该平台帮助客户管理从数据整理、定制到监控和优化的完整AI代理生命周期 [5] 竞争格局与市场趋势 - 英伟达对AI代理的兴趣 正值所谓的“Claw”类工具流行之际 这些是可在用户本地机器上运行并执行顺序任务的开源AI工具 [5] - OpenClaw(最初名为Clawdbot,后更名为Moltbot)在今年初崭露头角并使此类AI代理闻名 该项目最终被OpenAI收购 [6] - 专家已指出与OpenClaw新兴AI工具相关的诸多安全风险 而英伟达目前据称正以其AI代理平台瞄准企业客户 [6] 公司活动与展望 - 此举正值英伟达准备于下周在圣何塞举行年度开发者大会 预计大会将包含关于其硬件和软件产品的公告与路线图 [7]
直击CES|黄仁勋:英伟达在开放模型生态系统中处于领先地位
新浪财经· 2026-01-06 09:23
公司战略与定位 - 英伟达在2026年度国际消费电子展(CES)的新品发布会上,宣称其在开放模型生态系统中处于领先地位 [1] - 公司不仅开源了模型,还开源了用于训练这些模型的数据,旨在让用户信任模型的生成过程 [1] 产品与生态系统布局 - 公司展示了用于机器人的基础模型“GR00T” [1] - 公司展示了用于物理人工智能的“Cosmos” [1] - 公司展示了基于物理定律的数字孪生平台“Earth-2” [1] - 公司产品线还包括智能体AI模型Nemotron [1] - 公司产品线还包括用于生物医学AI的Clara [1] - 公司产品线还包括用于自动驾驶汽车的Alpamayo [1]
NVIDIA (NasdaqGS:NVDA) 2026 Conference Transcript
2026-01-06 06:02
NVIDIA CES 2026 主题演讲纪要分析 涉及的行业与公司 * 公司:NVIDIA (NVDA) [1] * 行业:人工智能、加速计算、半导体、云计算、自动驾驶汽车、机器人、工业设计与制造、EDA(电子设计自动化)[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41][42][43][44][45][46][47][48][49][50][51][52][53][54][55][56][57][58][59][60][61][62][63][64][65][66][67][68][69][70][71][72][73][74][75][76][77][78][79][80][81][82][83][84][85][86][87] 核心观点与论据 1. 人工智能引领双重平台变革 * 计算行业每10-15年发生一次平台转移,当前正同时经历向AI和基于AI构建应用的双重平台变革 [1][2] * 整个计算产业的五层堆栈(从芯片到应用)正在被重塑:软件从编程变为训练,计算从CPU转向GPU,应用从预编译变为实时生成 [2] * 过去十年价值约10万亿美元的计算基础设施正在向这种新计算方式现代化 [3] * 每年有数百亿至数千亿美元的VC资金投入这一现代化进程,同时数万亿美元产业(其中几个百分点是研发预算)的研发资金正转向人工智能 [3] 2. 2025年AI关键进展与趋势 * **推理模型与测试时扩展**:2023年ChatGPT O1模型引入“测试时扩展”(即思考),使AI能够实时推理 [5] * **智能体系统普及**:2024年开始出现,2025年广泛扩散,能够推理、查找信息、研究、使用工具、规划未来、模拟结果 [5][6] * **物理AI**:理解自然法则并与物理世界交互的AI [6][7] * **开源模型达到前沿水平**:以DeepSeek R1(首个开源推理系统)为代表,开源模型虽仍落后前沿专有模型约6个月,但每6个月就有新模型出现且越来越智能 [7][8] * **下载量激增**:开源模型下载量爆炸式增长,因为初创公司、大企业、研究人员、学生和各国都希望参与AI革命 [8] 3. NVIDIA作为前沿AI模型构建者的战略 * 公司运营着价值数十亿美元的DGX超级计算机用于开发自己的开源模型 [9] * 在多个领域进行前沿AI模型工作,包括: * **数字生物学**:La Protina(合成与生成蛋白质)、OpenFold3(理解蛋白质结构)、Evo2(理解与生成多种蛋白质) [9] * **物理AI**:Earth-2(理解物理定律)、FourCastNet和CorrDiff(革新天气预测) [10] * **基础模型**:Nemotron-3(首个混合Transformer SSM模型,速度极快)、Cosmos(前沿开放世界基础模型)、GR00T(人形机器人系统) [10] * **自动驾驶**:AlphaMyo [11] * 不仅开源模型,还开源用于训练模型的数据,并提供全套生命周期管理库(NeMo、Physics NeMo、Clara NeMo、Bio NeMo) [11] * 模型在多个排行榜上位居前列,包括PDF解析、语音识别、检索模型(语义搜索)等 [13][14] 4. 智能体(Agent)架构与AI应用未来 * AI智能体具备推理能力,能够将未知问题分解为已知步骤,无需在第一天就知晓一切 [15][16] * 未来AI应用架构是多模态、多云、混合云的,能够调用最适合任务的不同模型 [17][18] * 公司提供“蓝图”框架,集成到全球企业SaaS平台中,使企业能够构建既定制化又始终处于前沿的AI [19] * 现场演示了使用Brev、DGX Spark、前沿模型API、意图模型路由器和Hugging Face的Ricci机器人构建个人助理的示例 [20][21][22] * 这种基于语言模型(结合专有前沿模型与定制模型)的智能体框架,是现代AI应用的基本架构 [23] 5. 企业AI与物理AI的变革 * **企业AI**:与Palantir、ServiceNow、Snowflake、CodeRabbit、CrowdStrike、NetApp等领先企业平台合作,将智能体系统集成并加速其平台,智能体系统正成为新的用户界面,取代传统如Excel或命令行 [24][25] * **物理AI**:致力于让AI理解物理世界的常识(物体恒存性、因果关系、摩擦力、重力、惯性),这需要三个计算系统:训练AI的计算机、在边缘推理的计算机、以及用于模拟的计算机 [26][27][28][29] * **核心模拟与数据生成平台**: * **Omniverse**:数字孪生、基于物理的模拟世界 [29] * **Cosmos**:世界基础模型,通过对互联网规模视频、真实驾驶与机器人数据以及3D模拟进行预训练,学习世界的统一表征,能够生成物理上合理的合成数据以解决真实世界数据稀缺问题 [30][31] * Cosmos已被下载数百万次,公司也用它来创建自动驾驶汽车,进行场景生成和评估 [32] 6. 自动驾驶汽车:AlphaMyo与全栈整合 * **AlphaMyo发布**:全球首个具备思考、推理能力的自动驾驶汽车AI,端到端训练(从摄像头输入到执行机构输出) [33] * **数据来源**:结合自身驾驶里程、人类示范驾驶里程以及Cosmos生成的数据,并辅以数十万个精心标注的示例 [33] * **关键特性**:不仅处理传感器输入并控制车辆,还会推理即将采取的行动、解释原因并规划轨迹,通过处理“长尾”驾驶场景 [33][34] * **全栈整合示例**:以与梅赛德斯-奔驰的合作为例,展示了AI五层蛋糕在机器人领域的应用: * 底层:汽车(机器人本体) * 第二层:芯片(GPU、网络芯片、CPU) * 第三层:基础设施(Omniverse、Cosmos) * 第四层:模型(AlphaMyo) * 第五层:应用(梅赛德斯-奔驰汽车) [36][37] * **商业化进展**:首款NVIDIA自动驾驶汽车将于2026年Q1在美国上路,Q2进入欧洲,Q3/Q4进入亚洲,并将持续更新AlphaMyo版本 [38] * **安全架构**:采用双软件栈(AlphaMyo栈和经典AV栈)镜像运行,由策略与安全评估器决定使用哪个栈,确保安全冗余 [39][40] * **商业模式**:整个堆栈对生态系统开放,合作伙伴可根据需要采用全栈或部分技术,这已成为公司的巨大业务 [41][42] 7. 机器人技术的下一篇章 * 物理AI和模拟技术适用于所有形式的机器人系统(操纵器、移动机器人、人形机器人) [42] * 机器人通过Omniverse中的Isaac Sim和Isaac Lab模拟器进行训练 [43][44] * 众多合作伙伴正在构建各种机器人,包括Neurobot、Agibot、LG、卡特彼勒、Agility、Boston Dynamics、手术机器人、Franka、Universal Robots等 [44] 8. 赋能半导体与工业设计行业 * 物理AI和AI物理将革命性改变半导体设计(EDA)和系统设计行业 [45] * 与Cadence、Synopsys和西门子达成深度合作,将CUDA X库、物理AI、智能体AI、NeMo、Nemotron集成到其设计、仿真和数字孪生工具中 [45][46][49] * 未来将出现智能体芯片设计师和系统设计师,芯片和系统将在计算机中设计、制造、测试和评估 [46][47][48] * 与西门子的合作旨在将物理AI带入从设计、仿真到生产、运营的完整工业生命周期,开启新的工业革命 [49] 9. 下一代计算平台:Vera Rubin * **发布背景**:AI计算需求飙升,模型规模每年以10倍(一个数量级)增长,O1模型引入后,推理变为思考过程,测试时扩展导致生成的token数量每年增加5倍,同时AI token成本每年下降约10倍 [51][52] * **设计理念**:由于摩尔定律放缓,晶体管数量年增长有限(Vera Rubin GPU晶体管数量仅为Blackwell的1.6倍),必须通过极致的协同设计(重新设计所有芯片和整个堆栈)来实现性能飞跃 [57][58][60] * **系统组成**: * **Vera CPU**:定制设计CPU,性能是上一代的两倍,与Rubin GPU协同设计,双向一致共享数据 [55][59] * **Rubin GPU**:AI浮点性能是Blackwell的5倍,采用革命性的MVFP4张量核心,可动态自适应调整精度 [55][60][61][62] * **ConnectX-9 NIC**:为每个GPU提供1.6 terabits/秒的横向扩展带宽 [55] * **BlueField-4 DPU**:卸载存储和安全功能 [55] * **第六代NVLink交换机**:数据移动量超过全球互联网,连接18个计算节点,最多72个Rubin GPU协同工作 [56][68] * **Spectrum-X以太网光子交换机**:世界首个具有512端口、200 gigabits/秒能力的共封装光学器件以太网交换机,采用TSMC的COOP硅光子集成新工艺 [56][72] * **关键创新与性能**: * **能效**:功耗是Grace Blackwell的两倍,但进气流量相同,冷却水温仍为45摄氏度,无需冷水机,预计可节省全球数据中心约6%的电力 [71][80] * **机密计算安全**:所有总线(PCIe、NVLink)在传输、静态和计算过程中均加密 [81] * **功率平滑**:解决AI工作负载瞬时尖峰(可达25%)问题,避免过度配置造成的能源浪费 [82] * **性能数据(模拟预测)**: * **训练**:对于10万亿参数模型(DeepSeek Plus Plus),Rubin的吞吐量远高于Blackwell,只需1/4数量的系统即可在一个月内完成训练 [84][85] * **工厂吞吐量**:Rubin的吞吐量每瓦性能预计将比Blackwell再高10倍左右,直接影响数据中心收入 [85][86] * **Token成本**:Rubin生成token的成本效益约为Blackwell的十分之一 [86] * **规模化部署**:Vera Rubin已投入全面生产,一个Rubin Pod包含1,152个GPU(16个机架,每机架72个GPU) [54][56][57] 其他重要内容 * **公司定位演进**:NVIDIA不仅构建芯片,现在构建整个系统,AI是一个全栈事业,公司正在从芯片到基础设施、模型、应用等各个方面重塑AI [86] * **市场拐点**:自动驾驶汽车从非自动驾驶到自动驾驶的拐点可能正在此时发生,未来10年,全球很大比例的汽车将成为自动驾驶或高度自动驾驶 [42] * **生态合作广度**:演讲中提及大量合作伙伴,涵盖云计算、企业软件、数据平台、网络安全、工业设计、机器人等多个领域,凸显NVIDIA生态系统的广泛性和战略重要性 [24][41][44][45][46][49]
人均1个亿,黄仁勋拟砸下30亿美元,「买断」OpenAI昔日劲敌
36氪· 2025-12-31 19:50
文章核心观点 - AI行业竞争已从模型训练阶段进入推理与系统整合的终局之战,行业整合加速,独立创业公司的中间地带正在消失 [3][33] - 英伟达拟以20亿至30亿美元收购AI21 Labs,核心目的并非购买现有模型或业务,而是进行高价“人才收割”并锁定下一代AI推理技术的主导权 [1][3][17] - 大模型创业的规则已被重写,成功路径愈发集中于成为巨头或整体被巨头收编,出售成为许多创业公司最现实的退出机制 [32][33] 潜在收购交易分析 - 交易金额预计为20亿至30亿美元,若以30亿美元成交,将成为英伟达历史上金额最高的AI并购案 [1][3] - 收购目标AI21 Labs全职员工约200人,据此计算人均收购“身价”高达1000万至1500万美元,远超一般独角兽并购案例 [3] - 交易尚未官宣,但行业认为“大概率会发生” [3] 收购方:英伟达的战略意图 - 收购逻辑清晰:主要目的不是补齐产品线,而是获取大语言模型架构人才,以争夺推理市场的主动权 [17][19] - 英伟达在训练市场几乎没有对手,但在推理市场正面临定制ASIC、TPU、自研芯片的竞争,市场开始碎片化 [20] - 通过收购AI21,英伟达旨在直接掌控其高效的推理技术团队,特别是在以色列加强模型层与系统层的研发力量 [20][23][26] - 这是英伟达对推理市场的系统性整合,意在“提前锁定一代人才供给” [19][26] 被收购方:AI21 Labs的背景与现状 - AI21 Labs由Amnon Shashua教授等人于2017年联合创立,曾是以色列AI赛道的“门面担当” [4][6] - 在ChatGPT发布后,公司发展步履维艰,难以追上OpenAI等头部企业的进展 [11][14] - 公司已停止面向消费者的产品Wordtune研发,目前专注于面向企业客户的专业化语言模型 [14] - 旗舰企业产品Maestro旨在将语言模型准确率最高提升50%,并推出了据称速度更快、能效更高的新型推理模型 [16] - 公司当前年营收约5000万美元,但与高昂的研发成本和团队规模相比,业务可持续性面临挑战 [16] - 其核心技术价值在于Jamba混合架构(SSM-Transformer融合),该架构在长上下文处理速度上提升2.5倍,并较DeepSeek、Llama等模型实现2至5倍的能效优势 [20] 行业竞争格局与趋势 - 生成式AI爆发后,行业进入算力、数据、分发渠道的“军备竞赛”,OpenAI、Anthropic、Meta等巨头主导市场 [11] - 2025年10月,OpenAI跃升为全球估值最高的非上市科技公司 [12] - 大模型创业分为三阶段:第一阶段拼论文和参数,第二阶段拼算力和资本,第三阶段拼生态和并购对象 [32] - 当前,独立公司在“通用生成模型”赛道翻盘难度极高,做大模型创业的路径要么是做到OpenAI的体量,要么是被巨头整体收编,中间地带正在迅速消失 [32][33] - 市场暗流涌动,例如Meta与谷歌洽谈数十亿美元TPU交易的消息曾导致英伟达股价下跌4% [17] 创始人动向与行业隐喻 - AI21联合创始人Amnon Shashua已将主要精力转向其新创立的AI初创公司AAI,该公司聚焦于下一代AI推理模型与系统架构,成立不足两年已获数亿美元融资并跻身独角兽行列 [26][27][30] - 此次出售对创始人而言并非失败,而是一次“提前下车”或理性的退出机制 [26][32] - 收购案隐喻着AI淘金热或已近尾声,当英伟达这类“卖铲子”的巨头开始直接“买下挖矿的人”,标志着行业进入深度整合阶段 [33]
NVIDIA Corporation (NVDA) Launches a New Family of Open Source AI Models
Yahoo Finance· 2025-12-21 22:45
公司战略与产品发布 - 英伟达于12月15日发布了一个名为Nemotron的新系列开源AI模型 该系列模型比其以往所有模型更智能、更快且更便宜 [1] - Nemotron系列模型专长于写作、编码等任务 其中最小的模型Nemotron 3 Nano已发布 另外两个更大版本预计在2026年上半年推出 [2] - 尽管公司以制造并向其他AI模型公司提供芯片而闻名 但面对中国公司如深度求索、月之暗面及阿里巴巴的开源模型占据市场 公司也开始发布自己的开源模型 [2] 市场竞争格局 - 随着Meta Platforms据称转向闭源模型 英伟达有望成为该(开源模型)领域最大的参与者之一 [3] - 中国公司的开源模型(如深度求索、月之暗面、阿里巴巴)已在市场上大量涌现 [1][2] 市场观点与评级 - 华尔街对该科技巨头保持看涨 摩根士丹利的Joseph Moore于12月17日重申“买入”评级 目标价为250美元 [3] - 伯恩斯坦的Stacy Rasgon于12月15日同样重申“买入”评级 目标价为275美元 [3] - 有观点认为英伟达是2026年值得买入并持有的最佳股票之一 [1] 公司业务概览 - 英伟达设计并销售专用处理器 最初用于游戏 现在也对人工智能、数据中心、专业可视化及汽车行业至关重要 [4] - 公司开发了图形处理器以及CUDA并行计算平台 这使得其GPU能够执行图形处理以外的任务 [4]
Why Shares of UiPath Are Soaring Today
Yahoo Finance· 2025-09-30 23:40
公司股价表现 - 公司股价继昨日上涨2.9%后,今日延续上涨趋势,截至美国东部时间上午9点50分,股价上涨14.9% [1] 战略合作与产品创新 - 公司与英伟达合作,提供集成服务连接器,将UiPath平台与英伟达的NIM和Nemotron推理模型连接,以增强高信任度场景(如欺诈检测或医疗保健)中的自动化工作流程生成式AI能力 [3] - 公司与OpenAI合作开发ChatGPT连接器,将OpenAI的前沿模型与UiPath的企业级编排系统集成,以提升企业客户工作流程 [4] - 公司与Snowflake合作,将UiPath的Agentic Automation平台与Snowflake的Cortex AI平台结合,使客户能将可信的洞察转化为编排行动,而无需改造现有系统 [4] 市场定位与发展前景 - 多项合作公告表明公司致力于保持在人工智能创新前沿 [5] - 今日的公告增强了公司作为提供先进自动化能力平台行业领导者的看涨理由 [5][6]