Workflow
NVIDIA DGX Cloud
icon
搜索文档
黄仁勋 GTC 2026 演讲实录:所有SaaS公司都将消失;Token成本全球最低;“龙虾”创造了历史;Feynman 架构已在路上
AI前线· 2026-03-17 07:30
公司战略定位 - 公司已从单一的图形处理器供应商转型为为“数万亿美元AI基建时代”提供完整技术栈的“总包工头” [2] - 公司的核心壁垒是CUDA软件生态及其庞大的安装基数,这形成了强大的“飞轮效应”,吸引了开发者、催生新市场并持续降低算力成本 [3][6] - 公司业务覆盖AI全领域,是全球唯一能运行语言、生物、图形、视觉、机器人、边缘及云端所有AI领域的平台 [18] CUDA生态与飞轮效应 - CUDA架构诞生20年,其单指令多线程(SIMT)架构和“tiles”功能降低了编程难度,并围绕其形成了包含数千种工具、编译器、框架和库的庞大生态 [4] - 公司在全球建立了数亿块运行CUDA的GPU和计算系统,服务每一朵云、每一家计算机公司和几乎每一个行业,构成了飞轮效应的基础 [6] - 飞轮效应表现为:安装基数吸引开发者,开发者创造新算法和技术突破,催生新市场并扩大生态,进而进一步扩大安装基数,同时使计算成本持续下降 [6][7] - 庞大的安装基数使得公司愿意持续优化软件,因为每项新优化都能让数百万用户受益,这延长了硬件(如六年前出货的Ampere架构)的生命周期,甚至在云上出现定价上涨 [6][7] 数据处理基础设施变革 - AI的快速发展正推动全球数据处理体系发生结构性变革,核心是结构化数据与非结构化数据的全面加速 [8] - 企业计算长期建立在结构化数据(数据框)之上,未来AI系统和智能体也将直接访问和使用这些数据库,要求数据处理基础设施获得数量级性能提升 [10] - 全球每年产生的数据中约90%是非结构化数据(如向量数据库、PDF、视频、语音),AI的多模态理解能力正将其转化为可计算的信息资源 [12] - 为支持这一转变,公司构建了两项关键基础技术:用于加速结构化数据处理的cuDF和用于处理非结构化数据及AI数据的cuVS [13] - 这些技术正逐步融入全球数据处理生态,例如IBM正利用cuDF加速其IBM watsonx.data平台 [13] AI原生行业爆发与市场前景 - 2025年风险投资对AI初创公司的投入高达1500亿美元,创历史之最,投资规模跃升至数十亿美元级,因为这些公司普遍需要海量算力和Token [15] - AI行业爆发源于三件大事:ChatGPT开启生成式AI时代、推理AI(如o1/o3)的出现以及Claude Code开启代理(Agentic)时代 [15] - AI已从“感知”进化到“生成”、“推理”,现在可以执行高效的实际工作,“推理拐点”已经到来,过去两年计算需求增长了约10,000倍,使用量增长约100倍 [17] - 公司预见通过2027年的营收将至少达到1万亿美元,2025年是公司的“推理之年” [17] - 公司业务中,60%来自顶级云服务商,40%来自区域云、主权云、企业级服务器及工业自动化 [18] AI推理性能与成本优势 - AI推理是最困难也是最关键的商业环节,它直接决定AI服务的收入来源 [22] - 衡量AI系统效率的关键指标是每瓦特生成多少token,公司从Hopper H200到Grace Blackwell NVLink 72架构,实现了每瓦特性能提升约35倍(分析师认为接近50倍),并带来更低的token成本 [22] - 通过极致的软硬件协同设计(如NVFP4计算架构、NVLink 72、Dynamo、TensorRT-LLM等),公司构建了完整的大模型推理技术体系 [20] - 仅通过更新软件栈,就能将部分AI推理平台的生成速度从约700 token/秒提升至接近5000 token/秒,性能提升约7倍 [25] - 公司的Token成本在全球范围内具有绝对优势,即便竞争对手的架构免费,其总成本(如1GW数据中心工厂15年摊销成本高达400亿美元)也不够便宜 [25] - 数据中心正从存储和计算中心转变为生产token的“AI工厂”,token成为新的数字商品 [27] Vera Rubin AI超级计算平台 - Vera Rubin是一个全新的计算平台,由七款芯片组成,涵盖计算、网络和存储,是目前最先进的POD规模AI平台 [28] - 该平台包含40个机架、1.2千万亿个晶体管、近2万个公司芯片、1152个NVIDIA Rubin GPU、60 exaflops运算能力以及10 PB/s总扩展带宽,目前已全面投产 [28] - 该平台得到了Anthropic、OpenAI、Meta、Mistral AI及所有主要云提供商的支持 [28] - 过去十年间AI计算能力实现了约4000万倍的提升,推动数据中心向“AI超级计算机”形态演进 [30] - Vera Rubin是一套从硬件到软件完全纵向整合的计算平台,专为智能体AI设计,重新设计了计算、存储和网络架构 [31] - 平台硬件包括全新的NVIDIA Vera CPU,该CPU针对高性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,并已开始单独销售,有望成为一项数十亿美元级业务 [33] - 系统采用100%液冷架构,通过45°C热水散热降低制冷成本,并将整机安装时间从两天缩短至约两小时 [33] - 网络互连采用第六代NVLink架构,并推出了全球首个CPO光电共封装的NVIDIA Spectrum-X以太网交换机 [35] - 通过Kyber机架架构的Rubin Ultra Compute System,可以在一个NVLink域中连接144个GPU,形成大规模统一计算机 [35] Feynman GPU架构与深度整合 - Feynman GPU架构将采用定制化HBM技术,可能基于HBM4E增强版或定制化HBM5方案,允许将部分GPU数据处理逻辑嵌入存储底层,实现超高带宽与低延迟 [41][42] - Feynman平台将搭载代号为Rosa的全新CPU,该CPU被设计为AI智能体的编排中枢,旨在高效调度GPU、存储与网络之间的Token流动 [43] - Feynman时代标志着公司将计算、存储和封装进行了深度耦合,正将数据中心演进为一台高度集成的“巨型超级计算机” [44] AI基础设施与数字孪生平台 - 公司推出NVIDIA DSX平台,这是一个面向“AI工厂”的基础设施平台,用于数据中心的数字仿真、虚拟调试和运行期动态优化 [46][47] - 数据中心建设阶段可通过工程仿真工具进行虚拟调试,大幅缩短建设周期;运行后其数字孪生系统可作为“操作系统”,由AI智能体动态调度冷却、电力和网络系统以优化效率 [46] - NVIDIA Omniverse平台被设计用于承载全球规模的数字孪生模型 [49] - 公司的AI计算基础设施正在向太空延伸,计划开发Vera Rubin Space One轨道数据中心 [49] 智能体操作系统与软件生态 - 公司高度评价并正式支持开源项目OpenClaw,其增长速度甚至超过了Linux,被视为智能体计算机的操作系统 [52][54] - OpenClaw能够连接大语言模型,管理计算资源,调用工具和服务,具备任务调度与多模态交互能力 [54] - 公司认为未来所有科技和软件公司都需要制定“OpenClaw战略”,因为企业软件正在从传统SaaS转向以智能体为核心的AaaS(Agentic as a Service) [55] - 公司与OpenClaw作者合作推出NVIDIA NemoClaw参考架构,增加了OpenShell安全组件,提供企业级安全扩展,使企业能安全部署智能体系统 [56][58] 开放模型生态与行业应用 - 公司推进开放模型生态,目前生态已包含接近300万个开放模型,覆盖语言、视觉、生物、物理和自动驾驶等多个领域 [59] - 公司已发布多条开放模型产品线(如Nemotron、Cosmos World Foundation Model、Project GR00T等),并开放训练数据和方法,策略是“纵向整合、横向开放” [59][60] - 公司宣布成立Nemotron Coalition联盟,与多家技术公司合作共同推进模型发展 [61] - 在物理AI领域,全球几乎所有机器人公司与公司合作,公司提供从训练平台、仿真到部署的完整技术体系 [62] - 自动驾驶的“ChatGPT时刻已经到来”,车辆具备推理和语音指令执行能力,公司宣布与比亚迪、现代、日产、吉利(合计年产量约1800万辆)以及Uber成为新的Robotaxi合作伙伴 [64] - AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命,以及物理AI与机器人时代 [65]
国产人形机器人加速放量!“全市场唯一百亿规模”机器人ETF(562500)午后跌幅收窄!
每日经济新闻· 2025-08-12 14:44
机器人板块市场表现 - 机器人ETF(562500)下跌0.42% 盘中最大跌幅1.17% [1] - 成分股中信捷电气和石头科技涨幅超3% 奥比中光领跌6.24% 华东数控与夏厦精密跌幅超4% [1] - 单日成交额8.2亿元 换手率达5.11% 显示市场交投活跃且流动性充沛 [1] 技术发展与行业动态 - 英伟达推出Omniverse库与Cosmos世界基础模型 配套RTX PRO服务器及DGX Cloud 加速机器人解决方案开发 [1] - 英伟达高管表示AI推理与可扩展物理仿真融合将推动机器人和智能汽车产业万亿美元级变革 [1] - 中信建投证券指出国产人形机器人加速放量 产业链中灵巧手/关节模组/传感器等技术方案同步推进 [1] 行业催化与产品布局 - 世界机器人大会持续推高行业热度 国产机器人呈现多样化发展态势 [1] - 潜在行业催化剂包括世界人形机器人运动会/智元机器人合作伙伴大会/Optimus三代机发布及国产机器人招投标 [1] - 机器人ETF(562500)为全市场唯一规模超百亿的机器人主题ETF 覆盖人形/工业/服务机器人全产业链 [2]
NVIDIA Opens Portals to World of Robotics With New Omniverse Libraries, Cosmos Physical AI Models and AI Computing Infrastructure
Globenewswire· 2025-08-11 23:01
新产品发布 - 公司宣布推出全新NVIDIA Omniverse库和NVIDIA Cosmos世界基础模型(WFMs)以加速机器人解决方案的开发与部署 [1] - 新库和模型由NVIDIA RTX PRO服务器和NVIDIA DGX Cloud提供支持 使开发者能够开发物理精确的数字孪生 通过仿真重建现实世界 生成用于训练物理AI模型的合成数据 并构建理解物理世界的AI智能体 [2] - 新NVIDIA Omniverse软件开发工具包(SDKs)和库现已可用于构建和部署工业AI及机器人仿真应用 [3] 技术整合与合作伙伴 - Omniverse NuRec渲染技术已集成至CARLA开源模拟器 该平台拥有超过15万开发者使用 [4] - 自动驾驶工具链领导者Foretellix正在集成NuRec、NVIDIA Omniverse Sensor RTX和Cosmos Transfer 以增强其基于物理精确场景的可扩展合成数据生成能力 [4] - Voxel51的多模态AI数据引擎FiftyOne支持NuRec 简化数据重建准备工作 其客户包括福特和保时捷 [4] - 波士顿动力、Figure AI、Hexagon、RAI Institute、Lightwheel和Skild AI等公司采用Omniverse库、Isaac Sim和Isaac Lab加速AI机器人开发 [5] - 亚马逊设备与服务部门使用这些技术驱动新型制造解决方案 [5] 模型性能与采用 - Cosmos世界基础模型下载量超过200万次 支持开发者通过文本、图像和视频提示大规模生成多样化机器人训练数据 [6] - Lightwheel、Moon Surgical和Skild AI使用Cosmos Transfer通过大规模模拟多样化条件来加速物理AI训练 [6] - Cosmos Reason作为拥有70亿参数的可定制推理视觉语言模型 使机器人和视觉AI智能体能像人类一样进行推理 运用先验知识、物理理解和常识在现实世界中行动 [8] - NVIDIA机器人和NVIDIA DRIVE团队使用Cosmos Reason进行数据管理、过滤、注释和视觉语言动作模型后训练 Uber使用其注释和标注自动驾驶训练数据 [8] - Magna在其城市配送平台中开发应用Cosmos Reason 帮助车辆快速适应新城市环境 并将世界理解能力加入车辆长期轨迹规划器 [9] - VAST Data、Milestone Systems和Linker Vision采用Cosmos Reason实现交通监控自动化 提升安全性并增强城市及工业环境中的视觉检测能力 [9] 基础设施与开发支持 - NVIDIA RTX PRO Blackwell服务器为训练、合成数据生成、机器人学习和仿真等所有机器人开发工作负载提供统一架构 [10] - NVIDIA DGX Cloud通过微软Azure Marketplace提供全托管平台 支持开发者大规模流式传输基于OpenUSD和NVIDIA RTX的应用程序 显著减少基础设施编排和管理需求 早期采用者包括埃森哲和Hexagon [16] - 新Omniverse SDK实现MuJoCo(MJCF)与通用场景描述(OpenUSD)间的数据互操作性 使超过25万MJCF机器人学习开发者能够跨平台无缝模拟机器人 [13] - Isaac Sim 5.0和Isaac Lab 2.2开源机器人仿真与学习框架已在GitHub发布 Isaac Sim新增NuRec神经渲染和基于OpenUSD的机器人及传感器方案 帮助开发者缩小仿真与现实间的差距 [13] 技术突破 - Cosmos Transfer-2即将推出 通过简化提示流程和基于深度、分割、边缘及高精地图等空间控制输入 加速从真实3D仿真场景生成逼真合成数据的过程 [14] - Cosmos Transfer蒸馏版本将70步蒸馏过程缩减至1步 使开发者能在NVIDIA RTX PRO服务器上以空前速度运行模型 [14] - Cosmos Reason具备三大核心功能:实现海量多样化训练数据集的高质量自动管理与注释 作为机器人视觉语言动作模型的核心决策大脑执行复杂任务 以及基于NVIDIA Blueprint构建的视频分析AI智能体可对海量视频数据进行根源分析 [15] 生态系统建设 - 推出OpenUSD课程与认证计划 获得AOUSD成员Adobe、亚马逊机器人、Ansys(新思科技部分)、Autodesk、皮克斯、PTC、罗克韦尔自动化、SideFX、西门子、TCS、天宝以及Hexagon等行业领导者的支持 [17] - 与Lightwheel开展开源合作 将机器人策略训练与评估框架集成至NVIDIA Isaac Lab 提供并行强化学习训练能力、基准测试以及适用于机器人操作与移动的仿真就绪资产 [17]
黄仁勋预言:继AI之后,机器人将成为英伟达最强劲增长引擎
智通财经网· 2025-06-26 09:25
机器人业务与自动驾驶 - 公司CEO黄仁勋认为机器人技术尤其是人形机器人将成为最大潜在增长市场,自动驾驶汽车将是首个重大商用应用 [1] - 机器人业务部门季度销售额5.67亿美元,占总销售额1%,但同比增长72% [2][3] - 公司通过Omniverse、Cosmos等平台构建机器人AI大模型软件和硬件生态系统,目标是成为AI人形机器人和全自动驾驶领域的核心奠基底座 [2] - 公司正在开发基于物理世界的3D动态模拟技术,用于机器人模型开发和训练 [3] - 预计未来将有数十亿台机器人、数亿辆自动驾驶汽车和数万个超级机器人工厂 [3] 财务表现与业务结构 - 公司营收从2024财年270亿美元飙升至2025财年1305亿美元,预计2026财年接近2000亿美元 [4] - 第一财季整体营收441亿美元,同比增长69%,数据中心业务营收391亿美元 [4][5] - 汽车与机器人业务营收5.67亿美元,游戏业务营收38亿美元 [5] - 公司市值达3.75万亿美元,超越微软成为全球市值第一 [5] 战略转型与定位 - 公司不再仅定位为芯片公司,而是AI基础设施或计算平台提供商 [1][6] - 持续推出配合AI芯片的配套技术,包括软件开发平台、云计算服务和网络芯片 [6] - 与慧与科技等公司合作打造"全栈AI工厂基础设施",推动生成式AI工业化 [6] 技术发展 - 自动驾驶平台Drive已被梅赛德斯-奔驰使用,并推出面向人形机器人的AI大模型平台Cosmos [3] - 数据中心AI GPU需求爆发式增长,Blackwell架构GPU贡献显著 [4]