Workflow
Cosmos世界基础模型
icon
搜索文档
CSET:《物理AI:面向政策制定者的AI-机器人技术融合入门指南》
文章核心观点 - 人工智能发展的下一个核心阶段是物理AI(Physical AI),即AI与机器人技术的融合,旨在赋予自主系统在真实物理世界中感知、理解和执行复杂动作的能力 [2][3] - 物理AI的发展面临软件突破与硬件桎梏的鲜明对比,软件算法进展迅速,但硬件供应链在标准化、关键组件量产等方面存在巨大瓶颈 [4][5] - 全球竞争格局呈现中美在软件与规模上领先,而欧日企业控制核心硬件供应链的复杂局面,没有国家拥有完全垂直整合的供应链 [6][7][8][9] - 当前市场存在炒作与现实的背离,人形机器人虽受关注但实际部署和收入占比极低,而特定任务的仓储和工业机器人已吸引大量资金并实现规模应用 [10] - 实现通用人形机器人仍需在关键硬件、数据、供应链标准化等方面取得跨越式突破,物理AI的黎明已现但发展之路漫长 [11][12] 软件突破与硬件桎梏:实体AI的技术基本面 - 实体AI的兴起源于AI算法突破与机器人硬件供应链改善的偶然交汇,可能形成类似“摩尔定律”的积极反馈循环 [4] - 软件供应链的核心在于突破性AI算法:大型语言模型(LLMs)作为高层推理引擎;多模态基础模型整合视觉、语言和推理;强化学习提升技能获取效率;“从模拟到现实”技术降低真实数据收集成本 [4] - 机器人硬件供应链面临长期存在的技术与经济壁垒,五大核心硬件系统包括结构组件、执行器、动力系统、计算系统和传感器 [5] - 关键硬件如电池、电机、传感器和执行器的演进速度远慢于软件,且供应链严重缺乏标准化,各公司采用独特技术路线和物料清单,阻碍规模经济并推高成本 [5] - 人形机器人的关键硬件,如六维力矩传感器、触觉传感器及行星滚柱丝杠,缺乏大规模量产能力,成为产能爬坡的严重瓶颈 [5] 全球竞争格局:中美的资本角逐与欧日的隐形巨头 - 全球没有国家拥有完全垂直整合的机器人供应链,相互依赖度极高 [6] - 美国在AI基础模型和软件生态系统占据绝对先发优势:Alphabet(谷歌母公司)的PaLM-E、RT系列及Gemini Robotics-ER模型;英伟达的GROOT基础模型、Isaac平台及Cosmos世界模型;微软、Meta通过合作或开源模型切入该领域 [7] - 美国初创公司吸金能力强,例如Skild AI和Physical Intelligence在2024年分别筹集了数亿美元 [7] - 中国的竞争力体现在庞大的研究产出、快速增长的专利及无与伦比的硬件制造与部署规模:2018至2023年间,中国占全球机器人相关学术文章发表量的28%,远超美国的16%和日本的7%;中国每年安装近29万台工业机器人,超过日本、美国、韩国和德国的总和 [8] - 中国企业积极研发机器人优化的国产大模型,并涌现出宇树科技、优必选、智元机器人等众多人形机器人研发厂商 [8] - 日本和欧洲的“隐形冠军”企业扼守硬件供应链核心:日本企业如哈默纳科、纳博特斯克、尼得科在精密机械齿轮、电机和执行器领域保持高市场份额,其中哈默纳科控制其精密齿轮80%的市场份额;德国企业如博世力士乐、雄克在末端执行器等灵巧操作核心组件上极具竞争力 [9] 剥离炒作:万亿市场的商业现实与政策启示 - 金融界对市场前景预测乐观,如摩根士丹利断言人形机器人市场将从目前的数千万美元增长到2050年的5万亿美元,但此类预测被指出具有高度投机性且缺乏清晰定义 [10] - 市场存在显著认知反差:人形机器人虽受媒体热捧,但在真实世界中独立导航和处理灵巧任务仍困难,其在总机器人市场收入中的占比可能不足1% [10] - 资本实际大量流向实用型机器人:过去五年中,致力于仓储机器人的公司筹集了约205亿美元,而同期人形机器人市场仅筹集了约46亿美元 [10] - 目前表现最好的机器人是针对特定任务(如分拣包裹或移动托盘)在软硬件上高度优化的机器人,通用AI驱动的、可灵活切换任务的机器人仍是遥不可及的愿景 [11] - 政策制定者缺乏成熟的机器人政策议程和严谨分析框架,应集中资源解决高质量触觉传感器、运动学硬件及真实世界数据严重匮乏等痼疾,以推动机器人在航空航天、国防等关键战略领域的实质性应用 [11]
算力到应用的转折点?英伟达:AI进入兑现阶段
第一财经· 2026-01-06 21:21
文章核心观点 - 2026年国际消费电子展是英伟达从“算力叙事”转向“应用叙事”的关键节点,其核心看点在于AI商业模式的落地路径,特别是企业级AI能否走向可复制的收入模式[1] - 市场对英伟达的关注焦点已从“算力是否紧缺”转向“AI如何转化为可持续收入”,这决定了公司能否从“算力周期波动的一部分”转型为拥有“软件+平台型收入”的可持续商业模式[1][5] - 本届CES上,英伟达需要回答AI如何被嵌入产品、流程和收入模型的问题,市场讨论重点将从“需求是否过热”转向“哪些业务线能够持续兑现”[12] 企业级AI商业模式落地 - 企业客户需求发生变化,不再需要“最强的AI”,而是需要“可部署、可控、可持续”的AI系统,价值取决于部署与落地能力[4] - 英伟达与联想在CES2026联合展示企业级AI解决方案,核心方向是混合式AI:联想提供硬件与行业解决方案,英伟达提供GPU、软件栈及AI平台支持[4] - 合作旨在将AI变成企业能直接购买、插电即用的产品,提供包含服务器、GPU和软件的一整套方案,这被视为企业AI的第一次真正落地[4] - 此举对英伟达意义重大,使其业务从单纯依赖云厂商预算销售GPU,扩展到依靠软件、平台和企业方案赚取稳定收入,更像企业IT基础设施[4] - 今年特别重要的原因有三点:大模型能力已验证;企业不再为概念演示买单;云AI的成本和合规问题暴露[5] - 投资者关注实际产品形态、落地客户和收费模式,具体包括:产品形态是否明确、应用场景是否真实(如金融、制造、政企案例)、收费与交付模式是否清晰(一次性销售或持续订阅)[5] - 若上述问题在CES得到完整回答,意味着英伟达数据中心业务正从“算力供给驱动”向“企业AI应用驱动”过渡,其企业AI业务有望被重新定价[5] RTX业务从游戏周期转向AI标配 - 英伟达RTX系列显卡长期被视为受游戏周期影响的消费电子业务,出货节奏依赖游戏周期,导致业务偏周期性且股价波动[6][7] - 随着AI创作应用兴起,RTX的角色正在变化,CES2026上多家PC厂商预计发布搭载RTX 50系列并主打AI功能的新一代电脑[6] - 观察重点在于AIGC是否被定义为“默认能力”而非可选功能,如果AI能力实现出厂即有、默认开启,RTX的需求逻辑将从“为游戏升级”转变为“为工作与生产力升级”[6] - RTX是英伟达少数直接面向终端用户的产品线,其出货不完全依赖超大规模云厂商的资本开支,销售路径涵盖OEM、零售渠道和工作站厂商[7] - 随着本地AIGC、视频剪辑、3D渲染和大语言模型推理等创作及AI加速应用普及,RTX的“第二性应用”正在形成[8] - 如果OEM将RTX+AI加速作为标配卖点,换机逻辑将转向“为了更高效地工作与创作”,RTX出货节奏可能出现结构性变化,从而对公司的收入和估值产生长期支撑[6][8] 物理AI与Omniverse的商业化进程 - 物理AI是英伟达体量最大但兑现最慢的业务线,旨在让AI系统感知、模拟和控制真实物理世界,应用于机器人、自动驾驶和工业自动化等领域[9] - Omniverse平台是英伟达开发的数字孪生操作系统,用于构建物理真实的虚拟环境并支持工业软件集成[9] - 在CES展会上,公司发布了Alpamayo平台,使汽车能够在真实世界中进行“推理”,首款搭载英伟达技术的汽车将于2026年第一季度在美国上路[9] - 黄仁勋称“物理AI的ChatGPT时刻已到来”,Alpamayo为自动驾驶汽车带来推理能力,使其能够思考罕见场景并解释驾驶决策,是安全、可扩展自动驾驶的基础[9] - 投资者在CES2026更关注物理AI是否出现真实落地案例、明确商业收费模式以及披露合作伙伴名单,这些要素的清晰化意味着其正从“技术平台”迈向可规模化的商业应用阶段[10] - 回顾CES2025,英伟达发布了面向物理AI的技术框架与产品,但股价在发布会次日收跌超过6%,市值短期蒸发数千亿美元,市场反应消极的核心原因是未能满足短期盈利增长及产品商业化的具体预期[11]
直击CES | 黄仁勋新年第一场发布:物理AI的ChatGPT时刻即将到来
第一财经· 2026-01-06 10:20
英伟达CEO黄仁勋CES前演讲核心观点 - 英伟达CEO黄仁勋在CES开幕前发表演讲,发布多款与物理AI相关的开源模型,并首次详细披露新一代芯片平台Rubin的性能数据[1] - 演讲指出AI和计算架构正同时发生双重变革,AI本身既是应用又是新平台,软件开发范式正从编写代码转向训练模型[6] - 公司认为AI发展的下一站是进入物理世界,并预测自动驾驶汽车的转折点可能正在此时发生[9][12] 行业变革与AI平台 - 计算机行业每10到15年经历一次平台变革,但当前AI和计算架构正同时发生双重变革[6] - AI本身既是应用又是新平台,开发者将在其上构建更多应用[6] - 软件开发范式被彻底颠覆:从编写代码转向训练模型,从预编译执行转向实时生成[6] - 加速计算和人工智能正在彻底重塑计算领域的每个层面[7] - 过去十年价值约10万亿美元的计算基础设施正在进行现代化改造,每年还有数千亿美元的风投资金涌入该领域[7] - 全球100万亿美元的产业正在将研发预算从传统方法转向人工智能[7] - 去年行业最重要的改变之一是开源模型真正起飞,中国的DeepSeek R1等模型激活了全球性的开源运动[7] 物理AI与自动驾驶 - 物理AI是演讲的重中之重,英伟达已为此工作8年,其ChatGPT时刻即将到来[1][9] - 核心挑战在于让AI获得对物理世界的“常识”,如物体恒存性、因果性、摩擦力等[9] - 英伟达建立了一个包含训练、模拟和运行三台计算机的系统,并使用基于物理定律的合成数据来训练AI[9] - 仿真是英伟达几乎所有物理AI工作的核心,推动AI从对话者转变为现实世界的行动者[12] - 自动驾驶被视作最被看好的落地场景,未来十年世界上很大一部分汽车将是自动驾驶或高度自动驾驶的[12] - 英伟达推出开源推理VLA模型Alpamayo,包含开源AI模型、仿真工具和数据集,以加速安全的自动驾驶车辆开发[16] - 英伟达DRIVE AV软件将用于梅赛德斯奔驰车辆,第一辆AV自动驾驶汽车将于2025年第一季度在美国上路,随后进入欧洲和亚洲[16] - 公司将继续更新版本,并扩大合作建造L4 Robotaxi的生态系统[16] 工业制造与机器人 - 工业制造是物理AI的另一核心战场,英伟达宣布与西门子深化合作,将其物理AI模型、Omniverse仿真平台集成至西门子的工业软件组合[16] - 合作覆盖从芯片设计、工厂模拟到生产运营的全生命周期,公司认为正站在一场新工业革命的开端[16] - 物理AI将赋能芯片设计、生产线自动化乃至整个数字孪生系统,实现“在计算机中设计、在计算机中制造”[16] - 机器人系统的下一段征程是不同尺寸的机器人,公司推出了多个与机器人相关的开源模型和开发框架[17] - 新推出的模型包括Cosmos Transfer 2.5和Cosmos Predict 2.5世界模型、面向智能机器人的推理视觉语言模型Isaac GR00T N1.6等[17] Rubin芯片平台性能 - Rubin平台包含六款新芯片:Vera CPU、Rubin GPU、NVLink 6交换机芯片、ConnectX-9 Spectrum-X超级网卡芯片、BlueField-4 DPU、Spectrum-6以太网交换机芯片[18] - Rubin GPU的NVFP4(4位浮点数格式)推理算力为50 PFLOPS,是Blackwell的5倍;NVFP4训练算力为35 PFLOPS,是Blackwell的3.5倍[20] - Rubin GPU的HBM4内存带宽为22 TB/s,是Blackwell的2.8倍;晶体管数量为3360亿个,是Blackwell的1.6倍[20] - 与Blackwell平台相比,Rubin平台通过软硬件协同设计,将推理token成本降低10倍,将训练MoE模型所需的GPU数量减少4倍[20] - ConnectX-9 Spectrum-X超级网卡芯片有230亿个晶体管,支持800 GB/s以太网[21] - BlueField-4 DPU有1260亿个晶体管,其网络能力、计算能力和内存带宽是上一代BlueField-3的2倍、6倍、3倍[21] - Spectrum-X以太网共封装光学器件有3520亿个晶体管,可支持102.4 Tb/s横向扩展交换基础设施[21] 系统级产品与生产计划 - 公司推出了推理上下文内存存储平台,作为一种新型的AI存储基础设施,并由BlueField-4 DPU提供支持[22] - BlueField-4 DPU可为AI基础设施提供单一、可信的控制点,以便配置、隔离和运营大规模AI环境[22] - 新一代NVLink72是一种机架级扩展系统,通过整合多个CPU、GPU等形成单一较高效率的加速单元[22] - Vera Rubin NVL72的NVFP4推理和训练算力分别是3.6 EFLOPS、2.5 EFLOPS,分别是Blackwell的5倍和3.5倍[23] - Vera Rubin NVL72的HBM4内存带宽为1.6 PB/s,是Blackwell的2.8倍;晶体管数量为220万亿个,是Blackwell的1.7倍[23] - 相比使用Blackwell NVL72,使用Rubin NVLink72训练模型所需GPU数量是前者的1/4,思考输出的token数量则是10倍[23] - DGX SuperPOD由一个超节点整合8个Rubin NVL72机架中的576颗GPU,产品将于2025年下半年上市[23] - Rubin平台产品已全面投入生产,基于该平台的产品则将于2026年下半年由合作伙伴推出[23] - 首批使用Rubin的云服务提供商包括AWS、谷歌云、微软等,Anthropic、OpenAI、xAI等AI实验室也将使用其算力[23]
黄仁勋CES 2026演讲解析--AI计算需求爆炸式增长
傅里叶的猫· 2026-01-06 07:51
文章核心观点 英伟达在CES 2026上通过其主题演讲,系统性地阐述了公司在人工智能领域的未来战略重心,核心是推动AI从数字世界向物理世界的扩展,并为此构建了从底层硬件到上层应用的全栈平台[3][8][12][19] AI Agent - 公司将Agentic AI定位为AI发展的重大转型,标志着从生成式、推理模型进入具备高级推理、多步规划和自主行动能力的“代理”阶段[6] - Agentic AI的核心是多模型、多模态代理系统,这些代理根据专长相互调用形成“推理链”,以处理复杂任务,例如Perplexity和Cursor等模型的应用[6] - 该技术将革命企业AI,使企业能够训练特定任务模型并结合推理扩展能力,例如使用Nemotron等模型让数字代理自主管理工作流[7] - Agentic AI被视为连接物理世界的桥梁,使得大语言模型训练的AI代理能够从云端扩展到工业、工厂和机器人领域[8] Physical AI - Physical AI是本次演讲中占比最长的主题,其定义是让摄像头、机器人、自动驾驶汽车等自主系统在物理世界中感知、理解、推理并执行复杂操作[10] - 该技术解决了自主机器无法准确感知和适应物理环境的核心问题,其实现依赖于基于物理规律的仿真技术,通过在虚拟环境中安全训练来提高任务效率和精度[11] - Physical AI正在驱动多个行业变革:在机器人领域,使机器人从工具变为智能设备,如自主移动机器人、机械臂、手术机器人和人形机器人;在自动驾驶领域,让车辆能实时处理传感器数据并在虚拟环境中训练以应对复杂场景;在工业领域,通过摄像头和AI优化工厂、仓库的运营效率与安全[11][12] - 公司将其定位为AI发展的下一个重大阶段,即“机器人学的ChatGPT时刻”或“通用机器人大爆炸”,意味着AI从数字世界扩展到物理世界[12] - 为实现Physical AI,公司推出了全栈平台,以Omniverse为连接器,整合了训练、模拟和推理流程[13] - 平台中的关键亮点是Cosmos世界基础模型,它用于生成基于物理的合成数据以训练机器人和自动驾驶系统,公司提出了“Compute is Data”的理念,强调计算力本身已成为数据来源[15][16] - 公司展示了与三大EDA公司(Cadence, Synopsys)的合作,其技术将应用于汽车、工业、航空航天、医疗等多个领域的数字孪生[18] - 公司预测Physical AI将重塑全球产业,从工厂自动化到家用机器人,并成为应对劳动力短缺的必需技术,推动万亿参数“世界模型”在现实世界中落地[19] Rubin平台 - 公司宣布其下一代AI平台Vera Rubin已进入全面生产阶段,预计2026年下半年开始出货[22] - 该平台硬件核心包括Rubin GPU和Vera CPU,两者协同设计以实现更快数据共享和更低延迟,优化大规模AI模型的训练和推理[24] - Rubin GPU相比前代Blackwell性能大幅提升:NVFP4推理性能达50 PFLOPS,是Blackwell的5倍;NVFP4训练性能达35 PFLOPS,是Blackwell的3.5倍;HBM4带宽为22 TB/s,是前代的2.8倍;NVLink带宽每GPU达3.6 TB/s,是前代的2倍;晶体管数量达3360亿个,是Blackwell的1.6倍[24][33] - Vera CPU拥有88个定制核心、176线程,系统内存达1.5 TB,是Grace CPU的3倍,晶体管数量达2270亿个[31] - 平台升级包含六款新芯片:Rubin GPU、Vera CPU、NVLink 6、NVSwitch、新一代BlueField-4 DPU以及ConnectX-9智能网卡[24] - BlueField-4 DPU拥有1260亿个晶体管,提供800Gb/s带宽,其网络、计算和内存带宽相比BlueField-3分别提升2倍、6倍和3倍[26] - ConnectX-9智能网卡提供800Gb/s以太网带宽,拥有230亿个晶体管,具备可编程RDMA和数据路径加速器以及先进的安全功能[35] - 公司强调Rubin的升级是机架级甚至更大规模的AI基础设施飞跃,而不仅仅是单个芯片的升级[24] - 平台的其他组件包括无电缆、无软管、无风扇的Vera Rubin计算托盘,以及集成共封装光学的Spectrum-X以太网交换机,后者拥有3520亿个晶体管,提供102.4 Tb/s的扩展交换基础设施[28][30]
英伟达要做Robotaxi,采用端到端+强化学习|36氪独家
36氪· 2025-10-14 17:51
公司战略与项目细节 - 英伟达内部正在孵化Robotaxi项目,由高级总监Ruchi Bhargava负责[1] - 项目将采用全新的一段式技术路线,使用一个端到端神经网络,核心是通过仿真技术形成的世界模型对神经网络进行强化训练[1] - 英伟达今年1月发布了Cosmos世界基础模型,该平台经过2000万小时数据的预训练,能生成遵循物理规律的高质量合成视频数据[1] - 项目预计投入30亿美金,未来会在美国落地开城[2] - 英伟达的目标是通过实际项目验证其从GPU芯片到物理AI大模型的全链路工程能力,从而更精准地定义下一代物理AI所需的基础设施与生态标准[2] - 公司可将Robotaxi项目理解为在练兵,旨在打磨AI大模型在自动驾驶汽车上部署和调教的工程能力[5] 行业竞争与市场环境 - 理想、小鹏等企业均已着手打造自己的世界模型[1] - 美国市场Robotaxi落地速度正在加快,Waymo在2025年新增2座城市为无人商业运营范畴,截至2025年4月在美国每周提供超过25万次付费出行[3] - 特斯拉于2025年9月在美国得克萨斯州奥斯汀市与加利福尼亚州湾区面向公众开放Robotaxi服务,其应用首日下载量超过Uber 40%,并且比Waymo有史以来的最高下载量高出6倍[3] - 美国国家公路交通安全管理局计划在2026年提出修订议案,计划移除有驾驶员、有物理操控区的既定规范,允许Robotaxi去掉方向盘,同时承诺将自动驾驶车辆的豁免审查周期从以年计压缩到以月计[3] - Waymo在美运营车辆约为700辆,特斯拉在奥斯汀的首批投放量仅为数十辆,行业仍处于非常早期的阶段[4] 公司现有布局与能力评估 - 英伟达已与通用、奔驰、丰田三家车企展开合作,基于英伟达技术合作开发或打造自动驾驶车队,与奔驰合作的L4级自动驾驶车队将于2025年落地[2] - 公司在人才储备、量产级自动驾驶算法工程化、复杂场景数据积累以及实际道路测试经验方面,相较Waymo、特斯拉等头部玩家仍有明显差距[6][7] - 英伟达在2015年便涉足自动驾驶软件开发,但至今未有成功量产上车的高阶智能驾驶软件方案,2024年6月其辅助驾驶软件效果不如Momenta,导致奔驰将中国区多款车型的辅助驾驶业务从英伟达切换为Momenta[6] - 公司内部长期对标特斯拉FSD,在多次对标测试中对特斯拉FSD的跨城运行和接管次数感到震惊,五六百公里的路程特斯拉FSD只接管了1-2次[6] - 公司自研的DRIVE Thor芯片算力高达2000TOPS,大幅提升了端到端模型推理效率,其在AI训练集群和开发工具链上的积累为模型迭代提供了基础[7] - 英伟达2025年第二季度净利润达到264亿美元,而Waymo为达成当前运营规模累计投入为120亿美元,公司芯片业务的利润能为Robotaxi的长期发展提供充足的试错与迭代空间[7]
欧美日韩等发达经济体无不关注的这一领域,为何成为汽车业竞逐的新焦点?
中国汽车报网· 2025-10-10 11:07
全球AI汽车竞争格局 - 人工智能已成为全球汽车业竞争的新焦点,欧美日韩等发达经济体将其作为应对产业变革的利器 [4] - 欧盟发布“应用人工智能”战略,旨在利用AI变革潜力覆盖汽车等战略领域,具体举措包括建立AI赋能的自驾技术族和支持开发行业前沿模型 [5] - 欧盟发布“科学人工智能”战略,旨在利用虚拟研究院汇集资源,将AI应用于包括汽车在内的科研领域 [5] 主要地区战略与投入 - 2024年欧盟仅有13.5%的企业在日常经营中使用AI技术,欧盟委员会主席表示将在所有关键领域推动“人工智能优先”思维 [5] - 美国凭借科技巨头实力,英伟达在2025年CES发布Cosmos世界基础模型,试图通过创建合成训练数据让汽车理解物理世界,重塑汽车大脑 [6] - 特斯拉2024年投入超100亿美元用于自动驾驶研发,其CEO表示智能辅助驾驶系统未来将达到人类安全水平的10倍 [6] - 日韩侧重点在于跨界协同,韩国推出配备AI连接平台的概念车,实现车家互联;日本车企组建联盟共同研发AI自动驾驶技术,以应对中美竞争 [7] 技术应用与商业化进展 - Waymo无人驾驶出租车已完成数百万次出行服务,在多个城市开展商业化运营,为自动驾驶技术商业化作出有益尝试 [8] - 自动驾驶是汽车智能化变革的核心驱动力,各国企业加大研发投入,试图实现从辅助驾驶到全场景自动驾驶的跨越 [7] 产业发展挑战 - 自动驾驶在复杂路况和极端天气下的可靠性有待提升,智能座舱的语音识别、自然语言处理技术在方言识别和多语言交互上仍需优化 [9] - 数据隐私和网络安全问题凸显,汽车收集的大量用户数据面临泄露风险,车载系统可能遭受黑客攻击 [9] - 美国各州对自动驾驶上路规定不同,欧盟与日本在数据跨境流动上有严格限制,给智能汽车全球推广带来挑战 [10] 未来市场展望 - 到2030年,全球自动驾驶市场规模预计将突破2000亿美元,智能汽车将成为未来出行的主流方式 [11] - 随着技术进步,智能汽车将实现更高水平自动驾驶,成为集“出行工具、智能终端、生活空间”于一体的超级智能体 [10]
英伟达一口气开源多项机器人技术,与迪士尼合作研发物理引擎也开源了
量子位· 2025-10-02 11:26
文章核心观点 - 英伟达在机器人学习大会(CoRL)上发布了多项开源技术,旨在系统性解决机器人研发中的关键难题 [1] - 此次发布覆盖了从物理引擎、基础模型、训练工作流到硬件基础设施的“全栈式”布局,重新定义机器人研发的游戏规则 [1][10] - 行业领先的机器人公司、制造商及顶尖高校已开始采用这些技术,加速机器人从实验室走向日常生活的进程 [3][9][10] Newton物理引擎 - 该引擎旨在解决机器人技能从仿真环境安全可靠迁移至现实世界的核心难题,全球超过25万机器人开发者面临此问题 [4] - 作为开源项目,基于英伟达的Warp和OpenUSD框架构建,采用GPU加速技术,能够仿真复杂动作如雪地行走和操控细腻物体 [4] - 苏黎世联邦理工学院、慕尼黑工业大学、北京大学等顶尖高校以及光轮智能、Style3D等公司已成为其早期用户 [4] Isaac GR00T N1.6基础模型 - 该开源模型通过集成Cosmos Reason视觉语言模型,赋予机器人接近人类的推理能力,能够将模糊指令转化为可执行的逐步计划 [5][6] - 模型使机器人能同时完成移动和物体操控动作,躯干和手臂活动自由度更大,甚至可推开较重的房门 [6] - Cosmos Reason模型在Hugging Face平台下载量已超过100万次,并在物理推理模型排行榜上位居榜首 [6] - AeiROBOT、Franka Robotics、LG Electronics等领先机器人制造商正在评估采用该系列模型 [7] 训练革新与数据生成 - 基于Omniverse的Isaac Lab 2.3开发者预览版新增了灵巧抓取工作流,采用“自动化课程体系”从简单到复杂逐步训练机器人 [8] - Boston Dynamics的Atlas机器人通过此工作流学习抓取技能,操控能力获得显著提升 [8] - 英伟达与光轮智能联合开发了Isaac Lab Arena,作为开源策略评估框架,支持大规模实验和标准化测试,无需从零构建系统 [8] - 公司提供了开源物理AI数据集,包含数千条合成及真实世界轨迹数据,目前下载量已突破480万次 [6] AI硬件基础设施 - GB200 NVL72机架式系统集成36个Grace CPU和72个Blackwell GPU,已被各大云服务提供商采用 [9] - RTX PRO服务器为机器人开发提供统一架构,RAI Institute已率先使用 [9] - 搭载Blackwell GPU的Jetson Thor能够支持机器人运行多个AI工作流,实现实时智能交互,Figure AI、银河通用等合作伙伴已开始采用 [9] - 在CoRL收录的论文中,近半数引用了英伟达的相关技术,卡内基梅隆大学、华盛顿大学等顶尖研究机构均在使用其GPU、仿真框架和CUDA加速库 [9]
英伟达做Robotaxi,马斯克你怎么看?
搜狐财经· 2025-09-18 17:46
项目概况 - 英伟达内部正在孵化全新的Robotaxi项目,由资深高级总监Ruchi Bhargava负责 [4] - 公司预计为此项目投入30亿美元,未来将在美国落地开城 [5] - 项目核心逻辑是推出技术样本,验证其从GPU芯片到物理AI大模型的全链路工程能力,进而定义下一代基础设施与生态标准 [5] 技术路线与基础 - 英伟达采用一段式端到端技术路线,通过仿真技术构建的世界模型对神经网络进行强化训练,与特斯拉FSD路线高度相似 [4] - 关键支撑是今年1月发布的Cosmos世界基础模型,该平台整合多模态数据生成高质量合成视频,已完成2000万小时数据的预训练 [4] - 最新升级的Cosmos推出了仅7B参数的Cosmos Reason模型,具备物理理解能力和多步推理功能 [4] - 自研DRIVE Thor芯片算力高达2000TOPS,可大幅提升端到端模型推理效率 [6] 市场竞争格局 - 行业领导者Waymo为达成当前运营规模累计投入约120亿美元 [5] - Waymo已在美国7座城市运营,每周提供超过25万次付费出行,运营车辆约700辆 [5][6] - 特斯拉于今年9月在奥斯汀和湾区开放Robotaxi服务,首日下载量超过Uber 40%,比Waymo历史最高下载量高出6倍,首批投放仅数十辆 [5][6] - 2025年美国Robotaxi市场正加速发展 [5] 公司优势与挑战 - 英伟达2025年第二季度净利润达264亿美元,为长期研发提供充足资金支持 [6] - 公司在自动驾驶软件方面仍面临挑战,2024年6月测试显示其布局4年的辅助驾驶软件效果不如中国企业Momenta耗时1个月调试的软件 [5] - 内部对标测试显示,在五六百公里路程中,特斯拉FSD仅需接管1-2次,英伟达与特斯拉差距仍较大 [5] - 行业专家认为当前市场仍处早期阶段,英伟达入场时机并不算晚,仍有争夺技术话语权的机会 [6]
“反击”马斯克,奥特曼说OpenAI有“好得多”的自动驾驶技术
36氪· 2025-07-07 08:32
OpenAI与特斯拉的竞争动态 - OpenAI CEO山姆·奥特曼与特斯拉CEO马斯克因OpenAI商业化运营产生矛盾,马斯克起诉奥特曼违背创始协议并成立xAI直接竞争[1] - 奥特曼反击称马斯克曾试图掌控OpenAI未果,并可能研发自动驾驶技术挑战特斯拉FSD[1][3] - 奥特曼透露OpenAI拥有"比当前技术好得多"的自动驾驶技术,但未公布具体细节和时间表[3][5] OpenAI自动驾驶技术潜力 - 新技术可能基于Sora视频软件和机器人团队,利用世界模型理解物理世界[6][8][11] - Sora作为世界模型可生成高保真视频,但存在物理原理不完善的问题,可能用于自动驾驶模拟训练[10][11] - 业界认为世界模型是自动驾驶突破关键,需结合物理因果关系理解和预测能力[17][21] 行业技术发展趋势 - 自动驾驶行业正转向"世界模型"开发,如蔚来、小鹏等公司尝试让AI系统模拟人类对世界的理解[11] - 英伟达推出Cosmos世界基础模型,专为物理交互和驾驶环境设计,可能优于Sora的仿真能力[22][24] - AI大牛普遍认为仅靠语言模型不足实现自动驾驶,需结合多模态和世界模型[16][18][19] OpenAI在汽车智能化领域的布局 - 通过投资布局自动驾驶领域,如向Ghost Autonomy投资500万美元(已倒闭),与Applied Intuition合作开发智能座舱[12][14][15] - 2024年重组机器人团队,与Figure公司合作开发人形机器人AI模型,技术可能与自动驾驶相通[24] - 自动驾驶被视为AI应用最具前景场景之一,市场规模达万亿美元级别[7][24]