Workflow
NVIDIA Cosmos
icon
搜索文档
Mercedes, NVIDIA and Uber Team Up to Build S-Class Robotaxis
ZACKS· 2026-01-31 00:06
合作方与核心目标 - 梅赛德斯-奔驰集团、英伟达公司和优步科技公司正在推进在主要城市推出基于梅赛德斯S级轿车的机器人出租车服务的计划[1] - 该合作于去年启动,专注于构建一个全球自动驾驶平台[1] - 该计划突显了传统汽车制造商与人工智能领导者如何合作,生产更安全、更智能、更自动化的车辆,同时保持高质量和安全标准[3] 技术架构与整合 - 下一代搭载梅赛德斯-奔驰MBOS的S级轿车将集成英伟达DRIVE Hyperion硬件以及完整的英伟达DRIVE AV L4级软件堆栈[2] - 该设置旨在支持未来的机器人出租车部署,通过英伟达的Halos系统以及并行的基于AI和经典驾驶堆栈,强调安全第一的自动驾驶,以确保可靠的性能[2] - 英伟达DRIVE AV为全新S级轿车配备了完整的自动驾驶系统,能够在以安全为中心的架构内处理罕见和复杂的驾驶场景[4] - 该系统在英伟达DGX平台上进行大规模训练,并使用英伟达Omniverse NuRec库和Cosmos世界模型通过高保真模拟进行验证[4] 产品定位与部署 - S级轿车旨在提供高端、类似专职司机的自动驾驶体验[3] - 根据英伟达先前宣布的与优步的合作关系,两家公司计划通过优步的出行网络向乘客提供这些自动驾驶车辆[3] - 优步计划通过其出行网络提供自动驾驶S级轿车[7] 技术能力与基础 - DRIVE AV基于英伟达更广泛的AI基础(涵盖感知、规划和推理)构建,并针对量产车的可靠部署进行了优化和提炼,可根据梅赛德斯-奔驰的车辆平台和传感器套件进行定制[5] - 该技术能够实时分析复杂环境,评估多种驾驶选项,并选择最安全的行动方案[5] 其他背景信息 - 梅赛德斯-奔驰此前已与博世和中国软件公司Momenta在其他自动驾驶项目上展开合作[6] - 公司尚未披露推出机器人出租车服务的时间表[6]
午评:深成指、创业板指均涨超1% AI应用板块集体走强
新华财经· 2026-01-12 14:18
市场行情与指数表现 - A股三大指数1月12日震荡走强,沪指午盘涨0.75%报4151.14点,深成指涨1.31%报14305.10点,创业板指涨1.17%报3366.71点,科创50指数涨2.26%报1509.29点 [1] - 沪深两市半日成交额达2.31万亿元,较上个交易日放量2455亿元,其中沪市成交9153亿元,深市成交13916亿元,创业板成交7090亿元,科创50成交约677亿元 [1] 领涨板块与个股表现 - AI应用方向持续爆发,GEO、AI医疗方向领涨,值得买、光云科技等多股涨停 [1] - 商业航天概念延续强势,鲁信创投录得12天10板,金风科技5连板,通宇通讯4天3板 [1] - 光伏概念表现活跃,东方日升触及20cm涨停 [1] - 零售概念走高,茂业商业2连板,三江购物、家家悦涨停 [1] - 文化传媒、军工电子、影视院线、Sora、多模态AI、卫星导航等板块和概念股涨幅居前 [2] 下跌板块 - 油气、煤炭等方向跌幅居前 [1] - 油气开采及服务、保险、农化制品、草甘膦、大豆、动物疫苗等板块和概念股跌幅居前 [2] 机构市场观点 - 华泰证券认为春季行情或仍有空间,但交易结构较为集中,行情转向轮动的概率上升,建议关注游戏、免税、电池、工程机械、农化等行业 [3] - 中信建投指出AI产业动态密集,模型能力提升推动下游应用加速进入商业化验证阶段,重点关注搜索&营销、Coding、多模态、Agent、AI for Science领域 [3] 人形机器人产业动态 - 海通证券表示人形机器人产业发展加速,英伟达在CES 2026发布多项机器人学习推理工具与模型,有望推动打造通用型专业机器人 [4] - 特斯拉、Figure、波士顿动力等海外巨头及宇树、智元等国内领先企业有望在生态链协同下实现核心环节突破,共同推动人形机器人走向规模化商用 [4] 政策与产业消息 - 国家发展改革委等部门印发《关于加强政府投资基金布局规划和投向指导的工作办法(试行)》,首次在国家层面对政府投资基金的布局和投向作出系统规范 [5] - 该办法要求基金支持重大战略、重点领域和薄弱环节,推动科技创新和产业创新深度融合,培育新兴支柱产业,坚持投早、投小、投长期、投硬科技 [5] - 基金投向须符合国家重大规划和国家级产业目录中的鼓励类产业,不得投向限制类、淘汰类及政策明令禁止的产业领域 [5] 存储芯片市场展望 - Counterpoint Research指出存储市场已进入“超级牛市”阶段,当前行情超越了2018年的历史高点,供应商议价能力达到历史最高水平 [6] - 预计2025年第四季度存储价格将飙升40%–50%,2026年第一季度还将再涨40%–50%,2026年第二季度预计再上涨约20% [6][7]
黄仁勋点赞三款中国大模型,英伟达押宝物理AI
观察者网· 2026-01-06 19:22
英伟达CES 2026战略发布核心观点 - 公司战略重心从消费级GPU转向新一代AI计算平台与物理AI应用 公司五年来首次未在CES发布新款GPU 将重点放在新一代计算平台和物理AI领域的进展 包括自动驾驶和机器人 [2] - 公司高度评价并积极融入全球开源模型生态 特别点名肯定中国开源模型的领先地位与突破性贡献 [2][3] - 公司发布全新Vera Rubin一体化AI超算平台 通过协同设计实现性能的指数级提升与成本的大幅降低 旨在加速下一代AI模型的到来 [7][8][10] - 公司宣布物理AI的“ChatGPT时刻”已到来 在自动驾驶和机器人领域推出系列开源模型、工具及计算框架 并已获得多家行业领先企业的合作与应用 [10][11][12][13] 对开源生态的评价与布局 - 公司CEO黄仁勋对2025年开源社区给予高度评价 指出DeepSeek作为第一个开源推理系统 激发了整个行业的发展浪潮 [3] - 在展示的开源生态第一梯队中 包含三家中国模型:月之暗面的Kimi K2、深度求索的DeepSeek V3.2和阿里的Qwen模型 与OpenAI的GPT-OSS并列 其中Kimi K2和DeepSeek V3.2分别是开源第一和第二 [5] - 公司认为开源模型虽可能落后顶尖模型约六个月 但每隔六个月的快速迭代让包括公司在内的所有参与者都不愿错过 [5] - 公司公布了自身的开源模型生态系统 涵盖生物医药、物理AI、智能体模型、机器人及自动驾驶 通过价值数十亿美元的DGX Cloud超级计算机开发了如LaProteina和OpenFold3等前沿模型 [6] 新一代Vera Rubin计算平台发布 - 平台以天文学家Vera Rubin命名 寓意加快AI训练速度 让下一代模型提前到来 [7] - 平台为协同设计的一体化AI超算 重新设计了6款芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机 [7] - Rubin GPU搭载第三代Transformer引擎 NVFP4推理算力达50 PFLOPS 是Blackwell的5倍 目前已进入量产 [7] - 工程设计实现重大突破 超算节点从需接43根线缆、组装2小时 变为采用0根线缆、仅6根液冷管线、5分钟完成组装 [8] - 现场使用中国模型展示平台效能:在Rubin架构下 DeepSeek模型训练时间压缩至原来的1/4 Kimi K2 Thinking推理吞吐量提升10倍 Token成本削减至原来的1/10 [10] 在自动驾驶领域的进展 - 公司认为物理AI的ChatGPT时刻已到来 无人驾驶出租车将是最早受益的应用之一 [10] - 公司推出名为Alpamayo的开源AI模型、仿真工具及数据集 旨在推动推理型辅助驾驶汽车开发 其核心是加入了基于“思维链”的VLA推理模型 以处理复杂“长尾场景”并使决策过程可解释 [10][11] - 整套技术的安全核心由公司的Halos安全系统提供支持 [11] - 首款搭载公司技术的汽车将于2026年第一季度在美国上路 第二季度在欧洲上路 下半年在亚洲上路 [11] - 目前捷豹路虎、Uber、Lucid等企业均对该技术方案表达兴趣 希望基于此实现L4级自动驾驶 [11] 在机器人领域的进展 - 公司认为机器人开发的ChatGPT时刻已然到来 物理AI模型具备理解现实世界、推理和行动规划的能力 [12] - 公司发布两款用于机器人学习和推理的开源模型及配套数据:NVIDIA Cosmos和GR00T 同时推出用于机器人性能评估的Isaac Lab-Arena 以及从边缘到云的计算框架OSMO 以简化机器人训练流程 [12] - 公司与Hugging Face合作 将Isaac开源模型和相关库整合到LeRobot项目中 以加速开源机器人开发社区发展 [12] - 由公司Blackwell架构驱动的Jetson T4000模组已发售 能将设备能效和AI算力提升至原来的4倍 [12] - 波士顿动力、卡特彼勒、Franka Robots、Humanoid、LG电子和NEURA Robotics等企业 均已推出基于公司技术打造的新型机器人和自主运行设备 [13]
机器人,突传重磅!黄仁勋:ChatGPT时刻已来!英伟达放大招,波士顿动力、卡特彼勒、NEURA、LG......
券商中国· 2026-01-06 14:41
英伟达在CES 2026的核心发布 - 英伟达CEO黄仁勋在CES 2026发表90分钟演讲,宣告人工智能从理解语言进化到理解物理世界,并指出机器人产业已迎来“ChatGPT时刻” [1] - 公司发布了NVIDIA Cosmos和GR00T开放模型及数据用于机器人学习与推理,推出Isaac Lab-Arena用于评估,以及OSMO边缘到云计算框架以简化训练工作流程 [1] - 包括波士顿动力、卡特彼勒、弗兰卡机器人、LG电子和NEURA机器人在内的全球行业领导者,首次推出了基于英伟达技术的新机器人和自主机器 [1][4] 英伟达机器人技术栈与开放生态 - 英伟达宣布了面向物理AI的新开放模型、框架和AI基础设施,旨在加速整个机器人开发生命周期,推动打造能快速学习多项任务的通用型专业机器人 [3] - 公司通过构建开放模型,使开发者能绕过资源密集的预训练,将昂贵、单任务且难编程的机器转变为推理型通才机器人 [4] - 公司在GitHub上发布了新的开源仿真与计算框架,以简化零散且难以管理的机器人培训与评估工作流程,加速从研究向实际应用的转变 [5] - 英伟达合作伙伴包括AAEON、Advantech等超过10家公司,将提供支持边缘AI、机器人和嵌入式应用的Thor驱动系统 [5] 机器人商业化落地加速 - 人形机器人正加速在工业制造、物流搬运及康养服务等场景落地,具备替代人工、提升效率的潜力 [8] - 在汽车制造领域,优必选、特斯拉等已实现小批量部署,预计2028年需求达73.64万台 [8] - 在物流行业,头部企业如杭叉集团、井松智能等已推出高负载、多场景适应能力的产品,预计2028年需求达5.91万台 [8] - 行业已从技术探索转向商业化落地,Figure、宇树科技、优必选等国内外头部企业均推出多代产品,覆盖工业、服务、家庭等场景 [8] - Figure凭借多轮高额融资,估值达390亿美元,成为全球最高估值人形机器人公司 [8] 行业发展趋势与技术路径 - 行业呈现B端与C端并重的市场策略,产品向高性价比、模块化、平台化演进 [9] - 技术路径上,电机驱动替代液压驱动成为主流,AI大模型与具身智能深度融合 [9] - 应用场景从工业向家庭、康养、物流等多领域拓展,特斯拉Optimus推动“工业-服务-家庭”全场景适配能力提升 [9] - 特斯拉链预计2026年第一季度发布第一代量产产品,2026年上半年完成供应链大批量产线建设,2026年8月开启大规模量产 [9] - 国产链头部本体出货量规模有望从数千台跨越到数万台,应用场景主要来自二次开发、导览、巡检等 [9] - 2026年,随着大模型逻辑和训练架构迭代,机器人的“大脑”(算法)有望实现突破,而上肢能力迭代已接近奇点 [9] 英伟达的行业合作与产品拓展 - 卡特彼勒正在扩大与英伟达的合作,将先进AI和自主性带入建筑和采矿设备 [6] - NVIDIA IGX Thor将于本月晚些时候上市,将机器人技术延伸到工业前沿,提供高性能AI计算、企业软件支持和功能安全 [5] - Archer公司利用IGX Thor将人工智能引入航空领域,推动飞机安全、空域整合和自动驾驶系统的关键能力 [5]
黄仁勋又夸了DeepSeek,新一代“算力巨兽”正在量产,性能暴增5倍!
凤凰网· 2026-01-06 10:19
行业范式迁移 - 计算行业正同时经历两大平台迁移:应用转向以AI为核心构建,以及软件开发运行范式从“编程”转向“训练”、从CPU转向GPU、从执行预编译代码转向实时生成内容 [2] - 驱动变革的资金来自全球研发预算向AI的转移以及海量风险投资,过去十年价值约10万亿美元的计算产业正在被现代化改造 [4] - 开源模型已触及技术前沿,虽然与最前沿专有模型仍有约6个月差距,但其快速迭代正激活全球创新,成为AI迅速扩散的主引擎 [4] AI能力演进:从数字智能到物理AI - AI能力演进的下一个关键阶段是从大语言模型的“记忆与生成”迈向智能体的“推理与行动”,智能体能够进行思维链推理、主动规划步骤并调用工具,以解决新问题 [5] - 智能体架构本质上是多模型、多云、混合式的,能够根据任务动态选择最佳模型,并结合企业私有定制化模型 [7] - 真正的挑战在于让AI理解物理世界,这引出了“物理AI”的核心主题,需要构建由训练计算机、边缘推理计算机和高精度物理模拟计算机组成的完整系统 [7] 开源世界模型与自动驾驶系统 - NVIDIA Cosmos是一个开源的、“前沿级”的世界基础模型,基于对互联网规模视频、真实驾驶数据和3D模拟的学习,建立起对世界运作方式的统一表征 [8] - Cosmos能够根据单张图片生成逼真视频,或从3D场景描述中生成物理合理的运动轨迹,并能在交互式闭环模拟中响应AI动作及进行因果推理,其核心价值在于“将计算转化为数据”,以解决现实世界数据收集的成本与效率瓶颈 [8] - 基于Cosmos生成的海量合成与真实数据,公司训练并开源了首个端到端自动驾驶系统NVIDIA AlphaMio,这是世界上第一个具备思考推理能力的自动驾驶汽车AI,具备行动可解释性,首款搭载该系统的梅赛德斯-奔驰汽车将于2026年第一季度上路 [8] 新一代AI芯片架构Vera Rubin - 面对AI模型规模每年增长10倍、计算需求爆炸的挑战,公司揭示了下一代AI芯片架构NVIDIA Vera Rubin [9] - Vera Rubin架构包含Vera CPU与Rubin GPU,其中新一代CPU性能功耗比提升2倍,GPU的AI浮点性能达到Blackwell架构的5倍 [11] - 架构包含革命性的NVFP4张量核心,能动态自适应调整精度以优化Transformer模型吞吐量 [11] - 这是一次从芯片到系统的全栈革新,包括集成硅光子的Spectrum-X以太网交换机(512个200Gb/s端口)、为AI工作负载重塑的BlueField-4 DPU,以及彻底简化的DGX机箱设计 [11] Vera Rubin的系统性能与生产状态 - Vera Rubin的性能飞跃秘诀在于“极端协同设计”,对公司内部所有芯片进行彻底重新设计,使其作为一个整体系统工作,一次性展示了6款革命性芯片 [12] - 一个包含1152个GPU的Vera Rubin POD机柜重达约2吨,内部含2英里长的铜缆,散热仅需45摄氏度温水,能效显著 [13] - 该架构将使训练一个10万亿参数大模型所需的系统数量减少至Blackwell的四分之一,同时推理成本降低一个数量级 [13] - Vera Rubin芯片架构目前正在全力生产中 [13] 产业生态与未来应用 - 公司与西门子达成重磅合作,将物理AI模型与Omniverse数字孪生平台深度集成到西门子的工业软件与自动化系统中,共同推动从芯片设计到生产运维的全面数字化革命 [13] - 自动驾驶汽车仅是物理AI的第一个主流市场,相同的技术栈正催生机器人革命的到来,从机械臂到人形机器人,机器人领域的“ChatGPT时刻”即将到来 [14] - 公司通过开源关键模型与发布颠覆性硬件,正强势定义“物理AI”时代的技术标准与基础设施,战略核心是以全栈式的开放生态占据从数据中心到机器人指尖的每一个计算节点 [14]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]
LEM Surgical Showcases the World's First "Surgical Humanoid" at CES 2026; Groundbreaking NVIDIA Physical AI Toolsets to Drive Dynamis Robotic Surgical System Development
Accessnewswire· 2026-01-06 07:00
公司动态 - LEM Surgical公司宣布将参加2026年国际消费电子展 [1] - 公司是下一代硬组织机器人手术领域的领导者 [1] 产品与技术 - Dynamis机器人手术系统已获得美国食品药品监督管理局批准,并在拉斯维加斯投入常规临床使用 [1] - 该系统将进行下一次升级,利用英伟达Jetson Thor、英伟达Isaac for Healthcare和英伟达Cosmos平台来定义硬组织机器人手术的未来 [1]
NVIDIA Releases New Physical AI Models as Global Partners Unveil Next-Generation Robots
Globenewswire· 2026-01-06 06:04
核心观点 - NVIDIA在CES 2026上宣布了针对物理人工智能(物理AI)的新开放模型、框架和基础设施,旨在加速机器人技术发展,并推出了由全球合作伙伴打造的多行业机器人 [2] - 公司CEO黄仁勋称“机器人技术的ChatGPT时刻已经到来”,物理AI的突破正在解锁全新的应用,NVIDIA的全栈技术正赋能全球合作伙伴通过AI驱动机器人变革行业 [4] 新产品与技术发布 - **开放模型**:发布了NVIDIA Cosmos™ Transfer 2.5、Cosmos Predict 2.5(用于物理合成数据生成和策略评估的世界模型)以及Cosmos Reason 2(开放推理视觉语言模型VLM)[19] - **专用机器人模型**:发布了NVIDIA Isaac™ GR00T N1.6,这是一个专为人形机器人打造的开放推理视觉语言动作(VLA)模型,可实现全身控制并利用Cosmos Reason进行更好的推理 [19] - **开源框架**:发布了开源框架NVIDIA Isaac Lab-Arena,用于大规模机器人策略评估和基准测试 [9];发布了云原生编排框架NVIDIA OSMO,用于统一机器人开发工作流 [10] - **硬件升级**:推出了基于Blackwell架构的新NVIDIA Jetson™ T4000模块,在1000件批量下售价为1,999美元,其性能是上一代的4倍,拥有1,200 FP4 TFLOPS和64GB内存,功耗可配置为70瓦 [22] - **边缘计算**:宣布NVIDIA IGX Thor将于本月晚些时候上市,将高性能AI计算扩展到工业边缘 [23] 合作伙伴与生态系统 - **行业领导者采用**:包括波士顿动力、卡特彼勒、Franka Robotics、Humanoid、LG电子和NEURA Robotics在内的全球行业领导者正在使用NVIDIA机器人技术栈推出新的AI驱动机器人 [3][18] - **具体应用案例**: - Franka Robotics、NEURA Robotics和Humanoid使用GR00T工作流模拟、训练和验证机器人新行为 [5] - Salesforce使用Agentforce、Cosmos Reason和NVIDIA Blueprint分析机器人拍摄的视频,将事件解决时间缩短了2倍 [5] - LEM Surgical使用NVIDIA Isaac for Healthcare和Cosmos Transfer训练其Dynamis手术机器人的自主手臂 [6] - XRlabs使用Thor和Isaac for Healthcare使手术镜(从外窥镜开始)能够通过实时AI分析指导外科医生 [6] - Hexagon Robotics等机器人开发者已开始使用OSMO,该框架已集成到微软Azure Robotics Accelerator工具链中 [11] - **社区合作**:NVIDIA与Hugging Face合作,将开源Isaac和GR00T技术集成到领先的LeRobot开源机器人框架中,此举联合了NVIDIA的200万机器人开发者和Hugging Face的1300万AI构建者社区 [13] 机器人产品展示 - **人形机器人**:多家合作伙伴展示了集成NVIDIA Jetson Thor的新一代人形机器人 [15] - NEURA Robotics推出了保时捷设计的第三代Gen 3人形机器人以及一款优化灵巧控制的小型人形机器人 [20] - Richtech Robotics推出了Dex,一款用于复杂工业环境中精细操作和导航的移动人形机器人 [20] - AGIBOT推出了面向工业和消费领域的人形机器人以及集成Isaac Sim的机器人仿真平台Genie Sim 3.0 [20] - LG电子推出了一款能够执行广泛室内家务任务的新型家用机器人 [20] - 波士顿动力、Humanoid和RLWRLD已将Jetson Thor集成到其现有人形机器人中以增强导航和操作能力 [21] - **其他自主机器**:合作伙伴基于NVIDIA技术推出了从移动机械臂到人形机器人的多种新机器人和自主设备 [18] 市场与行业影响 - **增长领域**:机器人技术现已成为Hugging Face上增长最快的类别,NVIDIA的开放模型和数据集在蓬勃发展的开源社区中下载量领先 [12] - **技术可及性**:NVIDIA正在构建开放模型,使开发者能够绕过资源密集的预训练,专注于创建下一代AI机器人和自主机器 [5] - **协作扩展**:卡特彼勒正在扩大与NVIDIA的合作,将先进的AI和自主技术引入建筑和采矿领域的设备与工地 [25]
NVIDIA Announces Alpamayo Family of Open-Source AI Models and Tools to Accelerate Safe, Reasoning-Based Autonomous Vehicle Development
Globenewswire· 2026-01-06 05:49
文章核心观点 - NVIDIA在CES 2026上发布了名为Alpamayo的开放式AI模型、仿真工具和数据集家族,旨在加速下一代基于推理的安全自动驾驶汽车发展 [1][4][12] - Alpamayo家族通过引入基于思维链的视觉语言行动模型,为自动驾驶决策带来类人推理能力,旨在解决罕见、复杂的“长尾”驾驶场景挑战 [2][3][12] - 该生态系统整合了开放模型、仿真框架和数据集三大支柱,为汽车开发商和研究团队提供了一个可构建的完整、开放生态系统 [4][10][11] 产品与技术细节 - **Alpamayo 1模型**:行业首个基于思维链推理的视觉语言行动模型,拥有100亿参数架构,使用视频输入生成轨迹和推理痕迹,展示每个决策背后的逻辑 [13] - **AlpaSim仿真框架**:一个完全开源、端到端的高保真自动驾驶开发仿真框架,提供真实的传感器建模、可配置的交通动态和可扩展的闭环测试环境 [13] - **Physical AI开放数据集**:包含超过1,700小时的驾驶数据,覆盖了最广泛的地理区域和条件,包含对推进推理架构至关重要的罕见复杂真实世界边缘案例 [13] - 这些模型并非直接在车载系统运行,而是作为大规模教师模型,供开发者微调并提炼到其完整自动驾驶技术栈的骨干中 [5] - 未来该家族的模型将具有更大的参数量、更详细的推理能力、更灵活的输入输出选项以及商业用途选择 [13] 行业影响与合作伙伴 - 移动出行领军企业和行业专家,包括Lucid、JLR、Uber和Berkeley DeepDrive,均对Alpamayo表现出兴趣,以开发能够实现L4级自动驾驶的基于推理的自动驾驶技术栈 [8][12] - 行业观点认为,向物理AI的转变凸显了对能够推理现实世界行为的AI系统日益增长的需求,而先进的仿真环境、丰富的数据集和推理模型是发展的重要元素 [9] - 该模型的开放源码性质加速了全行业的创新,使合作伙伴能够根据其独特需求调整和完善该技术 [9] - 借助Alpamayo,行业领导者和研究社区可以加快安全、基于推理的L4级部署路线图 [12] 开发与部署支持 - 开发者可以利用NVIDIA丰富的工具和模型库,包括来自NVIDIA Cosmos和NVIDIA Omniverse平台的工具 [9] - 开发者可以在专有车队数据上微调模型版本,将其集成到基于NVIDIA DRIVE AGX Thor加速计算构建的NVIDIA DRIVE Hyperion架构中,并在商业部署前在仿真中验证性能 [9] - 这些工具共同为基于推理的自动驾驶技术栈实现了一个自我强化的开发循环 [7]
调研超600人,英伟达这份报告揭示AI医疗未来发展方向
36氪· 2025-12-16 09:12
行业市场规模与现状 - 中国AI医疗市场规模预计在2025年达到1157亿元,并预计在2028年攀升至1598亿元 [1] - 医疗健康/生命科学领域现阶段三大AI用例为:医疗影像和诊断(占比47%)、临床决策支持(占比43%)、疾病诊断和风险预测(占比40%) [2] - 截至2024年5月,中国已有85款AI医疗影像产品获批三类证,覆盖眼部、肺部、骨科、心血管、乳腺、宫颈等多个部位的疾病诊断 [7] 核心应用场景与驱动因素 - 医疗影像和诊断位列AI用例之首,主要原因为可缓解医疗资源紧缺及分布不均问题 [2][5] - 中国偏远地区的疾病误诊率是城市的2-3倍,2021年中国影像科医生配置仅为0.17人/千人,资源严重短缺 [5] - AI能高效处理分析大量图像数据,提高诊断效率和准确率,减少漏诊误诊,并能通过临床决策支持系统辅助医生做出更科学的诊疗决策 [6] - 海量数据的积累(如院内影像数据、检测检验数据、日常健康信息)是AI技术落地应用和迭代升级的基础 [6] 未来五年受AI影响最大的领域 - 未来5年内,受访者认为受AI影响最大的三大领域是:先进的医疗影像和诊断(51%)、虚拟医疗健康助手(34%)、精准医疗(29%) [8] - AI+医疗影像诊断当前主要实现定性分析,未来借助大模型和生成式AI,应用边界将不断拓展,向定量分析(如疾病病程判断)等能力进阶 [10] - 虚拟健康助手发展迅速,其驱动力包括:C端健康管理需求涌现、可作为企业抢夺用户入口并提升用户黏性与复购率、能积累用户健康数据赋能个性化健康管理与医药研发、以及生成式AI技术进步使主动式全生命周期健康管理成为可能 [11] - 国内AI虚拟健康助手已呈现同质化,但部分企业基于自身优势打造差异化产品,例如蚂蚁集团的医保与资源整合、讯飞医疗的复杂症状鉴别诊断、京东健康的“小病咨询-快速购药”服务闭环 [12] - 精准医疗在AI助力下,将在诊断和治疗水平上持续提升能力,实现更精准高效的诊断和更科学个性化的诊疗方案 [12] 行业发展挑战与解决方案 - 在医疗健康与生命科学领域实施AI的最大挑战是数据问题(如隐私和自主权),约33%的受访者提及此点 [13] - 其他主要挑战包括缺乏预算(30%)和用于模型训练的数据量不足(30%) [13] - 英伟达为赋能行业AI开发,构建了从底层硬件到顶层应用的完整解决方案,包括AI计算平台、NVIDIA Clara平台(含BioNeMo、Holoscan、Parabricks、MONAI等工具)、NVIDIA Omniverse和NVIDIA Cosmos平台,以及用于AI医疗机器人的开发者框架NVIDIA Isaac for Healthcare [14] - NVIDIA Isaac for Healthcare通过生成高保真合成数据解决训练数据不足问题,并通过数字孪生技术降低研发部署成本、缩短周期以应对预算不足挑战 [15] - NVIDIA Isaac for Healthcare的核心能力涵盖数字化原型设计、利用仿真数据训练AI模型、在数字孪生环境中验证模型、通过硬件在环进行持续测试以及实现从仿真到现实的部署应用 [16] - 英伟达已与强生、GE医疗等行业龙头合作,例如帮助强生将其MONARCH平台的设计、模拟与测试过程从数月或数年缩短至数小时 [17] - 英伟达还通过初创加速计划(NVIDIA Inception)为超过4000家医疗健康/生命科学企业提供产品折扣、技术支持等帮助,并持续通过其技术(如NVIDIA Clara平台的视觉语言模型Reason)提升AI模型的可解释性与透明度 [18]