Workflow
物理AI
icon
搜索文档
高通推出全套机器人技术组合,助力从家用机器人到全尺寸人型机器人的具身智能
硬AI· 2026-01-06 09:40
核心观点 - 高通在CES上发布了一套整合硬件、软件与AI能力的通用机器人全栈架构,并推出旗舰机器人处理器Dragonwing™ IQ10系列,旨在为从个人服务机器人到全尺寸人形机器人的各种形态提供高性能、低功耗的“机器人之脑”,加速零售、物流和制造等行业的自动化落地 [2][3] 产品发布与架构 - 发布新一代机器人“全栈式”架构,整合硬件、软件以及复合式AI,目标是为从小型家用机器人到全尺寸人形机器人在内的各种形态提供动力 [3] - 同步推出其最新的高性能机器人处理器——Qualcomm Dragonwing™ IQ10系列,面向工业自主移动机器人以及先进的全尺寸人形机器人 [2][3] - 该架构在能效和可扩展性方面处于行业领先水平,可支持从个人服务机器人、下一代工业自主移动机器人,到具备推理、适应和决策能力的全尺寸人形机器人 [2] - 全新的端到端架构通过赋能通用型、持续学习的机器人形态,加快了零售、物流和制造等行业的自动化落地 [2] 技术规格与特性 - Dragonwing IQ10平台整合了多种处理器单元,包括:Qualcomm Oryon™ CPU(最高18核)、Qualcomm® Adreno™ GPU、Qualcomm® Hexagon™ NPU(专为高效VLA设计)、Qualcomm Spectra™ ISP(用于低光相机处理)、CV处理器(用于深度和定位)、显示与音频处理器以及视频处理器 [5] - 平台支持Linux操作系统和实时操作系统,具备实时安全子系统(最高达SIL3等级)、多核实时CPU锁步模式、安全SRAM、自检功能以及用于低延迟控制和安全操作的安全I/O [5] - 内存控制器支持高性能LP5x,带宽大于270 GBps,并采用增强型内存架构以支持大参数模型 [5] - 提供高性能、低延迟工业I/O,包括USB、PCIe Gen5和10G以太网接口 [5] - 该架构将强大的异构边缘计算、边缘AI、混合关键级系统、软件、机器学习运维以及AI数据飞轮相结合 [11] - 依托公司在边缘AI、高性能低功耗系统方面的成熟经验,这一创新能够将原型产品转化为可部署的智能机器 [3] 战略合作与生态 - 公司正与其机器人平台生态内的多家企业合作,包括研华科技、APLUX、奥特酷智能科技、Booster、Figure、库卡机器人、Robotec.ai等,旨在实现大规模的部署就绪型机器人应用 [6] - 随着Figure扩展其人形机器人平台,高通技术公司正与其合作,共同定义下一代计算架构 [6] - 公司正在与Kuka Robotics就其下一代机器人解决方案展开讨论 [9] - 该体系由不断壮大的合作伙伴生态系统提供支持,并辅以完善的开发者工具套件 [11] - 该协作网络加速了可部署机器人解决方案的开发,解决“最后一公里”难题,推动各行业更快、更具规模化的创新落地 [11] 应用案例与市场进展 - Dragonwing工业处理器路线图已经为多种通用型机器人形态提供支持,其中包括来自Booster、VinMotion等全球机器人厂商的行业领先人形机器人 [9] - 与越南机器人公司Vinmotion合作,推出了Motion 2机器人——一款通用型人形机器人,展示了其击穿木板、捡拾物品等能力 [9] - 该架构支持先进的感知能力,以及结合端到端AI模型(如VLA和VLM)的运动规划,实现通用化的操作能力和人机交互能力 [9] - Dragonwing IQ10的推出,帮助高通在工业应用领域迈出了通向现实世界大规模部署的重要一步 [9] - 端到端的整体方案使机器人能够对空间和时间环境进行智能推理和自适应,并针对多种形态实现工业级可靠性下的规模化扩展 [11]
物理AI的ChatGPT时刻!英伟达“内驱”无人驾驶汽车将至,将于一季度在美国上路
硬AI· 2026-01-06 09:40
英伟达发布首个开源推理VLA模型Alpamayo - 公司宣布开源其首个用于自动驾驶的推理VLA(视觉-语言-动作)模型Alpamayo 1,旨在加速安全的自动驾驶技术开发[2][3] - 该模型采用100亿参数架构,使用视频输入生成轨迹及推理过程,展示每个决策背后的逻辑[2][9] - 模型旨在打造能在意外情况下“思考”解决方案的车辆,例如处理交通信号灯故障等复杂场景[2][5] 模型定位与部署计划 - 该模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中[11] - 公司CEO黄仁勋表示,首款搭载英伟达技术的汽车将于第一季度在美国上路,第二季度在欧洲上路,下半年在亚洲上路[2][5] - 未来该家族的模型将具有更大的参数规模、更详细的推理能力、更多的输入输出灵活性以及商业使用选项[11] 技术原理:推理VLA - 推理VLA是一种统一的AI模型,将视觉感知、语言理解和动作生成与逐步推理集成在一起[13] - 与将视觉输入直接映射到动作的标准VLA模型不同,推理VLA模型将复杂任务分解成可管理的子问题,并以可解释的形式阐明其推理过程[14] - 构建推理VLA需要三种基本AI功能:视觉感知、语言理解以及动作和决策制定[14] 构建完整开放生态系统 - 除模型外,公司还发布了配套的仿真工具AlpaSim和数据集,构建完整的开发生态系统[15] - AlpaSim是一个完全开源的端到端仿真框架,用于高保真自动驾驶开发,现已在GitHub平台发布[15] - 公司提供了面向自动驾驶的大规模开放数据集,包含超过1700小时的驾驶数据,覆盖罕见且复杂的真实世界边缘案例,这些数据集可在Hugging Face平台获取[15] 获得行业广泛支持 - 开源举措获得了行业广泛支持,包括捷豹路虎、Lucid、Uber以及加州大学伯克利分校DeepDrive联盟在内的多家移动出行领军企业和研究机构表示将利用Alpamayo开发基于推理的自动驾驶技术栈[5] - 业界认为,这一开放举措有助于加速整个自动驾驶生态系统的创新,为安全地应对复杂的真实世界场景提供新工具[17] - 处理长尾和不可预测的驾驶场景是自动驾驶的决定性挑战之一,Alpamayo为行业创造了加速物理AI、提高透明度并增加安全的L4级部署的新机遇[17] 跨行业AI模型全面开放 - 公司同期发布了推动各行业AI发展的多个新开源模型、数据和工具,涵盖用于代理AI的Nemotron家族、用于物理AI的Cosmos平台、用于机器人的Isaac GR00T以及用于生物医学的Clara[2][19][21] - 提供的开源资源包括全球最大的开放多模态数据集合之一,含10万亿语言训练标记、50万个机器人轨迹、45.5万个蛋白质结构和100TB的车辆传感器数据[21] - 博世、CrowdStrike、Salesforce、ServiceNow、日立和Uber等科技业领头羊正在采用并基于英伟达的开源模型技术进行开发[22]
黄仁勋最想赢的一仗, 四年仍在原地踏步
36氪· 2026-01-06 09:35
公司业绩与增长 - 英伟达在AI芯片业务推动下实现惊人增长,营收从2023年前九个月的275亿美元跃升至2024年同期的近1480亿美元 [1] Omniverse业务现状与问题 - 公司CEO黄仁勋将英伟达下一阶段押注在机器人和制造业,核心是Omniverse平台 [2] - 经过四年努力,Omniverse业务几乎没有取得实质性进展,真正签约在Omniverse Cloud上运行大规模模拟的公司寥寥无几 [7] - 开发者评价Omniverse软件难以使用、容易崩溃、功能不完整,尝试模拟人类等复杂场景时平台会崩溃 [7] - 有案例显示,英伟达代表承认Omniverse尚未准备好满足特定需求,并建议客户使用竞争对手Unity的软件 [8] - Omniverse团队向黄仁勋展示了大量软件演示,但至今未将任何一个演示转化为实际产品 [11] 管理层反应与内部挑战 - 黄仁勋在内部会议上质问Omniverse团队是否赚到了钱,并对与宝马合作的实际规模远小于预期感到生气 [10] - 黄仁勋曾因团队要求增员而愤怒训斥一小时,指责团队浪费工程师时间在无法转化为产品的演示上 [10][11] - 黄仁勋将其子女安插在Omniverse部门工作,女儿在营销团队,儿子是机器人产品经理,显示出战略层面的重视与焦虑 [25] 技术困境与市场挑战 - 模拟物理世界(尤其是柔性物体、液体、管线)的复杂程度极高,现有工具如Isaac Sim在操纵复杂物体(如衣物)方面几乎派不上用场 [12] - 为不同行业(机器人、汽车、工业设备)构建通用模拟软件是几乎不可能的任务,各领域需求差异巨大 [13][14] - 许多公司(如特斯拉)选择自己开发模拟软件,机器人行业主要玩家倾向于掌握核心技术自主权 [15][16] - Omniverse定位为面向开发者的横向开放平台,但缺乏足够的稳定性和完整性,面临“鸡和蛋”的生态发展困境 [16] - 竞争对手如Unity和开源模拟器Gazebo正在蚕食市场,它们各有图形渲染、用户体验或社区支持的优势 [18] 战略意义与潜在风险 - Omniverse承载着英伟达复制AI领域成功的战略野心,旨在通过模拟推动数十亿美元的芯片采购,并在制造业、物流业建立软件生态护城河 [21] - 如果Omniverse失败,公司可能从生态系统制定者退化为纯硬件供应商,一旦出现性能相当的竞争芯片,客户迁移成本将降低 [21][22] - 竞争对手AMD、英特尔及AI芯片初创公司正在缩小与英伟达的性能差距 [22] - 在物理AI和机器人领域,如果客户使用自建软件栈,英伟达将失去对技术趋势的洞察力和影响力 [23] - 公司试图在碎片化的市场中建立统一标准,但满足所有行业需求非常困难,且时间窗口紧迫,机器人产业正在快速发展并可能固化技术栈 [28][30]
直击CES丨NVIDIA开源Alpamayo系列AI模型及工具,黄仁勋:物理AI的ChatGPT时刻已然到来
新浪财经· 2026-01-06 09:28
公司动态:NVIDIA发布Alpamayo系列AI产品 - 在CES 2026上,NVIDIA发布了名为Alpamayo系列的开源AI模型、仿真工具及数据集,旨在推动安全可靠的推理型辅助驾驶汽车开发 [1][2] - 该系列产品包括基于思维链的VLA推理模型、仿真工具AlpaSim以及物理AI开放数据集,旨在为开发具备感知、推理与类人决策能力的车辆提供支持 [1][2][3] - NVIDIA创始人兼首席执行官黄仁勋表示,“物理AI的ChatGPT时刻已然到来”,并指出无人驾驶出租车将是最早受益的应用之一 [2][4] 技术方案:解决自动驾驶“长尾”挑战 - 智能汽车面临的核心挑战是被称为“长尾”的罕见、复杂驾驶场景,这是辅助驾驶系统需要攻克的最大难题之一 [1][3] - 传统辅助驾驶架构将感知与规划分离,在面临突发或异常状况时会限制系统扩展性 [1][3] - Alpamayo系列引入的VLA推理模型能够逐步推演罕见或全新场景,提升驾驶能力和可解释性,其核心技术由NVIDIA Halos安全系统提供支撑 [1][3] 产品功能与价值 - Alpamayo系列产品使开发者能够进行模型调优、蒸馏和测试,从而提升自动驾驶系统的安全性、鲁棒性与可扩展性 [2][3] - 该技术旨在为智能汽车注入推理能力,使其能够应对罕见场景、在复杂环境中安全行驶,并解释其驾驶决策,为安全、可规模化的自动驾驶奠定基础 [2][4] 行业合作与影响 - 移动出行领域的领先企业捷豹路虎、Lucid和Uber,以及包括伯克利DeepDrive在内的自动驾驶研究社区,将依托Alpamayo加速推进安全的推理型L4级部署进程 [2][4]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]
黄仁勋CES最新演讲:Rubin 今年上市,计算能力是 Blackwell 5 倍、Cursor 彻底改变了英伟达的软件开发方式、开源模型落后先进模型约6个月
AI前线· 2026-01-06 08:48
文章核心观点 - 英伟达在CES 2026上宣告AI发展进入历史性转折点,从理解语言走向改造物理世界,并系统性披露了面向“物理AI”的最新技术路线图 [2] - 公司正试图以一套完整的全栈式计算与软件体系,推动AI从“看懂世界”走向“理解、推理并行动” [2] 双重平台迁移与行业根本性转变 - 计算的核心正从传统CPU转向以GPU为核心的加速计算 [4] - 应用开发的基础正从预定规则代码转向以人工智能为基座,应用程序转变为能理解语境、动态生成内容的全新实体 [4] - 这两种根本性转变同时发生、相互交织,彻底重塑了计算的本质 [4] 2025年AI关键进展与趋势 - 2025年开源模型取得关键突破,虽仍落后尖端模型约六个月,但已触及技术前沿 [3][9] - 具备推理能力的模型出现,创造了“Test Time Scaling”革命性概念,即实时思考的能力 [6] - 能自主思考的Agent系统在2024年诞生,2025年已渗透到各个角落,能推理、检索信息、使用工具、规划未来 [8] - 物理AI是与物理世界交互及理解物理定律的AI,是除大语言模型外最重要的一类AI [8] - 开源模型的突破激活了全球企业、行业,模型下载量呈现爆炸式增长 [9] 英伟达的物理AI战略与三台计算机体系 - 构建物理AI需要三台计算机:用DGX训练AI模型,通过Omniverse和RTX上的Cosmos来仿真、测试与验证模型,最后通过AGX将模型部署到现实世界 [12] - 物理AI浪潮为英伟达物理AI部门带来近万亿美元的机遇 [12] - 公司将物理AI模型分为三大系列:Cosmos World基础模型、通用机器人模型GROOT,以及具备思考能力的自动驾驶模型AlphaMayo [12] Cosmos世界基础模型进展与应用 - Cosmos在对物理世界的理解上已与GPT-40、Gemini等顶级模型并驾齐驱,在物理推理等关键评估中取得更高分数 [14] - 这些模型下载量已突破400万次 [14] - 正驱动制造、物流、医疗健康与出行等各行业的实际应用,例如日立、Lem Surgical、Salesforce、Telet、Uber等公司均已部署 [14] 开源自动驾驶模型AlphaMayo - AlphaMayo是全新的开源AI模型、仿真工具和数据集系列,用于训练物理机器人和车辆,旨在帮助自动驾驶车辆应对复杂情况 [16] - 这是史上首个让自动驾驶车辆具备思考能力的模型,可以让自动驾驶汽车“像人类一样思考”,通过推理解决复杂边缘场景 [16] - 模型拥有100亿参数,既足以处理任务,又轻量化到可在工作站运行 [18] - 公司开源了包含17小时驾驶记录的数据集,成为业内最大最多元的公开自动驾驶数据集 [19] - 同时发布完全开源的AlpaSim仿真框架,用于评估推理模型 [19] 开源机器人模型GROOT 1.6与开发平台 - 发布GROOT 1.6,这是专为人形机器人打造的最新开源推理模型 [24] - 该版本采用Cosmos Reason作为长效思考中枢提升推理能力,并解锁了人形机器人全身协调控制能力 [24] - GROOT 1.6已成为社区热门选择,位列Hugging Face平台下载量最高的机器人基础模型之一 [24] - Isaac机器人平台提供了构建“通专融合型机器人”所需的开放框架、模型与工具库 [24] - 开发了开源控制中心NVIDIA OSMO,整合从数据生成到训练的完整流程 [26] - 发布Isaac Lab Arena,这是全球首个用于在仿真环境中安全测试机器人技能的开源框架 [26][27] 机器人生态合作与硬件支持 - 波士顿动力、Franco Robotics、Lem Surgical、LG电子等先进机器人公司已在Isaac与GROOT基础上构建其新一代物理AI系统 [29] - 英伟达与Hugging Face合作,将200万英伟达机器人专家与1300万Hugging Face AI开发者社区连接起来 [30] - 推出基于Blackwell架构的Jetson T4000,在40-70瓦功耗下提供1,200TOPS的AI算力与64GB内存,其AI性能与能效较AGX Orin提升4倍 [31] AI超算Vera Rubin发布 - 发布面向人工智能数据中心的新计算平台Vera Rubin,该系统目前正在生产中,首批产品将于2026年下半年上市 [32][36] - AI模型规模每年以10倍速度增长,推理变为思考过程导致计算需求爆炸,每年生成的文本量以5倍速度增长 [34] - 每次达到新边界,上一代AI生成文本的成本就会下降约10倍 [34] - Vera Rubin是一个由六种芯片(Vera CPU、Rubin GPU等)通过极致协同设计组成的系统 [38][44] - 系统重近2吨,包含220万亿个晶体管,是100%全液冷设计 [37][41] - 计算板卡可提供100 Petaflops的AI算力,是前代的5倍 [40] - 自设计启动以来累计投入1.5万工程师·年 [41] - 虽然功耗翻倍,但冷却液温度保持45°C,整个系统能效提升约两倍,预计能为全球数据中心节省6%的电力 [47] - 以训练10万亿参数模型为例,Rubin的吞吐量远超Blackwell,仅需1/4数量的系统即可在一个月内完成相同训练 [49]
AI竞赛转向推理,英伟达宣布Rubin芯片平台全面投产
21世纪经济报道· 2026-01-06 08:40
产品发布与战略节奏 - 英伟达在2026年1月5日的CES上意外提前发布下一代AI芯片平台"Rubin",打破了通常在每年3月GTC大会发布新架构的传统 [1] - Rubin平台采用极端协同设计理念,整合了6颗全新芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片 [4] - 公司高管表示,提前披露Rubin是为了尽早向生态伙伴提供工程样品,为后续部署做准备,量产爬坡计划仍按既定节奏在2026年下半年进行 [5] 性能提升与成本优势 - 相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款CPU [4] - 与Blackwell平台相比,Rubin平台可将推理token成本降低最高90%,并将训练混合专家模型所需的GPU数量减少75% [4] - 同步发布了Vera Rubin NVL72机柜级系统,该系统包含72个GPU封装单元,每个封装内部包含2个Rubin Die,因此实际包含144个Rubin Die [5] 生态系统与合作伙伴 - Rubin平台已获得头部云厂商和模型公司的集中响应,首批采用名单包括AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等 [5] - 构成Vera Rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载并取得积极结果 [5] 全栈AI与推理时代布局 - 公司发布了一系列AI体系产品,包括开源模型、AI存储、物理AI等,标志着AI重心从"训练规模"转向"推理系统" [6] - 发布了推理上下文存储平台,这是一个专为推理场景设计的AI原生存储平台,由BlueField-4 DPU与Spectrum-X以太网支撑,用于高效管理和共享KV Cache,减少算力浪费 [6] - 公司强调AI已从聊天机器人演变为能够理解物理世界、进行长期推理、使用工具并保有记忆的智能协作者 [6] 物理AI与机器人领域 - 围绕物理AI推进,发布了一系列开源模型、开发框架和硬件平台,将AI能力延伸至机器人、自动驾驶与工业边缘场景 [6] - 面向机器人领域,发布了Cosmos与GR00T系列开源模型,其中Cosmos Reason2是推理型视觉语言模型,GR00T N1.6是面向类人机器人的推理型视觉-语言-动作模型 [7] - 公司认为机器人领域的"ChatGPT时刻"已经到来,其完整技术栈正在赋能合作伙伴通过AI机器人重塑行业 [7] 自动驾驶领域 - 在自动驾驶领域,发布了Alpamayo开源模型家族,定位为面向"长尾场景"的推理型自动驾驶基础模型 [9] - 配套发布了AlpaSim高保真仿真框架以及覆盖1700多小时驾驶数据的开源数据集 [9] - 公司首款AV车将于2026年第一季度在美国推出,其他地区紧随其后 [9] 行业竞争格局演变 - 随着AI进入推理阶段,英伟达将AI基础设施的竞争推向"系统工程能力" [9] - 真正拉开差距的已不只是芯片算力本身,而是从架构、系统到生态的整体交付能力 [9]
早报|胖东来就“茶叶有苍蝇”致歉;马杜罗在美首次出庭拒认罪;豆包否认AI眼镜将出货传闻;官方通报新生儿被剪断手指
虎嗅APP· 2026-01-06 07:57
字节跳动与AI硬件 - 豆包相关负责人否认“豆包AI眼镜”即将进入出货阶段的传闻,称目前没有明确的销售计划 [1] 腾讯AI业务 - 腾讯元宝AI被用户反馈在代码修改对话中使用攻击性词汇,官方回应称核查后确认属于模型异常输出,并非人工回复,并已启动内部排查优化 [17][18] - 此前,腾讯元宝AI曾因拟人化回复引发关注,公司强调相关回复由AI独立生成 [19] 格力电器经营动态 - 格力电器发布声明,承诺其家用空调产品不涨价,以响应2026年家电国家补贴政策并让利消费者 [21] - 公司表示,为满足其家用空调十年免费包修服务标准,目前暂无“铝代铜”相关计划,未来若应用将明确标注以保障消费者知情权 [21] 罗马仕经营状况 - 罗马仕客服证实,因经营策略调整,公司部分部门延长停工停产状态,但客服及售后团队正常运作 [21] - 公司于2025年12月31日内部通知将继续停工停产一年,期间按当地最低工资标准的80%支付生活费 [21] - 公司于2026年1月4日启动“重生计划”,目标在第一季度完成资金引入与重组,恢复产品销售体系,目前正与红杉资本、金沙江创投等机构洽谈投资,并与供应商协商债转股方案 [21] - 罗马仕成立于2012年,主营业务为移动电源等3C数码产品 [22] 小米汽车 - 小米集团创始人雷军通过社交媒体回应关于车辆碰撞后车轮脱落的讨论,解释这是“丢轮保车”的安全设计策略,该策略在豪华车型中已非常成熟 [23][24] - 雷军指出,该技术最早由奔驰系统性实现并量产,小米在汽车安全性设计上下了巨大功夫,安全是公司造车的基础和前提 [23][25] - 相关技术解释指出,该设计通过结构弱化点让车轮和悬架在剧烈碰撞时优先脱落,以消耗冲击能量,最大程度保护乘员生存空间 [25] 保时捷经销商事件 - 保时捷中国通知消费者,由于授权协议终止,郑州中原保时捷中心于2025年12月31日终止经销业务 [16] - 多名已交付全款提车的车主因未拿到《货物进口证明书》而无法为车辆上牌,部分车主的临时车牌已经过期,面临无法上路的困境 [16] 周生生与黄金市场 - 受地缘政治事件催化,现货黄金价格急速上涨,伦敦金现报每盎司4422美元,单日涨幅达2.08% [27] - 金价上涨迅速传导至消费终端,周生生部分定价类黄金饰品将于1月6日调价,涨幅在200元到1500元不等 [28] 氢能与燃料电池产业 - 2025氢能与燃料电池产业年会于1月6日举办,相关影响板块为燃料电池 [29] 科技行业领袖观点 - 英伟达CEO黄仁勋将在CES开幕式上重点推介“物理AI”,并阐述英伟达的全栈技术如何推动工业革命,加速生成式AI与物理AI共同发展 [30][31][32] - 黄仁勋强调,物理AI的应用范围远超机器人领域,涵盖从无人机到冰箱的所有事物 [33] - 微软CEO萨提亚·纳德拉指出,2026年将是AI从“炫技”走向“落地”的关键一年,标志着行业从技术探索期进入社会应用扩散期的分水岭 [34][35][36] 南京市人才政策 - 南京市发布人才政策2.0版,目标每年吸引超过30万名青年人才 [13] - 新政包含“宁聚项目”,为高校毕业生提供阶梯式一次性生活补贴:学士1万元、硕士3万元、博士10万元 [14] - 首次推出“青年人才房票”,大专至博士学历人才可获得3万至15万元购房补贴,该补贴可与租房补贴叠加使用,并提高公积金贷款额度 [15] - 租房补贴首次覆盖大专生,标准为每月500元 [15]
物理AI的ChatGPT时刻!英伟达“内驱”无人驾驶汽车将至,发布首个链式思维推理VLA模型
美股IPO· 2026-01-06 07:38
英伟达发布开源推理VLA模型Alpamayo - 公司宣布开源其首个用于自动驾驶的推理VLA(视觉-语言-动作)模型Alpamayo 1,旨在打造能在意外情况下“思考”解决方案的车辆 [1] - 该模型采用100亿参数架构,使用视频输入生成轨迹和推理过程,展示每个决策背后的逻辑 [1][4] - 公司CEO黄仁勋表示,物理AI的ChatGPT时刻已到来,机器开始理解、推理并在真实世界中行动,无人出租车是首批受益者 [6] - 首款搭载英伟达技术的汽车将于第一季度在美国上路 [1][3] Alpamayo模型的技术定位与原理 - Alpamayo 1是业界首个为自动驾驶研究社区设计的思维链推理VLA模型,现已在Hugging Face平台发布 [4] - 该模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中 [6] - 推理VLA模型将复杂的任务分解成可管理的子问题,并以可解释的形式阐明其推理过程,这使其能够更准确地解决问题 [8] - 构建推理VLA模型需要三种基本AI功能:视觉感知、语言理解以及动作和决策制定 [8] 完整的开源生态系统 - Alpamayo家族整合了三大基础支柱:开源模型、仿真框架和数据集,构建了一个完整的开放生态系统 [4] - AlpaSim是一个完全开源的端到端仿真框架,用于高保真自动驾驶开发,现已在GitHub平台发布 [9] - 公司提供了面向自动驾驶的大规模开放数据集,包含超过1700小时的驾驶数据,覆盖罕见且复杂的真实世界边缘案例 [9] - 这些工具共同为基于推理的自动驾驶技术栈创建了一个自我强化的开发循环 [10] 行业支持与合作 - 包括捷豹路虎、Lucid、Uber以及加州大学伯克利分校DeepDrive产业联盟在内的多家移动出行领军企业和研究机构表示将利用Alpamayo开发技术 [3] - 行业合作伙伴认为,开放、透明的AI开发对于负责任地推进自动移动出行至关重要,开源模型有助于加速整个生态系统的创新 [11] - 处理长尾和不可预测的驾驶场景是自动驾驶的决定性挑战之一,Alpamayo为行业创造了加速物理AI、提高透明度并增加安全L4级部署的新机遇 [11] 跨行业AI模型全面开放 - 除Alpamayo外,公司还发布了多个推动各行业AI发展的新开源模型、数据和工具 [12] - 这些模型涵盖用于代理AI的Nemotron家族、用于物理AI的Cosmos平台、用于机器人的Isaac GR00T以及用于生物医学的Clara [1][14] - 公司提供了全球最大的开放多模态数据集合之一,包括10万亿语言训练标记、50万个机器人轨迹、45.5万个蛋白质结构和100TB的车辆传感器数据 [14] - 博世、CrowdStrike、Salesforce、ServiceNow、日立和Uber等科技业领头羊正在采用并基于这些开源模型技术进行开发 [15]
“物理AI的ChatGPT时刻”!英伟达最新发布 黄仁勋发声
每日经济新闻· 2026-01-06 07:20
公司战略与产品发布 - 英伟达在CES 2025上宣布开源其首个推理VLA模型Alpamayo 1,旨在加速安全的自动驾驶技术开发[2] - 公司CEO黄仁勋表示,首款搭载英伟达技术的汽车将于2025年第一季度在美国上路[2] - 公司免费开放Alpamayo模型,允许潜在用户自行对模型进行重新训练,并构建了一个整合开源模型、仿真框架和数据集的完整开放生态系统[4] - 公司CEO黄仁勋表示“物理AI的ChatGPT时刻已到来”,并称Alpamayo为自动驾驶汽车带来推理能力,是安全、可扩展自动驾驶的基础[4] - 公司计划在2027年测试一款无人驾驶出租车服务[7] 技术细节与模型特性 - Alpamayo 1是业界首个为自动驾驶研究社区设计的思维链推理VLA模型,采用100亿参数架构,使用视频输入生成轨迹及推理轨迹[4] - 该模型通过类人思维方式处理复杂驾驶场景,为解决自动驾驶长尾问题提供新路径,旨在打造能在意外情况下“思考”解决方案的车辆[2][4] - 推理VLA模型将视觉感知、语言理解和动作生成与逐步推理集成在一起,能够将复杂任务分解成可管理的子问题,并以可解释的形式阐明其推理过程[6] - Alpamayo模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中[5] - 未来该家族的模型将具有更大的参数规模、更详细的推理能力、更多的输入输出灵活性以及商业使用选项[5] 配套生态系统与硬件进展 - 除Alpamayo 1模型外,公司还发布了配套的仿真工具和数据集,构建完整的开发生态系统[7] - 公司宣布新款Vera Rubin设计已经全面量产,并发布了面向Vera Rubin电脑的六款新芯片,其新款Vera CPU拥有88个Arm定制核心[7] - 公司备受期待的新款Rubin数据中心产品将于2025年发布,相比前代Blackwell架构,其AI训练性能提升3.5倍,运行(推理)性能提升5倍[8] - 基于Rubin的系统运行成本将低于Blackwell版本,微软和其他大型云服务商将成为首批部署新硬件的客户[8] - 公司宣布NVIDIA BlueField-4数据处理器将为推理上下文记忆存储平台提供动力,这是一种专为千亿级参数规模推理设计的新型AI原生存储基础设施[8]