Workflow
英伟达 Thor 芯片
icon
搜索文档
英伟达开源智驾模型,想定义 “物理 AI 的 ChatGPT 时刻”
晚点Auto· 2026-01-06 10:59
英伟达在自动驾驶领域的战略与进展 - 公司创始人黄仁勋在2026年CES主旨演讲中宣称“物理AI领域的ChatGPT时刻已经到来”,并预测未来世界上将有**10亿辆汽车**实现高度或完全自动驾驶 [3] - 公司将包括自动驾驶汽车在内的机器人业务,定位为仅次于人工智能的第二大重要增长领域 [3] 英伟达发布的核心技术:Alpamayo模型 - 公司发布了自动驾驶开源VLA模型Alpamayo,宣称其是世界上第一个能思考、推理、自动驾驶车辆的开源AI系统,是其智驾技术全面转向“端到端”后推出的开源云端基座模型 [4] - Alpamayo第一代模型采用**100亿参数**架构,并配套提供仿真工具AlpaSim及包含**1700多小时**驾驶数据的开放数据集 [4] - 公司是第一家将此类云端模型开源的厂商,为不具备全栈自研能力或对开发速度要求不迫切的厂商提供了务实选择 [4] - 有资深从业者认为,**100亿参数**量级对于车端或云端部署而言,短期看都不大好用,云端作为世界模型参数规模偏小 [5] 英伟达在L2级辅助驾驶市场的商业化 - 公司在L2级辅助驾驶领域取得商业化进展,2025款梅赛德斯-奔驰CLA将搭载其L2级全栈辅助驾驶方案,硬件基础是**2颗**英伟达Thor芯片 [5] - 该方案计划于2026年一季度在美国上路,二季度在欧洲上路 [5] - 该方案采用双系统运行策略:具备推理能力的端到端AI系统处理复杂场景;基于规则的传统系统负责兜底,由策略与安全评估器实时监控并决定是否切换 [7] 英伟达自动驾驶业务的组织与挑战 - 公司招揽小鹏汽车前智驾负责人吴新宙加入,任全球副总裁兼汽车业务负责人,黄仁勋给予其三年时间带领团队拿下全球市场份额第一的目标 [7] - 吴新宙搭建了公司自动驾驶全栈自研部门,推进无图城市NOA方案研发并结合“端到端”技术迭代 [8] - 公司面临挑战,包括中国与北美团队的沟通协作问题,以及相比中国智驾供应商工作节奏更慢 [8] - 2024年4月,公司推出的无图城市NOA Demo版本体验不佳,导致其丢失了奔驰在中国市场的部分智驾方案订单 [8] - 截至2024年7月,新版无图城市NOA Demo表现已较4月份提升很多,公司计划每个季度迭代一个软件版本以提升体验 [8] 市场竞争格局与公司机遇 - 在智驾技术研发与部署上,理想、小鹏、蔚来、华为、地平线、Momenta等中国厂商已走在前面,完成了类似模型的研发甚至部署 [4] - 特斯拉已在北美落地“端到端”方案,多家中国厂商也已在中国上百座城市完成无图NOA方案的全量推送 [8] - 在竞争激烈的中国智驾市场,公司暂时落后于本土厂商 [9] - 海外市场(如欧美)的辅助驾驶渗透率仍处于较低水平,且对公司在地缘和商业关系上更具优势,是其重要机会 [9] - 随着Alpamayo发布及与奔驰合作落地,公司正试图重新夺回在自动驾驶领域的话语权 [9]
晚点独家丨元戎启行与高通合作开发智驾方案;月之暗面招募微软亚研院谭旭,研发类 GPT- 4o 的端到端语音模型
晚点LatePost· 2024-10-22 23:16
元戎启行与高通合作 - 智能驾驶研发商元戎启行已与芯片巨头高通达成合作,或基于高通骁龙8650芯片开发智能驾驶方案,该芯片算力可达100TOPS,适用于中高阶方案开发 [5] - 此前元戎启行主要使用英伟达芯片,其已量产的端到端方案使用英伟达Orin-X芯片,单颗算力达254TOPS,并计划于2025年采用英伟达Thor芯片 [5] - 与高通合作有助于降低智能驾驶解决方案成本,从而拓展更多客户 [6] 智能驾驶行业竞争格局 - 元戎启行官宣的量产车型数量低于行业头部厂商,2024年预计有20多款搭载大疆车载(卓驭)智驾系统的车型上市 [6] - Momenta的智驾软件已搭载于上汽、比亚迪、广汽等车企车型,后续还有包括通用、丰田、奔驰在内的十多个品牌的数十款车型将搭载 [6] - Momenta与大疆车载均已与高通达成合作,其方案可兼容或适配高通芯片,选择理由包括价格更低可搭载于更便宜车型,以及功耗更低更适合油车和混动车型 [6] 元戎启行发展历程与商业模式 - 公司成立于2019年2月,初期专注于L4级自动驾驶,2020年决定不再研发L4方案,2023年初将主要资源转向量产智能辅助驾驶“端到端”模型研发,并于当年8月完成道路测试 [7] - 2024年一季度,元戎启行成为继毫末智行之后,长城的第二家外部智驾供应商 [7] - 智驾方案商目前尚未形成商业闭环,车企在谈判中处于强势地位,即便是技术实力排名中国市场前三的智驾方案商,其承接的几乎所有量产项目现阶段也都不赚钱 [8] - 一家智驾供应商为国内一家头部车企提供的城市高阶智驾方案,单车License收费仅为500元 [8] 智驾芯片市场竞争 - 英伟达在高阶智驾市场几乎形成垄断,其Orin-X芯片价格约为300美元/颗,远高于地平线、高通等厂商的产品价格 [8] - 高通作为后发厂商,在智驾领域的市场拓展策略是重点进攻日系和韩系车企,并在商务政策方面给出倾斜,此举已取得明显效果,日韩车企目前均倾向于采用高通智驾芯片 [8] - 在元戎启行之前,Momenta、毫末智行、大疆车载三家厂商都已基于高通骁龙Ride系列芯片开发智驾方案,其中Momenta与丰田合作,毫末智行与现代合作 [8] - 智驾方案商希望其方案可以在不同主流芯片厂商的芯片上运行 [8] - 英伟达当前享受的超额利润,给高通等其他智驾芯片商留出了机会 [9] 月之暗面人才与研发动态 - 微软亚研院前首席研究经理谭旭于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型,其个人论文引用量达上万次,多项生成式AI成果曾应用于微软产品 [9] - 谭旭加入后的主要目标之一可能是帮助月之暗面打造类似GPT-4o的语音体验 [9] - 月之暗面的整个多模态研究在2023年10月就已开始,在视频生成大模型方面,目前有十人左右的团队在研发,为确保产品更具差异性,对外发布计划仍在推迟 [9] - 公司创始人杨植麟曾表示,基础大语言模型和多模态是两个东西,目前阶段提升智能能力更重要,但有可能两个同时做 [9] 端到端语音技术 - 传统主流语音对话方案是“ASR+LLM+TTS”,机器响应时间较长,且人无法随时打断机器讲话 [10] - 端到端语音技术能直接输入语音,经过一个模型处理后输出语音,省去中间转换过程,可压缩机器响应时间,实现更自然的交互,并能帮助改善大模型的幻觉问题 [10] - OpenAI发布的GPT-4o其语音交互效果大幅提升(延时更低、可随时打断)就来自端到端语音技术,但其高级语音功能直到2024年9月25日才向所有ChatGPT Plus用户推送,侧面说明该技术尚在实际应用的早期阶段 [10]