Workflow
端到端
icon
搜索文档
AI 如何成为理想一号工程
晚点LatePost· 2025-05-23 15:41
公司战略调整 - 2023年10月秋季战略会将智能辅助驾驶业务优先级提升至第一战略,车机端理想同学从最高优先级(IP0)降至最低(IP2)[4] - 2023年初确立"2030年成为全球领先人工智能企业"愿景[5] - 2024年1月设立AI技术委员会整合各部门AI资源,成员包括产品部和各研发部门负责人[15][16] AI产品发展 - 车机端理想同学基于T5架构打造10亿参数模型,2023年12月推出多模态认知大模型Mind GPT 1.0[6][7] - 2024年3-4月开发理想同学App,12月底上线手机端应用,2024年3月推出网页版[7] - 基座模型部门升级为二级部门,目标进入行业前三[17] 智能辅助驾驶进展 - 2020年9月组建自研团队,2022年L9上市搭载AD Max系统[9] - 2023年10月扩招50余个岗位,团队规模突破千人[10] - 2024年7月启动"端到端+VLM"千人内测,10月实现量产上车[10][11] - 技术路线从"端到端+VLM"转向VLA架构,VLA模型具备3D视觉和物理世界理解能力[12] 组织架构调整 - 2024年初总裁马东辉接替李想负责智能汽车战略,李想专注AI方向[13] - 2023年设立AI周会制度,2024年升级为AI技术委员会[14][15] - 基座模型负责人陈伟汇报对象调整为CTO谢炎,部门级别提升[16][17] 技术路线演进 - 初期采用供应商方案,2021年启动理想同学自研[6] - 2022年探索大规模语言模型应用,2023年实现算法全自研[6][7] - 智能辅助驾驶从依赖高精地图转向"无图"方案,最终采用VLA架构[11][12]
AI 如何成为理想一号工程
晚点Auto· 2025-05-22 15:16
公司战略调整 - 2022年10月秋季战略会将AI定位为未来竞争关键方向 车机端理想同学优先级从IP0降至IP2 智能辅助驾驶业务战略地位提升 [3] - 2023年初确立"2030年成为全球领先人工智能企业"愿景 智能辅助驾驶被列为第一战略 智能空间和智能电动分列二三位 [5][9] - 2024年1月成立AI技术委员会 整合产品部和各研发部门负责人 覆盖智能辅助驾驶/理想同学/智能商业/智能工业四大方向 [14][15][16] AI技术布局 - 2022年上半年基于T5架构研发10亿参数模型 支持多模态信息处理 2023年3月L7首发时实现语音视觉功能全自研 [6] - 2023年12月推出车端大模型Mind GPT 1.0 2024年7月启动"端到端+VLM"千人内测 10月实现量产上车 [5][10][11] - 技术路线从"端到端+VLM"转向VLA架构 VLA能结合3D/2D视觉构建物理世界理解 具备语言思维链和推理能力 [12] 产品发展路径 - 理想同学从车机语音助手发展为跨平台应用 2024年3-4月开发手机App 12月上线网页版 实现车机/手机/网页多端覆盖 [7][8] - 智能辅助驾驶系统AD Max 2022年随L9上市 2023年12月推送城市NoA功能 2024年通过端到端方案进入行业第一梯队 [9][10][11] 资源投入 - 2023年10月智能辅助驾驶团队扩招 开放50余岗位 11-12月每周新增数十人 团队规模突破千人 [10] - 基座模型部门升级为二级部门 负责人陈伟直接向CTO汇报 目标进入行业前三 为各业务线提供AI技术支持 [16][17]
从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?
机器之心· 2025-05-18 10:38
机器之心PRO · 会员通讯 Week 20 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远? 各大厂商智驾宣传坚持「卡」在 L2.999...有何玄机?端到端为何会成为主流叙事?车企在谈论端到端的时候,到底在谈论的是 什么?端到端智驾「说得比做得好」,存在哪些瓶颈?特斯拉为何被普遍认为领先市场?从 VLM 到 VLA,再到世界模型,自 动驾驶技术正在如何演进?... 2. 争夺 Agent 市场,微软的押宝点竟是「情商」? 是 情商将微软 AI 的核心竞争力?微软的办公 Agent 和 AI 伴侣如何区分?语音交互能否让 Copilot 脱颖而出,成功超越工具 属性?Suleyman 提出的「AI 个性工程」如何带来差异化优势?AI 算力的哪两个趋势正在发生?... 本期完整版通讯含 2 项专题解读 + 29 项 AI & Robotics 赛道要事速递,其中技术方面 12 项,国内方面 7 项,国外方面 10 项。 本期通讯总计 23569 字,可免费试读至 9% 消耗 99 微信豆即可兑换完整本期 ...
对话未来出行 | 商汤绝影CEO王晓刚:汽车是人工智能最好的载体,以世界模型和仿真学习突破特斯拉式数据壁垒
每日经济新闻· 2025-05-16 12:00
智能汽车行业趋势 - 智能汽车竞争焦点从硬件参数转向认知能力,行业处于"软件定义汽车"向"认知重塑出行"跃迁的临界点 [1] - 2025年第一季度中国L2级辅助驾驶新车渗透率达65% [1] - 智能座舱进化分为三个阶段:问答工具、大模型赋能的"全能助手"、具备记忆与共情能力的"家庭成员" [1][8] 商汤绝影技术路径 - 采用"世界模型+强化学习"技术组合突破现实数据不足瓶颈,降低对激光雷达的依赖 [1][10] - 世界模型可模拟未来场景变化,例如施工路段避让及碰撞情形 [12] - 通过仿真环境生成海量驾驶场景,使自动驾驶系统自我进化,类似AlphaZero的自我博弈逻辑 [10][16] 激光雷达技术观点 - 激光雷达属于阶段性技术选择,未来可被模型算法和数据迭代替代 [1][12] - 激光雷达在城区复杂场景中作用有限,且受天气干扰、老化等问题影响 [12] - 当前部分车企采用"激光雷达+端到端系统"双配置作为过渡方案 [16] 车企合作模式 - 与主机厂形成"太极式共生"关系,既保留车企自研能力又发挥科技公司技术优势 [3][18] - 产品已上车7款车型,2024年将推出地平线J6E方案并在奇瑞量产,基于英伟达Thor的系统将应用于东风车型 [17] - 合作核心是研发体系对齐而非股权绑定,涉及工具链、数据格式等基础设施协同 [19] 数据与商业化 - 车企保留数据所有权,商汤绝影提供脱敏技术支持 [21] - 自动驾驶盈利需3年,依赖量产规模扩大及摄像头配置标准化 [22] - 未来研发重心转向云端,提供云服务和大模型基础设施,车端研发将轻量化 [22] 行业应用场景 - 汽车是当前人工智能最佳载体,因多模态传感器丰富且数据回流规模大 [4][5] - 智能座舱通过全时感知(表情/动作/生理信号)实现情感化交互,远超手机等被动设备 [9] - 技术可延伸至智能机器人领域,与汽车AI存在高度重合性 [5]
特斯拉来的有点晚
远川研究所· 2025-03-17 20:51
文章核心观点 今年一月特斯拉财报显示汽车销量十年来首跌,核心财务指标低于预期,但马斯克在电话会汇报FSD进展并给出落地进度,释放FSD上半年入华信号,提振投资者信心;FSD落地后评价两极分化,存在水土不服问题;特斯拉面临汽车业务与人工智能业务青黄不接、资本市场预期未兑现等困境;FSD入华面临定价不合时宜等问题 [2][3][6]。 分组1:特斯拉业绩与FSD进展 - 今年一月特斯拉财报发布,汽车销量十年来首跌,核心财务指标全体低于预期,马斯克重申FSD战略核心地位,称明年特斯拉会“好得离谱” [2] - 马斯克汇报FSD发育情况并给出落地进度条,释放FSD上半年入华强烈确定性,电话会后特斯拉股价无视糟糕业绩不跌反涨 [3][4] 分组2:FSD评价与问题 - FSD落地后评论两极分化,槽点是算法不适应中国交通规则和复杂路况,优点是“稳”,感知和博弈能力强,驾驶流程流畅 [6] - FSD采用“端到端”技术,依托大模型学习能力,但在中国落地面临数据训练问题,解决需要时间 [7][8] 分组3:特斯拉业务转型困境 - 去年特斯拉汽车销量下滑1%,中国市场营收占比下滑,增长依赖降价 [12] - 特斯拉发展路径分汽车制造和人工智能两大板块,目前面临两大板块青黄不接、资本市场预期未兑现问题 [14][15] - 特斯拉FSD订阅率低,Robotaxi落地遥远,资本市场对其信仰欠费,FSD入华或因缓解此问题 [16][17][18] 分组4:FSD定价问题 - 机构对FSD落地比马斯克着急,曾预估其在中国的利润和收益,但如今智能驾驶普及,FSD 6.4万元定价不合时宜 [20][21] - 大部分车企将辅助驾驶定价整合进车型定价,且不超2万元,FSD兑现价格匹配体验周期长 [21][22] 分组5:尾声 - 马斯克经营思路与芯片行业不同,是迈出一大步充分利用,这或解释其不合常理的经营做法 [26]
晚点独家丨地平线组织再调整,苏箐将主导高阶智驾方案落地
晚点LatePost· 2025-01-18 23:28
组织架构调整 - 地平线近期发生多项组织调整,智能汽车事业部和高阶智驾研发团队的管理权限进一步向副总裁兼首席架构师苏箐集中 [4] - 智能汽车事业部总裁张玉峰将离职创业,他于2017年4月加入地平线,未来将从事与地平线生态相关的汽车和机器人业务 [4] - 智能汽车事业部下属AE应用工程部大部分人员将并入"土星五号"项目,负责智驾方案测试、交付和功能维护的人员继续留在智能汽车事业部 [6] - 地平线于2023年7月重组智能驾驶算法团队,100多人的低阶方案团队与数百人的高阶方案团队合并,由苏箐统筹负责 [9] 高阶智驾研发 - "土星五号"是地平线基于征程6P研发高阶智驾方案Horizon SuperDrive的项目代号,团队负责人苏箐此前是华为车BU智能驾驶产品部部长 [6] - 地平线此次调整意在集中资源,加快推进基于征程6P的高阶智驾方案研发,赋予苏箐更多主导权 [6] - 征程6P是征程6系列的最高阶版本,算力可达560TOPS,适用于全场景智能驾驶方案研发 [9] - 地平线SuperDrive高阶智驾方案已摆脱高精地图束缚,实现"全国都能开",预计在2024年三季度实现首款量产合作车型交付 [10] 市场与竞争 - 智能驾驶解决方案是地平线的主要收入来源,2021年至2024年上半年汽车解决方案收入占比从87.9%提升至97.7% [6] - 国内智能驾驶市场竞争激烈,技术焦点正向无图城市NOA、"端到端"、世界模型等方向迁移 [10] - 地平线征程6系列已获20余家车企及品牌的平台化定点,预计自2025年起有超过100款搭载征程6系列中高阶智驾方案的车型陆续上市 [10] - 截至2024年11月底,地平线征程系列车载计算方案累计出货量超700万套,合作车型超300款 [10] 技术发展 - 特斯拉FSD V12版本率先用"端到端"重塑量产智能驾驶算法架构,国内厂商如理想、小鹏、华为等也陆续上线"端到端"方案 [10] - 地平线需要补强工程化落地和量产交付能力,并借助标杆客户影响力证明自身能力 [10] - 地平线创始人余凯认为智能驾驶行业将在2025年迎来拐点,高阶智驾SuperDrive方案也将在2025年量产落地 [10] - 征程6P已顺利投片,计划在2024年一季度内回片点亮 [10]
对话小马智行楼天城:只靠端到端无法通向 L4,模仿优秀司机令人绝望
晚点LatePost· 2025-01-09 18:41
技术路线演进 - 小马智行经历从Learning by Watching(模仿学习)到Learning by Practicing(实践学习)的技术路线切换,核心突破在于构建"世界模型"作为车端模型的训练工厂[7][17][18] - 模仿学习存在三大局限:无法学习驾驶意图、人类与AI安全标准双标、优秀司机数据导致反向优化[19][22][23] - 世界模型由数据生成器、评估体系、高真仿真和数据挖掘工具组成,其精度决定车端模型上限[26][27][35] 行业现状与竞争格局 - 2023年Robotaxi行业回暖标志:Waymo旧金山日均单量超出租车、百度武汉运营400+辆、小马智行达百辆级规模[14][15] - L4与L2技术路线分叉:L2依赖数据量(MPCI约300公里),L4追求安全性(MPCI需达10万公里级)[45][47] - 商业化临界点为1000台运营车辆可实现毛利,小马智行采取差异化策略追求更优成本结构[52][53] 核心技术创新 - 世界模型使事故率降至人类司机1/10,车端模型实现感知-预测-规控三模块端到端打通[36][37] - 数据生成技术突破:生成数据覆盖率与一致性超越真实路采数据,解决长尾场景覆盖难题[28][29] - 评价体系与自我演进引擎构成技术护城河,需2/3研发资源投入且经历两年无显性进展的攻坚期[31][39] 商业化进展 - 运营效率提升:接入高德后单车日均订单达15单,远程监控人车比突破1:3向1:30迈进[54][53] - 前装量产合作推进:与丰田、广汽合作降低车辆成本,通过出租车公司合作解决充电等运维问题[53] - 行业竞争态势:滴滴等新玩家入局但市场渗透率不足1%,现阶段以共同培育市场为主[54][66] 认知方法论 - 技术突破关键在坚持"黎明前的黑暗",疫情延缓行业节奏反而为转型创造窗口期[10][40][41] - 商业化需平衡节奏与价值,避免过早变现或过度追求理想化目标两个极端[65][66] - 结果导向思维:技术方法的优劣由最终成果验证,非理论先进性决定[67][68]
晚点独家丨蔚来智驾再调整:任少卿直管大模型部门,推进 “端到端” 量产交付
晚点LatePost· 2024-12-24 20:53
蔚来智驾团队人事调整 - 蔚来智能驾驶研发团队近期完成多个重要岗位人事变动,涉及大模型部、部署架构与方案部、时空信息部负责人调整[5] - 智能驾驶研发副总裁任少卿将直管大模型部,陈昆盛接任部署架构与方案部负责人,时空信息部由张红霞接管[5] - 被替换的彭超、秦海龙将改任方案负责人,组成虚拟战队负责交付[5] - 人工智能平台负责人白宇利职位不变[6] 组织架构调整目的 - 调整目的是确保先进功能更好交付用户,满足多平台、多功能业务需求,应对技术和产品快速变化[6] - 智驾部门将分为技术委员会、资源、方案三部分,方案负责人不直接带团队但可参与成员绩效评定[6] - 技术委员会将作为中台加强平台易用性和稳定性[6] - 调整后架构为"战备架构",旨在提高智驾方案量产交付速度[6] 端到端智驾研发进展 - 蔚来尚未向用户全量推送"端到端"智驾方案,7月实现基于该算法的主动安全功能上车[6] - 公司计划在Banyan 3.1.0版本中新增基于大模型架构的自动紧急避让AES功能[6] - 白宇利表示"端到端"不是一夜之间能完成的任务,需足够大数据量和算力支持[7] - 任少卿透露蔚来世界模型NIO WorldModel已开发一年,能推演216种交通场景[7] 技术优势与人才储备 - 蔚来第二代车型NT2.0平台总算力达1016 TOPS,是理想和小鹏高阶智驾版本两倍[8] - 截至去年9月云端算力集群规模为1.4 EFlops,并行训练加速比达91%以上[8] - 智驾部门人才密度高于多数国产车企,多位技术主管来自Momenta[7] - ET9被定义为"十年技术结晶",具备七重冗余,李斌称其智驾水准全球领先[7] 行业竞争态势 - 特斯拉FSD V12率先采用"端到端"架构,国内理想、小鹏及华为等已完成全量推送[6] - 蔚来将成为国内第三家推出AES功能的公司,前两家为理想和华为[6] - 公司2016年启动智能驾驶自研,2020年首家量产高速NOA功能的国产车企[6]