理想TOP2
搜索文档
理想詹锟ICCV'25讲世界模型从数据闭环到训练闭环PPT
理想TOP2· 2025-10-28 23:18
目前没有视频,有视频后会放视频与对应文字版。 理想詹锟的title为Senior Director of VLA Model。 LiAD Tech RoadMap AI-based System Rule-based System E2E+VLM Map-Lite VLA Mapless MindVLA VLA Model vlm Imitation Learning Reinforcement Learning Rule-Based Algorithms Models trained in simulation with Performance depends on simulation efficiency efficiency Models are trained on human driving data Algorithms are manually designed and coded by engineers Performance depends on data quantity and Performance depends on human experience Value of Data ...
地平线HSD的确值得理想留意
理想TOP2· 2025-10-27 21:50
地平线HSD技术体验评估 - 2025年10月在杭州西湖对A车型的地平线HSD工程车进行了1.5小时试驾,辅助驾驶能力相当不错,明显优于理想L7 VLA在2025年10月的量产版本 [1][2] - 试驾路线为自选,除1次三点掉头外实现0次接管,在安心感、舒适感、丝滑度、时延及堵车连续启停舒适度方面表现均很出色 [2] - 地平线HSD技术架构为以车端视角信息输入、输出轨迹的VA式端到端,云端有语言介入,认为串联式VLA对算力带宽要求过高,VA式端到端尚有潜力可挖 [1] 与理想汽车VLA技术对比 - 2025年8月在北京顺义体验的理想i8 VLA工程车能力明显强于当时理想L7和i6的量产版本 [1] - 试驾地平线HSD过程中几乎没有通过调整滚轮调整速度的欲望,而使用理想VLA时则经常有此欲望 [2] - 难以直接判断2025年10月体验的HSD工程车与2025年8月体验的理想i8 VLA工程车孰优孰劣 [1] 地平线方案表现差异与团队沟通 - 不同车型搭载地平线HSD的表现差异显著,A车型工程车辅助驾驶能力很不错,而B车型工程车表现很一般,差异原因包括芯片算力不同以及主机厂配合度 [2] - 地平线智驾团队沟通诚实度高,主动详细说明方案在极端天气、非标场景、复杂博弈、必须加塞导航等场景下体验一般的局限性 [3] - 地平线相关人员非严谨评估其HSD方案可能达到特斯拉FSD V13约60%的水平 [3] 人机交互与主机厂合作 - HUD和车机构成智驾体验重要部分,但地平线与主机厂合作中,车机与智驾适配高度尊重主机厂意见,导致部分设计如SR界面位置、导航目的地更改按钮不符合直觉 [3]
理想对打破部门墙是如何思考的?
理想TOP2· 2025-10-26 18:06
核心观点 - 理想连山数据科学协作平台旨在通过建立统一的数据语言和协作模式,解决企业内部因部门分工导致的“部门墙”问题,将跨部门协作从临时性、重复性的“提数-给结果”模式,转变为围绕共同目标、基于数据事实的持续共创模式,并最终实现产品化和规模化推广 [4][5][9][10][11] 部门协作挑战 - 企业内部分工导致专业视角割裂,研发、质量、试验等部门目标存在天然冲突,缺乏跨部门常态化共同解决问题的机制 [3] - 数据口径不一、项目进度跨部门推进困难等问题直接影响产品质量和客户体验 [2] 协作模式演进 - 协作起点是从“提数-给结果”的临时支持模式转变为共享数据语言,通过将常用信号、工况逻辑、可视化方法沉淀为可复用分析框架(如通用工况分析仪),使业务团队能自行查询分析,实现用相同数据和口径对话 [4] - 协作方式发展为共创,基于高透明度的共同指标曲线进行问题根源探讨,协作从数据世界延伸至物理世界,例如与工程师共同开发连山自动化试验以减轻高温标定工作负担 [5][6] - 理想连山从外部支持者转变为与业务团队在一致目标下的共创伙伴 [6] 产品化能力建设 - 将协作模式抽象为可落地、可复制、可扩展的数据科学项目方法,在独立Site环境中配置开发工具和LADS框架,统一数据感知与计算标准 [9] - 项目流程包括立项共识、场景拆解、特征沉淀、模型共建、小步验证、能力下沉至一线团队(如质量工程师)、工单接入闭环,最终实践经验回灌平台形成标准化能力 [9] - 三年积累83个数据科学项目、3545个预警模型、1060个产线关键特性监控等成果,浏览量达1,103,602次,形成平台化、产品化的七步能力 [10][11] - 数据科学项目本质是跨部门、围绕数据的持续协作模式,而非一次性IT系统或部门内部分析 [10]
VLA/世界模型/WA/端到端是宣传分歧, 不是技术路线分歧
理想TOP2· 2025-10-25 13:21
本文参考了微博用户本诺、大雁jassy,知乎用户刘斯坦的观点。 本文核心4个观点: 1. 很多人不知道实际上VLA/世界模型/端到端其实压根就没有一个公认的怕他性定义。 2.头部智驾车企在自动驾驶探索上共同性的部分大于互联网上营造出来的差异性。内核 是宣传分歧, 不是技术路线分歧。 3.语言在自动驾驶上的作用是长推理/用户交互价值观对齐/理解世界。 4. 越认为predict the next token不只是概率分布的人,越容易认可语言可以理解世界。 以下为更细化论述: VLA/世界模型/WA/端到端的共同点是都指向需要具备生成看起来和真实世界的一样的道路视频数据 的能力,都指向是视觉信息进入(不区分是否是纯视觉),最终要能控制车辆行动。 区别点在于语言在其中是否参与,参与深度,以什么架构形式参与,将来语言相关的token是目前 LLM的text token,还是潜在的photon token。 目前互联网上充满着好像VLA/世界模型/端到端是不同技术路线,选了A就不能选B的氛围。特斯拉公 布一个自己关于自动驾驶的思考,大量人就急于去判定这个是不是VLA,如果是,就说明理想路线 是对的,如果不是,就不对。 ...
理想智驾是参考特斯拉, 不是跟随特斯拉已经有了很强的证据
理想TOP2· 2025-10-24 12:48
2025年10月20日左右, 在 特斯拉前自动驾驶软件总监现AI软件副总裁Ashok Elluswamy ICCV 2025 Workshop演讲后,还不承认 理想智驾是 参考特斯拉, 不是跟随特斯拉的人,只能归因为没有深入研究。 本文分为三部分: 1.理想智驾从跟随特斯拉到参考特斯拉的发展线。 理想智驾从跟随特斯拉到参考特斯拉的发展线: 2025年3月1日/6月8日/6月29日,TOP2三次指出VLM前可以说理想智驾是跟随特斯拉,VLM后就不能了,只能说参考,核心锚点是后面理想做 了特斯拉完全没在公开场合提过的大量原始创新,以及理想VLA创新度是DeepSeek MoE水平的,低于DeepSeek MLA创新水平。详见《 虽然理 想成绩很不错, 但不宜仅以接管次数来论智驾水平高低 》《 理想的VLA可以类比DeepSeek的MoE 》《 不用给理想入选ICCV高评价, 牛的是理想 的工作, 不是ICCV 》 在V10-11时期,说理想是在跟随特斯拉没有任何问题,从V12开始,理想跟随特斯拉的尺度越来越低。 确实是因为特斯拉说端到端是work的,让理想敢于去尝试端到端,这没有任何问题。没有特斯拉率先端到端,理 ...
特斯拉Ashok ICCV'25讲FSD与QA|952字压缩版/完整图文/完整视频
理想TOP2· 2025-10-23 23:33
952字压缩版: 特斯拉转向单一、大型的端到端神经网络,输入像素和其他传感器数据,直接产生下一个动作控制作为输出 。 不再有显式的感知模块;感知可以是隐式的或作为辅助任务训练 。 转向端到端的原因 : 1.将人类价值观(如驾驶平顺性、风险权衡)编入代码极其困难 。 2.传统感知、预测和规划之间的接口定义糟糕,可能丢失信息 。 3.易于扩展以处理现实世界的长尾问题 。 4.实现同构计算,具有确定性的延迟,这对于实时系统至关重要 。 学习"像素->控制"的主要挑战 : 1.维度灾难 (Curse of dimensionality) 。 2.可解释性和安全保证 (Interpretability and safety guarantees) 。 3.评估 (Evaluation) 。 挑战1 维度灾难的解决: 输入的上下文极长(例如30秒窗口可达20亿token)。 利用庞大的特斯拉车队数据 。 通过复杂的、基于触发器的数据收集(例如用户干预、状态空间大变化、小型NN捕捉特定场景)来挖掘有价值的 corner case 数据,而不是海量的"无 聊"数据 。 车中唯一重要的是控制动作;其他都是辅助性的 。 示例1: ...
理想i8提车40天的深度测评
理想TOP2· 2025-10-23 09:33
文章核心观点 - 文章是对理想i8车型为期40天、行驶1470公里的深度用户体验总结,核心观点为该车型在超充效率、辅助驾驶、乘坐舒适度及车机智能化方面表现优异,整体符合或超出用户预期 [2][23] 换车背景与驱动因素 - 换车周期符合行业普遍的6-8年规律,叠加购置税及置换补贴政策退坡预期,加速了换车决策 [3] - 家庭结构变化导致5人出行成为常态,是换购空间更大的6座车的主要驱动因素 [3] - 5C超充技术10分钟补充500公里续航的普及以及充电站网络完善,彻底打消了用户的续航焦虑,促使选择纯电车型 [3] 电耗与充电效率 - 累计行驶1470.3公里,驱动耗电量234.4kwh,驱动电耗为15.9kwh/100km [7] - 城区电耗约为14.9kwh/100km,与官方宣传的14.8kwh/100km接近,川西高海拔地区满载6人电耗为17.6kwh/100km [7] - 计入哨兵模式等电器耗电后,综合电耗约18kwh/100km,实际可用续航(95%-10%电量)约为460公里 [8] - 5C超充站充电效率极高,两次充电分别用时13分35秒充电68.685度(24.77%-95%)、14分34秒充电75.592度(17.7%-95%) [10][12] - 4C超充站充电70.943度至95%用时17分44秒,5C桩比4C桩在充相同电量下快约6分钟 [11][12] 乘坐与储物空间 - 6座布局在6人满载情况下,第三排仍能提供较为舒适的乘坐体验 [13] - 主驾座椅舒适度显著提升,支持连续驾驶11小时而无明显腰酸背痛 [13] - 对于常见5人出行场景,6座车的第二排乘坐舒适性完爆5座车 [15] - 储物空间经对比体验,i8显著大于理想L8,能满足两家6口人长途出行的行李装载需求 [15] 辅助驾驶系统 - 辅助驾驶总里程为565公里,软件版本为8.0.1 [16] - 系统优点包括对前方交通环境判断准确、操作丝滑,特别是在小路绕行和高速超车场景 [19] - 系统缺点包括对侧后方车辆预判不足、偶发急刹、城区变道突兀以及面对障碍物时决策迟疑 [19] - VLA召唤与小理师傅帮停功能在非复杂场景下成功率超过90%,提供了极高的情绪价值 [19] - VLA召唤功能目前仅限车主账号使用,且App启动时信号连接耗时较长是主要使用痛点 [20] 车机及智能座舱 - 桌面大师功能解决了功能入口层级过深的问题,支持生成个性化桌面卡片,获得高度评价 [22] - 语音识别能力强,能准确识别口语化表达及带有口音的普通话 [22] - 无麦K歌和调音大师(支持分享码导入模板)等娱乐功能提升了旅途乐趣和音响体验 [22] 驾驶感受 - 车辆过弯稳定性与燃油轿车相比无显著差异,滤震效果更优,得益于CDC和空悬 [23] - 高速行驶时风噪控制出色,仅有轻微风躁,优于以往燃油车的风躁加发动机噪音 [23]
理想操作系统架构负责人分享星环OS技术优势
理想TOP2· 2025-10-22 15:23
1.自研通信中间件:将全车几十个芯片的分布式系统(如车控、智驾、座舱)视为一个整体,通过自 研的(优于开源的)中间件像神经系统一样将其串联,实现了高效的通信和资源协调。(没在开源上 找到更好的) 2.打破"黑盒"实现跨域整合:传统车的各域控是来自不同供应商的"黑盒",难以协调。星环OS打破了 这些壁垒,实现了端到端的整合,这使其在实时性、抖动控制和车身姿态控制上具有技术优势。 3.极致的软硬结合:类似于iPhone的A系列芯片和iOS的结合,通过软硬件的深度集成来放大系统性 能。 压缩版: 理想操作系统架构负责人黄震认为 4.高迭代效率:通过应用层解耦和各种工具,实现了更快的开发速度、更准的问题定位和更快的问题 收敛。 较AUTOSAR核心的优势是机制的跨域实时性,以及通信协议没有采用AUTOSAR的SOME/IP,而是 采用了更像机器人领域DDS的分布式通信方式,这在QoS能力、安全性和伸缩性上对AUTOSAR的传 统标准有所优化。 通过叠加时间链同步、优先调度和内核改造,在120公里时速下,能提前7米判断并作出刹车或避让反 应。 通过简化的适配接口和原生的多CPU架构支持,新芯片仅需两周即可高质量地应用起 ...
特斯拉call back李想的线索
理想TOP2· 2025-10-21 11:13
特斯拉FSD V14与VLA技术路线 - 特斯拉FSD V14证明其采用与VLA相同的技术路线 核心特点是具备对空间的完整理解能力以及执行长任务的多任务能力[1] - 特斯拉前自动驾驶软件总监Ashok Elluswamy指出 FSD系统整合摄像头 LBS定位 自车信息和音频输入至大型升级网络 后端结合语言模型 3D占用网络和3D高斯技术 最终输出动作指令 语言信息对齐被视为关键选项[1] 技术验证与行业动态 - 理想汽车此前已强调语言模型与3D高斯技术的应用 Ashok的表述在实质上呼应了其观点 尽管双方可能并无直接交流[2] - 相关论述出现在ICCV 2025的"自动驾驶基础模型蒸馏"研讨会 该会议于2025年10月20日在夏威夷檀香山举行 专注于通过蒸馏技术将视觉语言模型和生成式AI等大型基础模型部署到自动驾驶车辆中[3][6] 研讨会核心内容 - 特斯拉AI软件副总裁Ashok Elluswamy在会上发表主题演讲"为特斯拉机器人构建基础模型" 演讲时段可能为11:10至11:45[5][6][7] - 研讨会涵盖自动驾驶基础模型 知识蒸馏 小型语言模型 视觉语言模型 生成式AI模型 多模态运动预测与规划 领域自适应及可信机器学习等多个前沿技术话题[6]
理想辅助驾驶产品经理在俄罗斯说开车了解城市一定要有辅助驾驶
理想TOP2· 2025-10-20 20:18
理想汽车全球化战略 - 公司出海首站落地中亚 乌兹别克斯坦塔什干零售中心开业 并计划于2025年11月在哈萨克斯坦再开设两家门店 [14] - 公司与乌兹别克斯坦及哈萨克斯坦头部经销商合作 采用授权经销商模式销售L9、L7、L6车型 并提供官方质保与售后服务 [14] - 公司将2025年定为全球化元年 已在德国和美国设立研发中心 计划从2026年起新车将进行全球适配 后续重点拓展市场包括中东、中亚和欧洲 [14] 海外辅助驾驶技术进展 - 公司辅助驾驶产品经理在俄罗斯发布微博 其发布的汽车HUD界面UI与理想汽车界面高度相似 合情推理公司在俄罗斯进行了辅助驾驶测试 [13][17] - 结合产品经理在莫斯科的活动及微博内容 合情推理公司已开始初步测试海外市场的辅助驾驶功能 [17] - 产品经理明确提及通过开车了解城市时一定要有辅助驾驶 暗示了辅助驾驶技术在其海外行程中的实际应用 [4]