Workflow
理想VLA司机大模型
icon
搜索文档
理想8月交付新车28,529辆 i6九月上市即交付
凤凰网· 2025-09-01 18:46
理想VLA司机大模型继8月完成理想i8推送后,9月将随着OTA8.0全量推送给所有AD Max车型,理想同 学智能体也将全面进化。 截至2025年8月31日,理想汽车在全国已有543家零售中心,覆盖156个城市。理想汽车在全国已投入使 用3190座理想超充站,拥有17,597个充电桩。 理想MEGA的热销带动品牌市占率提升,6月理想在50万元以上纯电市场的市占率超过30%,7月突破 35%。工厂正在提升产能,8月理想MEGA交付量超过3000辆,9月产能有望突破3500辆。 7月底上市的理想i8,正在加快生产进度,到9月底预计交付8000至10,000辆。9月,理想i6将上市,这是 面向25万至30万元价格区间打造的全能产品,将实现上市即交付。 凤凰网科技讯 9月1日,理想汽车今日公布2025年8月交付数据。2025年8月,理想汽车交付新车28,529 辆。截至2025年8月31日,理想汽车历史累计交付量为1,397,070辆。 ...
理想汽车8月交付新车28529辆,理想MEGA 9月产能有望突破3500辆
凤凰网· 2025-09-01 18:15
交付表现 - 8月交付新车28,529辆 [2] - 历史累计交付量达1,397,070辆(截至2025年8月31日) [2] - 理想MEGA车型8月交付量超过3,000辆 [2] 新产品规划 - 理想L8车型9月底预计交付8,000至10,000辆 [2] - 理想L6将于9月上市 定位25万至30万元价格区间全能产品 [2] - 理想L6将实现上市即交付 [2] 技术升级 - 理想VLA司机大模型9月通过OTA 8.0全量推送至所有AD Max车型 [2] - 理想同学智能体将全面进化 [2] 产能与体系优化 - 理想MEGA车型9月产能有望突破3,500辆 [2] - 销服体系完成组织升级 理想L系列销售势能预计逐步恢复 [2]
领潮 向新,2025成都国际车展今日开幕
中国经济网· 2025-08-29 14:42
展会概况 - 第二十八届成都国际汽车展览会于8月29日开幕 主题为"领潮而立 向新而行" [1] - 吸引近120个汽车品牌参展 展出车辆超过1600辆 展区面积达22万平方米 启用12大展馆及室外展区 [1] - 涵盖整车、改装车、人形机器人、三电系统等产业热点 [1] 自主品牌表现 - 奇瑞集团在5号馆独家呈现 旗下奇瑞、星途、iCAR、捷途等品牌参展 奇瑞纵横作为捷途全新豪华电混越野产品序列首秀 威麟品牌焕新回归定位"全球智能皮卡生态品牌" [2] - 比亚迪独占9号馆 王朝、海洋、方程豹、腾势、仰望等品牌悉数亮相 新增"天神之眼"系统动态演示与"兆瓦闪充"技术专区 室外展区设置仰望U8应急浮水等全场景互动 [2] - 中国长安以10号馆为主秀场 旗下长安、长安马自达、长安启源、阿维塔、深蓝等品牌集结亮相 [2] - 极氪首款超级电混旗舰SUV极氪9X开启预售 吉利星越L全新东方曜首秀 吉利银河M9亮相展台 [3] - 岚图知音搭载华为乾昆智驾ADS 4与鸿蒙座舱HarmonySpace 5亮相 东风风神L8迎来上市 [3] 新势力品牌创新 - 理想汽车展示下一代辅助驾驶技术VLA司机大模型最新进展 首发搭载该模型的全新车型理想i8及全系车型亮相 [4] - 零跑汽车发布B10全新配色 持续突破技术研发 保持高性价比产品定位 [4] - 小米汽车首次参展即拿下近1000平方米展位 鸿蒙智行、蔚来等品牌扩大展台规模 [4] 外资与合资品牌战略 - 梅赛德斯-奔驰推出全新AMG CLE 53 4MATIC+敞篷轿跑车及全新纯电CLA [5] - BMW M3 E46 GTR官方复刻涂装版首次亮相国内车展 [5] - 一汽奥迪携27款明星车型登场 Q6L e-tron家族、A5L迎来正式上市后首秀 PPE豪华纯电平台与PPC豪华燃油平台车展首秀 [6] - smart发布超级电混技术 全新smart1 BRABUS性能版焕新上市 [6] - 别克发布全新高端新能源子品牌"至境" 携三款先导车开启国内首秀 [6] - 丰田首次携手一汽丰田、广汽丰田同台亮相 [6] - 上汽大众新凌渡L上市 新威然及ID.3 GTX套件款发布 [6] - 福特全球首款智电趣野全地形SUV烈马新能源全球首秀 [6] - 进口现代旗舰SUV新一代帕里斯帝开启预售 [6] - 一汽大众、广汽本田、东风本田、东风日产、捷达、安徽大众、大众进口车、沃尔沃、凯迪拉克、林肯、上汽奥迪等品牌齐聚亮相 [7] 政策支持与市场影响 - 成都市商务局设立"购车补贴"专项政策 乘用车以旧换新补贴至高可享2万元/辆政府补贴 [8] - 成都市第三轮汽车消费奖励活动与2025成都车展同步启动 [8] - 通过互动体验、试乘试驾、具身机器人服务等措施加速新技术新产品认知 推动区域市场新能源转型和智能化渗透率提升 [8]
从理想VLA看自动驾驶技术演进路线...
自动驾驶之心· 2025-08-25 19:29
理想VLA司机大模型技术突破 - 具备更懂语义的多模态输入、更擅长推理的思维链和更接近人类驾驶直觉的轨迹规划三大核心能力提升 [1] - 核心能力包括空间理解、思维能力、沟通与记忆以及行为能力四大维度 [1] - 技术融合动态目标、静态元素、导航地图和空间理解等多元素协同 [3] VLA技术发展趋势 - 由VLM+E2E发展而来,涵盖端到端、轨迹预测、视觉语言模型和强化学习等前沿技术栈 [3] - 学术界重点转向大模型与VLA方向,传统BEV感知和车道线等研究方向在顶会中出现减少 [3] - 工业界持续优化传统感知与规划方案,但学术研究重心已明确转向VLA领域 [3] 科研辅导课程框架 - 课程周期为12周在线小组科研加2周论文指导和10周论文维护期,总时长约3.5-4个月 [13][32] - 每周安排1-1.5小时课程,覆盖先导课、课题概览、选题讨论和具体技术模块深度解析 [8][10][29] - 提供模块化VLA模型、统一端到端模型和推理增强模型三大核心研究方向 [34][36] 课程资源支持 - 提供公开数据集包括nuScenes、Waymo和Argoverse等,并支持大语言模型生成数据 [26] - 基线代码覆盖模仿学习、扩散模型和VLA端到端自动驾驶等多类开源项目 [25] - 必读论文包括Senna、SimLingo、OpenDriveVLA和ORION等核心研究成果 [27][28] 学员能力培养目标 - 系统掌握VLA理论体系并深化算法设计及创新思路 [5][14] - 通过基线代码和数据集高效开展实验研究,形成论文初稿 [19][33] - 获得论文写作方法论、修改指导和投稿建议等全流程支持 [5][19] 技术实践要求 - 硬件最低要求为4张4090显卡,推荐配置为8张4090或更高性能设备 [20] - 需掌握Python编程和PyTorch框架,具备Linux系统开发调试能力 [20] - 要求每周课后投入至少1-2小时自学时间并按时完成作业 [18][22] 学术服务机制 - 采用"2+1"多师制教学团队,包括主导师和科研论文班主任双轨支持 [23] - 提供个性化研究idea,每位学员均可获得专属课题方向 [19][33] - 课程产出包含论文初稿、结业证书和优秀学员推荐信 [23]
VLA方向的论文还不知怎么下手?有的同学已经CCF-A了......
自动驾驶之心· 2025-08-22 20:00
理想VLA司机大模型技术突破 - 多模态输入提升语义理解能力,结合动态目标、静态元素、导航地图和空间理解实现综合决策 [1] - 思维链推理技术增强模型逻辑能力,轨迹规划更接近人类驾驶直觉 [1][3] - 采用RAG技术强化记忆能力,整合视觉语言模型与端到端自动驾驶框架 [3][5] 自动驾驶技术发展趋势 - VLA成为学术界和工业界核心方向,涵盖端到端学习、轨迹预测和强化学习等技术栈 [5] - 传统BEV感知和Occupancy技术研究热度下降,顶会论文方向转向大模型应用 [5] - 工业界持续优化传统感知方案,学术界聚焦VLA子领域创新 [5] VLA科研培训课程体系 - 课程周期为14周,包含先导课、传统端到端自动驾驶介绍(4周)、VLA端到端自动驾驶介绍(4周)和论文写作指导 [9][11][30] - 提供模块化VLA模型(Week8-9)、统一端到端模型(Week10-11)和推理增强模型(Week12)三大研究方向 [30][35] - 每周课时1-1.5小时,覆盖算法原理、代码实践和论文写作方法论 [30][34] 课程资源与支持 - 提供公开数据集包括nuScenes、Waymo和Argoverse,支持感知任务和VLA任务开发 [27] - Baseline代码库涵盖模仿学习(VAD、UniAD)、扩散模型(DiffusionDrive、OccNet)和VLA模型(OpenDriveVLA、Senna) [26] - 必读论文包括Senna(2410.22313)、SimLingo(2503.09594)和OpenDriveVLA(2503.23463)等5篇核心文献 [28][29] 学员成果与培养目标 - 产出论文初稿、结业证书和推荐信(根据优秀程度) [24][34] - 获得定制化研究idea(每位学员1个)、baseline代码调试能力和数据集应用经验 [20][34] - 掌握创新点挖掘、实验方法设计和投稿策略等全流程科研能力 [6][20] 技术实施要求 - 硬件最低要求4张4090显卡,推荐8张4090或云服务器租赁方案 [21] - 需掌握Python编程、PyTorch框架和Linux开发环境,具备深度学习基础 [21] - 每周课后需投入1-2小时自学,完成作业和论文阅读任务 [19][23]
传统的感知被嫌弃,VLA逐渐成为新秀...
自动驾驶之心· 2025-08-20 17:15
理想VLA司机大模型技术 - 理想VLA司机大模型具备四大核心能力:空间理解能力、思维能力、沟通与记忆能力以及行为能力,其中思维能力和沟通与记忆能力由语言模型提供,记忆能力采用RAG技术 [2] - VLA结合动态目标、静态元素、导航地图和空间理解等元素进行思维链输出,代表自动驾驶领域最前沿方向 [2] - VLA技术整合端到端、轨迹预测、视觉语言模型和强化学习等多个前沿技术栈,正在成为学术界和工业界关注焦点 [4] 自动驾驶技术发展趋势 - 传统BEV感知、车道线和Occupancy等技术在顶会中占比下降,工业界仍在优化传统方案但学术界已转向大模型与VLA方向 [4] - VLA技术站在VLM和端到端技术基础上,具备更类人的思考推理能力,是当前最前沿研究方向 [2] - 模块化VLA自动驾驶模型和统一的端到端VLA模型成为重点研究方向,涉及OpenDriveVLA、CoVLA-Agent等算法 [30] 科研培训课程内容 - 课程为期14周,包含先导课、课题概览、选题讨论、传统/VLA端到端自动驾驶技术讲解等模块 [8][10] - 提供经典论文分析、创新点挖掘、baseline代码实现、数据集使用等全流程科研支持 [13][19] - 学员可获得论文初稿、结业证书及推荐信,课程采用"2+1"多师制教学团队,包含名校教授和行业导师 [23] 技术资源支持 - 提供多个开源代码库包括基于模仿学习的VAD、基于扩散模型的DiffusionDrive以及VLA方向的OpenDriveVLA等 [26] - 使用nuScenes、Waymo、Argoverse等公开自动驾驶数据集,VLA任务可结合大语言模型生成数据 [27] - 重点论文包括《A Survey on Vision-Language-Action Models for Autonomous Driving》等5篇核心文献 [28][29] 学员培养目标 - 帮助学员系统掌握VLA理论体系,解决知识碎片化问题,形成完整科研方法论 [5] - 通过baseline代码实践和论文写作指导,使学员具备独立完成科研论文能力 [5][19] - 针对不同基础学员提供先修课程,要求掌握Python和PyTorch,建议配备4-8张4090显卡 [20]
理想VLA司机大模型新的36个QA
自动驾驶之心· 2025-08-17 00:04
VLA技术架构与部署 - VLA模型通过"3D局部空间+2D全局理解"实现多模态对齐 解决自动驾驶特有的3D空间理解难题 [3] - 公司自研底层算子与引擎 在Orin芯片上实现2.2B参数模型部署 为业界首个双系统VLM部署方案 [3] - 采用FP8/FP4量化技术优化计算精度 通过分层精细调优实现模型压缩与算力优化 [45][46] 模型设计方法论 - 从并联VLM架构升级为串联VLA架构 实现每一步计算的自主思考能力 [5] - 引入Diffusion模型生成轨迹 基于机器人领域技术验证及年初预研结果确认其可行性 [6][11] - 通过语言思考模块提升决策一致性 解决上一代模型在高速场景中的决策摇摆问题 [20] 感知能力升级 - 整合3D空间编码与全局语义理解 使模型具备距离判断能力(传统VLM仅支持2D输入) [7] - 采用前融合方案结合视觉与激光雷达数据 提升对小物体(如锥桶)的识别置信度 [27][57] - 90%训练数据来自真实场景 10%合成数据用于特殊场景(雪天/事故车)补充 [53] 渐进式技术路线 - 采用L2到L4渐进路径 通过无图方案实现全场景覆盖 与Robotaxi玩家依赖高精地图的方案形成差异 [9][10] - 已储备语音控车、地库漫游等能力 但需配合法规逐步释放 [25][33][38] - 通过世界模型仿真平台测试4000多万公里 使用动态场景库(数十万clips)避免过拟合 [53][54] 算力与模型优化 - 大模型在垂域场景可通过语言压缩技术减少算力需求 同等智力水平下推理性能年提升10倍 [16] - 采用8×0.4 MoE特殊架构优化芯片部署效率 相比开源模型(如千问)具备硬件适配优势 [30] - 通过模型蒸馏与数据配比优化 在参数量不变(如7B)情况下持续提升模型智力 [16] 数据与训练体系 - VLA标注体系与端到端方案完全不同 需对原有数据全部重刷标注 [32] - 强化学习需要推理卡与训练卡交替使用 公司今年显著增加推理卡投入 [13] - 基座模型团队负责通识知识训练(交规/驾驶基础)并提供多尺寸模型蒸馏 [30] 行业技术对比 - 特斯拉FSD V13未使用Language模型 其漫游能力依赖端到端架构而非VLA的寻路能力 [41][42] - 互联网公司开源模型(如千问)缺乏3D数据资产 难以具备物理空间理解能力 [31] - Waymo等Robotaxi玩家受限于高精地图 扩城速度远低于无图方案(如特斯拉奥斯汀覆盖超Waymo) [9] 功能实现与用户交互 - 语音控车简单指令可通过规则实现 但连续组合指令必须依赖语言模型保障扩展性 [55] - EID界面细化需消耗座舱芯片算力 当前仅渲染车辆/车道线等基础元素 [40] - 用户记忆功能实现千人千面需求 解决不同驾驶风格(如超车决策)的个性化适配 [25]
VLA都上车了,还不知道研究方向???
自动驾驶之心· 2025-08-17 00:04
理想VLA司机大模型技术突破 - 具备更懂语义的多模态输入、更擅长推理的思维链和更接近人类驾驶直觉的轨迹规划三大核心能力提升 [1] - 展示空间理解能力、思维能力、沟通与记忆能力以及行为能力四大核心功能 [1] - 结合动态目标、静态元素、导航地图和空间理解等元素进行思维链输出 [3] VLA技术发展趋势 - 由VLM+E2E技术发展而来,涵盖端到端、轨迹预测、视觉语言模型和强化学习等前沿技术栈 [5] - 成为自动驾驶学术界和工业界最受关注的方向,传统BEV感知和车道线技术研究减少 [3][5] - 工业界持续优化传统感知与规划方案,而学术界转向大模型与VLA领域研究 [5] VLA科研论文辅导课程体系 - 课程设置14周周期,包含先导课、课题概览、传统与VLA端到端自动驾驶技术讲解及论文写作方法论 [9][11][26][27] - 提供模块化VLA自动驾驶模型、统一端到端模型和推理增强模型三大研究方向 [9][11][26] - 每周安排1-1.5小时课程,包含选题讨论、算法对比和未来方向探究等环节 [26][27] 课程资源与支持 - 提供公开数据集包括nuScenes、Waymo和Argoverse等,并支持大语言模型生成数据 [21][23] - 提供基于模仿学习、扩散模型和VLA的端到端自动驾驶Baseline代码库 [24] - 包含5篇必读论文,涵盖VLA自动驾驶综述、Senna、SimLingo、OpenDriveVLA和ORION等核心研究 [24] 招生与培养方案 - 每期限招6-8人,要求具备深度学习基础、Python和PyTorch能力,并通过在线1v1面试 [12][19] - 硬件要求最低4张4090显卡,推荐8张4090或云服务器租赁方案 [19] - 采用"2+1"多师制教学团队,配备主导师和科研论文班主任提供全方位学习支持 [22] 课程产出与价值 - 学员将获得论文初稿、项目结业证书和推荐信(根据优秀程度) [22] - 培养创新点挖掘、实验方法设计、论文写作和投稿能力 [13][18][31] - 提供12周在线科研+2周论文指导+10周论文维护的全周期服务 [14][31]
VLA与自动驾驶科研论文辅导第二期来啦~
自动驾驶之心· 2025-08-16 20:00
理想VLA司机大模型技术进展 - 核心能力提升体现在三方面:更懂语义(多模态输入)、更擅长推理(思维链)、更接近人类驾驶直觉(轨迹规划)[1] - 四大核心能力展示:空间理解能力、思维能力、沟通与记忆能力(含RAG技术)、行为能力[1][3] - 技术演进路径:从VLM+E2E发展为涵盖端到端、轨迹预测、视觉语言模型、强化学习的综合技术栈[5] 自动驾驶技术研究趋势 - 学术界焦点转移:传统BEV感知、车道线检测等研究减少,大模型与VLA成为顶会主流方向[5] - 工业界动态:传统感知/规划方案仍在优化,但技术迭代明显向VLA倾斜[5] - 典型技术融合案例:思维链输出结合动态目标、静态元素、导航地图等多维度数据[3] VLA论文指导课程体系 课程架构 - 周期设置:12周在线科研+2周论文指导+10周维护期[14][34] - 核心模块:模块化VLA模型(Week8-9)、统一端到端模型(Week10-11)、推理增强模型(Week12)[9][11][35][37] - 方法论覆盖:选题(Week3)、传统端到端技术(Week4-5)、VLA端到端技术(Week6-7)[9][11][30] 教学资源 - 代码库支持:提供基于模仿学习、扩散模型、VLA的6个开源项目基准代码[26] - 数据集配置:采用nuScenes/Waymo/Argoverse等公开数据集,VLA任务结合大语言模型生成数据[27] - 必读论文清单:包含5篇顶会论文如《Senna》《OpenDriveVLA》等[28][29] 学员培养目标 - 能力输出:完成论文初稿、掌握算法对比分析方法、获得定制化研究idea[20][34] - 技术深化路径:从理论认知(Week1-2)到代码实践(Week6-8)最终形成完整论文(Week13-14)[30][31] - 硬件门槛:建议配置8张NVIDIA 4090显卡,最低要求4张[21]
自动驾驶VLA论文指导班第二期来啦,名额有限...
自动驾驶之心· 2025-08-14 14:49
理想VLA司机大模型技术进展 - 核心能力提升体现在三方面:更懂语义(多模态输入)、更擅长推理(思维链)、更接近人类驾驶直觉(轨迹规划)[1] - 四大核心能力展示:空间理解能力、思维能力、沟通与记忆能力(含RAG技术)、行为能力[1][3] - 技术整合动态目标、静态元素、导航地图等多元素进行思维链输出[3] - VLA技术路径融合端到端学习、轨迹预测、视觉语言模型和强化学习等前沿技术栈[5] 自动驾驶技术研究趋势 - 学术界研究重心从传统BEV感知/车道线检测转向VLA大模型方向[5] - 工业界仍在优化传统感知规划方案 但学术顶会已较少收录相关论文[5] - VLA成为自动驾驶领域最受关注方向 存在多个待探索子领域[3][5] VLA论文指导课程体系 课程架构 - 14周系统训练:包含传统端到端/VLA技术对比、模块化模型设计、推理增强模型等模块[9][11][26] - 采用"2+1"多师制教学(名校导师+行业专家+科研班主任)[22] - 配套资源包括公开数据集(nuScenes/Waymo等)、Baseline代码库(VAD/UniAD等)及5篇必读论文[23][24] 学员产出 - 可获得论文初稿、结业证书及潜在推荐信[22] - 掌握从选题(Week3)、实验(Week6-12)到投稿(Week14)全流程方法论[26][27] - 硬件要求最低配置4张NVIDIA 4090显卡 建议8张以上[19] 教学特色 - 提供定制化研究idea(每位学员1个)及持续6个月答疑服务[18][30] - 强制学术诚信规范 要求每周1-2小时课外学习及全勤参与[19][22] - 三重能力培养:理论体系构建(Week2)、代码实践(Week6-8)、论文写作(Week13)[6][26]