VLA

搜索文档
AI 如何成为理想一号工程
晚点LatePost· 2025-05-23 15:41
公司战略调整 - 2023年10月秋季战略会将智能辅助驾驶业务优先级提升至第一战略,车机端理想同学从最高优先级(IP0)降至最低(IP2)[4] - 2023年初确立"2030年成为全球领先人工智能企业"愿景[5] - 2024年1月设立AI技术委员会整合各部门AI资源,成员包括产品部和各研发部门负责人[15][16] AI产品发展 - 车机端理想同学基于T5架构打造10亿参数模型,2023年12月推出多模态认知大模型Mind GPT 1.0[6][7] - 2024年3-4月开发理想同学App,12月底上线手机端应用,2024年3月推出网页版[7] - 基座模型部门升级为二级部门,目标进入行业前三[17] 智能辅助驾驶进展 - 2020年9月组建自研团队,2022年L9上市搭载AD Max系统[9] - 2023年10月扩招50余个岗位,团队规模突破千人[10] - 2024年7月启动"端到端+VLM"千人内测,10月实现量产上车[10][11] - 技术路线从"端到端+VLM"转向VLA架构,VLA模型具备3D视觉和物理世界理解能力[12] 组织架构调整 - 2024年初总裁马东辉接替李想负责智能汽车战略,李想专注AI方向[13] - 2023年设立AI周会制度,2024年升级为AI技术委员会[14][15] - 基座模型负责人陈伟汇报对象调整为CTO谢炎,部门级别提升[16][17] 技术路线演进 - 初期采用供应商方案,2021年启动理想同学自研[6] - 2022年探索大规模语言模型应用,2023年实现算法全自研[6][7] - 智能辅助驾驶从依赖高精地图转向"无图"方案,最终采用VLA架构[11][12]
AI 如何成为理想一号工程
晚点Auto· 2025-05-22 15:16
公司战略调整 - 2022年10月秋季战略会将AI定位为未来竞争关键方向 车机端理想同学优先级从IP0降至IP2 智能辅助驾驶业务战略地位提升 [3] - 2023年初确立"2030年成为全球领先人工智能企业"愿景 智能辅助驾驶被列为第一战略 智能空间和智能电动分列二三位 [5][9] - 2024年1月成立AI技术委员会 整合产品部和各研发部门负责人 覆盖智能辅助驾驶/理想同学/智能商业/智能工业四大方向 [14][15][16] AI技术布局 - 2022年上半年基于T5架构研发10亿参数模型 支持多模态信息处理 2023年3月L7首发时实现语音视觉功能全自研 [6] - 2023年12月推出车端大模型Mind GPT 1.0 2024年7月启动"端到端+VLM"千人内测 10月实现量产上车 [5][10][11] - 技术路线从"端到端+VLM"转向VLA架构 VLA能结合3D/2D视觉构建物理世界理解 具备语言思维链和推理能力 [12] 产品发展路径 - 理想同学从车机语音助手发展为跨平台应用 2024年3-4月开发手机App 12月上线网页版 实现车机/手机/网页多端覆盖 [7][8] - 智能辅助驾驶系统AD Max 2022年随L9上市 2023年12月推送城市NoA功能 2024年通过端到端方案进入行业第一梯队 [9][10][11] 资源投入 - 2023年10月智能辅助驾驶团队扩招 开放50余岗位 11-12月每周新增数十人 团队规模突破千人 [10] - 基座模型部门升级为二级部门 负责人陈伟直接向CTO汇报 目标进入行业前三 为各业务线提供AI技术支持 [16][17]
TransDiffuser: 理想VLA diffusion出轨迹的架构
理想TOP2· 2025-05-18 21:08
文章核心观点 - 文章详细解释了Diffusion模型在自动驾驶轨迹生成中的应用,特别是理想汽车VLA(Vision-Language-Action)系统的技术架构和创新点 [1][4][6] - 理想汽车的VLA系统通过Diffusion模型生成驾驶轨迹,相比VLM(Vision-Language-Model)系统具有更强的拟人感和决策能力 [1][2][4] - TransDiffuser模型通过多模态感知信息融合和去相关优化机制,显著提升了轨迹生成的多样性和质量 [6][11][12] 什么是Diffusion - Diffusion是一种通过加噪和去噪过程学习数据分布的生成模型,核心思想类似于逆向拼图 [4] - 相比GAN和VAE等其他生成模型,Diffusion在生成质量和稳定性上具有优势 [4] - 理想汽车采用ODE采样器将Diffusion生成步骤从几十步减少到2-3步,大幅提升效率 [5] 理想VLA系统的技术特点 - VLA是一个具备快慢思考能力的单一系统,直接输出action token并通过Diffusion解码为轨迹 [4] - 系统能同时生成自车轨迹和预测其他交通参与者轨迹,提升复杂环境博弈能力 [5] - 当前系统输出轨迹而非直接控制信号,但未来可能演进到直接输出油门/方向盘信号 [3] TransDiffuser架构细节 - 模型采用编码器-解码器结构,融合图像/LiDAR/运动状态等多模态信息 [6][7] - 场景编码器处理前视图像(8视角)和LiDAR数据(5传感器),输出BEV/图像/点云特征 [7][10] - 去噪解码器基于DDPM算法,通过10步迭代生成覆盖4秒的8个waypoints轨迹 [9][11] - 在NAVSIM数据集上PDMS指标达到94.85,优于Hydra-MDP++等现有方法 [11] 关键创新点 - 无锚点轨迹生成:不依赖预设轨迹或词汇表,直接从感知数据生成轨迹 [11] - 多模态去相关优化:解决模式崩溃问题,提升轨迹多样性且计算开销低 [11][12] - 采用256批量大小分布在4个NVIDIA H20 GPU上进行训练 [10] 局限性与未来方向 - 模型微调存在困难,特别是感知编码器部分 [13] - 未来可能结合强化学习,并参考OpenVLA等先进模型架构 [13] - 直接输出控制信号(油门/方向盘)是更难的挑战,短期内难以实现 [3]
理想汽车,压力山大
虎嗅APP· 2025-05-09 21:14
销量目标与产品规划 - 公司2025年销量目标为70万辆,较2024年增加20万辆 [1] - 2025年规划的新车型仅有理想i8和理想i6两款,均在下半年发布,其他为改款车型 [1] - L系列近4个月未能突破月销4万辆瓶颈,不及2024年下半年表现 [1] L系列竞争态势 - 2024年四季度公司增程车型市占率环比下滑2.1% [6] - 问界M9已取代理想L9成为40万以上高端SUV销量冠军 [6] - 2025年有超过10款中大型SUV新车上市,包括问界M8、领克900等竞品 [6] - 问界M8累计大定订单突破7万台,定位35万-45万价格区间 [7] - 零跑凭借"半价理想"定位成为新势力销冠,领克900等车型以更低价格切入家庭用车市场 [8] 产品升级策略 - L系列智能焕新版采用"加量不加价"策略 [1] - L7/8全系标配魔毯双腔空悬和52.3kWh大电池,L9升级双枪双阀魔毯空气悬架等配置 [1] - AD Max车型从英伟达双Orin-X芯片升级到单Thor-U芯片,采用全新激光雷达 [11] - 新一代VLA智驾方案计划2025年下半年量产上车 [15] 技术发展方向 - VLA方案整合基座模型、数据理解、预训练等能力,意在构建技术壁垒 [13] - 公司认为高阶智驾将成为20万元以上电动车的"必含项" [14] - 行业分析师认为智驾技术落地情况将影响L系列销量能否提升30%以上 [16] 纯电业务布局 - 公司已建成2271座超充站和12358根超充桩 [18] - 内部对i8/i6销量预期为5万辆,供应链预期为14万辆 [18] - 2024年Model Y年销48.23万辆,蔚来ES6月均6200辆 [18] - 公司正通过渠道下沉和海外扩张寻求增量,但短期难见显著增长 [19]
理想汽车,压力山大
虎嗅· 2025-05-09 18:58
销量目标与现状 - 公司2024年销量目标为70万辆,较2023年增加20万辆 [1] - 新车型仅规划理想i8和i6两款,均在下半年发布,其余为改款车型 [1] - L系列近4个月月销未突破4万辆瓶颈,低于2023年下半年表现 [1] - L6销量回升至2023年刚上市水平,L7单月销量均低于1万辆 [3] 产品策略与竞争格局 - L系列智能焕新版采取"加量不加价"策略,全系升级智能驾驶硬件并新增配置(如L7/8标配52.3kWh大电池) [2] - 2024年四季度公司增程车型市占率环比下滑2.1% [6] - 2024年行业新增超10款中大型SUV竞品,包括问界M8、领克900等,价格覆盖理想主力区间 [6] - 问界M8上市后累计大定订单突破7万台,定位35万-45万价格带直接对标L8/L9 [7] - 零跑等品牌以"半价理想"策略抢占市场份额,冰箱彩电大沙发配置已成行业标配 [7] 智能化技术布局 - L系列智驾硬件升级至单Thor-U芯片,搭载全新激光雷达以支持VLA(视觉语言行动模型) [8] - VLA技术定位为竞争壁垒,需整合基座模型、世界仿真等体系化能力 [9][11] - 公司预计2024年下半年量产VLA功能,目标将高阶智驾打造为20万元以上车型"必含项" [11] 纯电业务与海外拓展 - 纯电车型i8/i6内部销量预期为5万辆,供应链目标为14万辆(占总销量20%) [15] - 已建成2271座超充站、12358根超充桩,但30万以上高端纯电SUV市场尚无爆款先例(Model Y除外) [15] - 2024年为公司出海元年,重点布局中亚、亚太等市场,但短期难见显著增量 [16] 市场挑战 - 增程基本盘面临华为等对手的精准狙击,问界M9已取代L9成为40万以上高端SUV销冠 [6][7] - 家庭定位+增程路线的同质化加剧,产品差异化空间收窄 [7] - 智驾功能实际体验尚未建立明显领先优势,技术落地效果存疑 [12]