Workflow
VLA范式
icon
搜索文档
专访星海图赵行:热闹的Demo不等于泛化能力,具身智能胜负仍在数据量
36氪· 2025-08-13 11:37
核心观点 - 星海图在2025WRC展示具身智能机器人铺床Demo 突出VLA端到端基础模型G0的技术能力 该任务集柔性物体操作、全身控制和场景泛化性于一体[1][2][7] - 公司发布基于500小时真实场景数据集训练的G0模型 在平均指标上超越竞品PI 0约20% 并计划开源数据集推动行业标准化[9][10][28] - 具身智能行业当前处于非共识阶段 公司采取"快慢双系统"技术路线 同时探索世界模型等前沿方向但暂未工业化[34][35][39] - 公司已完成近15亿元人民币A轮系列融资 数据工程成为研发重点 首席科学家亲自参与采集流程标准化[5][19][26] 技术突破 - G0模型采用三阶段VLA训练框架(跨本体预训练/单本体预训练/后训练) 解决复杂全身移动控制任务表现不佳的行业痛点[9][10] - 机器人铺床需协调23个自由度 分三步完成底盘移动、躯干调节和机械臂操作 各步骤存在动态耦合关系[2][7][8] - 模型泛化性面临三大挑战:操作对象差异(纹理/软硬/尺寸)、场景环境多样性、任务动作的非语言可定义性[12][13] - 采用Transformer架构 短期内聚焦视觉-语言-动作模态 暂未引入触觉因传感器标准化程度不足[16][33] 数据战略 - 投入十个月构建五类场景(家庭/酒店/工厂/超市/餐厅)数据集 强调真实性和多样性 拒绝"数据采集厂"式理想环境[27][28] - 开源500小时真机数据集目的:建立行业基准测试标准 缩短用户从购机到部署的开发链条[29][30] - 数据工程包含采集员培训、真机遥操作、清洗标注全流程 目前尚未形成标准化SOP[22][23][26] - 数据质量被视为比模型结构更关键的因素 参考Sora案例证明数据规模的决定性作用[18] 商业模式 - 采用"整机+智能"双轮驱动 通过开源数据降低行业准入门槛 培育开发者生态[30] - 已完成A4、A5轮战略融资 A轮系列累计融资达15亿元人民币[5] - 技术路线选择兼顾学术前沿与工业化可行性 优先推进已成熟的VLA范式[32][34] - 产学协同效应显著 高校研究成果转化与产业数据规模形成良性循环[45][46]
通向L3的正确范式?理想i8全球首发VLA高阶辅助驾驶,我们帮你试了试
机器之心· 2025-08-02 12:43
理想i8与VLA司机大模型 - 理想全新纯电SUV i8上市,搭载新一代VLA辅助驾驶系统,成为全球首个展示VLA辅助驾驶范式的车企 [2] - VLA系统基于视觉-语言-行为大模型、英伟达Thor-U芯片和禾赛ATL激光雷达,辅助驾驶能力大幅提升 [2] - VLA架构最大改进在于利用大模型语言智能提供决策能力,将空间智能转化为语言理解编码再形成动作指令 [6] VLA技术特点 - 具备思维推理能力:通过CoT(思维链)推理充分理解环境并生成驾驶决策 [17] - 拥有沟通能力:支持自然语言交互,可接受人类实时指令调整驾驶行为 [9][17] - 具备记忆能力:可记住特定道路的驾驶设置并在下次自动应用 [17] - 自主学习能力:通过仿真环境自我迭代,利用生成数据持续提升 [17] - 驾驶平顺性提升:采用Diffusion生成光滑轨迹,相比之前连接轨迹点的方案更丝滑 [13] - 驾驶风格改进:从模仿"老司机"转向"专车司机"风格,更加稳健 [15] 技术演进与数据积累 - 辅助驾驶技术从BEV方案演进到无图辅助驾驶,再到端到端架构,现升级至VLA范式 [23] - 端到端辅助驾驶MPI(接管里程)从最初十几公里提升至100公里,7个月增长10倍 [5] - 已积累43亿公里用户智驾总里程,134万辆用户规模,云端算力达13EFLOPS [24] - 累计12亿公里有效数据,覆盖不同天气、道路类型等多样化场景 [24] - 通过世界模型生成合成数据解决长尾场景问题,提升数据价值 [25][26] 算法与工程优化 - 构建MindGPT基座模型,通过五步流程实现VLA大模型生成 [28] - 采用仿真测试大幅降低成本:从2023年实车测试157万公里(成本18.4元/公里)降至2024年仿真测试4009万公里(成本0.53元/公里) [28] - 实现模型量化:在Thor-U芯片部署4B模型并进行FP8、INT8量化,未来FP4精度可使算力翻倍 [29] - 算法效率高,强化学习应用显著,可实现天级发版迭代 [28] 未来展望 - 已在北京总部运行MEGA Home接驳车,实现全区域(含地下停车场)巡游 [30] - 构建1×1km完全仿真环境,训练速度远超真实世界 [32] - 预计一年后MPI可达1000公里,加速智能驾驶技术迭代 [32]
理想汽车-W(02015.HK):汽车与AI双向赋能 迈向全球领先的物理智能体企业
格隆汇· 2025-07-28 18:38
行业发展趋势 - 人工智能趋势下汽车行业最终或迎来颠覆性产业发展 [1] - 新能源渗透率步入瓶颈且行业内卷加剧 [1] - 智能化背景下技术迭代斜率和消费者认知变化速度加快行业洗牌 [1] - 技术跃迁是摆脱行业内卷的重要途径 [3] 公司战略定位 - 理想汽车转型AI以获取自动驾驶门票 [2] - 汽车业务为AI转型提供数据及资金基础 [2] - 公司业务结构和商业模式可能因VLA范式迎来新变化 [3] - 多模态大语言模型VLA具备成为广义具身智能基础模型的潜力 [3] 产品竞争力分析 - 高端家庭增程SUV赛道逐步进入红海市场 [2] - 理想L系列通过品牌力和产品价值巧思维持竞争力 [2] - 纯电i系列车型有望在空间/补能/智能化方面超越用户需求 [2] - 增程系列和MEGA Home成功经验赋能新产品开发 [2] 技术发展路径 - VLA范式创新引入多模态大语言模型 [3] - 汽车预计是VLA模型可量产的最早载体 [3] - 智驾成功需依赖多模态和强化学习方向 [3] - VLA有望在除汽车外的各种终端落地 [3] 企业核心能力 - 具备前瞻性企业家认知决定智驾方向选择和投入时机 [3] - 高效组织架构和执行力保障战略落地效果 [3] - 强大工程和产品能力支撑VLA技术商业化 [3] - 持续快速学习能力提升对产业趋势认知 [1] 财务表现预测 - 预计2025-2027年non-GAAP归母净利润分别为92/156/190亿元 [4] - 2025-2027年净利润同比增速分别为-14%/+70%/+22% [4] - 当前股价对应PE分别为25/15/12倍 [4] - 可比公司2025年平均PE为27.0倍 [4]
理想汽车-W(02015):汽车与AI双向赋能,迈向全球领先的物理智能体企业
华源证券· 2025-07-27 13:18
投资评级 - 首次覆盖,给予理想汽车-W“买入”评级 [5][11][179] 核心观点 - 智能化背景下汽车企业发展需决策者前瞻战略判断与精准抉择,李想的性格与学习能力有望赋能理想转型人工智能企业 [6] - 汽车业务是理想转型 AI 的基础,其品牌力和体系化能力有望使汽车销量和盈利稳中有升 [7] - 汽车及机器人等物理智能体模型交织,理想凭借高效战略执行力有望在 AI 战役中逆袭 [8] 各部分总结 理想的核心竞争力是李想 - 拒绝平庸是李想性格底色,持续学习使其成功,三次创业经历让他对产业择时、洞察需求、组织管理更成熟 [21][22] - 泡泡网时期李想意识到要成行业第一,汽车之家时期从“以技术为导向”进化到“以用户为导向”,理想汽车时期将组织与流程建设放核心地位 [23][24] 历史上成功与失败的经历,都将转化为 i 系列成功的基石 - 理想 ONE 因精准产品定位和超越用户需求的体验成功,L 系列成功是多方面赋能结果,L 系列在竞争中承压有限因品牌力成护城河 [26][30][38] - MEGA 首战失利因核心团队投入减少致市场误判,再战告捷是价值升级拓宽了用户基数,i 系列预计成功因 MEGA 经验赋能提供更优体验 [61][84][94] 人工智能企业阶段:物理智能体模型开始交织,理想凭借高效的战略执行力有望逆袭 - VLA 范式有望成解决物理智能体问题的通用范式,汽车预计是其可量产的最早载体 [142][143] - 技术跃迁是摆脱行业内卷的重要途径,理想通过 Mind VLA 打造技术底座向人工智能企业转型 [144] - 理想智驾逆袭核心在于高效战略执行力,包括企业家认知、工程&产品能力、组织执行力 [162] 盈利预测与评级 - 预计公司 2025 - 2027 年 non - GAAP 归母净利润分别为 92/156/190 亿元,同比增速分别为 - 14%/+70%/+22%,当前股价对应 PE 分别为 25/15/12 倍 [11][179] - 选取比亚迪、赛力斯为可比公司,2025 年平均 PE 为 27.0x,理想汽车有望销量稳中有升,给予“买入”评级 [11][179]