VLA大模型

搜索文档
理想汽车(2015.HK):2025Q2毛利保持韧性 VLA规模化部署在即
格隆汇· 2025-08-31 03:04
财务表现 - 2025Q2单季营收302.5亿元 同比-4.5% 环比+16.7% [1] - 汽车业务收入288.9亿元 同比-4.7% 环比+17.0% [1] - 归母净利润10.9亿元 同比-0.8% 环比+68.0% [1] - non-GAAP归母净利润14.6亿元 同比-2.7% 环比+43.8% [1] - 汽车业务毛利率19.4% 同比+0.7pct 环比-0.3pct [1][2] - 经营性利润8.3亿元 利润率2.7% 同比+1.3pct 环比+1.7pct [2] - 平均售价由26.6万元降至26.0万元 [2] 销量与产品结构 - 2025Q2交付11.1万辆 同比+2.3% 环比+19.6% [1][2] - L6占比46.8% L7占比23.8% L8占比13.3% L9占比13.0% Mega占比3.1% [2] - 其他业务营收13.6亿元 同比+0.1% 环比+9.0% [2] 成本与费用 - 研发费用28.1亿元 同比-7.2% 环比+11.8% 费用率9.3% [3] - 销售管理费用27.2亿元 同比-3.5% 环比+7.4% 费用率9.0% [3] - 经营活动现金净流出30亿元 自由现金流-38亿元 [3] 基础设施与网络 - 零售中心530家覆盖151城 售后维修中心511家覆盖222城 [3] - 超充站2,902座 充电桩15,945根 覆盖255城 [3] 未来展望 - 2025Q3预计交付9.0-9.5万辆 同比-41.1%至-37.8% [4] - 2025Q3预计收入248-262亿元 同比-42.1%至-38.8% [4] - 纯电SUV i6计划9月发布 起售价25万元 续航720km [4] - VLA系统9月覆盖增程AD Max车型 11月有重大更新 [4] - 预计2027年实现L4自动驾驶 [4] 长期预测 - 预计2025-2027年收入1,272.1/1,780.4/2,009.5亿元 [4] - 预计同期归母净利润50.1/114.1/145.5亿元 [4]
理想汽车 | 2025Q2:毛利保持韧性 VLA规模化部署在即【民生汽车 崔琰团队】
汽车琰究· 2025-08-30 22:56
0 1 事 件 概 述 经营性利润方面,2025Q2单季经营性利润为+8.3亿元,利润率为+2.7%,同比/环比分别为+1.3pct/+1.7pct。2025Q2单季归母净利润为10.9亿元,non-GAAP归母净利 润为14.6亿元,同比/环比分别为-2.7%/+43.8%;non-GAAP净利润率为4.8%,同比/环比分别为+0.1pts/+0.9pts 。 ► 研发费用率稳定 充电站持续投入 费用端: 2025Q2理想研发费用为28.1亿元,同比/环比为-7.2%/+11.8%;2025Q2研发费用率为9.3%,同比/环比为-0.3pts/-0.4pts。同比下降主要由于员工薪酬减少。 环比上升主要受新车项目进度影响,以及为支持持续扩展的产品组合与技术所增加的费用投入所致 。 2025Q2销售管理费用为27.2亿元,同比/环比分别为-3.5%/+7.4%;2025Q2销售管理费用率为9.0%,同比/环比为+0.1pts/-0.8pts。同环比下降主要由于员工 薪酬减少。环比上升主要由于营销及促销活动增加 。 0 2 分 析 判 断 ► 营收短期承压 毛利韧性凸显 营收端: 2025Q2公司总营收为302 ...
何小鹏,上了马斯克的贼船?!
电动车公社· 2025-08-29 00:01
全新小鹏P7市场表现 - 全新小鹏P7上市7分钟内获得1万台大定订单 [2] - 对比参考:小米SU7去年上市时1万台大定用时4分钟,小鹏MONA M03去年上市时1万台大定用时52分钟 [4] 技术路线转型 - 公司从激光雷达支持者转变为纯视觉路线坚定支持者 [13] - 公司认为视觉系统上限远超激光雷达,预计2027年自动驾驶技术路线之争将消失 [13] - 与特斯拉马斯克技术路线趋同,均认为激光雷达会降低安全性 [15][16] 纯视觉方案优势与突破 - 纯视觉方案过去表现不佳主要因算力不足,图像像素点阵和帧率不足导致决策困难 [29][30] - 当前算力较以往提升10倍,预计5-10年后算力将再提升10倍 [31] - 算力提升使纯视觉方案在夜间、大逆光、雨雪天等复杂条件下超越人眼感知能力 [33] 自研芯片技术优势 - 自研图灵芯片单颗有效算力相当于三颗英伟达Orin X芯片 [38] - 20万级小鹏G7 Ultra版搭载3颗图灵芯片,车端有效算力达2250TOPS,远超同级产品(多数仅100TOPS) [38] - 自研芯片算力利用率更高,专为自家产品优化,避免通用芯片的功能冗余 [41] - 自研算力领先行业3-10倍,支持功能代际跨越 [43] VLA辅助驾驶系统进展 - 全场景VLA辅助驾驶系统可实时识别水坑深度、行人位置、公交车盲区等复杂场景 [47] - 预计2024年底辅助驾驶能力将比第一阵营强10倍以上 [49] - 支持L4级自动驾驶车型计划2026年量产,并试点Robotaxi运营 [49] 财务与运营表现 - 最近一年半销量相当于过去9年总和 [56] - 2025年二季度总交付量超10万台,创历史新高,同比增长241.6% [56] - 总营收182.7亿元人民币,创历史新高,同比增长125.3% [56] - 毛利率17.3%,同比增长3.3个百分点,现金流475.7亿元人民币 [56] 行业竞争与战略定位 - 与特斯拉在Robotaxi领域可能面临直接竞争,双方均计划2026年扩大规模 [51][52] - 公司未来不排除通过合作方推进Robotaxi商业化运营 [54] - 公司发展聚焦"科技"和"颜值"两大核心方向 [57] - 行业尚未形成稳定格局,存在挑战与机遇并存局面 [60]
新一轮智驾PK,迈入实战时刻
虎嗅APP· 2025-08-27 21:37
新一轮智驾竞赛集中爆发原因 - 监管加强和舆情事件拖后部分公司既定节奏[10] - 各家公司智驾技术底层依赖AI创新突破 时间起点相近[10] - AI底层技术套用于智驾需大量训练和调整 时间周期相对固定[10] - 公司担忧竞对优先发布技术 选择先发布基础版再优化策略[10] VLA模型技术突破 - VLA模型去掉规控时代多环节划分 实现从传感器到控制端单一完整模型[7] - 模型底层从CNN升级为Transformer 大幅提升对人类大脑模仿学习能力[7] - VLA模型下限已超过端到端模型上限 未来持续优化[6] - 相比VLM模型 VLA增加历史状态输入并输出可执行动作 应用于机器人控制和人机交互等领域[8] 思维链能力提升 - VLA通过语言媒介模仿人类思考模式 将驾驶决策分解为连贯推理步骤[11] - 分步推理提升复杂路况处理可靠性 例如识别校车后减速并检测儿童横穿风险[15] - 决策依据以可理解语言展现 增强系统可解释性和事故追溯能力[15] - 模型通过海量数据学习推理逻辑 获得泛化能力处理未知新场景[15] 实际道路表现 - 在立交桥下辅道人车混行场景 持续自我推理并将车速降至绝对安全范围[16] - 视线被遮挡路口感知对向电瓶车时 决策从控速升级为主动降速预留反应空间[18] - 丁字路口汇入前提前分析识别 降速后再汇入车流避免被迫变道[20] - 复杂十字路口综合天气和行人动态推理风险 以缓慢安全方式通过[22] 行业发展趋势 - VLA模型成本差异主要在芯片 15万元以上车型可适配 10万元级别车型通过优化有望搭载[26] - 智驾芯片将加强对Transformer支持 尤其在FP4和FP6精度算力优化[26] - 自研辅助驾驶系统需经历规则算法、端到端1.0到VLA过程 无法完全跳过发展阶段[26]
新一轮智驾PK,迈入实战时刻
虎嗅· 2025-08-27 18:38
新一轮智驾技术竞赛背景 - 中国头部智驾公司近期集中落地最新智驾能力 包括理想汽车推送VLA司机大模型 Momenta与智己合作R6飞轮大模型 元戎启行发布VLA大模型 小鹏发布全新VLA大模型 华为计划9月推送ADS 4系统 [2][5] - 行业动作集中源于四大驱动力:监管加强推迟部分公司节奏 AI底层创新突破时间相近 技术适配需要固定训练周期 公司担心竞品抢先选择先发布基础版再优化策略 [3][6] VLA模型技术突破 - VLA模型相比传统端到端模型取消感知/定位/预测/规划等独立环节 实现从传感器到控制端的单一完整模型架构 [7] - 模型底层技术从CNN升级为Transformer 显著提升对人类大脑模仿学习能力 [8] - VLA模型具备思维链(CoT)能力 通过语言媒介模仿人类驾驶思考 将决策分解为连贯推理步骤 [9] - 相比VLM模型 VLA在输入输出和应用层面更贴合智驾需求 输入包含图像/文本/历史状态 输出为可执行动作 应用领域涵盖机器人控制和自动驾驶 [9] VLA模型核心优势 - 增强决策逻辑性:面对校车/儿童等复杂路况时能分步推理 显著提升可靠性及安全性 [11] - 提升系统可解释性:以人类可理解语言展现决策依据 助力研发调试与事故追溯 [11] - 强化泛化能力:通过海量数据学习推理逻辑 实现应对未知新场景的能力 [11] - 实际测试显示防御性驾驶能力突出 在立交桥辅道主动降速至安全范围 在视线遮挡路口预判电瓶车风险主动降速 在丁字路口提前分析并缓速汇流 [12][14][15][16] 技术应用体验升级 - 驾驶体验实现综合性飞跃 包括更顺滑控车/更果断反应/全程安全感提升 极端场景仍需人工接管但信任感显著增强 [17] - 支持语音指令交互 可响应"加速/减速"等基础操作 并能直接读取交通标识文字执行优化驾驶 [17] 行业发展趋势 - VLA模型当前尚未完全实现思维链能力 自评仅达6分(满分10分) 需持续收集测试数据并优化后训练 [18][19] - 成本差异主要集中于芯片 15万元以上车型可适配 10万元级别车型经优化也有搭载可能 [20] - 智驾芯片将加强Transformer支持 重点优化FP4/FP6精度算力 [21] - 车企自研辅助驾驶系统需经历规则算法/端到端1.0/VLA的完整技术演进过程 无法完全跳过特定阶段 [21]
7天闪电战,理想用「听劝力」改写爆款逻辑
36氪· 2025-08-11 23:41
行业竞争态势 - 中国汽车市场每年推出近百款新车 座舱及辅助驾驶能力快速迭代 价格战激烈程度达前所未有水平 [3] - 2025年前七个月有30余款全新新能源车型上市 价格带宽横跨5万至100万元 覆盖轿车和SUV全品类 [4] - 新能源渗透率突破50%后消费群体转向实用主义主导 传统用户教育策略失效 动态适配能力成为关键 [6] 理想汽车产品策略 - i8上市一周后迅速调整产品配置:将Max版本作为标准配置定价33.98万元 铂金音响改为标配 后排娱乐屏改为1万元选装项 [3][8] - 配置调整基于上市首周订单数据:98%订单集中在Max/Ultra版本 反映用户对VLA大模型及高阶舒适配置的强烈需求 [6] - 采用"单配置+选装包"极简产品矩阵 降低用户决策难度 精准锚定30-40万元六座SUV价值临界点 [15] 供应链与组织能力 - 配置调整需联动全产业链:7日内完成供应商协商 生产逻辑重新编程 已下线车辆消化处理 [8] - 市场营销/渠道/法务体系需同步刷新信息 体现企业组织能力的极限测试 [8] - 凭借互联网基因的敏捷决策机制和供应链信任资本 实现战略意图无损传导 [8] 市场定位与产品优势 - 30-40万元纯电SUV市场存在战略空白:销冠特斯拉Model Y上半年销量43,917辆(月均7,300辆) 第二名仅20,000辆(月均3,300辆) [10] - i8以六座全舒适空间直击家庭多代出行需求 第三排坐高333毫米 180cm身高乘客腿部空间超一拳 [12] - VLA智驾大模型通过自研世界模型复现99%中国路况 动态生成2,000余种长尾场景 具备优秀复杂场景处理能力 [12] 品牌竞争壁垒 - 2025上半年在30-40万元区间销量已超越BBA同级产品 增程车型成功培育品牌基本盘 [15] - 作为第七款车型延续爆款基因 通过需求转化效率竞赛在细分市场窗口期建立现象级产品地位 [15]
万字释疑理想VLA,总负责人郎咸朋:技术与研发流程改革都是挑战
36氪· 2025-08-04 13:05
产品发布与定位 - 理想i8为首款纯电SUV车型,售价32.18万至36.98万元,主打中大型六座市场[1] - 产品亮点包括三排六座布局与同级别优秀的二排过道/三排腿部空间,但后备箱空间在满员时受限[1] - 全系标配5C超充电池与双腔空气悬架,针对存在里程焦虑且追求舒适性的消费群体[1] VLA技术架构 - VLA采用4B参数模型,基于自研0.4×8 MoE架构,推理帧率达10Hz(较VLM提升3倍)[5][6] - 技术突破包括3D+2D视觉融合、思维链推理能力,可理解并执行动作[2][17] - 通过32B云端大模型蒸馏至3.2B车端模型,采用流匹配技术将Diffusion推理步骤从10步压缩至2步[19] 算力与芯片优化 - 在Thor芯片实现FP8量化精度下1000TOPS算力,计划向FP4演进[26][28] - 通过魔改CUDA底层、重写PTX指令实现Orin芯片部署大模型[15] - 训练算力从规则算法时代不足1EFLOPS增长至端到端时代的10EFLOPS[10] 数据与训练体系 - 累计12亿数据闭环,2024年实车测试缩减至2万公里,仿真测试占比超90%[8][12] - 构建40万+评测场景库,单日峰值仿真里程达30万公里[25] - 采用"老司机数据"标准,通过云端大模型清洗1000万量级训练数据[36][37] 技术路线比较 - VLA相较端到端路线突破数据限制,通过世界模型生成海量训练场景[2][40] - 当前MPA(事故间隔里程)达300万公里,目标提升至人驾水平的10倍(600万公里)[11] - 研发团队规模控制在200人左右,强调算法-数据-算力三角平衡[32][33] 商业化进展 - 辅助驾驶事故率现为人驾的1/6(350-400万公里/次 vs 60万公里/次)[11] - 计划实现驾驶风格个性化定制,通过强化学习模拟车主驾驶习惯[26] - 法律政策被视为L4落地核心制约因素,公司参与相关法规讨论[7]
智源研究院具身智能大模型研究员岗位开放了 ,社招、校招、实习都可!
自动驾驶之心· 2025-08-01 15:05
招聘信息 - 智源研究院开放具身智能大模型研究员岗位 招聘形式包括社招、校招和实习 [1] - 岗位职责包括具身智能大模型研究开发、模型架构设计优化、前沿技术调研及应用探索 [4] - 要求计算机相关领域硕士学历 精通Python和深度学习框架 具备大模型研究及机器人控制经验 [4] 求职社区资源 - AutoRobo知识星球聚焦自动驾驶/具身智能求职 成员近1000人 涵盖多家头部企业员工及应届生 [6] - 社区提供面试题库、行业研报、谈薪技巧、内推资源及简历优化服务 [6][7][9][15][19][24] - 汇总自动驾驶/具身智能领域100问 涵盖传感器融合、标定、部署等核心技术点 [10][11][12] 行业研究资料 - 社区收录具身智能/机器人领域深度研报 包括技术路线、市场机遇及产业链分析 [15][16][17] - 重点报告涵盖中国具身智能创投、人形机器人量产硬件等方向 [16][17] 面试经验分享 - 整理多企业面经 包括滴滴、英伟达、小米汽车等算法岗及产品岗实战案例 [21][25] - 提供面试技能树梳理、转行经验及面试官建议等宏观指导 [26] - 汇总HR面常见问题及谈薪关键技巧 [24][30] 企业校招动态 - 字节跳动启动2026校招计划 覆盖大模型算法、多模态等方向 工作地含北京/上海/深圳 [8] - 开放实习岗位包括PyTorch框架研发、C++开发等技术岗 [8]
中国科技如何将童年幻想照进现实?
21世纪经济报道· 2025-07-29 16:00
核心观点 - 中国科技正将科幻想象转化为现实 自动驾驶赛车 人形机器人 无人机等技术快速发展 [1] - 2025世界人工智能大会展出3000余款前沿科技产品 创历届规模之最 [1] - 机器人 低空经济 自动驾驶 大模型等领域展现显著技术进步和商业化潜力 [1][6][8][11] 机器人领域 - 机器人运动控制技术实现较大进步 从简单行走转向复杂高动态动作和精细操作 [2] - 大模型深度融入机器人终端 智能体负责思考和规划 小脑负责执行具体规则 [2] - 星动纪元机器人展示分拣包裹等精细操作 傅利叶GR-2机器人在3000家医院提供康复训练 [2] - 具身智能上升至国家战略高度 机器人逐步承担重复性 高风险 低技能岗位工作 [3] - 人形机器人投资进入新阶段 重点关注运动相关零部件和整机体验 [3][4] - 智元 宇树等机器人企业上市将激发市场投资热情 当前正值量产机遇期 [4] 低空经济 - 低空经济以无人机 eVTOL为载体 开展物流运输 载人交通等多元化经济活动 [6] - 时的科技E20倾转旋翼国产5座载人电动飞机 最大航程200公里 巡航速度260公里/小时 [6] - eVTOL商业化面临安全性技术 经济模型可行性等障碍 应用场景主要集中在景区 [6] - 无人机已广泛应用于农业 公安 测绘等领域 覆盖范围达3-5公里 最具商业化潜力 [7] - 低空经济发展路径为"先载货 后载人" "先隔离 后融合" "先远郊 后城区" [7] - 超过30多个省市出台文件支持低空经济 制造端市场空间更大 涵盖整机制造和关键环节 [7] 自动驾驶 - 上海进入Robotaxi商业化运营阶段 发放新一批智能网联汽车示范运营证 [8] - Robotaxi商业化核心瓶颈在于法规层面 事故责任归属尚未统一规定 [9] - 当前Robotaxi改装成本高达百万级别 限制车队快速扩张 [9] - 自动驾驶依赖高精度地图 目前仅限北上广深等大城市 [9] - 国产车规级芯片打破外资垄断 降低成本并提高算力利用率 [9] - VLA大模型引入加强人机互动 可通过语音指令控制车辆 [10] - 预控制器在自动驾驶硬件市场中价值量最高 规模接近1000亿元 [10] - 算法和芯片技术壁垒高 战略意义重大 蕴含较高投资潜力 [10] 大模型 - 国内与海外尖端模型差距正在缩小 大模型企业路线出现分化 [12] - 通用大模型未来可能由巨头主导 成本和人才积累构成高门槛 [12] - 2025年成为"智能体元年" 具备深度思考 自主规划与决策执行能力的AI智能体引领发展 [13] - 简单智能体已进入商业化应用阶段 如OpenAI的Operator可自主操作网页完成任务 [13] - AI硬件投资前置 模型迭代初期需要大量GPU和相关网络设备投入 [14] - 随着模型能力提升 智能体及更深层次应用将爆发 海外进展略快于国内 [14]
独家丨一汽与卓驭正在商讨战略投资事宜
晚点Auto· 2025-07-18 11:08
交易动态 - 卓驭科技与中国一汽正在商讨战略投资事宜 交易金额超8亿美元(约合人民币60亿元) 投后估值逾百亿元 [2] - 本轮投资除中国一汽外 还有其他车企和产业资金参与 [2] - 交易完成后卓驭将保持业务和管理团队独立 一汽未实现控股或并表 [1][2] 股东与客户 - 卓驭目前已获得至少4家车企投资 包括比亚迪、上汽、北汽 均为其合作客户 [4] - 其他公开客户包括大众、奇瑞、东风、长城、奥迪 [4] - 公司由大疆孵化 与大疆均为重要股东 [2][4] 技术方案 - 拥有软硬件一体化研发基因 专注有限算力和成本条件下的辅助驾驶功能覆盖 [4] - 2022年在10万元级宝骏KiWi EV车型实现首套量产辅助驾驶方案 采用双目视觉与低算力平台 [4] - 2023-2024年在10万级车型实现无图高速领航与城市记忆领航 [4] - 产品线覆盖低中高三档算力平台 新增带激光雷达的"激目"系统方案 [4] - 提供从7V+32TOPS到激目+高算力(400~1000TOPS)的多级别方案 [4] - 开发基于高通8775P平台的舱驾一体方案 [4] 市场竞争 - 行业从技术试验加速转向规模化商用 智能驾驶成为重要购车影响因素 [5] - 2024年4月发布基于英伟达Thor平台的VLA大模型 参与新一轮技术竞争 [5] - 针对Thor平台开发的供应商较少 最先量产者将占据先发优势 [5] - 公司提供多样化合作模式 可交付软硬一体/部分软硬一体/纯软件等方案 [5] 运营发展 - 新一轮融资将增强资金储备 支持新技术开发投入 [5] - 2024年重点建设销售与商务能力 引入博世与华为背景的销售负责人 [5] - 重整销售体系以更灵活应对行业变化 [5]