端到端模型

搜索文档
VLA:何时大规模落地
中国汽车报网· 2025-08-13 09:33
VLA技术发展现状 - 理想i8成为首款搭载VLA司机大模型的车型,主打"像家人一样懂你"的辅助驾驶体验 [2] - 博世认为VLA短期难以落地,坚持投入一段式端到端技术,因多模态对齐和数据训练困难 [2] - 行业对VLA落地时间存在分歧,乐观预测2025年为元年,保守估计需3-5年技术成熟 [2][12][13] 技术路线对比 - 模块化端到端保留部分人工设计接口,存在感知与决策衔接难题 [2] - 一段式端到端采用全局优化模型,特斯拉FSD V12代码量从30万行缩减至2000行 [4] - VLA通过思维链实现可解释性决策,在潮汐车道等复杂场景表现优于传统端到端 [4][5] - VLA单日可完成30万公里仿真测试,显著降低实车数据依赖 [5] 技术演进路径 - 行业主流从端到端+VLM双系统转向VLA原生融合架构 [6] - 端到端+VLM需同步处理TB级视频流与百亿参数模型,车载算力紧张 [6] - VLA通过对比学习实现多模态特征对齐,仿真复现率达99.9% [7] - 理想汽车通过端到端+VLM升级至VLA架构,实现空间理解等四大能力 [5] 算力与芯片挑战 - 当前智驾芯片算力不足,英伟达Orin(254TOPS)不支持语言模型直接运行 [9] - 英伟达Thor芯片实际算力缩水,基础版仅300TOPS [9] - VLA低速自动驾驶需10赫兹运行频率,高速需20赫兹 [9] - 车企加速自研芯片:理想马赫100计划2026量产,特斯拉AI 5算力或达2500TOPS [11] 落地时间表 - 短期(2025-2026):特定场景如高速路/封闭园区应用 [14] - 中期(2027-2029):算力达2000TOPS时覆盖城市全场景,接管率或低于0.01次/公里 [14] - 长期(2030年后):光计算架构+脑机接口实现类人直觉决策 [14] - 需突破多模态对齐、训练效率、芯片能效比等关键技术 [14]
「智驾」人才争夺战:帮新员工支付前司百万竞业赔偿
36氪· 2025-05-23 21:58
车企AI辅助驾驶人才争夺战 - 行业核心人才遭哄抢,理想、华为、Momenta成为被挖角最严重的公司,理想核心人员每人接到20+猎头电话[3][4][6] - 竞业协议诉讼频发,理想起诉跳槽员工案例涉及千万元赔偿,南方车企员工赔付超百万元[4][5] - 技术保密手段升级,理想要求VLA项目员工签署保密协议,离职需脱敏6个月;华为采取类似措施[12][14] 技术路线演进与竞争格局 - 技术路径从规则方案转向端到端模型,VLM/VLA多模态大模型成为新方向[6][9][24] - 头部企业技术布局: - 理想尝试4种技术路线(城市NOA/轻地图/端到端+VLM/VLA),与清华合作开发双系统方案[9][25] - 小鹏采用"世界基座模型"训练方式[10] - 华为乾崑智驾装机量突破50万,Momenta方案搭载量近30万辆[10] - 特斯拉停止公开FSD技术细节后,国内企业进入自主探索阶段[8][23] 车企人才战略与市场动态 - 传统车企加速布局: - 比亚迪推出5.58万元级辅助驾驶车型,下半年计划推出自研城市NOA[11] - 比亚迪技术院高层亲自招揽新势力背景人才,团队已吸纳多名竞品员工[11] - 小米引进Wayve科学家陈龙,强化辅助驾驶团队[11] - 人才流动双向性: - 理想曾为关键人才支付数百万竞业赔偿[12] - 端到端技术导致理想精简团队,部分人才外溢[12] 行业技术挑战与发展趋势 - 当前技术局限性: - 端到端方案存在场景泛化难题[23] - VLA模型面临人才稀缺、数据获取、问题定义等量产挑战[25] - 未来技术重点: - 生成式AI世界模型仿真器[25] - 强化学习在规控/仿真领域应用[25] - Momenta已率先在预测/规控环节应用AI模型和强化学习[26] 行业生态与潜在问题 - 技术泄露现象严重,存在代码被员工携带跳槽或出售的情况[18] - 部分企业通过"白盒"获取供应商代码进行拼凑开发,与头部"好用"方案存在差距[19][20] - 行业面临工程化能力与AI不确定性的双重挑战,需原创性思考突破技术迷雾[23][26]
VLA是特斯拉V13的对手吗?
36氪· 2025-04-08 19:05
特斯拉FSD入华表现 - 特斯拉FSD在2月底进入中国市场,引发国内智驾企业高度关注[1] - 3月表现呈现两极分化:在上海陆家嘴误将公交车道当超车道狂飙,在广州塔误判施工警示牌为广告牌急刹,但在常规驾驶中展现出老司机水准,能准确避让非机动车并完成复杂动作[2] - 割裂表现源于特斯拉强大的底层AI技术支撑常规场景的丝滑体验,但端到端模型缺乏中国数据训练,无法理解特殊路况规则[4] 技术差异与行业焦虑 - 特斯拉FSD采用端到端模型,虽避免信息损耗但无法理解中国特殊路况[4] - 行业担忧特斯拉一旦补齐中国数据短板将形成强大竞争优势[5] - FSD V13被博世中国区总裁和元戎启行CEO评价为领先国内高阶智驾系统一个代差[9] VLA技术解决方案 - VLA模型融合视觉、语言和动作,通过摄像头+激光雷达收集信息,大语言模型分析路况,实现类人思维链[8] - 相比端到端模型的"看图说话",VLA实现"阅读理解"能力,能理解交通标志、行人意图及特殊车道规则[8][9] - 元戎启行CEO周光认为VLA是通向L5自动驾驶的转折点,构建了时空统一的认知框架[12] 国内VLA布局现状 - 理想采用MindVLA技术,决策准确率领先但需同时维护两套系统,研发成本高企[18] - 奇瑞联合华为、英伟达开发猎鹰智驾,计划2027年落地但世界模型预测能力尚未达标[18] - 吉利推出"千里浩瀚"系统,采用全域AI+天地一体策略[19] - 元戎启行已进入VLA量产阶段,预计年中上路,在技术迭代节奏上领先行业2-3年[19] 行业竞争格局 - 智能驾驶竞争焦点从工程化能力转向AI模型底层能力[25] - 元戎启行通过与高通合作实现多芯片平台适配,展现第三方方案优势[23] - 行业面临技术迭代窗口期挑战,后发者可能错失黄金发展时机[23] - 2023年特斯拉FSD BetaV12转向端到端架构曾颠覆行业认知,未满血版V13进入中国再次引发行业震动[24]