VLA搞到现在，可能还是情绪价值的内容偏多一些......

端到端自动驾驶技术现状 - 学术界端到端研究呈现方法远多于问题的状态，各种流派百花齐放，只要实现传感器输入到轨迹规划输出的模型串联即符合端到端范式 [1] - 工业界端到端研发更加务实，车载算力限制将许多热门模型排除在外，但工业界拥有海量驾驶数据优势 [4] - 工业界对端到端技术的研发进度可能已领先于学术界，行业已超越依靠演示和论文证明实力的阶段，转向以量产模型表现为衡量标准 [5] 数据集与技术迭代关系 - 大模型时代数据集迭代速度需与技术迭代同步，固定数据集会阻碍技术发展，摩尔定律在算力和计算机行业均有体现 [2] - 研究团队通过发布数据集维持长期的高影响力产出，互联网海量文本数据是NLP领域大模型成功的关键因素 [3][4] - 工业界数据量达天文数字，不存在数据阻碍技术迭代的问题，反而更容易辨别学术界方法的实用价值 [4] 强化学习在VLA中的应用 - 强化学习适用于无标准答案但能定义答案特征的问题，VLA应用场景符合此特点 [7] - 模仿学习基于最大似然估计，倾向于将示范结果视为最优，而强化学习通过奖励机制定义正向和负向行为特征 [8][9] - 强化学习以奖励最大化为目标，避免错误示范干扰，节省数据采集成本，例如车辆平稳抵达+10分，压实线-10分，闯红灯-20分 [9] 视觉语言大模型发展前景 - VLA短期成果情绪价值偏多，真实控车作用尚不明确，长期串联万物成为行业共识趋势 [10][11] - 量产参考需综合算法、数据、训练策略等多重因素，包括部署难度、数据替代性、复现难度等非单一测试指标 [12] - 行业主流厂商对Large Vision-Language Model的潜力均无质疑，焦点集中于实现时间预期 [11]