Workflow
特斯拉Ashok ICCV'25讲FSD与QA|952字压缩版/完整图文/完整视频
特斯拉特斯拉(US:TSLA) 理想TOP2·2025-10-23 23:33

952字压缩版: 特斯拉转向单一、大型的端到端神经网络,输入像素和其他传感器数据,直接产生下一个动作控制作为输出 。 不再有显式的感知模块;感知可以是隐式的或作为辅助任务训练 。 转向端到端的原因 : 1.将人类价值观(如驾驶平顺性、风险权衡)编入代码极其困难 。 2.传统感知、预测和规划之间的接口定义糟糕,可能丢失信息 。 3.易于扩展以处理现实世界的长尾问题 。 4.实现同构计算,具有确定性的延迟,这对于实时系统至关重要 。 学习"像素->控制"的主要挑战 : 1.维度灾难 (Curse of dimensionality) 。 2.可解释性和安全保证 (Interpretability and safety guarantees) 。 3.评估 (Evaluation) 。 挑战1 维度灾难的解决: 输入的上下文极长(例如30秒窗口可达20亿token)。 利用庞大的特斯拉车队数据 。 通过复杂的、基于触发器的数据收集(例如用户干预、状态空间大变化、小型NN捕捉特定场景)来挖掘有价值的 corner case 数据,而不是海量的"无 聊"数据 。 车中唯一重要的是控制动作;其他都是辅助性的 。 示例1: ...