文章核心观点 - 自动驾驶与具身智能在技术路径和商业落地上存在根本性差异 自动驾驶旨在解决场景的泛化问题 而具身智能旨在解决行为的泛化问题 [1] - 自动驾驶的商业落地意味着终局 具有研发门槛高、复用性强、场景单一且安全要求极高的特点 [4][5] - 具身智能的商业落地则像大树长出的枝桠 在不同发展阶段都能找到多样化的应用场景 对错误的容忍度更高 商业路径更为灵活 [6] 自动驾驶与具身智能的泛化性差异 - 自动驾驶的核心是解决场景的泛化性 即对当前场景进行全面理解并做出相应决策 例如识别锥桶需要刹车 但识别载有锥桶的工程车则无需刹车 [2] - 自动驾驶技术演进从多段式模块规则 到端到端监督轨迹 再到VLA和世界模型路线 本质都是为了提升对场景信息的理解与监督 [2] - 当前自动驾驶量产(尤其是L2辅助驾驶)的最大困扰仍是场景认知能力不足带来的corner case 例如导航理解错误、奇怪的施工场景、未见的指示牌等 这些认知泛化是技术突破的最后难点 [2] - 具身智能的核心是解决行为的泛化性 聚焦于在特定任务上泛化各种带扰动的状态和行为 例如在倒咖啡任务中应对杯子被碰倒、制作不同咖啡种类、接收者手部位置不同等扰动 [3] - 从Physical Intelligence的PI系列论文看 模型成功率提升最明显的阶段是在单任务专家数据上进行微调 机器人需要足够鲁棒地完成长程任务 [3] 自动驾驶的商业落地特点 - 自动驾驶取代的是单一场景(从A点到B点) 对安全性底线要求极高 例如无人出租车可能有过半代码与安全相关 因此呈现研发门槛高、复用性强的特点 [5] - 行业曾狂热追求L4级别无人驾驶(如无人出租、无人重卡) 但商业铺开时问题频发 例如Cruise因事故频发关闭运营 经历起伏后 Waymo、百度、小马智行等公司的无人出租业务在2024年才逐渐重新铺开 [5] - 特斯拉引领的L2辅助驾驶是重启商业落地的关键 得益于驾驶员接管兜底 其AI路线成功推动了辅助驾驶的商业落地 [5] - 自动驾驶是一个研发门槛极高的技术 其数据闭环、仿真工具链、训练平台等研发工具每个都足以支撑一家独立公司 [5] 具身智能的商业落地特点 - 具身智能在不同发展阶段都能找到商业落地场景 虽然规模远小于自动驾驶 但场景更为多样化 [6] - 基于传统算法的工业机器人已在流水线运行 针对单一服务场景的机器人Demo也已出现 例如Physical Intelligence的博客显示其机械臂已可连续十小时制作咖啡 [6] - 具身智能落地场景的安全限制相对宽松 人们对错误的容忍度远高于自动驾驶 这使得一些公司(如Sunday Robotics)可以更早地专注于应用场景开发 [6]
一个自驾算法工程师的具身智能思考
自动驾驶之心·2026-01-19 11:15