Workflow
基于FeedForward GS的世界模型
icon
搜索文档
特斯拉的场景重建值得国内重视,前馈GS才是未来方向......
自动驾驶之心· 2025-11-07 08:05
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 这几天柱哥又仔细看了看特斯拉ICCV的分享, 愈发觉得特斯拉的世界模型有真东西~ 可以肯定,特斯拉是基于FeedForward GS实现的闭环仿真或者说世界模型,下图是特斯拉的算法结构图。输入包含:视觉视频、导航地图、车辆运动学、音频, 输出有全景分割(25年还能看到全景分割真难得)、3D OCC、 3D Gaussian 、语言等其他,这些内容共同Reasoning出Action。 由于使用了FeedForward GS,可以直接从视觉输入建模出3D场景,因此优化的时间也从传统GS的30分钟减少到220ms,也不再依赖点云初始化。下图直观对比了 传统GS和特斯拉生成式GS的差距:在新视角下左侧图像的动态目标非常模糊且伪影很严重,特斯拉的重建出车辆(中间)的车身结构和伪影有很大优化,地面和 两辆白色车辆均有明显的提升,强的可怕! 既然特斯拉已经指明了道路,国内各家新势力相信已经重视起来,相关岗位的需求也会多起来! 该部分视频如下,目前就柱哥了解到的情况,国内还没有哪一家能做到和特斯拉媲美的效果... 3DGS ...