理想砍掉BEV与token化直接用OCC稀疏注意力进行4D世界模型预测
理想的解决方案是稀疏占据表征 (Sparse Occupancy Representation)。模型不再生成离散的词,而是直 接在连续的 3D 坐标空间中操作。用稀疏锚点 (Sparse Anchors),配合可学习的特征向量,直接回归预 测几何偏移量 (Geometric Offsets)。将随机初始化的3D点云,通过attention机制去噪 (Denoise)与迭代 精炼(Iteratively Refine),使其精准匹配在物体表面 。避免了对空白区域的无效计算,在提升推理速度 的同时实现了高保真的场景重建。 这是一篇很有水准的工作,真正的think different。 2025年11月27日理想发布SparseWorld-TC: Trajectory-Conditioned Sparse Occupancy World Model Think different的锚点是对三点去结构化,背后的逻辑一致,去掉人为设计的中间拐杖,让数据和算 力直接接管。 1.去量化结构 从离散token到用稀疏锚点回归连续时空表征。 主流的世界模型通常沿用LLM的思路,通过VAE将连续的3D物理世界离散化,压缩成有限 ...