3D高斯泼溅技术突破与Aholo Viewer发布 - 3D高斯泼溅技术首次实现了“随手拍、即时重建、实时漫游”三维场景的可能,但此前在普通浏览器中流畅观看存在障碍[1] - 2024年4月,李飞飞领衔的World Labs开源了3D高斯渲染引擎Spark 2.0[1] - 群核科技的空间智能平台Aholo随后开源了3D高斯浏览器Aholo Viewer,在渲染速度和大场景加载性能上超越了Spark 2.0[1] - Aholo Viewer能让任何设备的浏览器流畅运行包含10亿+粒子的超大3D场景[1] Aholo Viewer的技术优势与性能表现 - 在性能上,对于一个3亿高斯点的场景,桌面端Aholo Viewer的内存占用仅为Spark 2.0的一半,加载速度快1倍,渲染速度快3倍[7] - Aholo Viewer最高可流畅加载10亿高斯点的场景,是Spark 2.0上限(1亿高斯点)的10倍[7] - 技术路线上,Aholo Viewer选用Chunk-based LOD Tree方案,而Spark 2.0选用Splat-based LOD Tree方案[8][9] - Chunk-based方案的优势在于内存与显存开销更可控,且未来扩展到城市级等超大场景的可扩展性更强[11] - 通过多精度数据结构、缓存预计算、Morton Sort等一系列优化,最终实现了内存减半、加载快1倍、渲染快3倍、容量上限大10倍的效果[11] - Aholo Viewer在格式上兼容主流3DGS格式,并提供完整的工具支持,包括数据格式转换、3D高斯碰撞体生成等[13] 从“能看”到“能用”:3D内容的价值跃迁 - 3D内容普及的障碍在于数据太大(动辄几十GB)导致传输难,以及设备性能门槛高导致加载慢[6] - 3D内容的价值跃迁在于从“展示媒介”变为“生产力工具”,即3D数据可以被编辑、调用、嵌入工作流并被下游系统消费[16] - 与李飞飞团队侧重于通过AI生成虚拟环境不同,群核科技的Aholo平台更着重于现实世界的重建模拟,关注在物理世界做功,如工业孪生、机器人训练等场景[16] - Aholo平台提供了一整套空间智能API,以解决“3D内容如何被大规模生产和使用”的问题[17] - 平台开放了空间能力API,并持续开放3D高斯数据集,例如曾登顶HuggingFace趋势榜的InteriorGS数据集[18] 空间智能全链路与行业应用 - Aholo平台形成了一个完整的空间智能全链路:空间重建、云端渲染、3D AI模型生成、重建/生成3D世界、编辑3D资产、浏览交互[19] - 在硬件生态上,群核科技与影石创新、禾赛科技等硬件龙头合作,推出空间重建软硬件一体化解决方案,并通过手机端App将3D内容创作能力普及化[20] - 数字文旅是典型应用方向之一,例如通过3DGS重建文物古迹,让访客在浏览器中360度查看与交互[21] - 短剧制作是另一个代表性方向,制作人可通过手机拍摄素材,在Aholo平台快速重建高度逼真的三维“虚拟片场”并进行编辑[28] - 未来,3D内容会像短视频App一样普及,成为下一代互联网的新内容形态[23] 3D内容对AI与互联网发展的战略意义 - 互联网信息载体正经历从文字、图片、视频向可交互、可漫游的3D内容的范式跃迁,3D将成为互联网的基础语言之一[3] - 让AI真正“看懂”三维世界是近年密集投入的方向,目标是构建能理解和预测物理世界的“世界模型”[25] - 通向AGI和构建世界模型的一大瓶颈是3D数据的稀缺,3D内容是对物理世界的数字化复刻,能为AI提供空间结构、物体关系等关键数据,是AI理解真实世界的最短数据路径[26] - Spark和Aholo Viewer的重要性在于让3D内容具备了互联网级分发能力,浏览器是这个数据飞轮的入口[26] - 当3D浏览器普及,更多贴近真实世界的3D数据进入循环,才能推动“更多人看3D,更多3D被生产,更多AI训练数据,更智能的3D模型,更多人看3D”这个飞轮真正转动起来[29] - 3DGS浏览器不仅是前端工程进展,更是通往世界模型的关键入口[30] - 空间智能终将像今天的搜索、地图和短视频一样,成为下一代互联网的基础能力[33]
性能超越李飞飞,他们把10亿高斯点的3D世界装进浏览器
机器之心·2026-05-25 14:34