FlashWorld
搜索文档
世界模型可单GPU秒级生成了?腾讯开源FlashWorld,效果惊艳、免费体验
机器之心· 2025-10-30 16:52
技术突破与性能表现 - FlashWorld将三维场景生成速度提升至单卡5-10秒,相比之前方法提速百倍[4] - 生成速度比Marble的快速模式快5倍,且完全通过前端渲染,无需连接后端GPU[6] - 在WorldScore Benchmark中以9秒的最快速度获得最高平均分68.72,优于WonderWorld的66.43分和10秒耗时[23] 技术方法与创新 - 采用基于3D高斯泼溅(3DGS)的技术路线,使结果可在本地网页端实时渲染[8] - 核心创新为通过蒸馏损失将以多视角为中心的教师模型提升以三维为中心的学生模型,兼顾多视角一致性和图像质量[10] - 利用分布匹配蒸馏无需真实数据的特性,使用随机图像、文本和轨迹进行训练,提升模型泛化能力[16] 生成质量与效果 - 支持单张图片或文本输入,生成质量胜过其他同类闭源模型[4] - 能够生成整齐的栅栏和细粒度的毛发细节,这在以往工作中几乎不可能实现[18][21] - 对卡通风格场景具备优秀生成能力,并可在仅RGB监督下自然学习深度信息[24][26] 行业影响与资源获取 - 相关论文在Huggingface Daily Paper榜单位列第一,并获得AI领域多位创始人点赞转发[2] - 作者提供了Huggingface上的免费Demo可供体验,并开源了基于SparkJS的交互式Demo[6][28][29]