Workflow
“AI教母”李飞飞发布实时生成式世界模型!一张H100就能运行
第一财经·2025-10-17 12:40

公司技术产品RTFM - 斯坦福大学教授李飞飞的创业公司World Labs发布了实时生成式世界模型RTFM,该模型具有实时、持久运行和保持3D一致性的特点[1][3] - RTFM的设计围绕三个关键原则:效率、可扩展性和持久性,使其能在很小的GPU上运行并随计算资源增加而扩展,且构建的世界是永久的[4] - 该模型是一款基于大规模视频数据端到端训练的自回归扩散Transformer,通过观察训练样本学会了建模3D几何、反射和阴影等特征[4] - 团队设定简单目标,最终开发出可高效部署在单个H100 GPU上的模型,无论交互时长均能保持帧率和世界持久性[5] 技术挑战与行业前景 - 生成式世界模型的算力需求将极其庞大,远超当今大语言模型,若用现有架构生成60帧4K交互视频流每秒需超10万个token,持续一小时交互需处理上下文token超1亿[4] - 以当前计算基础设施看,高算力需求既不可行也不经济,团队相信能平滑扩展的简单方法将主导AI领域,因其能受益于计算成本指数级下降[4] - 行业认为世界模型将带来巨大变革,应用远超游戏领域,可能直接面向内容生产行业如游戏公司或电影制片厂[8] - 空间智能技术被李飞飞视为AI领域真正难题,该技术可赋能创造、设计、学习、AR/VR及机器人等广泛领域[9] 公司融资与发展规划 - 李飞飞于2024年创办World Labs,旨在开发具备空间智能的下一代AI系统,公司在短短几月内完成约2.3亿美元(约合人民币16亿元)融资,估值迅速突破10亿美元(约合70亿元)[8] - 公司投资方阵容强大,包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重要玩家[8] - World Labs致力于构建大型世界模型,计划生成虚拟三维空间供用户控制物理等变量,并允许人们创建自己的三维世界,该技术对艺术家、设计师、开发者和工程师等职业群体具有重要意义[9] - 公司未来规划第一阶段专注于构建对三维性、物理性及空间和时间概念有深入理解的模型,随后将支持增强现实技术和机器人技术等领域[10]