腾讯混元世界模型1.5发布 可生成实时交互的3D场景
公司产品发布 - 腾讯混元团队正式发布混元世界模型1.5(WorldPlay)[1] - 模型支持通过文本描述或单张图片生成可实时交互的3D场景[1] - 用户可通过键盘、鼠标或手柄在生成的世界中自由探索[1] 模型技术特性 - 发布版本强调空间记忆能力,当用户在场景中移动并返回先前区域时,模型能保持三维结构的前后一致性[1] - 模型支持以24帧/秒的速率生成720P视频流[1] - 模型可将交互场景导出为3D点云复用[1] 技术开源与细节 - 公司同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架[1] - 技术报告公开了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节[1] 应用场景与体验 - 该模型主要面向AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景[1] - 目前用户可通过官网申请体验[1]