3D世界生成模型
搜索文档
李飞飞3D世界模型公测,网友已经玩疯了
具身智能之心· 2025-11-14 09:02
Marble模型核心特点 - 李飞飞创立的World Lab推出全新3D世界生成模型Marble 开启公测 人人可玩[1][3] - 模型支持通过文本 照片 短视频轻松生成可编辑 可下载的专属3D世界 无需专业团队建模[5] - 生成的世界可长久保存 直接下载 支持多种输入方式包括文本 图像 视频 粗略3D布局等[35] 多模态生成与编辑能力 - 支持通过简短文本提示 单图提示生成3D世界 还能通过多张图片 不同视角图片拼接成统一世界[17] - 内置AI原生世界编辑工具 可进行局部编辑如移除物体 修饰区域 也可彻底改变视觉风格或重构大片区域[21] - 针对专业用户推出原生AI工具Chisel 可直接在3D中塑造Marble世界[23] 导出与兼容性 - 提供两种导出方式:导出为高斯散点(最高保真度呈现)和三角形网格(与行业标准工具兼容)[29] - 3D世界可渲染成视频 导出后视频可进行增强 添加细节 去除瑕疵并融入动态元素[31] - 组合模式能将任意数量世界组合起来 构建更广阔空间[27] 技术发展方向 - 未来重点发力交互性 从静态创造转向动态交互 实现与3D世界内元素的实时互动[36][37] - 模型发展方向与李飞飞提出的空间智能三大核心能力一致:生成 多模态 交互[37][40] - 作为World Lab首款商业世界模型产品 Marble代表了世界模型赛道的加速发展[3][34]
李飞飞3D世界模型公测,网友已经玩疯了
量子位· 2025-11-13 13:38
产品发布与市场反响 - 李飞飞创立的World Lab公司发布全新3D世界生成模型Marble,并开启公测,人人可玩[1][3] - 该模型发布后迅速获得好评,用户使用简单,并在社交媒体引发刷屏现象[7][15] - 模型支持通过文本、照片甚至短视频轻松生成可编辑、可下载的专属3D世界,大幅降低使用门槛[4][35] 核心技术功能与特性 - Marble支持通过简短的文本提示、单图提示生成3D世界,并能通过多张图片、不同视角的图片拼接成统一世界[17] - 模型内置AI原生世界编辑工具,可进行局部编辑(如移除物体、修饰区域)或彻底编辑(如交换物体、改变视觉风格、重构大片区域)[21] - 对于专业用户,团队推出原生AI工具Chisel,可直接在3D中塑造Marble世界[23] - 模型支持对已生成世界进行扩展,为特定区域添加细节,并能将任意数量的世界组合起来构建更广阔空间[25][27] 输出格式与兼容性 - 创建的世界可选择两种方式导出:导出为高斯散点(最高保真度呈现形式)或导出为三角形网格(包含低保真碰撞器网格和高质量网格)[29] - 以网格形式导出能使3D世界与众多行业标准工具兼容,便于融入下游项目[29] - 3D世界可渲染成视频,导出后的视频可进行增强,添加细节、去除瑕疵并融入动态元素[31] 战略方向与行业定位 - 作为World Lab首款商业世界模型产品,Marble的核心在于多模态功能的深度落地,支持文本、图像、视频甚至粗略3D布局等多种输入方式[34][35] - 公司未来将重点发力交互性,目标是从静态创造发展到动态交互,实现与3D世界内元素的实时互动[36][37] - 该产品方向与李飞飞强调的空间智能是AI下一个前沿领域的观点一致,旨在打造具备生成、多模态处理和交互预测能力的真正空间智能世界模型[37]
混元3D世界模型1.0 lite版本发布,消费级显卡就能跑
量子位· 2025-08-15 18:05
腾讯混元3D世界生成模型HunyuanWorld 1.0技术框架 - 核心功能为通过单句或单图输入生成360度全景3D世界,并支持沉浸式漫游[1][3][5] - 技术路径以全景图为桥梁分层实现3D生成,先通过2D技术生成无边界断裂的全景图,再拆分为天空/背景/前景等语义图层并标注深度转化为3D结构[9][11][15][16] - 采用点云缓存与视频扩散技术实现长距离场景无缝漫游,并优化双模式压缩存储以适应VR/游戏开发场景[18] 显存优化技术突破 - 初始版本需26GB显存,通过动态FP8量化技术将显存需求降至17GB以下(减少35%),适配消费级显卡[19][20][25] - SageAttention量化技术将Transformer注意力计算改用INT8,推理速度提升2倍且精度损失<1%[28][29] - Cache算法通过自动化搜参优化冗余时间步,显著提升推理效率[33] - 优化后全景代理生成显存从23.14GB降至13.80GB,世界分层从25.51GB降至16.17GB(4090显卡可运行)[32] 行业对比优势 - 生成质量优于开源竞品:画面清晰度/推理速度(分钟级vs小时级)/3D引擎兼容性/可编辑性全面领先[37][38][39] - 相比谷歌Genie3可生成可编辑3D mesh而非视频,且开源并提供单卡部署量化版本[41] - 技术方案兼容传统CG/3D工业生产管线,支持3DGS方案,实用价值高于闭源demo模型[42] 应用场景与开源生态 - 生成内容可导出为标准3D mesh格式,无缝接入游戏引擎/影视制作/物理仿真等二次创作[6][39] - 已全面开源并部署于GitHub/Hugging Face平台,提供技术报告与在线体验入口[43][44]
腾讯正式发布并开源业界首个的3D世界生成模型
快讯· 2025-07-27 09:55
腾讯AI技术发布 - 腾讯在WAIC期间的腾讯AI论坛上正式发布并开源业界首个3D世界生成模型——混元3D世界模型1.0 [1] - 该模型允许用户通过输入一句话或一张图在几分钟内生成可漫游的3D世界 [1] - 模型能够输出标准化3D资产,大幅缩短生产周期 [1] 腾讯未来技术规划 - 公司透露未来将有大量模型陆续开源 [1] - 即将开源的模型包括端侧混合推理大语言模型和多模态理解模型 [1]