Workflow
空间智能(Spatial Intelligence)
icon
搜索文档
李飞飞世界模型爆火后,我们实测后发现离「真可用」还很远
深思SenseAI· 2025-11-14 20:40
产品核心功能与技术特点 - World Labs公司发布“世界模型”,可根据单张图片和提示词创建3D世界 [1] - 支持两种使用方式:直接通过提示词生成世界,或上传图片由系统自动生成提示词和世界 [1] - 在初始视角下生成效果颇为亮眼,画面质量和精美程度表现良好 [1][2] 当前技术局限与性能瓶颈 - 空间范围扩展后质量快速下降,远离起始区域后场景出现模糊、扭曲、拉伸等失真现象 [3] - 现实输入与生成空间之间存在明显质量断层,从图像视角稍作移动后质量显著降低 [4] - 世界越大细节越稀疏,难以维持足够的密度和几何连续性,大范围探索时沉浸感不足 [5] - “世界延展”功能存在严重几何扭曲与纹理拉伸,画面偏向高度抽象化 [6] - 多图生成功能运行效率低下,实测中任务运行两个多小时仍停留在初始loading状态 [8] 用户实际体验反馈 - 多图合成功能经常长时间卡在生成中,在Reddit和小红书等平台被用户反馈“形同摆设” [8][12][14] - 官网展示的游戏项目效果与普通用户实际使用体验存在明显落差 [17] - 对于不具备专业背景的个人用户而言,产品能力的可享受程度有限 [17] 行业定位与发展前景 - 该产品被视为AI生成游戏与虚拟空间的早期雏形,技术概念前沿但距离成熟应用尚有距离 [19] - 在技术路径上为虚拟世界构建、机器人仿真、数字孪生等应用打开了新的想象空间 [19] - 作为标志性起点,展示了下一代空间计算与内容生产工具的轮廓 [19]
主打空间智能!“AI教母”李飞飞发布首款商用世界模型
华尔街见闻· 2025-11-13 14:21
产品发布与核心功能 - World Labs公司正式发布首款商业产品Marble,该产品由多模态世界模型驱动,能够利用文本、照片、视频或3D布局等多种输入形式生成可编辑和下载的3D交互环境 [1] - 与限量预览版相比,正式版Marble支持更大规模的多模态输入,并推出了名为Marble Labs的创意中心 [4] - 产品核心差异化在于能生成持久化、可供下载的3D环境,显著减少场景变形和不一致性,并允许用户将成果导出为高斯泼溅、网格或视频等专业格式 [6] - 产品强调创意控制,输入端支持上传多张图片或短视频以生成更逼真的数字孪生体,编辑端推出了名为"Chisel"的实验性3D编辑器,允许用户先搭建粗略空间结构再通过文本提示填充视觉风格 [8][13] 商业模式与市场定位 - 产品采用免费增值与付费订阅结合的模式,订阅方案分四档:免费版(每月4次生成)、标准版(20美元/月)、专业版(35美元/月)和旗舰版(95美元/月,含75次生成及商业使用权) [11] - 短期目标市场锁定在游戏开发、影视特效(VFX)和虚拟现实(VR)三大行业,为创作者提供资产生成工具 [4][14] - 该产品是世界中模型赛道首个投入商业应用的产品,相较于谷歌的Genie模型(仍处于研究预览阶段)及其他初创公司的免费演示版,取得了先发优势 [6] 公司背景与战略愿景 - 公司由斯坦福大学教授李飞飞联合创办,自2024年创立以来已完成约2.3亿美元融资,估值突破10亿美元,投资方包括a16z、英伟达NVentures、AMD Ventures和Intel Capital等 [15] - 产品发布背后的宏大构想是实现"空间智能",即赋予机器理解、导航并与三维世界交互的能力,这被视为实现真正通用人工智能的关键 [12][15] - 具备空间智能的世界模型预计将分阶段变革行业:短期赋能创意产业,中期推动具身智能机器人发展,长期在科学、医疗和教育等领域引发革命 [17]