Chisel - 财报，业绩电话会，研报，新闻

Chisel

搜索文档

机器之心· 2026-03-04 17:15

文章核心观点 - AI在空间创作和现实世界任务中需要一种类似“代码”的通用接口，而3D作为一种结构化的表达方式，正扮演着这个角色，它能够被生成、检查、修改、版本管理，并接入模拟与机器人系统[2] - 将3D比作代码，神经图形学比作编程语言，模拟引擎比作芯片，共同构成一个支持可编程、数据驱动空间系统的新架构栈，以实现人、智能体与软件之间的可靠沟通与协作[9][11][13][23] 3D作为通用接口的类比与优势 - 3D与代码在作为接口上具有关键的结构相似性，都能将状态外化为其他系统可用的结构化构件，从而实现推理、表示和执行的分离[3][6] - 与让大语言模型直接“成为程序”或依赖黑盒系统相比，使用结构化的3D表示能提供可操作的结构，其输出可被检查、编辑、共享并集成到现有系统中[6][7] - 3D作为接口，对人而言自然且高效，因为人类的思维围绕持久物体构建，3D编辑一次即可自动传播到所有渲染帧，这与代码只需修改一次源代码而非重写每个输出的逻辑一致[19][20] 技术驱动与神经图形学的作用 - 为机器学习优化的现代GPU硬件，拥有庞大的内存，打破了传统3D引擎在内存和计算上的限制，使得NeRF和高斯泼溅等消耗大量资源的技术得以实现，支持生成和渲染世界级规模的表示[9][10] - 神经图形学在此架构栈中扮演着类似编程语言的角色，提供了一种表现力丰富的媒介，用于描述和生成空间结构[11] - 具体技术应用包括：Marble多模态世界模型可从多种输入创建持久、可导航的3D世界并导出为高斯泼溅、网格或视频；Chisel功能允许通过粗粒度3D布局控制生成细节；RTFM实验从简单输入生成复杂视觉效果；Spark则是集成WebGL的高性能高斯泼溅渲染器[25] 模拟引擎与系统架构的重要性 - 模拟引擎是运行“3D代码”的“芯片”，它解决状态管理、物理机制、碰撞检测等系统问题，使世界模型在时间维度上实现交互、持久性和动态变化[13][14] - 完全端到端的“像素化”方法将状态、动态和渲染纠缠在单一网络中，虽然方便，但会削弱物理一致性、可回放性和确定性的保证[14] - 更可行的方案是采用因式分解或混合运行时架构，让学习到的世界模型生成结构化3D表示，同时利用外部工具和引擎组件，在感知、生成组件与需要严格规则的组件之间保持区分[15][16] 3D作为人机与机机接口的价值 - 对于机器，3D是自然通用语，能使世界模型输出直接接入现有的模拟器、机器人软件栈、CAD等工具链，并促进机器间高效交流空间意图[17][18] - 结构化的3D输出使得空间意图（如目标区域、禁区标记）能够被清晰传达，这比共享隐向量或使用低效的语言格式更为可靠[18] - 3D表示的可导出能力至关重要，它将模型的“思想”外化为具体表示，使其成为可检查、验证、版本控制、测试和重用的构件，从而支持可组合的流水线[18]

李飞飞世界模型公司一年估值暴涨5倍！正洽谈新一轮5亿美元融资

量子位· 2026-01-25 14:00

World Labs新一轮融资与估值跃升 - 公司正在以约50亿美元估值进行新一轮融资，融资规模最高可达5亿美元[1] - 若融资完成，公司估值将从2024年的10亿美元跃升至50亿美元，实现一年多时间5倍重估[2] - 此前公司已完成累计2.3亿美元融资，估值达到10亿美元[2] - 公司成立于2024年4月，当月完成首轮融资，估值约2亿美元[2] 公司历史融资与投资方 - 首轮投资方包括Andreessen Horowitz（a16z）和加拿大投资机构Radical Ventures[5] - 2024年6–7月，公司完成一轮1亿美元融资，由NEA领投，估值被抬升至超过10亿美元[5] - 历史投资方还包括英伟达、沙特阿拉伯的Sanabil Investments、新加坡主权基金淡马锡[5] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton[6] 公司核心业务：世界模型 - 公司正在研发能够在三维世界中进行导航和决策的AI系统，构建“大世界模型”[8] - 目标并非“生成一张好看的图”，而是让模型真正理解真实物理世界的结构与演化方式[9] - 世界模型被视为继大语言模型之后，AI下一个十年的核心主线，是一种“基础设施型能力”[16][17] 产品与技术：Marble与World API - 公司于去年11月推出首款3D世界生成模型Marble[10] - Marble可以根据文本或图像提示，直接生成可探索的3D世界[12] - 技术采用3D高斯溅射，用数以百万计的半透明点表示场景结构，在保持较高渲染效率的同时实现更细腻的视觉效果[14] - Marble同时输出“碰撞网格”，专门用于物理仿真和机器人模拟[15] - 提供Chisel工具，用户可先用简单几何体快速搭建骨架，再生成不同风格的细节版本[15] - 公司近期开放了World API，开发者可通过文本、图像或视频直接生成可探索的3D世界[15] 世界模型的应用前景与能力框架 - 真正具备空间智能的世界模型需要三种能力：生成、多模态、交互[22] - 生成能力指能创造遵守物理定律、空间一致的世界[22] - 多模态能力指能处理从图像、视频到动作的多模态输入[22] - 交互能力指能预测世界随时间演变或互动的状态[22] - 应用方向包括AIGC（如3D资产生成、游戏世界构建、影视制作）和具身智能（如机器人、仿真环境）[22] - 以具身智能为例，世界模型提供对环境的可预测表示，是叠加有效决策与控制的基础[18] 行业竞争格局与技术路线 - 前Meta首席科学家Yann LeCun创办的AMI Labs传闻融资估值可能达到35亿美元[20] - LeCun的路线更偏向“内在认知”，采用隐式世界模型，基于JEPA在抽象的潜在空间中预测世界演化，而非还原每一个像素[21] - 世界模型技术版图大致分三层：可观看、可编辑的世界界面（如Marble）；可反复试错的模拟器（如谷歌DeepMind的Genie 3）；以状态与预测为核心的认知世界模型（如LeCun的JEPA路线）[27][24] - 资本押注的是对不同世界模型技术路径的提前下注[24]

世界模型

空间智能

大语言模型（LLM）

Artificial Intelligence

Artificial Intelligence

Marble

Chisel

李飞飞的World Labs联手光轮智能，具身智能进入评测驱动时代！

量子位· 2026-01-19 11:48

文章核心观点 - 具身智能行业正面临模型进步速度远超评测能力的瓶颈，规模化评测成为关键制约因素[18][20][22][23] - 为解决此问题，行业两大关键基础设施公司——李飞飞旗下的世界模型公司World Labs与仿真合成数据公司光轮智能宣布合作，标志着具身智能正式迈入“评测驱动时代”[1][2][76] - 双方合作基于“数字表亲”理念，分工明确：World Labs的Marble产品解决高保真3D环境生成的规模问题，光轮智能则提供与真实物理对齐的资产及评测闭环，共同构建可规模化运行的仿真评测系统[3][45][49][51] World Labs（世界模型公司）分析 - 公司由AI领域权威人物李飞飞创立，成立仅两年已融资数亿美元，股东包括Andreessen Horowitz、英伟达、Databricks、Adobe等顶级风投与AI生态公司[4][5][17] - 公司选择“空间智能”作为AGI发展路线，旨在构建能感知、生成、推理并与环境互动的世界模型，以突破大语言模型的智能天花板[6][7] - 核心产品Marble是一款可视化世界模型，仅需一句话、一张图片或一段视频等轻量输入，即可生成高保真、持久、可下载的3D环境，支持导出多种格式，并内置AI世界编辑器Chisel[8][9][11][12][14] - Marble主要服务于视觉特效、游戏开发等领域，实现了“一句提示→生成3D世界→一键导出至Unity”的生产力链路，但其生成的世界缺乏物理参数，需与物理引擎结合才能用于机器人训练与评测[15][16][36] 光轮智能（仿真合成数据公司）分析 - 公司是当前最炙手可热的具身智能基建公司，与英伟达关系紧密，深度参与其仿真系统底层共建，是Newton物理引擎的早期验证者和开发合作者[54][55] - 公司在仿真合成数据市场占有率极高，服务了全球前三的世界模型公司，国际主要具身团队的仿真资产和合成数据80%以上来自光轮智能[58][59] - 公司构建了三位一体的自研仿真技术体系：1）自研GPU物理求解器，支持百万级自由度并行计算；2）全自动虚实对标物理测量工厂；3）将真实物理特性规模化映射为SimReady资产与场景[52] - 基于其基础设施地位，公司推出了工业级仿真评测平台RoboFinals，并与英伟达联合打造了开源仿真评测框架Isaac Lab Arena，致力于成为行业评测标准[63][64] 行业瓶颈与解决方案 - 具身智能模型迭代速度极快（几乎每隔一两周），现有学术基准已无法准确评估其能力，行业缺乏有效的规模化评测手段[20][22][23] - 在真实物理环境中测试机器人成本高昂、难以规模化，且存在安全风险，仿真被视作规模化评测具身智能的唯一可行路径[24][27][28][29] - 李飞飞提出的数据金字塔框架中，仿真合成数据被视为最具可扩展性的主干数据形态，是解决数据与评测这一根本约束的关键[31][32][35] - 传统追求“数字孪生”（一比一复刻真实世界）的仿真方式成本极高、无法规模化，行业转向“数字表亲”理念，即追求物理与空间结构可信，细节允许近似[42][43][44][45][46] World Labs与光轮智能的合作细节 - 合作本质是“世界模型×仿真基础设施”的历史性交汇：World Labs解决“世界从哪来”，光轮智能解决“进步怎么被衡量”[3] - 分工明确：Marble负责将环境创建时间从数周压缩到数分钟，解决环境生成的规模问题；光轮智能则承担仿真中最难的部分——提供与真实物理对齐的资产及构建评测闭环[47][49] - 合作旨在构建一个世界、行为、评测高度耦合的闭环系统，使仿真成为一个可重复运行、可持续扩展的数据生产系统，让规模化评测第一次真正成为可能[50][51] - 此次合作有深厚的学术渊源，李飞飞在斯坦福时期推动的BEHAVIOR系列研究及其2025年的BEHAVIOR Challenge，早已为具身智能建立长期、可扩展的评测工程奠定基础[38][40][41] 评测驱动时代的行业意义 - 随着众多大模型公司、机器人本体公司及行业巨头涌入，具身智能路线高度分叉，行业亟需能指引方向的“路标”或“北极星”[65][67][68][69][70] - 好的评测不仅能评估模型能力，更能提前发现技术瓶颈、反向塑造研究方向，是具身智能发展中必须与模型同步扩展的系统级能力[71][72] - 作为仿真与评测基础设施提供商，光轮智能处在所有技术路线之上而非其中，这使其最适合承担客观的行业评测角色[73][74] - World Labs与光轮智能两大关键基建的联手，串联起从环境生成到物理仿真再到规模化评测的全链条，有望推动具身智能行业进入以评测为驱动的新发展阶段[75][76]

具身智能之心· 2025-11-14 09:02

Marble模型核心特点 - 李飞飞创立的World Lab推出全新3D世界生成模型Marble 开启公测人人可玩[1][3] - 模型支持通过文本照片短视频轻松生成可编辑可下载的专属3D世界无需专业团队建模[5] - 生成的世界可长久保存直接下载支持多种输入方式包括文本图像视频粗略3D布局等[35] 多模态生成与编辑能力 - 支持通过简短文本提示单图提示生成3D世界还能通过多张图片不同视角图片拼接成统一世界[17] - 内置AI原生世界编辑工具可进行局部编辑如移除物体修饰区域也可彻底改变视觉风格或重构大片区域[21] - 针对专业用户推出原生AI工具Chisel 可直接在3D中塑造Marble世界[23] 导出与兼容性 - 提供两种导出方式：导出为高斯散点（最高保真度呈现）和三角形网格（与行业标准工具兼容）[29] - 3D世界可渲染成视频导出后视频可进行增强添加细节去除瑕疵并融入动态元素[31] - 组合模式能将任意数量世界组合起来构建更广阔空间[27] 技术发展方向 - 未来重点发力交互性从静态创造转向动态交互实现与3D世界内元素的实时互动[36][37] - 模型发展方向与李飞飞提出的空间智能三大核心能力一致：生成多模态交互[37][40] - 作为World Lab首款商业世界模型产品 Marble代表了世界模型赛道的加速发展[3][34]

李飞飞的世界模型来了，一句话生成3D世界，AI 真的开始理解现实了

36氪· 2025-11-13 19:42

产品发布与核心能力 - 斯坦福教授李飞飞的创业公司World Labs正式推出首款世界模型产品Marble，这是该方向首次以可用产品形式出现 [1] - Marble具备多模态生成能力，可根据一张图片、一段视频或一句文字提示，重建出结构完整、细节丰富的3D世界 [1] - 产品拥有AI原生的世界编辑能力，允许用户对生成的世界进行局部替换、材质变化、光照调整或布局重构 [1] - 支持将生成的世界导出为高斯溅射、三角网格或视频格式，可直接接入Unreal、Unity、Blender等主流创作工具 [1] 技术特点与工作流程 - 支持从文本提示生成3D世界，系统能自动提取关键元素并在几秒钟内生成可漫游的三维空间 [7] - 支持单图生成，能根据照片的透视关系、光线方向和物体摆放方式，将场景自动补齐成可漫游的3D世界 [9] - 提供Chisel工具，允许进阶创作者先搭建粗略的3D框架，再通过文本提示控制最终呈现的风格与氛围 [11] - 将空间逻辑与视觉风格明确区分，同一三维框架可衍生出完全不同的世界 [12] 编辑与扩展功能 - 产品允许用户像处理真实场景一样对生成的三维世界进行删除物体、替换材质、改变光线等调整 [13] - 用户可对初始世界的任意区域进行扩展，系统会根据已有场景逻辑推演并补全环境细节 [13] - 提供“组合模式”，允许将多个独立生成的世界像拼接地图一样组合，以构建规模庞大、层次丰富的虚拟环境 [14] 行业应用与集成 - 支持将场景导出为高斯粒子渲染和三角网格等通用格式，可无缝进入Blender、Maya、Unity、Unreal等主流制作工具 [15][17] - 导出的高质量网格适合用于游戏关卡、动画镜头或建筑展示，碰撞网格则用于物理模拟和机器人路径规划 [16][17] - 支持将整个世界直接渲染成视频，并可进行增强处理，自动补上细腻细节并加入动态效果 [18] 战略意义与未来展望 - Marble的发布象征着空间智能时代的正式开场，其意义远不止让3D创作更方便，而是迈向创造真正具有空间智能的世界模型的第一步 [1][2] - 产品让外界首次清晰感受到AI有可能从理解图像和语言，迈向理解并操控一个由结构、物理与动态规律构成的完整世界 [3] - 未来应用方向包括帮助机器人理解现实环境，以及在科学研究中用于虚拟实验和预测结果 [2][27] - 世界模型需具备生成性、多模态性和交互性三种核心能力，其技术门槛远高于语言模型 [22][23][24][25][26]

世界模型

空间智能

Artificial Intelligence

Artificial Intelligence

量子位· 2025-11-13 13:38

产品发布与市场反响 - 李飞飞创立的World Lab公司发布全新3D世界生成模型Marble，并开启公测，人人可玩[1][3] - 该模型发布后迅速获得好评，用户使用简单，并在社交媒体引发刷屏现象[7][15] - 模型支持通过文本、照片甚至短视频轻松生成可编辑、可下载的专属3D世界，大幅降低使用门槛[4][35] 核心技术功能与特性 - Marble支持通过简短的文本提示、单图提示生成3D世界，并能通过多张图片、不同视角的图片拼接成统一世界[17] - 模型内置AI原生世界编辑工具，可进行局部编辑（如移除物体、修饰区域）或彻底编辑（如交换物体、改变视觉风格、重构大片区域）[21] - 对于专业用户，团队推出原生AI工具Chisel，可直接在3D中塑造Marble世界[23] - 模型支持对已生成世界进行扩展，为特定区域添加细节，并能将任意数量的世界组合起来构建更广阔空间[25][27] 输出格式与兼容性 - 创建的世界可选择两种方式导出：导出为高斯散点（最高保真度呈现形式）或导出为三角形网格（包含低保真碰撞器网格和高质量网格）[29] - 以网格形式导出能使3D世界与众多行业标准工具兼容，便于融入下游项目[29] - 3D世界可渲染成视频，导出后的视频可进行增强，添加细节、去除瑕疵并融入动态元素[31] 战略方向与行业定位 - 作为World Lab首款商业世界模型产品，Marble的核心在于多模态功能的深度落地，支持文本、图像、视频甚至粗略3D布局等多种输入方式[34][35] - 公司未来将重点发力交互性，目标是从静态创造发展到动态交互，实现与3D世界内元素的实时互动[36][37] - 该产品方向与李飞飞强调的空间智能是AI下一个前沿领域的观点一致，旨在打造具备生成、多模态处理和交互预测能力的真正空间智能世界模型[37]