Workflow
群核科技发布空间大模型,旨在解决AI视频空间一致性难题
群核科技群核科技(US:KOOL) 36氪·2025-08-29 12:00

8月25日,在首届技术开放日(TechDay)上,群核科技正式发布了其空间大模型的最新成果:新一代 空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并宣布将延续开源战略,逐步向全球开发者开 放模型。 作为专注于3D室内场景认知与生成的模型体系,群核空间大模型主要围绕真实感全息漫游、结构化可 交互及复杂室内场景处理三个方向构建其技术优势。 本次发布的SpatialLM 1.5是一款基于大语言模型训练的空间语言模型 。群核科技首席科学家周子寒在 技术交流中解释,SpatialLM并非在视觉语言模型(VLM)上增加新模态,而是让大语言模型学会了一 种新的"空间语言"。这种语言能以数字文本的形式,精确描述场景中物体的空间结构、几何信息、相互 关系及物理参数。 通过对话系统SpatialLM-Chat,用户输入简单的文本指令,模型即可自动生成包含物理正确信息的结构 化3D场景脚本,并智能匹配家具进行布局。该模型还能通过自然语言进行场景问答与编辑,例如,在 现场演示中,当输入"去客厅餐桌拿药"指令后,模型不仅理解了物体对象,还调用工具自动规划出行动 路径,展示了其在机器人场景中的应用潜力。 群核 ...