Workflow
群核科技发布两款空间开源模型 将坚持开源共建技术生态

核心产品发布 - 公司发布新一代空间语言模型SpatialLM 1.5和空间生成模型SpatialGen 专注于3D室内场景认知与生成 [1] - SpatialLM 1.5基于大语言模型训练 支持通过对话交互系统实现端到端可交互场景生成 [2] - SpatialGen基于扩散模型架构 可根据文字描述、参考图像和3D空间布局生成多视角图像 [3] 技术突破与应用 - SpatialLM 1.5能输出包含空间结构、物体关系和物理参数的"空间语言" 解决传统大模型对物理世界理解的局限 [2] - 模型生成场景富含物理正确的结构化信息 可快速批量输出多样化场景用于机器人路径规划和避障训练 [2] - SpatialGen生成的多视角图像确保物体在不同镜头下保持准确空间属性和物理关系 支持3D高斯场景渲染和全息漫游视频 [3] - 现场演示显示模型能理解"去客厅餐桌拿药"指令 自动规划机器人最优行动路径 [2] 商业化进展 - 基于SpatialGen的AI视频生成解决方案旨在解决时空一致性难题 计划年内发布全球首款深度融合3D能力的AI视频生成Agent [3] - 公司构建"空间编辑工具-空间合成数据-空间大模型"的智能飞轮 截至6月30日拥有超过4.41亿个3D模型和5亿个结构化3D空间场景 [4] 开源战略 - 两款模型将逐步在HuggingFace、GitHub和魔搭社区等平台面向全球开发者开源 [5] - 公司自2018年启动开源战略 通过开放数据和算法能力推动空间智能技术发展 [4]