开源又赢闭源,商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步
商汤商汤(HK:00020) 36氪·2025-11-11 16:45

产品发布与性能表现 - 商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个参数版本 [1] - SenseNova-SI-8B模型在四大核心基准测试(VSI-Bench、MMSI-Bench、MindCube-Tiny、ViewSpatial)中获得60.99的平均成绩,大幅领先同级别开源及专注空间理解的模型,如Qwen3-VL-8B(40.16)和SpatialMLLM(35.05)[1] - 在8B参数规模下,该模型平均成绩已领先闭源模型GPT-5(49.68)与Gemini-2.5-Pro(48.81)[2] 技术突破与训练方法 - 性能提升得益于系统性的训练机制设计,公司研究团队构建了“空间能力分类体系”并扩充空间理解数据规模 [2] - 首次在空间智能领域验证了“尺度效应”,即随着数据量与质量的增长,模型的空间认知能力同步增强 [5] - 该训练方法具备通用性,能支持多种基座模型进行空间能力的增强迁移 [5] 具体能力对比与优势 - 在六道典型空间智能题目测试中,SenseNova-SI-8B全部答对,而GPT-5在俯视图判断、相对方位判断等题目上均出现误判 [6][8][10][12][15][16] - 测试题目覆盖空间智能多个关键维度,包括视角转换、物体方位与移动方向推理等,显示该模型在空间理解与推理上表现更稳定 [18] 战略整合与行业应用 - SenseNova-SI作为空间能力组件,将接入公司今年7月发布的“悟能”具身智能平台,补强模型在三维结构认知方面的基础能力 [19] - 公司同步开源了空间智能测评平台EASI,旨在统一测评口径、展示模型进展和推动开源生态合作 [19] - 空间智能是支撑具身智能与世界模型发展的核心能力,将为自动驾驶、机器人等落地应用提供更坚实的基础 [24]