文章核心观点 - 公司正式发布全球首个支持全景图输入、推测空间深度的空间大模型Argus 1.0,其核心路径是“真实复刻”而非“虚构”世界 [2] - 该模型基于公司构建的“数字空间-算法-行业应用”飞轮驱动,其决定性优势在于海量、高精度、高一致性的真实世界数据 [6][41] - Argus 1.0实现了兼容性、实时性与生成质量三大突破,标志着空间智能领域从底层重建走向顶层AIGC应用的新纪元开始 [16][42] Argus 1.0的技术特性 - 兼容性突破:是业界首个且唯一支持全景图作为输入的深度推测大模型,并广泛兼容单张/多张普通照片及AI生成图片 [17][19] - 实时性突破:推理效率达毫秒级,是首个实时的全景图全局重建系统,通过将深度推测和位姿计算融合到一个算法模块,实现全流程无感知响应 [23] - 生成质量突破:得益于独有的高精度、带尺度、像素级对齐的真实数据库,在处理玻璃、镜面等传统难题时表现稳健,生成质量显著优于其他方案 [11][24][29] 公司的技术积累与战略布局 - 核心数据资产:拥有全球最大的三维空间数据库,截至2025年9月,累计数字空间数据突破5300万套,覆盖面积超过44亿平方米 [7][8] - 高质量数据特色:通过自研硬件(如伽罗华系列3D激光扫描仪)确保数据在源头实现像素级精度的对齐,图像与点云平均匹配误差小于2个像素 [10][11] - 持续研发投入:公司坚持应用导向的底层创新,平均每年研发投入在2亿人民币以上,已积累600余项国内外授权专利 [13] 空间智能版图与未来规划 - 四层理论框架:公司提出空间智能四层理论,包括物理数据重建、潜藏数据感知推理、融合数据业务及AIGC生成交互,Argus 1.0是第一层的集大成者 [31][34][36] - 未来技术路线:团队下一个重点难题是攻克第四层AIGC,预计明年初发布的Argus 2.0将用于实时渲染的3DGS模型和精细Mesh模型,赋能高阶应用 [36][38] - 开放行业生态:为加速空间智能领域研究,公司计划于今年年底开放10000套室内房屋数据集,是目前最大规模的空间三维数据集 [39]
如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
机器之心·2025-11-19 12:07