Workflow
AI仿真合成数据服务
icon
搜索文档
专访光轮智能总裁杨海波:为什么具身智能需要仿真数据
贝壳财经· 2026-01-15 22:16
公司定位与市场地位 - 公司成立于2023年,自成立第一天起就明确聚焦于AI仿真合成数据赛道,旨在为物理AI构建必需的数据基础设施[5] - 公司定位为“基于仿真技术打造物理AI时代的数据基础设施”,旨在支撑未来机器人产业的规模化落地[18] - 目前,超过80%的国际主流具身智能团队的仿真资产与合成数据来源于该公司,全球前三的世界模型团队也是其客户[1][7] 行业需求与市场格局 - 2025年具身智能赛道呈现爆发式增长,但面临训练数据短缺的现状[1] - 具身智能的数据需求量至少是自动驾驶的1000倍,主要因其需要与物理世界深度交互且应用场景远比自动驾驶广泛[2][8] - 行业认知已从2023年讨论“要不要用合成数据”转变为现在讨论“怎么做好合成数据”,市场已进入快速发展阶段[6] 技术路径与核心能力 - 采用全栈自研的“求解—测量—生成”三位一体的仿真技术路线,通过自动化测量工厂精准获取真实物理参数,确保仿真数据与真实世界高度一致[11] - 自研GPU物理求解器,通过GPU并行加速解决高计算复杂度问题,能在毫秒内完成计算,实现了物理精度与实时计算的平衡[12] - 做好合成数据需要两项核心能力:一是确保数据高质量,需将仿真与真实世界的误差压到最小;二是具备规模化供给能力,能稳定生成跨本体、跨任务的大规模高质量数据[10] 产品定价与商业模式 - 合成数据定价主要按小时计价,具体价格会根据场景难度、任务复杂度、训练规模进行调整,并非单纯的成本定价法[9] - 高质量数据极其稀缺,一旦解决了客户“有无”的核心问题,价格就不再是关键,供给方将具备更强的定价能力[9] - 公司提供的不只是数据文件,更是持续提升的研发能力,客户会将仿真和评测能力纳入长期研发规划[9] 仿真数据的作用与挑战 - 在物理AI体系中,仿真数据并非对真实数据的补充,而是训练体系的基础,预训练、强化学习、评测都高度依赖仿真数据[13][14] - 仿真数据的供给量能比真机数据跨2到3个数量级,是满足具身智能规模化本体数据供给的唯一解法[14] - 行业面临“仿真与真实之间的差异”挑战,公司通过源头保证数据真实性(测量误差在1%以内)、训练时引入对抗性扰动、与头部客户持续迭代三种方式应对[15] - 采用“仿真为主、真实为辅”的方案,99%的训练用仿真数据完成,剩下1%用真实数据微调[16] 未来发展方向与竞争策略 - 面对竞争,公司的核心是提升多样复杂场景的生成能力,构建一个可被学习的物理世界,需在资产、场景、任务三个层面努力[17] - 技术层面将持续深耕全栈自研仿真,从自动化物理测量、物理属性库到高精度物理解算器,不断完善技术平台[18] - 行业层面,物理AI将从工具阶段走向基础产业阶段,未来机器人和智能体会像手机、汽车一样广泛应用[18]