开悟具身智能世界模型产品平台
搜索文档
开悟世界模型3.0,大晓机器人构建具身智能开放新生态
中国经济网· 2025-12-22 17:54
核心观点 - 大晓机器人发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0以及具身超级大脑模组A1,旨在通过全链路技术体系推动具身智能的规模化商业落地,构建自主可控的产业发展路径 [1] 技术与研发范式 - 公司提出以人为中心的ACE具身研发范式,构建了从“环境式数据采集—开悟世界模型3.0—具身交互”的全链路技术体系,颠覆传统研发逻辑 [5] - ACE范式的环境式数据采集技术可实现一年千万小时的数据收集,并通过开悟世界模型3.0放大数据价值,达到上亿小时数据规模的效果 [5] - 环境式数据采集技术通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据,为模型训练提供“人—物—场”全要素精准数据支撑 [5] - 该技术实现了超10个视角、8种模态、4大类物品属性的多模态数据升级,支撑分钟级、数百种原子动作的复杂任务,交互精度达亚像素级,并能快速完成从十万小时到千万小时的海量数据积累 [9] - 在即时零售仓储场景中,该方案已覆盖数万种SKU,完成仓储分拣与打包全流程;在居家、零售等场景中,能精准捕捉人体自然行为与物品交互轨迹 [9] 世界模型产品 - 公司发布首个开源且商业化应用的世界模型——开悟世界模型3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作 [10] - 开悟世界模型3.0是首个“多模态理解—生成—预测”的世界模型,通过多维度信息输入深度理解物理规律与人类行为底层逻辑 [12] - 模型可生成长时动态交互场景视频,实现场景内元素精准可控,并具备跨本体一键生成、多本体泛化、预测演化路径等特性,为具身智能提供高保真虚拟训练环境 [13] - 基于模型打造的开悟具身智能世界模型产品平台,集成“文生世界、像驱世界、迹塑世界”等多模态生成能力,内置支持11大类、54细类累计328个标签,覆盖115个垂类具身场景 [13] - 开悟世界模型3.0于12月18日面向全行业开源,开放API,旨在降低开发门槛,推动轻量化、定制化具身智能产品涌现 [13] 硬件与商业化应用 - 公司推出具身超级大脑模组A1,并与行业伙伴共建创新生态,加速机器人商业化落地 [13] - 搭载模组A1的机器狗基于纯视觉无图端到端VLA模型,无需预采高精地图即可适应复杂、动态、陌生环境,实现自主道路选择与复杂场景自主避障 [14][16] - 模组A1具备云端交互能力,能实时解析自然语言指令与图像语义的意图关系,生成可执行的中间指令,使机器狗能根据自然语言指令在复杂环境中完成多样任务 [17] - 结合Insta360全景感知方案与商汤方舟通用视觉平台,构建的环境感知体系可覆盖超10个行业,实现超150个智能化应用场景适配 [17] - 模组A1在安防、能源、交通、文旅等高可靠性要求场景中可实现长期稳定工作,具备走进产业一线的实用价值 [17] 团队与产业生态 - 公司汇集了来自国际知名大学的全球稀缺AI领域前沿科学家,他们是环境智能、世界模型、具身模型领域的开拓者 [3] - 公司秉持持续创新技术理念,携手产业链伙伴共建开放协同的产业生态,推动具身智能规模化商业落地与产业蓬勃发展 [1]
机器人从比硬件转向比大脑,商汤发布开悟世界模型3.0
南方都市报· 2025-12-21 22:59
行业核心瓶颈与范式转变 - 具身智能行业长期面临数据短缺、泛化能力不足等核心瓶颈,商业化路径受阻 [1] - 行业竞争焦点正从硬件性能的“硬件竞赛”转向以“大脑”为核心的智能升级 [4] - 传统纯视觉学习方案存在“现实鸿沟”,机器人通过观看视频学习,但缺乏对三维物理世界的力学规律、物理属性和动作意图的理解 [4][6] 商汤科技(大晓机器人)的核心解决方案 - 公司正式发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0(Kairos 3.0)以及具身超级大脑模组A1 [1] - 开悟世界模型3.0能生成AI模拟场景视频,可作为机器人训练素材,比实拍更便捷且能生成危险场景以规避现实风险 [3] - 公司提出“环境式数据采集”路径,采用“以人为中心”的体系,通过跨视角多模态设备融合视觉、触觉、语音、力学规律等多维度数据,构建基于物理基础的3D资产库 [6] - 该方案在即时零售仓储场景已实现多视角数据采集,覆盖数万种SKU,完成仓储分拣与打包全流程,涵盖五大阶段13个“原子动作” [9] - 在居家、零售等多元场景中,已实现对人体自然行为、物品交互轨迹的精准捕捉,能复现生鲜抓取、精细化放置等复杂任务 [9] 开源战略与产业生态构建 - 公司宣布开悟世界模型3.0将面向全行业开源开放,旨在破解国产芯片适配难、模型不开源、上下游沟通成本高的生态困局 [10] - 开源使芯片厂商能直接基于模型优化算法,效率提升数倍,同时能吸引全球开发者参与,覆盖更多垂类场景,解决单一企业场景覆盖不足的痛点 [10] - 开悟世界模型3.0已与沐曦股份、壁仞科技、中科曙光等多款国产芯片完成适配 [12] - 公司同步推出开悟具身智能世界模型产品平台,内置支持11大类、54个细类,累计328个标签,覆盖115个垂类具身场景,开发者输入简单指令即可快速生成可视化任务模拟内容 [12] 行业市场背景与展望 - 根据国际机器人联合会数据,2024年面向专业场景的服务机器人销量接近20万台,同比增长9%,搬运、酒店与清洁是主要应用类别 [12] - 劳动力短缺与老龄化是服务机器人需求的重要驱动力 [12] - 摩根士丹利研究显示,预计到2050年人形机器人相关市场规模可能达到5万亿美元,但判断在2030年代中期之前发展相对缓慢 [12] - 目前全球涉足人形机器人的公司不少,但真正推进到规模化试点或预商业部署的仍是少数 [12]
开悟世界模型3.0开源、超级大脑模组A1落地!具身智能商业化提速
国际金融报· 2025-12-18 22:41
公司核心产品发布 - 大晓机器人于12月18日正式发布开悟世界模型3.0与具身超级大脑模组A1 [2] - 公司首创“以人为中心”的ACE具身研发范式,旨在与行业伙伴共建生态,加速机器人商业化落地 [2] ACE具身研发范式 - 该范式颠覆传统“以机器为中心”的逻辑,以人类与物理世界的互动规律为研究起点 [8] - 构建了“环境式数据采集—开悟世界模型3.0—具身交互”的全链路技术体系 [8] - 环境式数据采集技术可实现一年千万小时的数据收集,结合模型能将真实数据价值放大至相当于上亿小时数据规模的效果 [8] - 该技术通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据,为模型训练提供“人—物—场”全要素精准数据支撑 [8] 开悟世界模型3.0特性 - 模型可生成长时动态交互场景视频,实现场景内各元素精准可控 [8] - 具备跨本体一键生成、多本体泛化、预测万千演化路径等特性,为具身智能打造高保真、可泛化的虚拟训练环境 [8] - 基于该模型同步发布开悟具身智能世界模型产品平台,集成“文生世界、像驱世界、迹塑世界”等多模态生成能力 [9] - 平台内置11大类、54细类,累计328个标签,覆盖115个垂类具身场景,开发者输入简单指令即可快速生成任务模拟内容 [9] 模型开源与产业合作 - 开悟世界模型3.0已于12月18日面向全行业开源,并同步开放API [9] - 模型已与沐曦股份、壁仞科技、中科曙光等多款国产芯片完成适配,极大提升了芯片性能 [9] 具身超级大脑模组A1 - 模组基于领先的纯视觉无图端到端VLA模型,搭载该模组的机器狗无需预采高精地图即可适应复杂、动态、陌生环境 [9] - 依托模型的视觉理解和运动规划能力,机器人能在动态环境中生成鲁棒、安全、合理的路径,实现“自主行动” [9] - 模组具备云端交互能力,可实时解析自然语言指令与图像语义的意图关系,生成如“前进50厘米”“绕过障碍”等可执行中间指令 [10] - 此特性使机器狗能在复杂环境中完成自主巡检、跟随、避障等多样任务,并精准响应自然语言指令 [10]