开悟世界模型3.0(Kairos3.0)
搜索文档
大晓机器人发布“以人为中心”ACE具身研发范式
观察者网· 2025-12-22 23:15
行业背景与挑战 - 当前具身智能行业面临数据瓶颈,真机数据量级仅为10万小时,与智能驾驶领域存在数量级差距,导致传统研发路径在成本、效率与通用性上遭遇挑战 [1] - 行业传统研发范式为“以机器为中心”,将机器人本体及硬件参数置于核心,本质是以高资源消耗换取有限且僵化的“智能” [1] 公司核心战略与范式创新 - 公司率先提出“以人为中心(Human-centric)”的ACE具身研发范式,旨在突破行业瓶颈 [1] - 公司发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0(Kairos3.0)、以及让具身本体拥有自主空间智能的具身超级大脑模组A1 [1] - 公司致力于与行业伙伴共同构建全链自主可控、开放共赢的产业级生态体系 [1] 核心技术:环境式数据采集 - 作为ACE范式核心技术之一,环境式数据采集技术通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据 [3] - 该技术采用物理级建模与全场景覆盖的创新设计,为模型训练提供“人—物—场”全要素精准数据支撑 [3] - 该技术带来四大核心数据价值:数据维度更全面,完成超10个视角、8种模态、4大类物品属性的多模态数据升级;任务覆盖更长程,支撑分钟级、数百种原子动作的复杂任务;交互精度更高,达到亚像素级标准,可精准追踪人手精细化操作;采集效率更具规模化,能快速完成从十万小时到千万小时的海量数据积累 [3] 核心产品:开悟世界模型3.0 - 开悟世界模型3.0已面向全行业开源,所有企业均可使用其工具链,以推动各类轻量化、定制化具身智能产品快速涌现,促进应用生态发展 [3] - 该模型已与沐曦股份、壁仞科技、中科曙光等多款厂商国产芯片完成适配,极大提升了芯片性能,形成从底层算力到上层智能应用的协同合力 [3] 产业生态合作 - 硬件领域,公司与Insta360、卧龙电驱、帕西尼等伙伴深度绑定,依托其感知等硬件强化世界模型、模组产品对多视角、动态场景的信息采集能力 [4] - 云服务与数据层面,公司联合商汤大装置、腾讯云、火山引擎、商汤方舟、算丰信息等平台,构建全流程支持体系,借助其算力调度能力降低中小厂商研发成本 [4] - 公司依托库帕思、中建西南院的数据资源,持续优化世界模型的场景泛化能力,使方案能快速适配不同行业的个性化需求 [4]
开悟世界模型3.0,大晓机器人构建具身智能开放新生态
中国经济网· 2025-12-22 17:54
核心观点 - 大晓机器人发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0以及具身超级大脑模组A1,旨在通过全链路技术体系推动具身智能的规模化商业落地,构建自主可控的产业发展路径 [1] 技术与研发范式 - 公司提出以人为中心的ACE具身研发范式,构建了从“环境式数据采集—开悟世界模型3.0—具身交互”的全链路技术体系,颠覆传统研发逻辑 [5] - ACE范式的环境式数据采集技术可实现一年千万小时的数据收集,并通过开悟世界模型3.0放大数据价值,达到上亿小时数据规模的效果 [5] - 环境式数据采集技术通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据,为模型训练提供“人—物—场”全要素精准数据支撑 [5] - 该技术实现了超10个视角、8种模态、4大类物品属性的多模态数据升级,支撑分钟级、数百种原子动作的复杂任务,交互精度达亚像素级,并能快速完成从十万小时到千万小时的海量数据积累 [9] - 在即时零售仓储场景中,该方案已覆盖数万种SKU,完成仓储分拣与打包全流程;在居家、零售等场景中,能精准捕捉人体自然行为与物品交互轨迹 [9] 世界模型产品 - 公司发布首个开源且商业化应用的世界模型——开悟世界模型3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作 [10] - 开悟世界模型3.0是首个“多模态理解—生成—预测”的世界模型,通过多维度信息输入深度理解物理规律与人类行为底层逻辑 [12] - 模型可生成长时动态交互场景视频,实现场景内元素精准可控,并具备跨本体一键生成、多本体泛化、预测演化路径等特性,为具身智能提供高保真虚拟训练环境 [13] - 基于模型打造的开悟具身智能世界模型产品平台,集成“文生世界、像驱世界、迹塑世界”等多模态生成能力,内置支持11大类、54细类累计328个标签,覆盖115个垂类具身场景 [13] - 开悟世界模型3.0于12月18日面向全行业开源,开放API,旨在降低开发门槛,推动轻量化、定制化具身智能产品涌现 [13] 硬件与商业化应用 - 公司推出具身超级大脑模组A1,并与行业伙伴共建创新生态,加速机器人商业化落地 [13] - 搭载模组A1的机器狗基于纯视觉无图端到端VLA模型,无需预采高精地图即可适应复杂、动态、陌生环境,实现自主道路选择与复杂场景自主避障 [14][16] - 模组A1具备云端交互能力,能实时解析自然语言指令与图像语义的意图关系,生成可执行的中间指令,使机器狗能根据自然语言指令在复杂环境中完成多样任务 [17] - 结合Insta360全景感知方案与商汤方舟通用视觉平台,构建的环境感知体系可覆盖超10个行业,实现超150个智能化应用场景适配 [17] - 模组A1在安防、能源、交通、文旅等高可靠性要求场景中可实现长期稳定工作,具备走进产业一线的实用价值 [17] 团队与产业生态 - 公司汇集了来自国际知名大学的全球稀缺AI领域前沿科学家,他们是环境智能、世界模型、具身模型领域的开拓者 [3] - 公司秉持持续创新技术理念,携手产业链伙伴共建开放协同的产业生态,推动具身智能规模化商业落地与产业蓬勃发展 [1]