智元机器人世界模型GE开源 - 公司正式开源世界模型GenieEnvisioner(GE),定位为行业首个面向双臂真机的世界模型 [1] - GE采用视觉中心建模范式,直接在视觉空间建模机器人与环境交互,保留空间结构和时序信息 [3] - 基于3000小时真机数据,GE-Act在跨平台泛化和长时序任务执行上超越现有SOTA水平 [3] - 模型整合"预测-控制-评估"环节,使机器人具备"想象-验证-行动"的主动能力 [3] - 已实现制作三明治、倒茶、擦桌、使用微波炉、装箱等五项连续任务 [4] 技术突破与行业定位 - 公司认为机器人必须搭载大模型,当前大语言模型存在1-5秒延迟,无法满足工业场景3-10毫秒需求 [6] - GE作为世界模型,通过"想象"行动策略的未来状态序列实现提前规划 [6] - 行业存在数据飞轮派与模型瓶颈派之争:前者强调数据积累(智元),后者主张重构模型架构(宇树) [15][16] - 世界模型被视为"认知地基",需百万小时级互联网数据;具身智能则是依赖真机数据的"上层建筑" [11][12] 资本市场反应 - 公司通过"协议转让+要约收购"控股材料供应商上纬新材63.62%股权 [1] - 上纬新材市值从30亿元最高冲至400多亿元,走出11个涨停板 [1][13] - 控股实现供应链锁定(PEEK材料可减重30%)与市值杠杆放大双重效应 [13] - 二级市场提前定价,行业进入"市梦率"博弈阶段,技术路线尚未收敛 [14][17] 行业发展现状 - 具身智能技术成熟度类比2016年自动驾驶:硬件可用,算法需打磨 [11] - 训练数据量级对比:Meta V-JEPA 2使用100万小时数据,智元3000小时数据被认为作用有限 [9] - 行业争议焦点:世界模型能力提升是否依赖具身智能领域数据量 [9][10] - 当前瓶颈在于模型架构不够统一,部分场景数据采集后难以有效利用 [10]
智元世界模型:机器人的“大脑”,还是市值翻十倍的“样板间”?