VLA模型KOM2.0
搜索文档
AI下一个超级风口?世界模型融资盛宴正酣,资本押注万亿级物理AI赛道
证券时报· 2026-04-01 08:17
文章核心观点 - 世界模型是让AI理解物理世界规律、实现通用人工智能的关键路径,正成为AI领域下一个重要风口,国内外资本已大量押注 [1][2][6] - 世界模型通过多模态信息刻画环境运行规律,旨在解决当前AI在物理世界中泛化能力不足、缺乏因果理解的问题,是具身智能发展的核心 [3][4][8] - 行业共识认为AI的下一个主战场是从数字世界走向物理世界,世界模型是通往物理AI的必经之路,其发展高度依赖高质量物理交互数据的积累与闭环 [6][7][11] AI在现实世界的困境与需求 - 当前AI在现实世界中仅能完成固定、流程化动作,面临“莫拉维克悖论”挑战,脱离屏幕后能力受限 [1] - 纯数据驱动模型对极端长尾场景泛化能力不足,例如机器人遇到预设代码中未定义的折断树枝或不规则堆积物时会判定为障碍并停工 [4][5] - AI“思考”本质是基于数据统计的概率预测,缺乏对世界的深层认知,根源在于模型主要建立在语言数据上,认知边界被文本限制 [3] 世界模型的定义与核心价值 - 世界模型通过从感官数据中学习和预测运动、力、空间关系等动态特性,来理解物理世界的性质、运行规律和空间特性 [3] - 其核心价值在于构建符合物理规则的虚拟平行世界,通过环境空间理解、长时序推演预测输出决策,实现场景推演、因果预测与长尾场景覆盖 [4] - 世界模型能让系统通过视觉、听觉、空间动态等多模态信息去刻画环境运行规律,使AI从认知、识别转向理解、推理 [3] - 世界模型是具身智能和客观环境自主高效交互的基础,能让机器人在“脑海”中模拟动作后果,选择最优策略,是实现“少样本学习”和“零样本泛化”的关键 [3][9] 国内外融资热潮与行业共识 - 2026年以来,世界模型领域出现密集高额融资,国内外资本大量押注,表明行业共识正在形成 [6][7] - 2026年2月,李飞飞创立的世界模型企业完成10亿美元融资;杨立昆的初创公司AMI也完成逾10亿美元融资 [6] - 今年以来,国内发生25起世界模型相关融资事件,融资总额超22亿元,其中极佳视界在3月完成10亿元的Pre-B轮融资 [6] - 资本押注本质上是押注物理AI这个万亿级赛道,认定“大语言模型的下一站是物理世界” [6][7] 企业布局与技术路径 - 多家AI企业将业务支点切入世界模型,例如酷哇科技2月发布Coowa WAM 2.0通用世界模型,以解决“泛化能力缺失”问题 [8] - 擎朗智能正探索将视觉—语言—动作模型与世界模型融合,以弥补VLA模型缺乏物理因果理解的短板,并计划在今年部分场景试点引入世界模型预测能力 [9] - 上海开普勒机器人有限公司开始构建工业世界模型和家庭世界模型,计划先将工业世界模型与工业VLA融合,并通过小规模POC验证效果 [9] - 未来技术路线可能从大一统走向专业化分工:世界模型负责物理直觉,VLA模型负责语义理解,底层控制负责精准执行 [6] 数据的关键作用与当前挑战 - 世界模型迭代高度依赖物理终端在真实世界产生的高价值交互数据,其演进将绑定具身智能产业的三大发展阶段 [9][11] - 当前主要挑战在于高质量、多模态的真实物理世界交互数据极度匮乏,操作数据不能完全依赖互联网视频或计算机仿真数据 [11] - “数据壁垒正在形成,先发优势至关重要”,能率先在真实场景中完成规模化部署、跑通“数据—模型—场景”飞轮的企业将形成代际优势 [12][13] - 高质量的物理数据获取与规范使用是核心挑战,纯靠云端仿真数据无法解决物理世界无尽的长尾问题 [11][13] 世界模型与AGI及机器人发展的关系 - 世界模型是实现物理AGI腾飞的基础,物理AGI在全球GDP中约占一半的物理世界里有不可限量的增长空间 [8] - 2026年或将成为世界模型为AGI奠定基础的元年,也是大世界模型真正为机器人及更广义多模态AI奠定基础的第一年 [11] - 世界模型能让机器人拥有对复杂物理世界的常识性理解、几何推演和因果预测能力,是实现人机安全交互的基础 [8][9] - 世界模型与当前主流的VLA模型并非替代关系,未来更倾向于互补和深度融合:世界模型在底层负责物理直觉和决策推演,VLA承担语义理解和任务规划 [13]
快讯|阿里巴巴与英伟达开启Physical AI合作;柯力传感AI及人形机器人传感器批量出货;擎朗智能发布自研VLA模型
机器人大讲堂· 2025-09-25 18:07
阿里巴巴与英伟达合作 - 阿里巴巴与英伟达达成Physical AI(物理AI)合作,合作范畴广泛,覆盖从数据合成处理、模型精细训练到环境仿真强化学习及模型验证测试等关键环节 [2] - 双方旨在优化物理AI开发流程,显著缩短具身智能、辅助驾驶等前沿应用的开发周期,加速技术从实验室走向实际场景应用 [2] 柯力传感传感器进展 - 柯力传感用于AI理疗机器人机械臂及开普勒人形机器人的六维力传感器已实现批量出货,出货量达数百台 [5] - 此次批量出货体现了公司在传感器研发制造领域的实力,为AI理疗机器人和人形机器人产业发展提供支持 [5] 擎朗智能VLA模型升级 - 擎朗智能发布针对服务行业的自研VLA模型KOM2.0,该模型将应用于公司人形具身服务机器人,以提升机器人泛化能力与产品迭代速度 [9] - 模型架构引入时空自适应注意力机制等创新,可精准提取关键信息、理解场景关联,并能持续自我进化,利用海量场景与运行数据增强鲁棒性与泛化能力 [9] - 公司此前已推出首款双足人形具身服务机器人XMAN-F1,未来将围绕"通用 + 专用"定位完善产品矩阵 [9] 优必选专利授权 - 优必选"一种机械手和人形机器人"专利获授权,该专利属于人形机器人技术领域,机械手设计由手臂机构和夹抱机构组成 [12] - 夹抱机构通过弹性件协同作用形成独特夹持机制,在人形机器人搬运箱子时,即便箱子重心偏置也能紧密夹紧,有效降低箱子摆动风险,提升搬运稳定性与安全性 [12] 产学研合作动态 - 郑州大学与乐聚机器人签约共建人形机器人联合研发中心,将依托郑州大学智能集群系统教育部工程研究中心,推动具身人形机器人在多场景的技术突破与产业化落地 [15] - 双方将围绕河南具身智能产业发展需求攻关关键技术,旨在填补国内具身机器人工业级应用技术空白,构建"高校研发+企业转化"产学研用生态 [15] - 乐聚机器人主打产品"夸父"人形机器人此前曾在华为HDC大会上亮相,此次合作将为河南具身智能产业发展注入新动力 [15]