Workflow
VLA(Vision - Language - Action)模型
icon
搜索文档
专治Demo玩家:「具身灵巧操作奥林匹克」大赛三项第一,全被国内这家公司拿下
机器之心· 2026-04-10 11:50
文章核心观点 - 星动纪元在具身智能顶级赛事Benjie's Olympics中,击败行业公认的技术领先者Physical Intelligence,在开锁、剥橘子、翻袜子三项核心任务中均获得全球第一,证明了其技术实力和全栈能力在真实场景下的优越性 [9][11][22][34][38] - 该赛事以硬核、实战著称,旨在终结行业“Demo表演”文化,其成绩直接反映了当前具身智能领域的全球最高水平,星动纪元是唯一上榜的中国企业 [19][24][27][29] - 星动纪元凭借其自研VLA具身智能模型在样本效率、感知精度和控制响应等关键环节实现突破,展示了比国际顶尖同行更有效的解决具身智能核心难题的方法论 [46][48][58] 赛事背景与含金量 - Benjie's Olympics由前谷歌机器人专家发起,旨在撕下行业包装,将评判标准拉回实用落地层面,被誉为“机器人行业的压力测试” [27][28] - 赛事汇聚了Physical Intelligence、Sunday Robotics等全球顶尖公司,是PI唯一主动参赛并出动其未公开闭源旗舰模型π*0.6的赛事 [20][28] - 赛事设有15项实战挑战,按难度分金银铜牌,开锁和剥橘子为金牌难度,翻袜子为银牌难度,任务容错率极低(1-3mm),要求机器人全自主、零人工干预、无仿真,环境和物体随机摆放 [29] - 业内专家共识认为该赛事是唯一强制泛化而非复现的比赛,多数队伍连铜牌都难以通过,金牌任务近乎奇迹 [31] - 行业形成新评判标准:能通过Benjie's Olympics考验的才叫“工业级全栈”,否则只是“Demo” [33] 星动纪元参赛成绩详情 - **总体成绩**:在翻袜子(银牌难度)、开锁、剥橘子(金牌难度)三项任务中均位列全球第一,全面刷新世界纪录 [11] - **击败对手**:击败了行业公认的技术领先者Physical Intelligence,后者派出了从未公开过的核心闭源模型π*0.6 [17][20] - **剥橘子任务**:成为该赛事首个实现完全无工具、纯手剥操作的团队,用时1分47秒,比使用削皮刀的PI(2分46秒)快35% [41][42] - **开锁任务**:在存在金属反光等视觉干扰下,用时49秒顺利开锁,比PI(66秒)快25% [43][44] - **翻袜子任务**:仅使用120个训练样本,比PI的176个样本少32%,且执行速度更快,用时1分04秒,比PI(1分33秒)快30% [45] 星动纪元VLA模型的技术优势 - **极高的样本效率**:在翻袜子任务中,仅用120组样本就达到甚至超过了PI使用176组样本的表现,样本量减少约32%,展现了强大的小样本学习和知识迁移能力 [45][49] - **自适应视觉注意力机制**:在开锁等精细操作中,能动态聚焦关键区域,增强微小目标特征,在高干扰环境下保持稳定的感知能力,为毫米级精度操作提供基础 [51][53] - **异步高频推理与短时域规划**:引入异步推理与短时域规划机制,提升决策频率,使机器人能更高频地修正动作,及时响应环境变化,抑制误差累积,提升任务成功率与稳定性 [53][55] - **综合能力验证**:模型在柔性物体操作、双手协作、工具使用及长程复杂任务等关键能力上实现同步提升,其全栈能力在极端压力下得到整体验证 [35][37][56] 公司的行业地位与技术引领 - **研究范式引领**:公司与斯坦福大学团队联合发布的Ctrl-World可控生成世界模型,在世界模型权威评测World Arena榜单上击败谷歌、英伟达等模型,在四大核心维度登顶 [61] - **技术首创**:是全球首个提出分频VLA架构(HiRT快慢分层架构)的团队,早于PI、Figure、谷歌、英伟达等公司 [63] - **技术首创**:打造了全球首个融合世界模型的具身大脑VPP算法框架,将可用数据扩展到海量互联网视频数据 [63] - **技术标杆**:其研发的ERA-42模型,是全球仅有的四个实现了全尺寸人形机器人全身及五指灵巧手精准控制的标杆之一,其余三家为Figure Helix、特斯拉Grok及英伟达GR00T [63] - **实际落地**:ERA-42具身大脑已在物流分拣及扫码、制造零部件抓取、高精度装配、质量检测以及商业服务等真实场景中落地,部分场景效率达70%~80% [62]
400亿狂热追逐:具身智能2025投资战事|商业头条No.112
搜狐财经· 2026-02-12 11:28
行业阶段定位与投资逻辑 - 行业对具身智能发展阶段存在分歧,部分观点认为即将在2026上半年达到“GPT-2时刻”,即证明某些技术路径可行,而更多受访者认为行业尚处“GPT-1”阶段,即验证技术可行性的初期 [5][6] - 发展阶段定位直接影响投资决策,假设在GPT-3.5和GPT-1/2时期投资OpenAI,至2026年估值增长将分别为30倍和约100倍,凸显早期投资的巨大潜在回报 [7] - 行业在2025年因宇树科技春晚走红而提前获得广泛关注,促使投资者从观望转向积极抢入,希望找到该领域的早期“OpenAI” [8] 投融资市场热度与估值变化 - 2025年具身智能赛道投融资活动激增,融资事件数从2024年的105起增至333起,融资金额从95.25亿元扩大至405.99亿元,分别增长217%和326% [9] - 早期项目估值显著抬高,例如它石智航在天使轮及天使+轮共融资约2.42亿美元,刷新行业记录,多家公司在pre-A及A轮阶段融资达数亿元 [12] - 项目单轮估值涨幅平均在50%-100%之间,市场存在阶段性估值跃升,但估值模型缺乏标准,更多取决于机构间的竞价,存在因投资人偏好或焦虑推高估值的非理性因素 [12][13] 主要参与者与投资格局 - 投资机构态度在2024至2025年发生转变,从谨慎观望转为激进出手,导致投资相同公司的成本在一年内上涨了四五倍 [15] - 一线美元基金是行业早期投资主力,同时部分地方国资机构投资表现活跃且迅速,如无锡锡创投、珠海科技产业集团等,其投资策略的主动性和效率大幅提升 [16] - 政府背景资金因政策支持及培育大产业的动力,在投资决策上更为大胆,有时可见领导直接拍板投资的情况 [17] 代表性公司估值情况 - 多家具身智能公司估值在2025年至2026年初达到高位,例如:优必选市值约653.92亿元,银河通用估值30亿美元,云深处、智元机器人估值均为150亿元,宇树科技估值130亿元 [18] - 其他高估值公司包括众擎机器人、星海图估值均为100亿元,傅利叶、自变量机器人估值均为80亿元,估值范围从数十亿至数百亿元不等 [18][19] 技术进展与商业化挑战 - 技术层面被认为变化有限,Vision-Language-Action模型的实际泛化能力与预期有差距,技术进程和商业落地速度不及部分投资人预期 [20] - 行业面临技术扩散风险,在共同的技术瓶颈前,领先公司的技术红利可能快速被追赶者抹平,类似AI 1.0时期商业红利未被初创公司独占的情况 [20][21] - 商业化方面,2025年春晚曝光带动了央国企采购增加,一家头部机器人公司2025上半年营收同比增长300%,接订单和量产能力成为资本重点观察指标 [23][25] 当前发展策略与行业心态 - 行业进入“命题作文”时期,许多公司的目标路径明确指向利用如“港股18C”等上市通道,投资人与创业者合力推动公司上市 [21] - 2026年行业竞争的主线是“抢钱”和“抢人”,拥有自动驾驶背景的创始人因相关经验而受到投资人关注 [22][23] - 部分创业者对商业化持谨慎态度,强调量产需循序渐进,避免为拼订单陷入虚假繁荣,并严格控制订单质量和回款 [26] 对行业繁荣程度的看法 - 对行业是否真正繁荣存在不同看法,有观点认为从资本层面看是繁荣的,但技术层面许多公司仍基于现有模型微调,技术传承性可能存在问题,并未达到想象中的繁荣程度 [26] - 也有投资人坚信行业正迈向技术突破,将具身智能视为通往AGI的道路,并认为技术路线选择具有决定性作用 [27] - 尽管存在对投资回报的担忧,有判断称60%-70%的投资者最终可能亏损,但市场普遍认为该领域最终将产生赢家 [27]
商业头条No.112|400亿狂热追逐:具身智能2025投资战事
搜狐财经· 2026-02-12 09:38
行业发展阶段与定位 - 行业对具身智能发展阶段的定位存在分歧,部分观点认为即将在2026上半年走到“GPT-2时刻”,即本质上证明某些技术路径可行,而更多受访者认为行业尚处“GPT-1”阶段,即搭建验证可行性的技术环境 [2][3] - 对发展阶段的定位直接影响投资决策,假设在GPT-3.5和GPT-1/2时期投资,至2026年获得的估值增长将分别为30倍和约100倍 [7] - 行业因宇树科技在2025年春晚意外走红而提前进入公众视野,技术进程与商业落地实际进展不及部分投资人预期 [8][16] 投融资市场变化 - 2025年行业投融资格局发生剧变,融资事件数从2024年的105起激增至333起,增长217%,融资金额从95.25亿元扩大至405.99亿元,增长326% [9] - 项目估值快速攀升,早期项目估值抬高,成长期项目估值上升加快,过去一年项目单轮估值涨幅平均浮动在50%-100%之间 [11] - 出现非理性估值因素,部分投资人因错过前期项目而急于入场,或出于对团队的偏好进行多轮加价,行业尚未形成合理的估值模型 [12] - 一家互联网战投在2024年与2025年认可的项目一致,但2025年出手时估值已上涨四五倍 [13] 主要参与者与投资策略 - 一线美元基金是行业早期投资主力,同时部分国资机构投资表现比市场化机构更积极,出手迅猛 [13] - 无锡锡创投、珠海科技产业集团以及上海、北京、深圳的国资机构在产业链上下游进行了相对完整的布局 [14] - 投资机构策略从2024年的谨慎观望转向2025年的激进抢入,驱动因素是担忧错过行业“贝塔”机会 [13] 代表性公司估值 - 多家具身智能公司在2025年至2026年初获得高估值,例如:优必选估值653.92亿元,银河通用估值30亿美元,云深处与智元机器人估值均为150亿元,宇树科技估值130亿元 [15][16] 技术进展与商业化挑战 - 技术路线方面,当前火热的VLA模型被认为距离期待的泛化能力仍有差距,天花板可能不及预期,有观点将其与BERT模型对标 [17] - 商业化落地前景是主要担忧之一,上一代机器人公司中鲜有商业化路径顺利的前例,影响了部分投资人的决策 [13] - 行业存在技术扩散风险,在共同的技术瓶颈面前,技术领先的公司可能很快被落后者赶上,商业红利可能被传统巨头获取 [17] 2026年竞争焦点与策略 - 2026年具身智能公司竞争的主线任务是“抢钱”和“抢人” [20] - 商业订单和营收规模成为企业自证实力的关键,一家头部机器人公司2025上半年营收同比增长300% [21] - 量产能力是资本重点观察的指标,千台量产被视为一个重要门槛,但有创业者强调需循序渐进,避免为拼订单陷入虚假繁荣 [27] - 许多公司及投资人将“港股18C”上市标准作为目标,进入“命题作文”时期,寻求在短期内推动公司上市 [18] 行业前景与风险认知 - 行业内对繁荣与否看法不一,有观点认为许多公司仅是基于现有模型微调,技术传承性可能存在问题,行业并未想象中繁荣 [28] - 也有投资人坚信行业正迈向GPT-2阶段,并将具身智能视为通往AGI的道路,技术路线选择具有决定性作用 [28] - 尽管埃隆·马斯克预言机器人将从稀缺到充足,但有投资人判断此轮狂热投融资中,60%-70%的投资人最终可能亏损 [28]