百度Create 2026具身智能专场论坛成功举办 产学研共探技术落地新路径

行业迈入关键拐点 - 全球AI产业核心命题已转向让AI在物理世界安全、可靠、低成本行动,产业机会从软件延伸至制造、物流、交通、民生服务等国计民生产业[2] - 具身智能是涵盖模型、数据、本体、芯片、传感器、控制、安全及供应链的系统工程[4] - 百度智能云将从三大维度深耕:夯实AI基础设施、深化场景链接、推动行业标准建设[4][5] 星动纪元:全栈系统驱动规模化 - 人形机器人从“可用”迈向“可规模”需构建AI Native全栈系统,覆盖数据、大脑、本体、应用四层闭环[6] - 规模化落地四大核心前提:场景价值、产品市场匹配、稳定交付能力、可控成本[6] - 构建五级数据金字塔,从互联网数据到真机数据,其中长尾故障数据价值远超常规成功数据,真机数据是最高质量数据源[8] - 大脑端,世界模型是突破泛化上限的核心;本体端,坚持核心硬件全栈自研、模块化设计,重点突破五指灵巧手技术[8] 智平方:VLA范式进化与开源 - VLA范式正持续迭代,其本质是语言、视觉、行为三要素的端到端对齐[9] - 自研NeuroVLA模型融合类脑计算,实现毫秒级实时响应与强逻辑推理,适配物理世界动态复杂需求[11] - 联合百度智能云开源AlphaBrain Platform,开放自研VLA模型、测评工具、数据服务及场景化工具链,旨在降低行业研发门槛[11] 浙江大学熊蓉:SPIRE知行融贯体系 - 提出SPIRE知行融贯发育体系,构建“大脑+小脑”分层架构,破解VLM识别不准、物理交互薄弱、算力依赖高、跨场景泛化不足四大痛点[12][13] - 力、触、重量、摩擦力等物理信息必须纳入模型训练核心环节[15] - SPIRE体系已在多场景规模化落地:与杰克科技签订2000台订单攻克柔性布料操作;联合方太发布全球首个机器人总厨;在康养场景完成喂饭、陪护等服务[15] 百度百舸:全栈AI基础设施 - 百度百舸已升级为具身智能专属全栈AI Infra,覆盖数据准备、训练、仿真、推理、真机部署全链路[16] - 2026年行业两大趋势:世界模型分布式训练进入爆发期;运动控制策略走向统一范式并向大规模Scaling演进[18] - 针对性优化技术:提供5B–20B中型模型高性价比算力配置,解决世界模型推理延迟瓶颈,优化运动控制策略多机训练[18] - 已累计支撑30余家具身企业完成模型研发与真机落地,平台预置多种数据集、仿真环境与框架,集成英伟达Isaac生态等[18] 逆矩阵科技:世界模型核心在Action - 世界模型核心价值在于搭建物理世界的因果推理体系,动作是建立因果关联、解构物理规律的关键[19] - 首创世界模型W0至W5分级理论,W0为视频生成阶段,W5是能自主完成复杂任务的真实世界通用推理阶段[21] - 通用世界基座模型是各垂直场景规模化落地的核心基础,各类真机与仿真数据可跨场景互补赋能,构成双向飞轮[21] 日冕机器人:构建Scaling飞轮 - 提出具身世界模型的Scaling飞轮:表征、数据、训练范式三者相互驱动形成闭环[22] - 下一代表征体系需具备离散性、普世性、结构性,以降低对重人力采集数据的依赖,开启数据Scaling曲线[24] - 提出世界模型奖励系统方案,将世界模型泛化性优势融入真机强化学习,降低对现场部署训练和人在环的依赖[24] - 将高速增长的AI基础设施制造业作为重点突破方向,该行业具备多批量快迭代、精细操作丰富、扩产需求旺盛特征[25] 英伟达:Compute is Data新范式 - 行业正从“计算资源处理数据”走向“以高性能计算驱动高质量数据生产”的新范式[26] - NVIDIA的Physical AI Data Factory Blueprint旨在统一自动化训练数据的生成、增广与评估流程[26] - Cosmos可用于合成数据生成、视觉推理和动作仿真,加速通用机器人智能开发[28] - NVIDIA已构建完整产品栈覆盖仿真、训练、评测到部署,Isaac Sim/Lab和GR00T模型已在百度智能云上线[28] 北京人形机器人创新中心:开源生态 - 作为国家队推动技术普惠,已开放天工1.0通用人形机器人硬件设计、RoboMIND多模态数据集、运动控制框架TienKung-Lab、VLA及世界模型等核心资产[29] - RoboMIND数据集累计40万条,下载量600万+[29] - 发布基于通用平台“慧思开物”的低代码开发平台和领先的VLA仿真平台,降低开发者门槛[31] - 联合百度智能云开启首届具身智能黑客松大赛,设立运动控制、VLA模型微调两大赛道,开放硬件、数据集、仿真平台与算力资源[31][33] 圆桌论坛:行业共识与挑战 - 具身智能已走完从0到1,正迈入从1到100的规模化发展周期,世界模型与VLA技术路线可融合互补[38] - 2026年将迎来行业格局剧变,技术路线从多元分散走向收敛,应用场景转向规模化落地,搭建完整数据闭环是核心[40] - 清晰的任务界定与轻量化评测体系是搭建数据闭环、支撑技术规模化发展的基础[42] - 情感共生成为共识,人形机器人终极落点面向消费端,硬件形态终将收敛到仿人构型[44] - 行业首要解决泛化能力弱、优质数据稀缺、物理世界理解不足等痛点,商业化落地需循序渐进[46] - 把2026年定义为具身智能落地元年,主张从开发者生态场景切入,打造具备成长进化能力的产品[48] - 硬件形态会向人体构型靠拢,开源本体搭配小脑系统能有效降低行业准入门槛[50] - 具身智能是复杂系统工程,数据加工的重要性远超原始采集,高质量的数据编译是模型训练核心[52]

百度Create 2026具身智能专场论坛成功举办 产学研共探技术落地新路径 - Reportify