第七届北京智源大会概况 - 大会邀请4位图灵奖得主、30余位AI企业创始人&CEO、100余位全球青年科学家、200余位人工智能顶尖学者和产业专家参与[1] - 设置20个论坛共计180余场报告,覆盖多模态、深度推理、下一代AI路径、Agent智能体、具身智能等关键议题[1] - 首次联合Pytorch举办Pytorch Day China,并搭建智源AI科研成果互动体验展台展示具身智能、脑科学等前沿成果[1] 具身智能领域发展 - 具身智能成为人工智能与机器人技术融合的核心赛道,过去一年迎来爆发式增长[3] - 大会首次将具身智能升级为全天分论坛,加入人形机器人主题,体现技术演进趋势[3] - 具身智能分论坛邀请清华大学、北京大学等高校学者及众擎机器人、千寻智能等企业创始人分享前沿研究[3] 具身智能技术路线 - 世界模型是全要素模型,空间智能是其向视觉空间的投影,需构建包含物理属性的沉浸式数字物理系统[5] - 类脑算法可替代传统控制器,人形机器人需从运动控制向视觉决策升级[7] - 采用合成数据为主、真实数据校准的训练范式,通过十亿级高质量仿真数据实现零样本泛化[9] - 合成数据有助于本体和场景泛化,但全合成数据达成零样本泛化需要时间[11] - 利用互联网视频预训练姿态生成模型,解决人形机器人数据稀缺问题[13] - 虚实结合是具身智能的正确方式,世界模型能模拟物理规律生成虚拟数据[17] 具身智能通用泛化能力 - 构建具身快慢系统是从单一任务迈向通用泛化的关键路径,采用分层快慢系统和VLA端到端快慢系统两条技术路线[19] - 视触觉感知是具身智能从感知迈向精准操作的核心环节,需通过传感器创新与多模态融合解决操作稳定性问题[20] 商业化落地挑战 - 当前人形机器人基础能力不足,需先解决全地形适应、稳定行走,再发展上层应用[20] - 存在数据质量与数量不足、学术研究与产业落地错位、移动操作难度大等痛点问题[22] - 需融合多源数据,推动硬件接口标准化,构建分层框架,平衡技术创新与工程化验证[22] 未来展望 - 5-10年内具身智能有望代替人类从事不愿干、危险的劳动[23] - 2045年具身智能有望全面超越人类,代表人类走向星际[23]
2025北京智源大会闭幕|黄铁军:构建物理智能体,类脑方法开启具身智能新范式
机器人圈·2025-06-08 09:38