Workflow
物理智能体
icon
搜索文档
2025北京智源大会闭幕|黄铁军:构建物理智能体,类脑方法开启具身智能新范式
机器人圈· 2025-06-08 09:38
第七届北京智源大会概况 - 大会邀请4位图灵奖得主、30余位AI企业创始人&CEO、100余位全球青年科学家、200余位人工智能顶尖学者和产业专家参与[1] - 设置20个论坛共计180余场报告,覆盖多模态、深度推理、下一代AI路径、Agent智能体、具身智能等关键议题[1] - 首次联合Pytorch举办Pytorch Day China,并搭建智源AI科研成果互动体验展台展示具身智能、脑科学等前沿成果[1] 具身智能领域发展 - 具身智能成为人工智能与机器人技术融合的核心赛道,过去一年迎来爆发式增长[3] - 大会首次将具身智能升级为全天分论坛,加入人形机器人主题,体现技术演进趋势[3] - 具身智能分论坛邀请清华大学、北京大学等高校学者及众擎机器人、千寻智能等企业创始人分享前沿研究[3] 具身智能技术路线 - 世界模型是全要素模型,空间智能是其向视觉空间的投影,需构建包含物理属性的沉浸式数字物理系统[5] - 类脑算法可替代传统控制器,人形机器人需从运动控制向视觉决策升级[7] - 采用合成数据为主、真实数据校准的训练范式,通过十亿级高质量仿真数据实现零样本泛化[9] - 合成数据有助于本体和场景泛化,但全合成数据达成零样本泛化需要时间[11] - 利用互联网视频预训练姿态生成模型,解决人形机器人数据稀缺问题[13] - 虚实结合是具身智能的正确方式,世界模型能模拟物理规律生成虚拟数据[17] 具身智能通用泛化能力 - 构建具身快慢系统是从单一任务迈向通用泛化的关键路径,采用分层快慢系统和VLA端到端快慢系统两条技术路线[19] - 视触觉感知是具身智能从感知迈向精准操作的核心环节,需通过传感器创新与多模态融合解决操作稳定性问题[20] 商业化落地挑战 - 当前人形机器人基础能力不足,需先解决全地形适应、稳定行走,再发展上层应用[20] - 存在数据质量与数量不足、学术研究与产业落地错位、移动操作难度大等痛点问题[22] - 需融合多源数据,推动硬件接口标准化,构建分层框架,平衡技术创新与工程化验证[22] 未来展望 - 5-10年内具身智能有望代替人类从事不愿干、危险的劳动[23] - 2045年具身智能有望全面超越人类,代表人类走向星际[23]
最新必读,互联网女皇340页AI报告解读:AI岗位暴涨,这些职业面临最大危机
36氪· 2025-06-03 21:32
AI行业趋势 - ChatGPT仅用2个月达到1亿用户,17个月后月活增至8亿,订阅用户超2000万,年营收近40亿美元,成为商业化速度最快的AI产品[5][6] - 2024年AI相关资本支出达2120亿美元,同比增长63%,为十年内最高[6][11] - AI模型训练成本8年内暴涨2400倍,单个模型训练成本可能在2025年达10亿美元,未来或突破100亿美元[6][20] - 开源模型如DeepSeek、Qwen等在推理和编程能力上已逼近顶级闭源模型[36][37] 基础设施投资 - 苹果、英伟达、微软、Google、亚马逊、Meta等科技巨头2024年AI相关资本支出达2120亿美元[11] - 英伟达占据数据中心投资预算的25%,成为AI浪潮最大受益者[12] - 英伟达GPU推理单个Token能耗10年间下降约105000倍,有利于规模化部署[27] 技术发展 - AI在图灵测试中表现超越人类,GPT-4.5被73%测试者误认为人类[43][46] - Midjourney图像生成质量从v1到v7显著提升,达到商品级水平[50] - ElevenLabs语音克隆技术月访问量从0飙升至2000万,音色克隆+实时翻译趋近商用级别[57] 应用场景 - Waymo自动驾驶出租车在旧金山市场份额已达1/3[59] - AI相关岗位2018-2025年增长448%,传统IT岗位需求下降9%[67][69] - AI Agent成为新型数字劳动力,能执行多步骤任务如在线购物、界面导航等[72][74] 区域发展 - 美国发布超100个训练计算量超10²³ FLOPs的大语言模型,中国紧随其后不断缩小差距[40] - ChatGPT北美之外用户普及率超90%,呈现全球同步爆发特征[9]