Workflow
高级机器智能
icon
搜索文档
刚刚,LeCun亲自出镜,Meta推出新世界模型!
机器之心· 2025-06-12 08:53
Meta的AI战略布局 - 公司组建"超级智能团队"以实现通用人工智能 并提供9位数薪酬吸引人才[3] - 推出基于视频训练的世界模型V-JEPA 2 旨在开发能像人类一样认知世界的AI系统[4][5] - 首席AI科学家Yann LeCun强调世界模型是物理世界的数字孪生 可帮助AI理解物理规律并进行任务规划[6] V-JEPA 2技术特性 - 模型架构包含12亿参数 基于联合嵌入预测架构(JEPA)构建[8] - 包含编码器和预测器两大组件 通过自监督学习无需人工标注[16][18][19] - 训练分两阶段:使用超100万小时视频和100万张图像进行预训练 再用62小时机器人数据微调[20][21][25] 模型性能表现 - 在抓取任务(Grasp)成功率从8%提升至45% 放置任务(Pick-and-place)从13%提升至73%[12] - 动作预测任务(Epic-Kitchens-100)准确率达39.7% 超越前最佳27.6%[12] - 在Hugging Face物理推理榜单排名第一 超越GPT-4o等模型[34] 应用场景拓展 - 适用于辅助技术、混合现实指导、个性化教育等场景[6] - 在机器人领域实现零样本规划 新环境物体操作成功率65%-80%[26] - 对自动驾驶和家庭服务机器人具有重大意义[7] 新发布的基准测试 - IntPhys 2测试物理合理性判断 人类准确率85%-95%而当前模型接近随机水平[28] - MVPBench通过最小变化对减少模型作弊 评估真实物理理解能力[29] - CausalVQA专注视频因果关系理解 揭示模型在反事实推理方面的不足[32][33] 未来研究方向 - 开发跨多时间尺度的分层JEPA模型 应对复杂任务分解需求[36] - 探索多模态JEPA模型 整合视觉、听觉和触觉等感官信息[36] - 持续优化在物理推理和因果理解方面与人类表现的差距[28][33]