Workflow
BGE模型
icon
搜索文档
深度学习与强化学习两大巨头齐聚2025北京智源大会 智源发布“悟界”系列大模型
机器人圈· 2025-06-07 12:02
2025北京智源大会核心内容 - 第七届北京智源大会以"全球视野、思想碰撞、前沿引领"为特色,汇聚30余位AI公司创始人/CEO、100余位全球青年科学家、200余位顶尖学者和产业专家,围绕多模态、下一代AI路径等前沿议题展开讨论 [3] - 大会邀请到Yoshua Bengio、Richard Sutton等图灵奖得主及Google、DeepMind、Meta等国际机构代表,以及华为、百度、腾讯等国内互联网大厂参与 [3] 智源研究院技术成果 悟道系列大模型 - 悟道1.0于2021年3月推出,是中国首个超大规模信息智能模型 [9] - 悟道2.0于2021年6月发布,以1.75万亿参数规模成为全球最大预训练模型,在9项核心任务上国际领先 [9] - 悟道3.0于2023年全面开源,在通用视觉与多模态六大技术维度取得突破 [9] 悟界系列大模型 - 包含Emu3原生多模态世界模型、Brainμ脑科学模型、RoboOS 2.0/RoboBrain 2.0具身智能框架、OpenComplex2全原子生命模型 [10] - Emu3实现文本/图像/视频任意组合理解与生成,支持多模态输入输出的端到端映射 [13][14] - Brainμ完成超过100万单位神经信号预训练,在自动化睡眠分型等任务中超越现有专有模型 [15][16] - RoboOS 2.0整体性能提升30%,全链路平均响应时延低于3ms,端云通信效率提升27倍 [17] - RoboBrain 2.0任务规划准确率较1.0提升74%,新增空间推理能力和闭环反馈机制 [18][19] - OpenComplex2实现原子分辨率层面分子相互作用捕捉,在CASP16竞赛中成为唯一预测蛋白质构象分布的团队 [20][22] 开源生态建设 - FlagOpen开源技术体系已开源约200个模型和160个数据集,模型全球总下载量超6.4亿次 [23] - BGE系列模型成为2023年全球下载量冠军,2024年登顶Hugging Face月度下载榜首 [25] - Video-XL-2实现单GPU处理万帧视频能力,编码2048帧视频仅需12秒 [26] - OmniGen视觉生成模型GitHub Star数超4,000,催生一系列创业产品 [27] 具身智能进展 - 银河通用Galbot机器人展示端到端VLA大模型在商业零售场景应用 [47] - 宇树G1机器人展示"组合拳"动作,天工2.0完成"水果摆盘"服务任务 [47] - 基于RoboOS 2.0/RoboBrain 2.0的机器人展示餐饮互动、抓娃娃等技能 [58] 行业观点与趋势 - Yoshua Bengio指出需研发非代理性AI系统并建立全球协同治理框架 [30][31] - Richard Sutton认为AI正进入"体验时代",强调去中心化合作路径 [35] - Jim Zemlin表示2025年是开源AI元年,开源可帮助节约70%开发成本 [39] - Karol Hausman展示π0机器人基础模型在陌生环境任务完成率达80%-90% [43] - 专家共识认为短期内人形机器人是重要载体,长期将多样化发展 [50]