Workflow
AI决策能力
icon
搜索文档
探访北京人形机器人赛训基地:机器人练习踢足球
中国经营报· 2025-08-10 22:36
2025世界人形机器人运动会 - 2025世界人形机器人运动会将于8月14日至17日在国家速滑馆举行,来自全球16个国家的280支队伍、500余台人形机器人将参与26个赛项、538个比赛项目 [1][4] - 运动会足球类赛事使用国产企业加速进化的T1机器人,该机型在2025 RoboCup巴西机器人足球世界杯上获得成人组冠军 [1] - 全球首创5v5阵型AI自主控制足球对抗赛将在运动会上演,全程无需人工操作 [4] 技术挑战与研发进展 - 机器人足球比赛面临三大技术挑战:运动能力(行走速度与稳定性)、多机协作能力(从2/3/5人制升级至11人制)、AI决策能力(单体与群体决策优化) [7] - 加速进化采用"本体+系统+开发者工具"战略,聚焦人形本体研发、端到端运动控制大模型及开发工具,构建全栈技术壁垒 [7] - 公司同时建设海内外开发者社区,通过通用机器人平台降低开发门槛,类比PC/智能手机行业经验扩大开发者生态 [7] - 足式具身智能技术当前处于L1-1.5阶段,公司正推进L2级任务研发(如拦截移动球/空中球) [8] 市场表现与行业应用 - 加速进化2023年7月交付量创历史新高,T1/K1两款机型合计交付超120台 [8] - 人形机器人在情绪稳定性、数据分析方面具备优势,未来或成为儿童体育教育、运动员训练的重要工具 [4] - 组委会计划将赛训基地打造为青少年科普平台,提升科技素养 [4] 用户体验与改进方向 - 当前机器人足球比赛存在调试时间长、运动速度慢、动作不流畅、方向识别错误及碰撞等问题 [5] - 行业需持续优化运动控制算法(如快速自主起身能力)和AI决策系统(避免球识别失败导致的原地打转) [3][5]
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤
36氪· 2025-08-06 16:41
比赛概况 - 谷歌举办首届Kaggle AI国际象棋竞赛 旨在测试AI的涌现能力 比赛时间为8月5日至8月7日每天10:30(太平洋时间)并全程直播 [5][6] - 参赛模型包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4共8个顶级模型 [6] - 直播特邀国际象棋特技大师中村光担任讲解 其为全美冠军及GM头衔持有者 现任EWC国际象棋锦标赛季军 [7] 赛程安排 - 比赛周为8月4日至10日 其中周二至周四为AI展览锦标赛 具体时段为EDT时间10:30 AM或1:00 PM(对应印度时间9:00 PM或11:30 PM) [9] - 首日比赛后 Gemini 2.5 Pro、Grok 4、ChatGPT的o4-mini和o3晋级半决赛 [9][12] 首日赛果分析 - 所有八分之一决赛均以4-0的完美比分结束 体现明显实力差距 [12] - Grok 4表现最佳 被网友评价为"在战术策略和速度上超越所有其他模型" 其与Gemini 2.5 Flash对局中展现GM级水平 轻松获胜 [13][14] - OpenAI o4-mini战胜DeepSeek R1 虽双方均有失误 但o4-mini率先抓住R1的推理错误及棋盘局势误判 [16] - Gemini 2.5 Pro与Claude Opus 4的对局被评为当日最佳 两者展示高水平棋艺 Gemini Pro展现强大战术视野但分析冗长 Claude则出现失误 [18] - Kimi K2 Instruct因反复走非法棋步被o3弃权击败 成为最快结束的四分之一决赛 有观点认为Kimi作为非推理模型需长思考才能发挥性能 [20] 模型预期变化 - 赛前网友投票显示Gemini 2.5 Pro以22%支持率最被看好 o4-mini以3%支持率紧随其后 [28][31] - 首日后Grok 4支持率呈现压倒性优势 远超其他模型 [30] 比赛意义 - 国际象棋因规则明确但复杂度高(10^120种可能局面)成为测试AI决策能力的理想场景 重点考察涌现能力而非暴力计算 [21][23] - 网友普遍认为国际象棋是可靠评估AI能力的方式 其反映模型的一致性泛化能力而非领域特定训练 [24]