Workflow
《宝可梦蓝》
icon
搜索文档
大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
量子位· 2025-05-03 12:05
大模型在游戏领域的突破 - Gemini 2 5 Pro成为首个通关《宝可梦蓝》并登入名人堂的大模型 标志着AI在游戏领域的重大进展[3][18] - 相比一年前的Claude 3 5仅能到达新手村 以及2个月前Claude 3 7仅能击败道馆主 Gemini 2 5 Pro实现了全面通关的突破[3] - 谷歌CEO第一时间官宣这一成就 并放出通关影像 显示公司对该技术突破的重视[1][18] 大模型游戏表现的技术细节 - Gemini在游戏中每步行动需长时间思考 例如在华蓝洞穴探索时思考40多秒 消耗76011个token进行决策[8] - 大模型面临的主要挑战包括:难以解读低分辨率像素画面 理解二维地图空间关系 以及上下文限制影响表现[10][11][12][16] - 在文本理解方面表现优异 如能快速理解属性相克提示并整合到战斗策略中[17] 行业技术发展对比 - Claude Plays Pokémon项目显示 早期模型需通过复杂流程处理游戏:截屏 网格覆盖 信息发送 响应解析等15步流程[15] - 行业技术进步明显 从Claude系列到Gemini 2 5 Pro 模型游戏能力呈现阶梯式提升[3][18] - 网友提议将通关宝可梦作为测试大模型的新基准 反映AI能力评估方式的潜在演变[19] 技术展示与持续发展 - 谷歌通过Twitch直播展示Gemini游戏过程 直播将持续数天以进行更多探索[4][18] - 模型思考过程完全透明化 左侧文本框实时显示其决策逻辑[7] - 公司表示将在该挑战中继续深入 暗示相关技术研发将持续推进[18]