Workflow
字节跳动为了玩明白《原神》,至少「氪」了几千万?
36氪·2025-11-17 13:22

AI模型Lumine-Agent的技术能力 - 能够游玩《原神》《崩坏:星穹铁道》和《鸣潮》等3D开放世界游戏,并公开了总长超过25小时的8段实录视频[1] - 在《原神》中可完成基础交互(战斗后开宝箱、通关秘境、完成日常委托)、应对BOSS机制(理解无相之雷、风魔龙等BOSS玩法)、精密操作(飞行搜集、瞄准射击、解谜)以及界面适应(3D探索与2D界面切换)等复合操作[10][13][15][18] - 通过目标拆解可执行收集风神瞳、冻结水面取物、利用风场开箱等更复杂任务[19][20] - 在《鸣潮》中仅凭推理能力即以接近新手水平完成前两个剧情(约107分钟),在《崩坏:星穹铁道》中通关“黑塔”空间站主线耗时约7小时,比人类玩家平均速度(4.7小时)慢2.3小时[25][26][28] - 是目前唯一能在3D开放世界中完成数小时任务的AI智能体,其“Lumine-Instruct-NonHis”版本在四项关键测试中成功率均超过80%,性能显著优于GPT-5、Gemini 2.5 Pro等主流大模型[24] 技术实现与资源投入 - 采用视觉推理模式:由一台主机每200毫秒截一张图并提交推理请求,另一台主机负责推理并转化为鼠标键盘指令[33] - 使用总计约4500小时的《原神》视频数据进行训练,包括1731小时人类游戏数据用于预训练、200小时指令数据用于语言基础训练、15小时推理数据用于实现混合式思维[35] - 推理主机搭载4块H20显卡(价格超过30万人民币),训练整个Agent模型需要64块H100显卡,成本至少1500万元,项目总成本达数千万[35][37] - 团队来自字节跳动种子计划(ByteDance Seed),负责公司AI能力研究,技术已落地于飞书、火山引擎、豆包等应用[37][39] 行业应用潜力与竞争优势 - 相比游戏厂商自研AI(如《王者荣耀》“绝悟”测试架构动用60万个CPU核心和1064张显卡、成本数亿元;《逆水寒》手游每年投入约3000万元训练智能NPC),Lumine展现出训练成本较低的优势[49][57] - 具备通用性优势:仅依靠公开游戏资料和视觉推理模拟真实玩家操作,无需游戏内部数据,低训练门槛、高拟真度、隐私性好[53] - 潜在应用场景包括自动化游戏测试(可24小时不间断工作,模拟真实玩家复杂操作以高效发现BUG)以及反推游戏设计(AI自主生成地图、关卡等)[58][59] - 某深圳射击游戏厂商CEO透露,每年为游戏配备AI队友需向专业公司支付数千万元费用,证明该市场需求旺盛且盈利空间大[50]