LynkSoul VLM v1
搜索文档
国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键
量子位· 2025-10-11 17:01
文章核心观点 - 国产开源模型在垂类领域取得突破,逗逗AI的游戏理解模型LynkSoul VLM v1在东京电玩展上表现超越GPT-4o等顶尖闭源模型 [1][2] - 公司认为AI陪伴的终极目标是让虚拟形象融入生活,多模态理解技术是产品持续突破的关键 [9] - 公司通过用户参与和数据积累构建核心壁垒,并已实现显著的用户增长和全球化初步布局 [5][43] 技术优势与性能表现 - 专为游戏训练的视觉语言模型LynkSoul VLM v1,在《英雄联盟》测试场景的识别准确率、建议实用性及语言表达自然度上显著超越通用模型 [7][10] - 官方测试数据显示,该模型在视觉理解准确度(3.44 vs 1.95)、游戏情境掌握度(3.29 vs 1.95)和语言表达自然度(2.91 vs 1.37)上均优于OpenAI-4o-Latest [11] - 在泛化能力测试中,模型在未参与训练的游戏上同样表现稳健,三项核心指标(4.06/3.67/4.18)超越对比模型 [12] - 模型推理延迟具有优势,首包延迟为2.179秒,总延迟为3.981秒,优于对比模型 [14] 用户增长与市场反响 - 新产品上线约一个月,新增200多万用户,总用户数突破1000万 [5] - 海外版Hakko AI已积累几十万用户,在英语和日语市场反响良好,用户留存时长甚至超过国内 [43] - 用户使用场景超出预期,有超过一半的时间发生在游戏外,如陪同看剧、逛电商平台乃至作为直播课助手 [35] 产品理念与战略方向 - 公司认为Chatbot交互形态不友好,理想形态是基于多模态的、能理解环境信息的深度陪伴,类似Cursor基于代码上下文的交互范式 [29][31] - 公司定位为软件优先,目标是打造一个可跨设备(电脑、手机、硬件等)使用的7x24小时陪伴账号,未来再与硬件结合 [37] - 公司从第一天就定位全球化,预计长期用户比例国内与海外为6:4,收入各占一半 [43][45] 核心竞争力构建 - 超越顶级模型的关键在于前期积累的800多万游戏玩家提供的画面及互动数据,通过精调使模型能精准理解场景 [18] - 采用主题索引结合向量检索的技术方案实现长期记忆,使AI能根据用户偏好提供个性化互动 [23][24] - 当前技术攻关重点在于多模态理解,特别是对游戏连续帧而非法单帧的理解 [27]
暴走东京电玩展,Game Show也AI上了
量子位· 2025-09-27 15:00
中国厂商在东京电玩展的展示 - 中国游戏厂商如网易、腾讯、叠纸、鹰角等在东京电玩展设立大型展台吸引大量玩家关注 [8] - AI厂商也在展会上展示技术实力 包括大模型和3D生成等应用 [8][10] - 中国游戏厂商在海外市场的影响力日益显著 游戏工业链条从3D建模到云计算展现出全面实力 [36] 阿里巴巴的大模型展示 - 阿里巴巴展台以通义千问和通义万相两个开源模型为核心展示 [11][12] - 本地化团队面向日本市场提供从IaaS到SaaS的大模型商用化方案 包括Model Studio和AI开发平台PAI [12][13] - 开展2天内已有不少B端客户到展台交流 显示开源影响力超出线上下载量 [15][16] MiniMax的创意展示 - MiniMax在展会现场推出日式算命活动 展示语言模型和音频模型能力 [17] - 通过互动形式展示大模型与游戏结合的潜力 [18] 腾讯云的3D生成技术 - 腾讯云展台强调云计算能力支持游戏安全和运营 但重点提及混元3D技术 [21] - 混元3D已被国内多家游戏厂商应用 不仅用于物品如桌椅板凳 还用于人物3D建模并展现良好效果 [22][24] VAST的3D生成项目 - VAST的Tripo作为开源3D生成项目在日本等海外市场吸引游戏厂商关注 [26] - 参展重要目的是与海外客户增强线下交流 [27] - Meshy AI也参与线上展 展示3D生成技术 [29] AI陪玩应用展示 - 逗逗AI游戏伙伴海外版HakkoAI基于实时VLM技术 能理解游戏画面并提供深度陪伴 支持多款游戏如黑猴、老头环和星露谷物语 [32][33] - 其视觉语言模型LynkSoul VLM v1在游戏场景中表现超越GPT-4o、Claude-4-Sonnet和Gemini-2.5-Flash等顶尖通用模型 [34] 游戏与AI融合趋势 - AI技术在游戏展中展现出越来越多潜力 与游戏融合趋势不断升温 [36] - 中国技术力量在海外输出过程中 为游戏玩家创造更多可能性并带来未来惊喜 [36][37]