OpenClaw 太火！最合适它的大模型排行榜来了，国产两个进前三～

OpenClaw现象级爆发与衍生市场 - 2026年初，AI项目OpenClaw成为现象级产品，迅速登顶GitHub，并催生了上门安装服务这一新兴市场 [1] - 上门安装OpenClaw的服务费从几百元人民币一路飙升至最高上万元人民币，有服务提供者在短短几天内就赚得盆满钵满 [1] - 相关服务需求广泛出现在深圳、广州、杭州、成都等多个中国主要城市，形成了活跃的线下服务市场 [1] 大模型在OpenClaw生态中的性能表现 - 根据OpenClaw作者发布的大模型适配排行榜，在模型成功率指标上，Google的gemini-3-flash-preview以95.1%位居第一，MiniMax的minimax-m2.1以93.6%和Moonshot AI的kimi-k2.5以93.4%分列二、三位 [10][11] - 在模型速度指标上，MiniMax的minimax-m2.5以105.96秒的最佳时间排名第一，领先于Google的gemini-2.0-flash（106.05秒）和Meta的llama-3.1-70b（106.14秒） [12] - 在模型使用成本指标上，OpenAI的gpt-5-nano每次任务成本最低，为0.03美元，而国内模型中MiniMax的minimax-m2.1成本为0.14美元，表现较优 [13] AI Agent基准测试系统PinchBench - PinchBench是一个开源的AI Agent基准测试系统，通过让不同大模型执行同一组真实任务来评估其作为智能体核心的表现 [14][15] - 该系统摒弃模拟测试，任务覆盖会议排期、代码编写、邮件分拣、主题调研、文件管理等23个跨场景的真实任务 [14][18] - 评估主要围绕三个核心指标：任务成功率（Success Rate）、完成任务所需速度（Speed）以及运行任务的模型成本（Cost） [17][19] - 每个任务的评估同时采用自动脚本检查和LLM法官（Claude Opus）打分两种方式 [18]