通义千问发布Qwen3-Coder代码模型,性能媲美Claude Sonnet4
产品发布 - 阿里通义千问发布Qwen3-Coder代码模型,宣称是迄今为止最具代理能力的代码模型 [1] - Qwen3-Coder拥有多个尺寸,最强大版本是Qwen3-Coder-480B-A35B-Instruct,具有480B参数激活35B参数的MoE模型结构 [2] - 该模型原生支持256K token上下文,可通过YaRN扩展到1M token,在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use上取得开源模型SOTA效果 [2] 性能表现 - 在Terminal-Bench测试中得分为37.5,优于Open Models Kini-K2(30.0)和Proprietary Models OpenAT(25.3) [2] - 在SWE-bench Multilingual测试中得分为54.7,高于Claude(53.3)和OpenAT(31.5) [2] - 在WebArena测试中得分为49.9,优于Open Models Kini-K2(47.4)和OpenAT(44.3) [2] - 在BPCL-V3测试中得分为68.7,仅次于Claude(73.3)但优于其他对比模型 [2] 配套工具 - 推出并开源命令行工具Qwen Code,基于Gemini Code二次开发,可激发Qwen3-Coder在Agentic Coding任务上的表现 [3] - Qwen3-Coder可与社区编程工具如Claude Code、Cline等结合使用 [3]