Workflow
代码模型
icon
搜索文档
通义千问发布Qwen3-Coder代码模型,性能媲美Claude Sonnet4
新浪科技· 2025-07-23 07:45
产品发布 - 阿里通义千问发布Qwen3-Coder代码模型,宣称是迄今为止最具代理能力的代码模型 [1] - Qwen3-Coder拥有多个尺寸,最强大版本是Qwen3-Coder-480B-A35B-Instruct,具有480B参数激活35B参数的MoE模型结构 [2] - 该模型原生支持256K token上下文,可通过YaRN扩展到1M token,在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use上取得开源模型SOTA效果 [2] 性能表现 - 在Terminal-Bench测试中得分为37.5,优于Open Models Kini-K2(30.0)和Proprietary Models OpenAT(25.3) [2] - 在SWE-bench Multilingual测试中得分为54.7,高于Claude(53.3)和OpenAT(31.5) [2] - 在WebArena测试中得分为49.9,优于Open Models Kini-K2(47.4)和OpenAT(44.3) [2] - 在BPCL-V3测试中得分为68.7,仅次于Claude(73.3)但优于其他对比模型 [2] 配套工具 - 推出并开源命令行工具Qwen Code,基于Gemini Code二次开发,可激发Qwen3-Coder在Agentic Coding任务上的表现 [3] - Qwen3-Coder可与社区编程工具如Claude Code、Cline等结合使用 [3]
通义千问发布其最具代理能力的代码模型Qwen3-Coder
快讯· 2025-07-23 06:14
通义千问发布Qwen3-Coder代码模型 产品发布 - 通义千问正式发布Qwen3-Coder代码模型,是其迄今为止最具代理能力的代码模型 [1] - 公司重点推出当前最强大版本Qwen3-Coder-480B-A35B-Instruct [1] 技术参数 - Qwen3-Coder-480B-A35B-Instruct为480B参数激活35B参数的MoE模型 [1] - 原生支持256K token上下文,可通过YaRN扩展到1M token [1] 性能表现 - 在AgenticCoding、Agentic Browser-Use和Agentic Tool-Use上取得开源模型SOTA效果 [1] - 性能可与ClaudeSonnet4媲美 [1]