阿里开源最强AI编程模型Qwen3-Coder，性能比肩Claude4

模型发布与性能 - 阿里开源通义千问AI编程大模型Qwen3-Coder，编程能力登顶全球开源模型阵营，超越GPT4-1等闭源模型，比肩Claude4 [1] - Qwen3-Coder采用混合专家MoE架构，总参数480B，激活35B参数，原生支持256K token上下文并可扩展至1M长度 [2] - 模型在代码占比70%的7-5T数据上预训练，通过强化学习提升编程任务及智能体任务能力 [3] 技术指标与评测表现 - Terminal-Bench评测得分37-5，高于Claude Sonnet-4的35-5和GPT4-1的25-3 [2] - SWE-bench Verified评测中，w/ OpenHands 500 turns得分69-6，接近Claude4的70-4 [2] - WebArena评测得分49-9，超越GPT4-1的44-3；Mind2Web评测得分55-8，超越Claude4的47-4 [2] - 在工具调用评测BPCL-v3中得分68-7，超越GPT4-1的62-9 [2] 应用场景与商业化 - 模型擅长多步骤长任务，支持Agent调用工具解决复杂编程问题，适用于网页开发、AI搜索、深度研究等场景 [3] - 可大幅提升编程效率，代码测试、查询生成等工作从数小时降至数分钟，降低普通人编程门槛 [4] - 模型已在魔搭社区、HuggingFace等平台开源，将接入阿里AI编程产品通义灵码，API上线阿里云百炼 [4] - 千问系列编程模型全球下载量突破2000万次，阿里巴巴内部及一汽集团、建设银行等头部企业已接入使用 [4]