Workflow
阿里开源最强AI编程模型Qwen3-Coder,性能比肩Claude4 | 钛快讯
钛媒体APP·2025-07-23 08:01

模型发布与性能 - 阿里开源通义千问AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,超越GPT4-1等闭源模型,比肩Claude4 [1] - Qwen3-Coder采用混合专家MoE架构,总参数480B,激活35B参数,原生支持256K token上下文并可扩展至1M长度 [2] - 模型在代码占比70%的7-5T数据上预训练,通过强化学习提升编程任务及智能体任务能力 [3] 技术指标与评测表现 - Terminal-Bench评测得分37-5,高于Claude Sonnet-4的35-5和GPT4-1的25-3 [2] - SWE-bench Verified评测中,w/ OpenHands 500 turns得分69-6,接近Claude4的70-4 [2] - WebArena评测得分49-9,超越GPT4-1的44-3;Mind2Web评测得分55-8,超越Claude4的47-4 [2] - 在工具调用评测BPCL-v3中得分68-7,超越GPT4-1的62-9 [2] 应用场景与商业化 - 模型擅长多步骤长任务,支持Agent调用工具解决复杂编程问题,适用于网页开发、AI搜索、深度研究等场景 [3] - 可大幅提升编程效率,代码测试、查询生成等工作从数小时降至数分钟,降低普通人编程门槛 [4] - 模型已在魔搭社区、HuggingFace等平台开源,将接入阿里AI编程产品通义灵码,API上线阿里云百炼 [4] - 千问系列编程模型全球下载量突破2000万次,阿里巴巴内部及一汽集团、建设银行等头部企业已接入使用 [4]