阿里通义千问AI编程大模型Qwen3-Coder发布 - 阿里正式发布并开源全新AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,超越GPT4-1等闭源模型,比肩全球最强编程模型Claude 4 [1] - Qwen3-Coder是千问系列首个采用混合专家MoE架构的代码模型,总参数480B,激活参数35B,原生支持256K上下文并可扩展至1M长度 [2] - 该模型在代码占比70%的7.5T数据上进行预训练,后训练阶段进行了编程任务及智能体任务的强化学习 [2] Qwen3-Coder技术性能 - 最强大版本Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use三类任务中获得开源SOTA [3] - 在Terminal-Bench测试中得分37.5,高于Claude Sonnet-4的35.5和GPT4-1的25.3 [2] - 在SWE-bench Verified测试中,500轮得分为69.6,接近Claude的70.4 [2] - 在执行任务时能调用的工具数量比Claude多几倍 [3] Qwen3-Coder应用场景 - 具备"氛围编程"功能,可完成写代码、补全代码、修Bug等基础编程任务 [4] - 编程工作效率大幅提升,代码测试、查询生成等工作从数小时降至数分钟 [4] - 新人程序员一天可完成资深程序员一周的工作量,生成品牌官网最快只需5分钟 [4] - 普通人用一句话即可生成复杂3D物理模拟过程 [4] 商业化与市场表现 - 采用阶梯计费方式,256K-1M档输入价格6美元/百万token,输出价格60美元/百万token [4] - 有望取代昂贵的Claude成为Agent领域最受欢迎的编程模型 [4] - 千问系列编程模型全球下载量已突破2000万次,是全球最受欢迎的开源编程模型 [6] - 阿里巴巴内部已大量使用,一汽集团、中国石油、建设银行等行业头部企业也已接入 [6] 行业竞争格局 - AI编程成为检验模型性能的重要领域,科技巨头加大投入布局 [5] - 谷歌以24亿美元引入初创公司Windsurf核心团队及技术 [5] - ChatGPT用户请求中近29%与编程相关,反映企业用户对AI辅助开发的兴趣 [5] - AI编程有利于补强云服务生态黏性,是大模型商业化的重要机会点 [5]
阿里,最新发布!