阿里云开源AI编程模型，新手程序员一天可完成“老师傅”一周工作

产品发布 - 阿里云正式发布并开源通义千问AI编程大模型Qwen3-Coder 这是通义千问迄今为止最具代理能力的代码模型 [1] - Qwen3-Coder编程能力超越GPT4-1等闭源模型在SWE-Bench评测中比肩全球最强的编程模型Claude4 [1] - Qwen3-Coder能帮助刚入行的程序员(工作两年)一天完成资深程序员一周的工作生成一个品牌官网最快只需5分钟 [1] 技术参数 - Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型总参数达480B 激活35B参数 [2] - 原生支持256K token的上下文并可扩展至1M长度 [2] - 预训练数据扩展至总计7-5T 其中代码占比70% [2] 性能表现 - 在SWE-bench Verified w/ OpenHands 500 turns评测中得分为69-6 [2] - 在WebArena评测中得分为49-9 在Mind2Web评测中得分为55-8 [2] - 在TAU-Bench Retail评测中得分为77-5 在TAU-Bench Airline评测中得分为60-0 [2] 应用场景 - 能帮助程序员完成基础编程任务如写代码、补全代码、修Bug等 [3] - 代码测试、查询生成等工作从人工编写的数小时可降至数分钟 [3] - 将很快接入阿里的AI编程产品通义灵码 [3] 行业应用 - 阿里巴巴内部AI辅助代码生成比例已接近40% 较半年前提升50%左右 [4] - 一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等公司已接入千问AI编程模型 [4] - AI编程工具在开发领域的渗透率约为20% 主要集中在前端和小型项目 [4] 行业趋势 - 阿里、字节、百度等都在加快AI编程赛道的布局 [4] - AI编程产品有着相对较高的用户付费意愿有着替代高薪资程序员的可能性 [4] - 预计一年后AI编程在开发领域的渗透率有望达到40%-50% [4] 竞争策略 - 阿里云通过模型、平台、产品三位一体提升AI编程能力 [5] - 持续构建通义千问的通用模型以及针对代码领域专项调优的模型 [5] - 认为AI编程的竞争已经进入到了端到端的竞争 [5]