产品发布 - 阿里云正式发布并开源通义千问AI编程大模型Qwen3-Coder 这是通义千问迄今为止最具代理能力的代码模型 [1] - Qwen3-Coder编程能力超越GPT4-1等闭源模型 在SWE-Bench评测中比肩全球最强的编程模型Claude4 [1] - Qwen3-Coder能帮助刚入行的程序员(工作两年)一天完成资深程序员一周的工作 生成一个品牌官网最快只需5分钟 [1] 技术参数 - Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型 总参数达480B 激活35B参数 [2] - 原生支持256K token的上下文并可扩展至1M长度 [2] - 预训练数据扩展至总计7-5T 其中代码占比70% [2] 性能表现 - 在SWE-bench Verified w/ OpenHands 500 turns评测中得分为69-6 [2] - 在WebArena评测中得分为49-9 在Mind2Web评测中得分为55-8 [2] - 在TAU-Bench Retail评测中得分为77-5 在TAU-Bench Airline评测中得分为60-0 [2] 应用场景 - 能帮助程序员完成基础编程任务 如写代码、补全代码、修Bug等 [3] - 代码测试、查询生成等工作从人工编写的数小时可降至数分钟 [3] - 将很快接入阿里的AI编程产品通义灵码 [3] 行业应用 - 阿里巴巴内部AI辅助代码生成比例已接近40% 较半年前提升50%左右 [4] - 一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等公司已接入千问AI编程模型 [4] - AI编程工具在开发领域的渗透率约为20% 主要集中在前端和小型项目 [4] 行业趋势 - 阿里、字节、百度等都在加快AI编程赛道的布局 [4] - AI编程产品有着相对较高的用户付费意愿 有着替代高薪资程序员的可能性 [4] - 预计一年后AI编程在开发领域的渗透率有望达到40%-50% [4] 竞争策略 - 阿里云通过模型、平台、产品三位一体提升AI编程能力 [5] - 持续构建通义千问的通用模型以及针对代码领域专项调优的模型 [5] - 认为AI编程的竞争已经进入到了端到端的竞争 [5]
阿里云开源AI编程模型,新手程序员一天可完成“老师傅”一周工作