Workflow
阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了
AI前线·2025-07-23 08:22

阿里发布Qwen3-Coder代码模型 - 核心观点:阿里发布迄今为止最具代理能力的代码模型Qwen3-Coder,具备卓越的代码和Agent能力,支持358种编程语言,在多项评测中取得开源模型最佳效果[1] - Qwen3-Coder采用混合专家MoE架构,参数规模达480B,激活参数35B,原生支持256K token上下文,可通过YaRN扩展到1M token[1] - 模型在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等任务上表现优异,可与Claude Sonnet4媲美[1] 模型性能表现 - 在Terminal-Bench评测中得分37.5,优于Kimi-K2 Instruct的30.0[2] - SWE-bench Verified得分69.6,SWE-bench Live得分26.3,均领先其他模型[2] - Multi-SWE-bench mini得分25.8,优于Kimi-K2 Instruct的19.8[2] - WebArena评测得分49.9,Mind2Web得分55.8,表现优异[3] - BFCL-v3评测得分68.7,TAU-Bench Retail得分77.5,展示强大工具使用能力[3] 技术特点与创新 - 训练数据总量达7.5T,其中代码占比70%[8] - 采用扩展Code RL训练方法,通过自动扩展测试样例构造高质量训练实例[7] - 实现可验证环境的扩展系统,可同时运行20k独立环境[10] - 利用Qwen2.5-Coder对低质数据进行清洗与重写,提升数据质量[8] 应用场景与效率提升 - 可帮助程序员完成基础编程任务,如写代码、补全代码、修Bug等[14] - 编程工作效率大幅提升,代码测试、查询生成等工作从数小时降至数分钟[14] - 刚入行程序员一天可完成资深程序员一周的工作[4] - 生成一个品牌官网最快只需5分钟[4] 开发者生态与商业化 - 已在魔搭社区、HuggingFace等平台开源,Github获得5.1k stars[5] - 将接入阿里AI编程产品通义灵码,API已上线阿里云百炼[5] - 阿里云百炼提供API服务,输入Token成本从$1/百万到$6/百万不等[20] 开发者反馈 - 开发者称赞模型速度快,可替代每月200美元的Claude Code[13] - 有开发者反馈模型在逐步推理提示下表现更好[19] - 部分开发者遇到基本操作失败的问题[20]