Workflow
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

核心观点 - 阿里通义大模型团队开源Qwen3-Coder,刷新AI编程SOTA,超越开源模型DeepSeek V3、Kimi K2及闭源标杆Claude Sonnet 4 [1] - Qwen3-Coder为开源免费模型,用户无需每月支付200美元使用Claude Code [2] - 模型效果被评价为“改变游戏规则” [3] 模型规格 - Qwen3-Coder-480B-A35B-Instruct为450B参数的MoE模型,激活参数35B [5] - 原生支持256K上下文,通过YaRN技术可扩展至1M长度 [6][23] 功能演示 - 简单prompt即可生成复杂功能:如p5js交互动画、动态天气卡片、3D地球可视化、可交互小游戏 [11][13][14][16] - 实测案例:生成可编辑简历模板、扫雷游戏(提示词直接输出可运行代码) [17][19] 技术细节 - 预训练阶段:数据扩展(7.5T tokens,70%为代码数据)、上下文扩展、合成数据扩展 [20][21][22] - 后训练阶段:采用Scaling Code RL(自动生成测试用例提升执行成功率)和Scaling Long-Horizon RL(阿里云支持20000个独立环境运行) [24][27] 开源生态 - 提供多端体验:Qwen官网、命令行工具Qwen Code(适配OpenAI SDK)、阿里云百炼平台API [28] - 采用Apache License 2.0协议,商用友好 [29] - 中国开源模型技术领先,Qwen3-Coder被视为开源编程Agent的重大飞跃 [30][32][34]