阿里发布Qwen3.6-Plus模型 - 阿里发布了新一代基座大模型Qwen3.6-Plus,该模型在编程和智能体能力上实现了显著提升,被称为“捅破了国产大模型的天花板”[1][3] - 模型支持1M(一百万token)的上下文窗口,具备独立拆解任务、规划执行路径、自测迭代并达到目标的能力,并能根据简单提示词进行Vibe Coding[3][15] - Qwen3.6-Plus已第一时间上线阿里云百炼平台,API服务全面开放,并在悟空、千问APP等阿里AI应用平台同步上线[11][76][77] 模型性能与评测表现 - 在涵盖智能体编程和真实世界任务的权威评测中,Qwen3.6-Plus是目前最接近全球最强Claude系列的国产模型[6] - 在SWE-bench系列真实编程任务测试、Terminal-Bench2、NL2Repo、Claw-Eval、QwenClawBench等评测中,Qwen3.6-Plus几乎直逼Claude Opus 4.5,部分性能表现更优,并超越了参数规模为其2倍乃至3倍的其他主流模型[12] - 相较于上一代Qwen3.5模型,新版本在编程能力、智能体能力和工具调用能力上实现了大幅提升[12] Vibe Coding能力实测 - 模型能够根据一句简单的自然语言提示,生成功能完整的网页应用,例如一个可交互的“AI资讯日历网站”,具备月历视图、日期标注、详情页跳转及外部链接等功能,耗时约2分钟[19][20][21] - 在视觉设计方面,模型能根据“制作一个3D的雪山场景,中间有日式寺庙,风格参考塞尔达旷野之息”的提示,生成色彩鲜明、支持360度旋转和自由缩放的3D场景,并带有动态飘落的雪花粒子[25][26][28][29] - 模型还能生成复杂的交互应用,如“虚拟宠物养成网页”,该应用包含宠物状态系统、互动功能、任务和商店模块,宠物可跟随鼠标移动[29][31][32] - 仅用“生成一个美食卡通主题的消消乐小游戏网站”一句提示,模型即可输出包含核心玩法、连锁机制、视觉UI、数据持久化和多端适配的完整游戏[33][36] 多模态理解与执行能力 - 模型具备强大的多模态理解能力,能够解析长视频内容,进行逐秒脚本拆解,并从视觉、内容、目的三个维度进行推理判断,最终根据内容二创出符合小红书平台风格的爆款文案[37][38][39] - 模型能够根据一张旅游规划页面的图片,准确理解其内容与功能,并复刻出一个布局效果更好、视觉呈现更佳、内容更充实的完整在线网页,展示了其从视觉感知到代码生成的能力[40][42] 复杂编程与代码治理能力 - 模型支持通过命令行工具(如CC)直接调用API,实现高效自动化的前端开发,例如根据开源项目介绍(如AIRI项目)自动生成完整的项目官网落地页(landing page),耗时约3分钟[45][46][47][49][52] - 在问题分析与代码重构方面,模型能够分析老旧代码,自动整理出包含安全漏洞修复、Bug修复、代码架构优化、依赖升级和性能优化在内的详细优化清单,并在获得确认后实施具体的代码修改[45][56][58][60] - 模型展现出对复杂编程工作流的深度支持,集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化[16][17] 行业影响与意义 - 该模型通过“以小胜大”的策略,以更轻的体量实现了对标甚至超越2到3倍参数规模模型的效果,为用户提供了更高性价比的选择[12][13][71][72] - 模型大幅降低了普通人的编程门槛,基于自然语言驱动的Vibe Coding从概念变为现实,用户仅需一句大白话就能将想法转化为可运行的程序,降低了提示词和基础编程能力的要求[66][67][69][70] - Qwen3.6-Plus是阿里ATH(Alibaba Token Hub)思路在编程模型上的一次代表性落地,旨在创造、输送并普惠化高效低成本的Token[72][73] - Qwen3.6-Plus是千问3.6系列的首个模型,该系列后续将开源更多不同尺寸版本,性能更强的旗舰款Qwen3.6-Max也将在近期发布[74][75]
中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈