中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈

阿里发布Qwen3.6-Plus模型 - 阿里发布了新一代基座大模型Qwen3.6-Plus，该模型在编程和智能体能力上实现了显著提升，被称为“捅破了国产大模型的天花板”[1][3] - 模型支持1M（一百万token）的上下文窗口，具备独立拆解任务、规划执行路径、自测迭代并达到目标的能力，并能根据简单提示词进行Vibe Coding[3][15] - Qwen3.6-Plus已第一时间上线阿里云百炼平台，API服务全面开放，并在悟空、千问APP等阿里AI应用平台同步上线[11][76][77] 模型性能与评测表现 - 在涵盖智能体编程和真实世界任务的权威评测中，Qwen3.6-Plus是目前最接近全球最强Claude系列的国产模型[6] - 在SWE-bench系列真实编程任务测试、Terminal-Bench2、NL2Repo、Claw-Eval、QwenClawBench等评测中，Qwen3.6-Plus几乎直逼Claude Opus 4.5，部分性能表现更优，并超越了参数规模为其2倍乃至3倍的其他主流模型[12] - 相较于上一代Qwen3.5模型，新版本在编程能力、智能体能力和工具调用能力上实现了大幅提升[12] Vibe Coding能力实测 - 模型能够根据一句简单的自然语言提示，生成功能完整的网页应用，例如一个可交互的“AI资讯日历网站”，具备月历视图、日期标注、详情页跳转及外部链接等功能，耗时约2分钟[19][20][21] - 在视觉设计方面，模型能根据“制作一个3D的雪山场景，中间有日式寺庙，风格参考塞尔达旷野之息”的提示，生成色彩鲜明、支持360度旋转和自由缩放的3D场景，并带有动态飘落的雪花粒子[25][26][28][29] - 模型还能生成复杂的交互应用，如“虚拟宠物养成网页”，该应用包含宠物状态系统、互动功能、任务和商店模块，宠物可跟随鼠标移动[29][31][32] - 仅用“生成一个美食卡通主题的消消乐小游戏网站”一句提示，模型即可输出包含核心玩法、连锁机制、视觉UI、数据持久化和多端适配的完整游戏[33][36] 多模态理解与执行能力 - 模型具备强大的多模态理解能力，能够解析长视频内容，进行逐秒脚本拆解，并从视觉、内容、目的三个维度进行推理判断，最终根据内容二创出符合小红书平台风格的爆款文案[37][38][39] - 模型能够根据一张旅游规划页面的图片，准确理解其内容与功能，并复刻出一个布局效果更好、视觉呈现更佳、内容更充实的完整在线网页，展示了其从视觉感知到代码生成的能力[40][42] 复杂编程与代码治理能力 - 模型支持通过命令行工具（如CC）直接调用API，实现高效自动化的前端开发，例如根据开源项目介绍（如AIRI项目）自动生成完整的项目官网落地页（landing page），耗时约3分钟[45][46][47][49][52] - 在问题分析与代码重构方面，模型能够分析老旧代码，自动整理出包含安全漏洞修复、Bug修复、代码架构优化、依赖升级和性能优化在内的详细优化清单，并在获得确认后实施具体的代码修改[45][56][58][60] - 模型展现出对复杂编程工作流的深度支持，集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化[16][17] 行业影响与意义 - 该模型通过“以小胜大”的策略，以更轻的体量实现了对标甚至超越2到3倍参数规模模型的效果，为用户提供了更高性价比的选择[12][13][71][72] - 模型大幅降低了普通人的编程门槛，基于自然语言驱动的Vibe Coding从概念变为现实，用户仅需一句大白话就能将想法转化为可运行的程序，降低了提示词和基础编程能力的要求[66][67][69][70] - Qwen3.6-Plus是阿里ATH（Alibaba Token Hub）思路在编程模型上的一次代表性落地，旨在创造、输送并普惠化高效低成本的Token[72][73] - Qwen3.6-Plus是千问3.6系列的首个模型，该系列后续将开源更多不同尺寸版本，性能更强的旗舰款Qwen3.6-Max也将在近期发布[74][75]