AI春节档最强杀手锏来了!千问3.5除夕强势亮相,开源SOTA、性价比之王
雷峰网·2026-02-17 11:32

阿里发布新一代开源大模型Qwen3.5-Plus - 阿里于2月16日除夕开源全新一代大模型Qwen3.5-Plus,其性能媲美Gemini-3-pro、GPT-5.2等顶级闭源模型,登顶全球最强开源模型宝座[2] - 该模型是阿里旗下首款原生多模态模型,在性能和推理效率上均实现大幅提升[2] - 模型总参数达3970亿,实际激活仅170亿,性能却超越万亿参数的Qwen3-Max模型[2] - 部署显存占用降低60%,最大吞吐量可提升至19倍[2] 模型性能评测表现卓越 - 在MMLU-Pro认知能力评测中得分87.8,超越GPT5.2[3] - 在博士级难题GPQA测评中得分88.4,高于Claude 4.5[3] - 在指令遵循IFBench评测中以76.5分刷新所有模型纪录[3] - 在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,表现均超越Gemini-3-Pro[3] - 在多模态推理、通用视觉问答、文本识别、空间智能、视频理解等众多权威评测中均斩获最佳性能[12] 模型架构与技术创新 - 注意力机制革新:引入混合注意力机制,让模型自动识别关键信息精读、非关键部分快读,大幅降低长文本处理算力成本并保障精度[7] - 架构代际跃迁:采用极致稀疏的混合专家架构,3970亿总参数中仅需激活不到5%即可调动全部知识储备,解决算力浪费问题[8] - 原生多Token预测:训练时学会“预判”,能同时规划多个词甚至一整句话的输出,让长文本生成、代码补全等场景响应速度近乎翻倍[8] - 系统级训练稳定性优化:应用注意力门控机制等底层优化,在256K超长上下文下推理吞吐量最大提升至19倍[9] - 原生多模态训练路径:从预训练第一天起就在文本和视觉混合数据上联合学习,视觉与语言在统一参数空间内深度融合[9] - 在训练阶段,文本、图像、视频等混合数据训练吞吐量几近100%持平纯文本基座模型训练,降低了训练门槛[11] - 通过FP8、FP32精度应用策略,训练稳定扩展到数十万亿个token时,激活内存减少约50%,训练提速10%[11] 成本与商业化策略 - 阿里云百炼上的千问3.5 API定价为每百万Token输入低至0.8元,仅为Gemini-3-pro的1/18[5][14] - 极致普惠定价的底气来自模型和AI基础设施层面的协同创新,包括自研芯片的加持[15] - 平头哥真武芯片针对主流MoE架构模型做了大量优化,满足千问大模型对大规模计算的需求[17] - 通过模型、芯片以及云的协同创新,打破了性能、效率和成本的不可能三角[17] - 千问3.5面向全球开发者开源,开发者可在魔搭社区和HuggingFace免费下载部署[17] - 阿里将陆续开源不同尺寸、不同功能的Qwen3.5系列模型,支持本地、端侧等多场景部署[17] - 千问系列已开源400多个模型,衍生模型数量超20万,全球下载量突破10亿次[17] 对阿里云业务的影响 - 千问3.5的性能和成本突破是阿里在云、芯片和模型三大技术领域持续深耕的结果[19] - 千问大模型的持续爆火让阿里云再次进入高速增长期[19] - 2025年上半年,中国AI云整体市场规模达223亿元,阿里云占比35.8%,超过第二到第四名总和[19] - 2025年,阿里云在中国云市场的份额从上季度的33%提升至36%,领先优势进一步扩大[19]

AI春节档最强杀手锏来了!千问3.5除夕强势亮相,开源SOTA、性价比之王 - Reportify