阿里千问Qwen3.5模型发布 - 阿里巴巴于2月16日除夕开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型[1] - Qwen3.5-Plus版本总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型,实现了“以小胜大”[1] - 该模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练[1] 模型性能与效率突破 - 部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍[1][3] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,最大提升至19倍[3] - API价格极具竞争力,每百万token低至0.8元,仅为Gemini 3 Pro的1/18[1] 技术架构与训练创新 - 模型性能跃升源于对Transformer经典架构的重大创新突破,融入了获2025 NeurIPS最佳论文的自研门控技术[3] - 结合线性注意力机制与稀疏混合专家模型架构,实现了3970亿总参数仅激活170亿的极致效率[3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练,大幅降低训练门槛[4] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿token时,激活内存减少约50%,训练还能提速10%[4] 多模态与视觉能力 - 千问3.5在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能[3] - 以不到40%的参数量获得了超万亿参数Qwen3-Max基座模型的顶尖性能[1] Agent智能体应用突破 - 基于顶级视觉能力,千问3.5实现了从Agent框架到Agent应用的新突破,可自主操作手机与电脑高效完成日常任务[4] - 在移动端支持更多主流APP与指令,在PC端可处理复杂的多步骤操作,如跨应用数据整理、自动化流程执行[4] - 团队构建了可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体支持扩展至百万级规模[4] 行业动态:AI大模型“春节档” - 国产大模型集体上新抢占“AI春节档”,行业竞争加剧[5] - 字节跳动于2月14日推出豆包大模型2.0系列,针对大规模生产环境进行优化[5] - MiniMax于2月13日上线并开源新一代文本模型MiniMax M2.5[5] - 字节跳动发布Seedance2.0,阿里发布Qwen-Image-2.0,DeepSeek更新至1.7.4版本,面壁智能开源MiniCPM-o 4.5模型[5]
阿里除夕发布千问3.5,性能媲美Gemini 3,价更低