阿里巴巴发布千问Qwen3.5-Plus大模型 - 公司于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus,其性能据称可媲美Gemini 3 Pro [1] 模型性能与效率 - 千问3.5-Plus总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,推理吞吐量最大提升至19倍 [3] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿个token时,激活内存减少约50%,训练还能提速10% [5] 成本与定价 - Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro价格的1/18 [1] 技术架构与创新 - 模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练 [1] - 公司自研的门控技术成果已融入模型创新的混合架构,结合线性注意力机制与稀疏混合专家MoE模型架构 [3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练 [5] 多模态能力 - 在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能 [2] - 支持长达2小时(对应1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成 [2] - 实现了视觉理解与代码能力的原生融合,可将手绘界面草图直接转为可用的前端代码 [2] Agent智能体与应用 - 模型在推理、编程、Agent智能体等全方位基准评估中表现优异 [1] - 千问3.5可自主操作手机与电脑高效完成日常任务,在移动端支持更多主流APP,在PC端可处理复杂的多步骤操作 [5] - 公司构建的可扩展Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模 [6] - 千问App发布的全球首个消费级AI购物Agent,在春节期间6天时间帮用户完成了1.2亿笔订单 [6] 开源生态与市场影响 - 自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态 [6] - 千问模型全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和 [6] - 开发者基于千问开发的衍生模型超20万 [6] - 千问3.5扩展支持201种语言,将词表大小从15万扩展到25万,可最高提升小语种60%的编码效率 [6] 模型获取与未来计划 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型,开发者可在魔搭社区和HuggingFace下载新模型,或通过阿里云百炼获取API服务 [7] - 公司很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布 [7]
千问3.5除夕开源!可通过千问APP免费体验