Workflow
原生多模态训练
icon
搜索文档
千问3.5除夕开源!可通过千问APP免费体验
新浪财经· 2026-02-16 21:00
阿里巴巴发布千问Qwen3.5-Plus大模型 - 公司于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus,其性能据称可媲美Gemini 3 Pro [1] 模型性能与效率 - 千问3.5-Plus总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,推理吞吐量最大提升至19倍 [3] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿个token时,激活内存减少约50%,训练还能提速10% [5] 成本与定价 - Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro价格的1/18 [1] 技术架构与创新 - 模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练 [1] - 公司自研的门控技术成果已融入模型创新的混合架构,结合线性注意力机制与稀疏混合专家MoE模型架构 [3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练 [5] 多模态能力 - 在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能 [2] - 支持长达2小时(对应1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成 [2] - 实现了视觉理解与代码能力的原生融合,可将手绘界面草图直接转为可用的前端代码 [2] Agent智能体与应用 - 模型在推理、编程、Agent智能体等全方位基准评估中表现优异 [1] - 千问3.5可自主操作手机与电脑高效完成日常任务,在移动端支持更多主流APP,在PC端可处理复杂的多步骤操作 [5] - 公司构建的可扩展Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模 [6] - 千问App发布的全球首个消费级AI购物Agent,在春节期间6天时间帮用户完成了1.2亿笔订单 [6] 开源生态与市场影响 - 自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态 [6] - 千问模型全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和 [6] - 开发者基于千问开发的衍生模型超20万 [6] - 千问3.5扩展支持201种语言,将词表大小从15万扩展到25万,可最高提升小语种60%的编码效率 [6] 模型获取与未来计划 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型,开发者可在魔搭社区和HuggingFace下载新模型,或通过阿里云百炼获取API服务 [7] - 公司很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布 [7]
千问3.5,除夕开源!
上海证券报· 2026-02-16 19:08
核心观点 - 公司于2月16日开源全新一代大模型Qwen3.5-Plus,其性能媲美Gemini 3 Pro,且API价格仅为后者的1/18,展现出极强的性能与成本优势 [2][3][6] - 千问3.5系列实现了从纯文本到原生多模态的代际跃迁,在多项核心评测中超越包括GPT-5.2、Claude 4.5在内的顶级模型,并在底层架构、训练效率和Agent能力上取得重大突破 [4][6][7][8][10] - 公司持续推动模型开源与生态建设,千问模型全球下载量已突破10亿次,基于其开发的衍生模型超20万个,巩固了其全球第一开源模型的地位,并已通过AI购物Agent实现大规模商业化验证 [12] 模型发布与性能表现 - 公司于2月16日除夕当天开源了Qwen3.5-Plus模型,性能媲美Gemini 3 Pro [2] - Qwen3.5-Plus的API价格为每百万token 0.8元,仅为Gemini 3 Pro价格的1/18 [3][6] - 公司即将发布性能更强的旗舰模型Qwen3.5-Max,并计划继续开源不同尺寸、不同功能的千问3.5系列模型 [2] 技术突破与架构创新 - 千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练 [4] - 模型以不到40%的参数量获得了超万亿参数的Qwen3-Max基座模型的顶尖性能 [4] - 模型底层架构全面革新,采用自研门控技术、线性注意力机制与稀疏混合专家(MoE)架构,实现了3970亿总参数中仅激活170亿参数的极致效率 [6][7][8] - 通过训练稳定优化及多token预测等技术,在保持与Qwen3-Max同等性能的同时大幅提升推理效率 [8] 评测成绩与能力优势 - 在知识推理评测MMLU-Pro中得分87.8分,超越GPT-5.2 [4] - 在博士级难题测评GPQA中得分88.4分,高于Claude 4.5 [4] - 在指令遵循评测IFBench中以76.5分刷新所有模型纪录 [4] - 在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,表现均超越Gemini 3 Pro、GPT-5.2 [4] - 在多模态推理、通用视觉问答、文本识别、空间智能、视频理解等众多权威评测中均斩获最佳性能 [6] - 视觉能力支持长达2小时(对应1M token上下文)的视频直接输入与分析 [6] - 实现了视觉理解与代码能力的原生融合,可将手绘草图转为前端代码,或通过截图定位修复UI问题 [6] 效率与成本优化 - 相比前代模型,Qwen3.5-Plus部署显存占用降低60% [6] - 在32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,最大推理吞吐量可提升至19倍 [8] - 原生多模态训练的吞吐量几近100%持平纯文本基座模型训练,大幅降低了训练门槛 [10] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿token时,激活内存减少约50%,训练还能提速10% [10] Agent能力与商业化进展 - 千问3.5可自主操作手机与电脑完成日常任务,在移动端和PC端处理复杂操作,显著提升效率 [10] - 公司构建了可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体支持扩展至百万级规模 [10] - 公司于1月15日发布全球首个消费级AI购物Agent,并在春节前夕用6天时间帮助用户完成了1.2亿笔订单,实现了大规模真实世界任务执行和商业化验证 [12] 开源生态与市场影响 - 自2023年开源以来,公司已开源400多个千问模型,覆盖全尺寸、全模态 [12] - 千问模型全球下载量突破10亿次,单月下载量是第二到第八名模型的总和 [12] - 开发者基于千问开发的衍生模型超过20万个,公司被公认为全球第一开源模型 [12] - 千问3.5扩展支持201种语言,词表大小从15万扩展到25万,最高可提升小语种60%的编码效率 [12] - 千问App、PC端已第一时间接入Qwen3.5-Plus模型,开发者可通过魔搭社区、HuggingFace或阿里云百炼获取模型及API服务 [12]