原生多模态训练 - 财报，业绩电话会，研报，新闻

原生多模态训练

搜索文档

新浪财经· 2026-02-16 21:00

阿里巴巴发布千问Qwen3.5-Plus大模型 - 公司于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus，其性能据称可媲美Gemini 3 Pro [1] 模型性能与效率 - 千问3.5-Plus总参数为3970亿，激活参数仅170亿，性能超过万亿参数的Qwen3-Max模型 [1] - 模型部署显存占用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍 [1] - 在常用的32K上下文场景中，推理吞吐量可提升8.6倍；在256K超长上下文情况下，推理吞吐量最大提升至19倍 [3] - 通过FP8、FP32精度应用策略，在训练扩展到数十万亿个token时，激活内存减少约50%，训练还能提速10% [5] 成本与定价 - Qwen3.5-Plus的API价格每百万Token低至0.8元，仅为Gemini 3 Pro价格的1/18 [1] 技术架构与创新 - 模型实现了从纯文本模型到原生多模态模型的代际跃迁，基于视觉和文本混合token进行预训练 [1] - 公司自研的门控技术成果已融入模型创新的混合架构，结合线性注意力机制与稀疏混合专家MoE模型架构 [3] - 原生多模态训练在阿里云AI基础设施上完成，混合数据训练吞吐量几近100%持平纯文本基座模型训练 [5] 多模态能力 - 在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能 [2] - 支持长达2小时（对应1M token上下文）的视频直接输入，适用于长视频内容分析与摘要生成 [2] - 实现了视觉理解与代码能力的原生融合，可将手绘界面草图直接转为可用的前端代码 [2] Agent智能体与应用 - 模型在推理、编程、Agent智能体等全方位基准评估中表现优异 [1] - 千问3.5可自主操作手机与电脑高效完成日常任务，在移动端支持更多主流APP，在PC端可处理复杂的多步骤操作 [5] - 公司构建的可扩展Agent异步强化学习框架，端到端可加速3到5倍，并将插件式智能体Agent支持扩展至百万级规模 [6] - 千问App发布的全球首个消费级AI购物Agent，在春节期间6天时间帮用户完成了1.2亿笔订单 [6] 开源生态与市场影响 - 自2023年开源以来，阿里已开源400多个千问模型，覆盖全尺寸、全模态 [6] - 千问模型全球下载量突破10亿次，单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和 [6] - 开发者基于千问开发的衍生模型超20万 [6] - 千问3.5扩展支持201种语言，将词表大小从15万扩展到25万，可最高提升小语种60%的编码效率 [6] 模型获取与未来计划 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型，开发者可在魔搭社区和HuggingFace下载新模型，或通过阿里云百炼获取API服务 [7] - 公司很快将继续开源不同尺寸、不同功能的千问3.5系列模型，性能更强的旗舰模型Qwen3.5-Max不久也将发布 [7]

大模型

原生多模态训练

Agent智能体

Artificial Intelligence

Artificial Intelligence

千问3.5

千问APP

千问3.5，除夕开源！

上海证券报· 2026-02-16 19:08

核心观点 - 公司于2月16日开源全新一代大模型Qwen3.5-Plus，其性能媲美Gemini 3 Pro，且API价格仅为后者的1/18，展现出极强的性能与成本优势 [2][3][6] - 千问3.5系列实现了从纯文本到原生多模态的代际跃迁，在多项核心评测中超越包括GPT-5.2、Claude 4.5在内的顶级模型，并在底层架构、训练效率和Agent能力上取得重大突破 [4][6][7][8][10] - 公司持续推动模型开源与生态建设，千问模型全球下载量已突破10亿次，基于其开发的衍生模型超20万个，巩固了其全球第一开源模型的地位，并已通过AI购物Agent实现大规模商业化验证 [12] 模型发布与性能表现 - 公司于2月16日除夕当天开源了Qwen3.5-Plus模型，性能媲美Gemini 3 Pro [2] - Qwen3.5-Plus的API价格为每百万token 0.8元，仅为Gemini 3 Pro价格的1/18 [3][6] - 公司即将发布性能更强的旗舰模型Qwen3.5-Max，并计划继续开源不同尺寸、不同功能的千问3.5系列模型 [2] 技术突破与架构创新 - 千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁，基于视觉和文本混合token进行预训练 [4] - 模型以不到40%的参数量获得了超万亿参数的Qwen3-Max基座模型的顶尖性能 [4] - 模型底层架构全面革新，采用自研门控技术、线性注意力机制与稀疏混合专家（MoE）架构，实现了3970亿总参数中仅激活170亿参数的极致效率 [6][7][8] - 通过训练稳定优化及多token预测等技术，在保持与Qwen3-Max同等性能的同时大幅提升推理效率 [8] 评测成绩与能力优势 - 在知识推理评测MMLU-Pro中得分87.8分，超越GPT-5.2 [4] - 在博士级难题测评GPQA中得分88.4分，高于Claude 4.5 [4] - 在指令遵循评测IFBench中以76.5分刷新所有模型纪录 [4] - 在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中，表现均超越Gemini 3 Pro、GPT-5.2 [4] - 在多模态推理、通用视觉问答、文本识别、空间智能、视频理解等众多权威评测中均斩获最佳性能 [6] - 视觉能力支持长达2小时（对应1M token上下文）的视频直接输入与分析 [6] - 实现了视觉理解与代码能力的原生融合，可将手绘草图转为前端代码，或通过截图定位修复UI问题 [6] 效率与成本优化 - 相比前代模型，Qwen3.5-Plus部署显存占用降低60% [6] - 在32K上下文场景中，推理吞吐量可提升8.6倍；在256K超长上下文情况下，最大推理吞吐量可提升至19倍 [8] - 原生多模态训练的吞吐量几近100%持平纯文本基座模型训练，大幅降低了训练门槛 [10] - 通过FP8、FP32精度应用策略，在训练扩展到数十万亿token时，激活内存减少约50%，训练还能提速10% [10] Agent能力与商业化进展 - 千问3.5可自主操作手机与电脑完成日常任务，在移动端和PC端处理复杂操作，显著提升效率 [10] - 公司构建了可扩展的Agent异步强化学习框架，端到端可加速3到5倍，并将插件式智能体支持扩展至百万级规模 [10] - 公司于1月15日发布全球首个消费级AI购物Agent，并在春节前夕用6天时间帮助用户完成了1.2亿笔订单，实现了大规模真实世界任务执行和商业化验证 [12] 开源生态与市场影响 - 自2023年开源以来，公司已开源400多个千问模型，覆盖全尺寸、全模态 [12] - 千问模型全球下载量突破10亿次，单月下载量是第二到第八名模型的总和 [12] - 开发者基于千问开发的衍生模型超过20万个，公司被公认为全球第一开源模型 [12] - 千问3.5扩展支持201种语言，词表大小从15万扩展到25万，最高可提升小语种60%的编码效率 [12] - 千问App、PC端已第一时间接入Qwen3.5-Plus模型，开发者可通过魔搭社区、HuggingFace或阿里云百炼获取模型及API服务 [12]