行业竞争逻辑转变 - 大模型行业正经历从“参数竞赛”到“架构竞赛”的拐点,竞争维度从“谁更强”转向“如何更高效地变强”,核心竞争维度转变为效率和成本 [1][3] - 继续单纯堆叠参数面临边际收益递减,而部署和推理成本刚性增长,导致模型性能曲线与普及曲线背离 [1][3] - 行业竞争标准发生变化,从过去比拼参数量和基准跑分,转向比拼谁能以更少的资源、更统一的架构覆盖更多的能力维度 [4] Qwen 3.5 模型性能与效率突破 - 模型总参数397B,激活参数仅17B,以不到40%的参数量超越了上一代万亿参数级的Qwen3-Max [1] - 多项基准测试成绩媲美或超越顶级闭源模型:MMLU-Pro知识推理得分87.8超越GPT-5.2,博士级难题GPQA得分88.4超越Claude 4.5,指令遵循IFBench以76.5分刷新所有模型纪录 [1] - 效率提升显著:在32K常用上下文场景下推理吞吐量提升8.6倍,256K超长上下文场景下最大提升至19倍,部署显存占用降低60% [3] - API定价极具竞争力,每百万Token低至0.8元,仅为同等性能Gemini 3 pro价格的1/18 [1][8] 技术实现路径:架构与协同创新 - 通过稀疏MoE、线性注意力、原生多Token预测等架构创新,大幅压缩激活参数,实现极致参数效率 [4] - 实现了从纯文本模型到原生多模态模型的代际跃迁,在文本和视觉混合Token上联合预训练,同时大幅新增STEM和推理数据 [4] - 原生多模态训练采用前期投入更高的路线,让不同模态各自选择最优并行策略并在关键位置做跨模态对齐,使多模态训练吞吐量几乎追平纯文本训练 [7] - 采用FP8/FP32混合精度策略,使激活内存减少约50%,同时训练效率提升10% [7] 公司的核心能力与战略协同 - 具备“模型+芯片+云”的垂直整合能力,自研的真武芯片针对MoE架构做了专项优化,能从硬件层面适配极致稀疏结构的计算需求 [5] - 拥有强大的基础研究向产品转化能力,例如获得NeurIPS 2025最佳论文奖的门控技术已融入Qwen 3.5,成为产品核心组件 [5] - 在原生多模态方向上投入决心大,承担了更高的工程风险,旨在打造具备原生跨模态能力的基础设施级模型 [7][8] - 极致的性价比(如API价格)源于模型架构效率、自研芯片优化和云基础设施的三重协同,而非补贴定价,具备可持续性 [8] 市场影响与商业生态 - 对闭源厂商构成结构性挑战,当开源模型在性能上追平且价格极低时,闭源厂商的API溢价根基被动摇 [9] - 千问在中国企业级大模型调用市场排名第一,阿里云在2025上半年中国AI云市场份额达到35.8%,超过第二到第四名总和,且份额从上季度的33%继续攀升至36% [11][12] - 开源生态飞轮效应显著:开源模型数量超过400个,开发者构建的衍生模型突破20万个,全球下载量突破10亿次,单月下载量超过第2到第8名总和 [12] - 千问App的AI购物Agent在春节期间6天完成1.2亿笔订单,成为全球大模型在真实消费场景中规模最大的商业化验证之一 [12] 行业未来展望与竞争格局 - 行业竞争进入新阶段,对模型架构、硬件协同和工程效率的深度理解将定义下一轮竞争规则 [13] - 留下关键观察问题:闭源阵营的护城河还剩什么;行业中具备类似垂直整合能力的玩家还有多少;原生多模态路线对当前主流分步组装路线的冲击 [13] - 公司已连续三代在开源模型的关键能力维度上稳定输出天花板级产品,这种持续的稳定性本身构成一种竞争优势 [13]
千问 3.5 发布,四成参数超越万亿模型,大模型的竞赛逻辑变了