阿里正式发布新一代大模型Qwen3.5
每日经济新闻·2026-02-16 17:36

公司动态 - 公司于2月16日发布了名为Qwen3.5的新模型系列,并推出了该系列的首个模型Qwen3.5-397B-A17B的开放权重版本[1] - 该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术相结合[1] - 模型总参数量达到3970亿,但每次前向传播仅激活170亿参数[1] 产品与技术 - 新模型通过创新的混合架构设计,旨在实现出色的推理效率[1] - 模型在保持强大能力的同时,优化了运行速度与成本[1] - 技术核心是结合了线性注意力与稀疏混合专家系统,以实现参数的高效利用[1]