Workflow
AI产业跟踪:Qwen3Next开源发布,大幅降本有望加速AI落地
长江证券·2025-09-14 22:38

行业投资评级 - 行业评级为看好 并维持该评级 [7] 核心观点 - 阿里于9月12日发布下一代基础模型架构Qwen3-Next 并开源基于该架构的Qwen3-Next-80B-A3B系列模型 [2][4] - Qwen3-Next在模型架构上实现重大突破 展现出国产大模型性能和技术持续向世界领先水平演进 [2][9] - 该模型在性能提升的同时大幅降低训练成本 有望加速国产AI应用落地进程并推动算力需求爆发 [2][9] - 建议关注中国推理算力产业链 阿里云产业链 云服务厂商和IDC等投资方向 [2][9] 模型架构创新 - 采用混合注意力机制:引入Gated DeltaNet并采用3:1混合策略 75%层使用Gated DeltaNet 25%层保留标准注意力 兼顾性能与效率 [9] - 采用高稀疏度MoE结构:总参数量达800亿 但每次推理仅激活约30亿参数 扩展到512个总专家 采用10路由专家加1共享专家组合设计 [9] - 进行稳定性优化:采用Zero-Centered RMSNorm 对norm weight施加weight decay 初始化时归一化MoE router参数 [9] - 引入多token预测机制:采用原生Multi-Token Prediction机制 得到Speculative Decoding接受率较高的MTP模块 [9] 性能提升数据 - Base模型拥有800亿参数仅激活30亿参数 实现与Qwen3-32B dense模型相近甚至略好性能 [9] - 训练所需GPU Hours不到Qwen3-30A-3B的80% 相比Qwen3-32B仅需9.3%的GPU计算资源就能取得更优性能 [9] - 推理效率大幅提升:在4k tokens上下文长度下 吞吐量接近前者的7倍 当上下文长度超过32k时 吞吐提升达到10倍以上 [9] 开源策略影响 - 模型已在魔搭社区和HuggingFace开源 开发者使用门槛显著降低 加速技术传播和应用 [9] - 有助于构建开放协作社区 促进技术持续创新 加速国产大模型在技术和性能上的突破 [9] 投资建议关注领域 - 中国推理算力产业链 重点推荐国内AI芯片领军企业寒武纪 [2][9] - 阿里云产业链 [2][9] - 云服务厂商 [2][9] - IDC 重点关注与腾讯 阿里 字节等大厂合作的IDC [2][9]