报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 2025年4月29日凌晨阿里发布并开源新一代通义千问混合推理模型Qwen3,含MoE和Dense两种架构共8款不同尺寸,旗舰模型是Qwen3 - 235B - A22B,采用Apache2.0协议开源,可免费下载商用,也能通过阿里云百炼调用API服务 [2][5] - 小模型匹敌大模型,Agent能力积累,AI仍是今年技术变革最强主线,建议关注AIAgent相关厂商、中国推理算力产业链、云服务厂商、IDC [7] - 开源模型智能水平新高,模型能力持续增强,Qwen3在多方面大幅增强,能在思考和非思考模式间切换,可平衡效果、成本和时间 [11] - 部署成本大幅下降,有望加速应用放量,Qwen3参数量低,部署成本大降,显存占用仅为相近模型的三分之一 [11] - 包含两类架构八款尺寸,加强对MCP支持,加速智能体多场景灵活落地,Qwen3家族满足AI应用和不同场景对性能和成本的多样需求,延伸场景落地边界 [11] 根据相关目录分别进行总结 事件描述 - 4月29日凌晨阿里发布并开源Qwen3,有MoE和Dense两种架构、8款不同尺寸,旗舰模型是Qwen3 - 235B - A22B,采用Apache2.0协议开源,可免费下载商用,可通过阿里云百炼调用API服务 [2][5] 事件评论 小模型匹敌大模型,Agent能力积累 - Qwen3预训练数据集显著扩展,使用约36T个token,涵盖119种语言和方言,分三步预训练,后训练实施四阶段流程提升特定领域性能 [7] - 从训练模型过渡到训练Agent时代,AI是今年技术变革最强主线,建议关注AIAgent相关厂商、中国推理算力产业链(重点推荐寒武纪)、云服务厂商(关注与DeepSeek合作的)、IDC(关注与大厂合作的) [7] 开源模型智能水平新高,模型能力持续增强 - Qwen3作为Qwen系列新一代混合推理模型,在推理等多方面大幅增强,235B模型在ArenaHard测试得分95.6超OpenAI - o1和DeepSeek R1,在AIME25测试得分81.5刷新开源纪录 [11] - Qwen3能在思考和非思考模式间无缝切换,用户可控制模型“思考”程度,平衡效果、成本和时间 [11] 部署成本大幅下降,有望加速应用放量 - 成本降低源于参数量低和MoE架构下激活参数量降低,Qwen3最大参数量235B仅为DeepSeek - R1的1/3,部署满血版仅需4张H20,显存占用为相近模型的1/3 [11] - Qwen3旗舰模型部署成本是满血版R1的25% - 35%,大降75% - 65% [11] 包含两类架构八款尺寸,同时加强对MCP的支持,加速智能体多场景灵活落地 - Qwen3系列含两款MoE和六款Dense模型,MoE模型有Qwen3 - 235B - A22B和Qwen3 - 30B - A3B,Dense模型参数分别为32B、14B、8B、4B、1.7B和0.6B [11] - Qwen3更新加强对MCP支持,有强大工具调用能力,家族满足AI应用和不同场景对性能和成本的多样需求,延伸场景落地边界 [11]
AI产业速递:阿里发布并开源Qwen3系列,智能体应用有望加速落地
长江证券·2025-05-01 10:42