通义千问混合推理模型Qwen3 - 财报，业绩电话会，研报，新闻

通义千问混合推理模型Qwen3

搜索文档

长江证券· 2025-05-09 10:43

报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 上周计算机板块震荡反弹，上涨2.59%，在长江一级行业中排名第2位，两市成交额占比为10.45%，人工智能及业绩高增标的活跃 [2][4] - 看好云&AI Agent两大主线，推荐关注云服务大厂、国产算力产业链（寒武纪、昇腾产业链）、各类垂类场景的AI Agent相关厂商 [2][6][52] 根据相关目录分别进行总结上周复盘：计算机板块持续反弹 - 计算机板块上周走势：受五一假期影响，上周仅有三个工作日，大盘震荡调整，上证综指周三报收3279.03点，下跌0.49%，计算机板块震荡反弹，上涨2.59%，在长江一级行业中排名第2位，两市成交额占比为10.45% [4][12] - 热点板块及个股：上周计算机板块人工智能及业绩高增标的持续活跃，人工智能相关股票如新*软件（+13.85%）等，业绩高增相关股票如创意信息（+20.95%）等 [16] 上周关键词：Qwen3、多邻国财报 - 阿里发布并开源Qwen3系列，智能体应用有望加速落地：4月29日凌晨，阿里发布并开源新一代通义千问混合推理模型Qwen3，包含MoE和Dense两种架构，共8款不同尺寸，旗舰模型是Qwen3 - 235B - A22B，采用Apache2.0协议开源，可免费下载模型并商用，也可调用API服务；Qwen3在推理等方面能力增强，部署成本大幅下降，能满足多样需求，加速智能体多场景灵活落地；建议关注AIAgent相关厂商等 [19][20][25] - 从多邻国FY25Q1财报看AI + 教育趋势变化：美东时间5月1日，多邻国发布2025财年Q1财报，营收2.3亿美元，同比增长38%，净利润3510万美元，同比增长30%，两项指标均高于彭博一致预期，股价盘中上涨21%达220亿美金市值；Q1业绩增速亮眼，上调Q2及全年指引超预期；营销推动用户增长及订单增速强劲，付费用户结构优化；“AI为先”战略加速推进，有望通过AI迭代核心功能，实现商业模式升级 [26][27][36] 重点推荐：云&AI Agent - CSP大厂超预期，看好云&AI Agent两大主线：美国公有云服务提供商微软、亚马逊等新一季度财报业绩超市场预期，微软云业务增长强劲，亚马逊AWS业务营收同比增长17%；虽短期Capex不及预期，但中长期有望上升；AI对CSP大厂业务边际影响增强，为后期Capex投入奠定基础，推荐关注云服务大厂、国产算力产业链、各类垂类场景的AI Agent相关厂商 [6][37][52]

AI产业速递：阿里发布并开源Qwen3系列，智能体应用有望加速落地

长江证券· 2025-05-01 10:42

报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 2025年4月29日凌晨阿里发布并开源新一代通义千问混合推理模型Qwen3，含MoE和Dense两种架构共8款不同尺寸，旗舰模型是Qwen3 - 235B - A22B，采用Apache2.0协议开源，可免费下载商用，也能通过阿里云百炼调用API服务 [2][5] - 小模型匹敌大模型，Agent能力积累，AI仍是今年技术变革最强主线，建议关注AIAgent相关厂商、中国推理算力产业链、云服务厂商、IDC [7] - 开源模型智能水平新高，模型能力持续增强，Qwen3在多方面大幅增强，能在思考和非思考模式间切换，可平衡效果、成本和时间 [11] - 部署成本大幅下降，有望加速应用放量，Qwen3参数量低，部署成本大降，显存占用仅为相近模型的三分之一 [11] - 包含两类架构八款尺寸，加强对MCP支持，加速智能体多场景灵活落地，Qwen3家族满足AI应用和不同场景对性能和成本的多样需求，延伸场景落地边界 [11] 根据相关目录分别进行总结事件描述 - 4月29日凌晨阿里发布并开源Qwen3，有MoE和Dense两种架构、8款不同尺寸，旗舰模型是Qwen3 - 235B - A22B，采用Apache2.0协议开源，可免费下载商用，可通过阿里云百炼调用API服务 [2][5] 事件评论小模型匹敌大模型，Agent能力积累 - Qwen3预训练数据集显著扩展，使用约36T个token，涵盖119种语言和方言，分三步预训练，后训练实施四阶段流程提升特定领域性能 [7] - 从训练模型过渡到训练Agent时代，AI是今年技术变革最强主线，建议关注AIAgent相关厂商、中国推理算力产业链（重点推荐寒武纪）、云服务厂商（关注与DeepSeek合作的）、IDC（关注与大厂合作的） [7] 开源模型智能水平新高，模型能力持续增强 - Qwen3作为Qwen系列新一代混合推理模型，在推理等多方面大幅增强，235B模型在ArenaHard测试得分95.6超OpenAI - o1和DeepSeek R1，在AIME25测试得分81.5刷新开源纪录 [11] - Qwen3能在思考和非思考模式间无缝切换，用户可控制模型“思考”程度，平衡效果、成本和时间 [11] 部署成本大幅下降，有望加速应用放量 - 成本降低源于参数量低和MoE架构下激活参数量降低，Qwen3最大参数量235B仅为DeepSeek - R1的1/3，部署满血版仅需4张H20，显存占用为相近模型的1/3 [11] - Qwen3旗舰模型部署成本是满血版R1的25% - 35%，大降75% - 65% [11] 包含两类架构八款尺寸，同时加强对MCP的支持，加速智能体多场景灵活落地 - Qwen3系列含两款MoE和六款Dense模型，MoE模型有Qwen3 - 235B - A22B和Qwen3 - 30B - A3B，Dense模型参数分别为32B、14B、8B、4B、1.7B和0.6B [11] - Qwen3更新加强对MCP支持，有强大工具调用能力，家族满足AI应用和不同场景对性能和成本的多样需求，延伸场景落地边界 [11]