通义千问混合推理模型Qwen3

搜索文档
CSP大厂超预期,看好云、AIAgent两大主线
长江证券· 2025-05-09 10:43
报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 上周计算机板块震荡反弹,上涨2.59%,在长江一级行业中排名第2位,两市成交额占比为10.45%,人工智能及业绩高增标的活跃 [2][4] - 看好云&AI Agent两大主线,推荐关注云服务大厂、国产算力产业链(寒武纪、昇腾产业链)、各类垂类场景的AI Agent相关厂商 [2][6][52] 根据相关目录分别进行总结 上周复盘:计算机板块持续反弹 - 计算机板块上周走势:受五一假期影响,上周仅有三个工作日,大盘震荡调整,上证综指周三报收3279.03点,下跌0.49%,计算机板块震荡反弹,上涨2.59%,在长江一级行业中排名第2位,两市成交额占比为10.45% [4][12] - 热点板块及个股:上周计算机板块人工智能及业绩高增标的持续活跃,人工智能相关股票如新*软件(+13.85%)等,业绩高增相关股票如创意信息(+20.95%)等 [16] 上周关键词:Qwen3、多邻国财报 - 阿里发布并开源Qwen3系列,智能体应用有望加速落地:4月29日凌晨,阿里发布并开源新一代通义千问混合推理模型Qwen3,包含MoE和Dense两种架构,共8款不同尺寸,旗舰模型是Qwen3 - 235B - A22B,采用Apache2.0协议开源,可免费下载模型并商用,也可调用API服务;Qwen3在推理等方面能力增强,部署成本大幅下降,能满足多样需求,加速智能体多场景灵活落地;建议关注AIAgent相关厂商等 [19][20][25] - 从多邻国FY25Q1财报看AI + 教育趋势变化:美东时间5月1日,多邻国发布2025财年Q1财报,营收2.3亿美元,同比增长38%,净利润3510万美元,同比增长30%,两项指标均高于彭博一致预期,股价盘中上涨21%达220亿美金市值;Q1业绩增速亮眼,上调Q2及全年指引超预期;营销推动用户增长及订单增速强劲,付费用户结构优化;“AI为先”战略加速推进,有望通过AI迭代核心功能,实现商业模式升级 [26][27][36] 重点推荐:云&AI Agent - CSP大厂超预期,看好云&AI Agent两大主线:美国公有云服务提供商微软、亚马逊等新一季度财报业绩超市场预期,微软云业务增长强劲,亚马逊AWS业务营收同比增长17%;虽短期Capex不及预期,但中长期有望上升;AI对CSP大厂业务边际影响增强,为后期Capex投入奠定基础,推荐关注云服务大厂、国产算力产业链、各类垂类场景的AI Agent相关厂商 [6][37][52]
AI产业速递:阿里发布并开源Qwen3系列,智能体应用有望加速落地
长江证券· 2025-05-01 10:42
报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 2025年4月29日凌晨阿里发布并开源新一代通义千问混合推理模型Qwen3,含MoE和Dense两种架构共8款不同尺寸,旗舰模型是Qwen3 - 235B - A22B,采用Apache2.0协议开源,可免费下载商用,也能通过阿里云百炼调用API服务 [2][5] - 小模型匹敌大模型,Agent能力积累,AI仍是今年技术变革最强主线,建议关注AIAgent相关厂商、中国推理算力产业链、云服务厂商、IDC [7] - 开源模型智能水平新高,模型能力持续增强,Qwen3在多方面大幅增强,能在思考和非思考模式间切换,可平衡效果、成本和时间 [11] - 部署成本大幅下降,有望加速应用放量,Qwen3参数量低,部署成本大降,显存占用仅为相近模型的三分之一 [11] - 包含两类架构八款尺寸,加强对MCP支持,加速智能体多场景灵活落地,Qwen3家族满足AI应用和不同场景对性能和成本的多样需求,延伸场景落地边界 [11] 根据相关目录分别进行总结 事件描述 - 4月29日凌晨阿里发布并开源Qwen3,有MoE和Dense两种架构、8款不同尺寸,旗舰模型是Qwen3 - 235B - A22B,采用Apache2.0协议开源,可免费下载商用,可通过阿里云百炼调用API服务 [2][5] 事件评论 小模型匹敌大模型,Agent能力积累 - Qwen3预训练数据集显著扩展,使用约36T个token,涵盖119种语言和方言,分三步预训练,后训练实施四阶段流程提升特定领域性能 [7] - 从训练模型过渡到训练Agent时代,AI是今年技术变革最强主线,建议关注AIAgent相关厂商、中国推理算力产业链(重点推荐寒武纪)、云服务厂商(关注与DeepSeek合作的)、IDC(关注与大厂合作的) [7] 开源模型智能水平新高,模型能力持续增强 - Qwen3作为Qwen系列新一代混合推理模型,在推理等多方面大幅增强,235B模型在ArenaHard测试得分95.6超OpenAI - o1和DeepSeek R1,在AIME25测试得分81.5刷新开源纪录 [11] - Qwen3能在思考和非思考模式间无缝切换,用户可控制模型“思考”程度,平衡效果、成本和时间 [11] 部署成本大幅下降,有望加速应用放量 - 成本降低源于参数量低和MoE架构下激活参数量降低,Qwen3最大参数量235B仅为DeepSeek - R1的1/3,部署满血版仅需4张H20,显存占用为相近模型的1/3 [11] - Qwen3旗舰模型部署成本是满血版R1的25% - 35%,大降75% - 65% [11] 包含两类架构八款尺寸,同时加强对MCP的支持,加速智能体多场景灵活落地 - Qwen3系列含两款MoE和六款Dense模型,MoE模型有Qwen3 - 235B - A22B和Qwen3 - 30B - A3B,Dense模型参数分别为32B、14B、8B、4B、1.7B和0.6B [11] - Qwen3更新加强对MCP支持,有强大工具调用能力,家族满足AI应用和不同场景对性能和成本的多样需求,延伸场景落地边界 [11]