Qwen3系列模型 - 财报，业绩电话会，研报，新闻

Qwen3系列模型

搜索文档

破解大模型「无效并行推理」：Parallel-Probe问世，并行推理效率提升35.8%

机器之心· 2026-03-07 12:20

核心观点 - 研究团队提出了一种名为Parallel-Probe的Training-Free并行推理控制算法，旨在解决大模型在并行推理（Parallel Thinking）过程中存在的计算资源浪费问题 [2] - 该算法通过系统性分析发现，并行推理并非“算得越多越好”，全局共识常提前稳定，而少数长尾路径却持续占用大量资源，成为效率瓶颈 [2] - Parallel-Probe通过基于共识的早期停止和基于偏差的分支剪枝两大机制，在不牺牲核心准确率的前提下，显著提升了推理效率 [2][13] 技术原理与发现 - 研究通过引入2D Probing技术，系统性刻画了在线并行推理的全局动态性，揭示了三大底层特征 [8] - 特征一：非单调缩放，即准确率并非随算力投入单调增加，而是取决于“宽度”与“深度”的精细平衡 [12] - 特征二：路径长度不均，并行分支的生成长度差异极大，计算资源往往被少数“长尾”路径占据 [12] - 特征三：共识提早稳定，全局共识往往在所有分支结束前就已达成，平均共识达成率仅为0.31 [12] - 现有并行推理方法（如多数投票）的缺陷在于各推理分支彼此独立，即使大部分分支已达成共识，系统仍需等待所有冗余分支完成，导致效率低下 [5] 算法与性能 - Parallel-Probe是一种模型无关、即插即用的方法，可直接适配各种现成的开源或闭源大语言模型 [9][11] - 算法核心机制一：基于共识的早期停止，周期性提取各分支中间结果，一旦探测到全局多数答案在连续几个周期内保持稳定，便终止整组推理 [13] - 算法核心机制二：基于偏差的分支剪枝，实时监控每条路径，对显著偏离当前全局趋势的异常路径进行剔除，将资源集中在更有潜力的路径上 [13] - 实验表明，该算法能显著减少无效计算，将推理延迟降低35.8%，总token成本降低25.8% [2] - 在多个基准测试（AIME24, AIME25, HMMT25）和不同规模的基础模型（Qwen2-0.6B, 1.7B, 4B, 8B）上，Parallel-Probe在性能、成本效率和延迟效率之间建立了更优的平衡点，系统性地优于现有的ESC和SC等基准方法 [14] 基础设施与贡献 - 研究团队推出了名为SCOUT（顺序与并发离线利用测试床）的平台，实现了推理生成与控制策略的解耦，允许开发者在极低开销下模拟各种缩放策略，极大提升了测试效率 [15][16] - 相关代码、论文及Online Judge平台均已开源，可供行业研究使用 [6][16][18]

大模型并行推理

2D Probing

Artificial Intelligence

Artificial Intelligence

Parallel-Probe

SCOUT

Qwen3系列模型

计算机行业AI2026算力系列（二）：从云业务到千问APP，阿里算力需求保持旺盛态势

广发证券· 2026-01-30 15:10

行业投资评级 - 计算机行业评级为“买入” [3] 核心观点 - 在AI商业回报逐步显现的基础上，阿里巴巴或加大AI基础设施的投入，其算力需求保持旺盛态势 [1][7] - AI投资与云业务已开始形成协同效应，阿里云营收增长明显提速 [7][10] - 千问App有望成为阿里生态统一的超级Agent入口，其大规模推广有望进一步拉动AI算力需求，并形成新的商业化增长点 [7][16] - 千问系列大模型的持续迭代将保持训练端算力需求的旺盛状态 [7][21] 从云业务到千问APP，阿里算力需求保持旺盛态势 - **资本开支与投入计划**：以2025年11月截止的过去4个季度，阿里巴巴在AI+云基础设施的资本开支约1200亿元人民币 [7][10]。阿里正考虑将未来三年投入到AI基建与云计算上的3800亿元提升至4800亿元 [7][10] - **云业务增长与市场地位**：2025年第三季度，阿里云营收为398亿元，同比增长34.5%，主要由AI强劲需求驱动 [7][12]。AI相关产品已经连续9个季度实现三位数同比增长 [7][12]。根据Omdia报告，2025年上半年，阿里云在中国AI云市场份额位列第一，占比35.8% [7][12] - **千问App的生态整合与商业化潜力**：2026年1月15日，千问App宣布全面接入淘宝、支付宝、飞猪、高德等阿里生态业务，上线超过400项AI办事功能 [7][16]。其产品迭代节奏快，自2025年11月推出至全面接入生态仅花了2个月时间 [7][26]。报告判断，千问App作为超级Agent入口，其大规模推广或带来电商交易、金融服务、出行服务相关用户流量的快速增长，有望进一步拉动AI算力需求，并形成比广告或订阅模式更直接、更具长期价值的变现方式 [7][16] - **大模型持续迭代**：自2025年4月以来，Qwen3系列模型已迭代多个版本 [7][21]。2026年1月推出的Qwen3-Max-Thinking模型增强了自适应工具调用能力，性能比肩GPT-5.2-Thinking等模型 [7][21]。随着模型持续迭代，阿里巴巴对于训练端的算力需求将保持旺盛 [7][21] - **平头哥AI芯片的赋能作用**：平头哥自研的真武810E芯片可应用于AI训练、推理等场景，在当前英伟达H200在中国市场销售存在不确定性的情况下，有望填补阿里巴巴对于AI算力的需求 [24] 投资建议与关注公司 - **投资逻辑**：阿里巴巴对算力投入规模的上调，反映了其对于千问App等AI应用后续用户生态和商业拓展的信心 [7][26] - **建议关注的具体方向与公司**： - CDN相关业务有望受益于阿里云基础设施的拓展，建议关注**网宿科技** [26] - AI芯片和服务器等产品需求有望受拉动，建议关注**寒武纪、浪潮信息、紫光股份** [26] - 电商平台及相关商家IT服务有望受益于千问App的推广，建议关注**光云科技** [26] - 酒店预订相关IT服务有望受益于千问App的推广，建议关注**石基信息** [26] - 出行相关IT服务有望受益于千问App的推广，建议关注**千方科技** [26] - 千问系列大模型的商业拓展或激发同行加快大模型迭代节奏，建议关注火山引擎合作伙伴**汉得信息** [26]