面向Agentic时代,阿里云“芯-云-模型-推理”全面升级
财联社·2026-05-20 16:45

阿里云全栈Agent化升级与产品发布 - 公司于5月20日峰会上宣布完成“芯片-云-模型-推理”全栈Agent化升级,并推出全新AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max [1] - 这是国内云厂商首次围绕Agent进行全栈产品发布,公司正在进行全栈技术革新,旨在建设中国最大的AI工厂 [1] 财务表现与增长引擎切换 - 根据最新财报,公司AI模型及应用服务的年度经常性收入(ARR)已超过80亿元人民币,预计年底将突破300亿元人民币,消息发布当天公司股价上涨8% [3] - Agent驱动的模型即服务(MaaS)收入将取代弹性计算服务(ECS)成为阿里云最大的产品线,标志着增长引擎全面切换为以Token为计量单位的AI收入 [3] 自研芯片进展与布局 - 平头哥发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,点对点时延低于150纳秒 [4] - 真武M890为训推一体芯片,配置144GB显存,片间互联带宽达800GB/s,性能是上一代真武810E的3倍 [6] - 平头哥首次公布芯片路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片 [6] - 目前真武系列AI芯片累计出货量已达56万片,服务超过20个行业的400多家客户 [6] - 结合自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片及ICN Switch互联芯片,平头哥的芯片版图已实现从“单点突破”到“全面覆盖” [8] - 构建全栈自研芯片矩阵的核心目标是实现算力、网力、存力的系统级协同,以满足Agentic时代毫秒间数十次模型调用的需求 [9] Agentic Cloud与产品重构 - 公司正将云产品本身改造为Agent可用的形态,对云产品进行了Skill化、MCP化和CLI化改造,使其成为Agent可像调函数一样调用的标准化能力模块 [10] - 传统云产品交互逻辑面向人类,而Agent工作负载具有“无规律弹性、短生命周期、瞬时起量即走”的特点,与传统云计算的稳态负载截然不同 [10] - 公司为Agent构建了完整的运行环境支撑,包括轻量高效的沙箱执行环境、多Agent协同能力、跨任务记忆能力、顺畅的数据流转通路及全域智能运维能力 [12] 旗舰模型能力与迭代 - 新旗舰模型Qwen3.7-Max在三方机构Arena全球大模型盲测总榜中,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1等国产模型,位列国产模型第一,与GPT、Claude、Gemini的最强模型接近 [13] - 一个实战案例显示,Qwen3.7-Max在从未接触过的真武M890芯片上,仅凭任务说明,自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍 [14] - 该案例展示了模型“自主完成复杂工程任务”的能力,这正是Agent场景最核心的需求 [16] - 大模型的核心范式正在从“对齐人类偏好”转向“对齐任务目标”,即从追求“说得好”转向要求“做得到” [16] - 近3个月内,千问旗舰模型已连续迭代了3.5、3.6、3.7三个版本,保持着极高的发布节奏,以匹配Agent时代对模型能力的指数级增长需求 [18] 百炼推理平台与开放生态 - 百炼推理平台是Agent运行的“生产车间”,构建了大规模GPU资源集群,并通过统一调度提升整体利用率,消除Agent在多轮对话和长链路任务中的重复计算开销 [19] - 平台保持开放接入策略,除了自研的千问模型矩阵,还接入了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3等第三方模型 [19] - 平台已全面开放,与多家AI厂商达成合作,提供“一个入口、多模型可选”的一站式服务体验 [19] - 平台提供按需、按时长的灵活计费模式,并支持通过统一SDK接口接入不同模型,以降低使用门槛和开发运维成本 [20] - 过去三个月,模型服务的Token消耗规模较上一季度大幅提升,截至2026年3月,百炼平台的客户数量同比增长了8倍 [20] 千问云官网与模型生态 - 千问云是公司成立17年来首次在阿里云官网之外推出的全新产品官网,采用Agent-Friendly设计理念,首页仅有一行Agent可读的代码指令“安装千问云skills” [3][20] - 公司同步推出Skills门户,将常用云功能封装为可被Agent直接调用的标准化模块,用户通过自然语言指令即可让Agent完成从资源识别到应用部署的全流程 [22] - 在模型生态方面,千问云已上架150余个模型系列、480余款各类模型,覆盖国内外主流模型,支持多款模型同步对比 [22] - 平台提供智能透明的用量管理机制,Agent可实时拉取模型用量数据进行成本优化,并通过CLI拉取日志实现异常识别与任务溯源 [22] - 千问云还推出了Token plan订阅模式,采用多模型支持、月费可管控的灵活计费方式,面向高频AI编程与Agent工具使用场景 [23]

面向Agentic时代,阿里云“芯-云-模型-推理”全面升级 - Reportify