行业与公司 * 行业:AI基础设施,包括云计算、边缘计算、AI芯片、服务器硬件(PCB、散热、光互联)、内存技术(CXL)[1] * 公司: * 云服务商 (CSP):阿里云、腾讯云、金山云、AWS、Cloudflare、火山引擎[2][3][4] * 硬件/芯片:英伟达(下一代“菲曼”芯片)、蓝企(CXL)[6][7] * 产业链: * PCB:胜宏、沪电、菲利华、生益科技、鼎泰高科[7][8] * 散热:英维克、申菱环境[8] * 服务器集成:中科曙光[8] * 光互联:天孚通信、源杰科技、泰辰光[8] * 模型厂商:Anthropic、智谱、Deepseek[4] * 其他:Open Router(API聚合平台)、软通、华为升腾(政企方案)[2][3] 核心观点与论据 1 云服务商业模式变革:从推理API到智能体打包服务 * 驱动因素:OpenCloud现象级增长,从开发者工具演进为全民级AI产品,GitHub Star数在约2个月内突破26万,单周用户达200万人次,为2026年乃至有史以来增长最快的开源项目[2] * 计费逻辑转变:云服务从单纯按token计费的推理API,转向算力、存储、网络带宽的打包计费,综合客单价显著提升[1][2] * 商业化溢价机制: * 高并发与token乘数效应:智能体执行多步操作,单任务消耗可达数百万甚至上千万token,远超纯推理单次约2000 token的水平[1][3] * 叠加高利润组件:打包服务集成向量数据库、安全沙箱(调用费高于普通虚拟机),带来持续的网络、存储IO及带宽费用[3] * 资源占用模式改变:从按需调用转向要求算力资源持续stand by,推动客户购买预留吞吐量或专享算力池,实现资源溢价[1][3] * 市场响应:国内外云厂商迅速上线打包服务,如AWS的Bedrock blueprint、腾讯云的5分钟快速部署、阿里云/火山引擎的全托管环境[2][3] 2 云服务投资机会:聚焦定价权与合规性 * 头部CSP掌握定价权:大型B端/G端客户(如金融机构、医疗集团)出于数据合规与安全考虑,倾向于选择可将服务嵌入企业内网的头部云厂商,这构成了关键的定价权基础[1][4] * 价值重估:在涨价趋势下,头部云厂商在2026年有望迎来价值重估,重点关注阿里、腾讯、金山云[4] * 模型厂商策略调整:为应对智能体带来的高资源消耗(如Anthropic因消费级账号滥用被迫封禁第三方Agent接入),模型厂商开始严格限制并发并推动客户使用价格更高的官方API和预留吞吐量,进一步强化了云厂商的“稀缺性”溢价能力[3][4] 3 基础设施硬件边际变化:CPU、CXL与边缘计算 * CPU需求显著拉动:智能体带来巨大通用计算需求,且部分负载不能全部运行在AI服务器机柜内。当前GPU与CPU配比约为8:1~8:2,未来可能提升至2:1甚至1:1,在GPU数量增长与CPU配比提升的双重作用下,CPU需求增量具备放大效应[1][6] * CXL(Compute Express Link)渗透加速:为应对智能体“超长上下文”带来的内存瓶颈,CXL被视为打破内存墙的优选方案。预计2026年CXL渗透率处于低个位数(约3%~5%) 的爬坡阶段,2027年有望迎来非线性加速爆发[6] * 边缘计算分流云中心推理:以Cloudflare的Moto Worker为例,通过在全球边缘节点进行Prompt Caching,拦截并缓存重复请求,减少回传云中心,凭借低时延“截胡”大量API流量,可能形成新的AI基建形态[1][5] 4 下一代芯片(英伟达“菲曼”)驱动的产业链增量 * PCB价值量与地位跃升:菲曼芯片采用1.6nm工艺并集成LPU,采用COOP先进封装,取消传统ABF载板,使PCB从承载板变为互联枢纽。单芯片相关PCB价值量从过去的几百美元跃升至数千美元。工艺要求也大幅提高,层数可能从十多层跃升至接近30层甚至50到52层以上[1][7][8] * 液冷成为标配:算力密度指数级提升带来功耗激增,液冷(尤其是冷板式) 已成为AI算力中心标配,需求旺盛[1][8] * 光互联潜力:进入RUBY时代后,跨机柜互联逼近铜线传输物理极限。若GTC大会释放CPU规模化量产或系统级参考设计的信号,将对光模块及交换机产业链形成强催化[1][8] 其他重要内容 * OpenCloud生态规模:围绕其构建的工具插件超过5,000个,相关扩展包单周下载量突破1,500万次,生态粘性增强[2] * 第三方平台流量激增:受OpenCloud拉动,如Open Router平台过去两周日均API请求量环比增长300%以上,OpenCloud请求占比一度接近50%[2] * 政企市场方案:出现面向政企客户的重度打包方案(如软通与华为升腾的“锐动AI智能体育平台”),将OpenCL框架与国产算力绑定,提供私有化部署,应用于工业制造、政务审计等场景[3] * 智能体运行成本实例:海外实测显示,若智能体在多步循环或死循环中持续自我修正,单日可消耗**“几百美金”级别**的成本[3]
聚焦AI基础设施的关键变化
2026-03-10 18:17