Workflow
千问3 Only
icon
搜索文档
AI云计算行业发展现状
2025-09-26 10:29
**AI 云计算行业发展现状与阿里巴巴战略分析** **一 行业与公司概况** * 纪要涉及的行业为AI云计算行业 公司为阿里巴巴及其阿里云[1] * 阿里云在中国云计算市场占据领先地位 市场份额约为33-35% 排名第一 同时也是全球第四大先进营销厂商[2] * 国内云计算赛道已形成两个梯队 阿里属于前站的新一代云计算厂商 其技术架构与谷歌相似 从底层自研芯片到智能体应用 与其他竞争者拉开差距[1][2] * 华为云位居国内第二 市场份额约13% 火山引擎紧随其后占比接近14% 其他主要厂商包括腾讯和百度[2] **二 市场竞争格局与技术优势** * 阿里云拥有自研芯片和智能体应用能力 形成包括数据标注 模型后训练及托管的MAAS 2.0服务矩阵[1][3] * 阿里开源社区拥有400万用户 并提供丰富的模型矩阵覆盖语言模型 视觉理解与生成 全模态及语音模型等[3] * 火山引擎尚未实现自研芯片 百度有一定前站特征但较弱 腾讯主要做应用层面工作 华为由于其深层架构且不开源 不能完全对标全球领先的谷歌 微软和AWS[2] * 从全球布局来看 阿里的数据中心遍布东南亚 中美洲 中东及欧洲多个国家 如新加坡 泰国 墨西哥 迪拜 西班牙等地 而其他几家如腾讯和华为则仅在东南亚有一些数据中心[2] * 目前国内各大云厂商收入结构中 一半以上仍来自于传统IaaS服务 如云主机 存储 安全网络带宽等 然而未来几年内 这些收入结构将逐步转向PaaS SaaS以及AI驱动产品[3] **三 Token需求 价格与用户行为趋势** * 国内Token需求激增 主要由互联网巨头利用AI重构产品驱动 如高德地图 淘宝和美团等 互联网流量中约60%来自巨头重构原有产品体系[1][4] * 以阿里的10亿DAU为例 每人每天使用10次 每次消耗2000个Token 总计每天消耗20万亿个Token 推算出市场接近90万亿个Token需求[4] * 预计每年渗透率将从30%增长到明年的60% 再到后年的90% 将保持高速增长并持续增加Token消耗量[4] * 2023年第三季度 主流模型Token价格较第一季度下降30%-50% 从每百万token 16元降至8元左右 字节跳动甚至将部分模型调价至4元或2元[6] * 但阿里巴巴新模型23MAX主导定价权 其新定价为每百万token 24元 输入6元[6] * AI Chatbot豆包平均停留时长从第一季度的13分钟增加到第三季度的一次对话半小时左右[6] * AIGC视频生成速度显著提升 从第一季度生成一个十几秒的视频需要20分钟 到现在只需3-5分钟[6] **四 产品发布与技术亮点** * 阿里云栖大会发布7款大模型 旗舰产品23MAX拥有万亿参数 具备极致稀疏性(仅有3.7%的参数在推理时激活)和超低幻觉率(降至1%) 支持百万token上下文[7] * 千问3 Only是国内首个全模态模型 可以处理文本 声音 视觉理解和生成等任务[7] * 通用万象代表阿里视频生成能力 重返全球前三 在电商平台上已有40%的图片和视频通过此模式生成[7] * 未来迭代方向将从语言模型为骨干逐步走向多模态融合 并对标GPT-5 从明年开始 全模态将成为主流技术路径[7] **五 资本支出与战略投入** * 未来三年 阿里巴巴计划投入3800亿CAPEX 主要用于全球化数据中心建设(占1/3) AI服务器采购(占硬件相关支出60%)和网络设备升级[10] * 全球化布局重点在亚洲和欧洲 南美洲以墨西哥为起点辐射巴西等人口密集国家[1][10] * 云业务中的硬件服务器折旧周期为5年 每年约20% 2025年开始进入加速折旧期 到2026年会产生大量老旧卡淘汰替换[11] * 阿里资本支出的逻辑是通过这些技术赋能内部核心场景 如电商 通过提升用户停留时长 广告投放精准率等指标来增加GMV 而不是直接销售AI产品[11] **六 算力基础设施与芯片合作** * 当前云计算卡市场总量约为36万张 先进训练卡约8万张 推理卡十几万张[2][12] * 国产推理卡性能已超过H20 国产海关账号芯片指标与A100相当甚至更优(IP16达到400多TFRAPS IP32超过100 带宽达到500多G)[2][12] * 阿里巴巴与NVIDIA合作聚焦"Physical AI" 将Isaac Cosmos世界模型及Universe自动驾驶模拟和机器模拟架构组件部署到阿里云 并迭代聚生智能平台 提供全流程解决方案[2][13][14] * 今年发布的所有模型均使用英伟达CUDA训练卡进行训练[17] * 目前对外服务的推理部分全部使用英伟达CUDA卡 国产卡预计明年上线对外出租 目前仍处于内部测试阶段[18] * 明年的存量CUDA芯片可以支撑现有模型迭代 但需要补充新的型号如B3A或B30A以承接下一代模型训练[19] **七 应用场景与市场拓展** * 垂直智能体结合模型和Agent框架 使客户能够将业务数据填入其中 适用于许多垂直行业 AI编程是最早落地的应用之一[8] * 在企业实际应用中 99%的客户使用的是智能体而非直接使用AI模型[22] * 在C端市场 AI技术主要应用于AI搜索 虚拟社交 数字人 面向C端的AI编程助手 以及图像生成和视频生成等AIGC玩法[9] * 阿里巴巴将其端侧模型与手机芯片进行合作 并推送给手机制造商 如传音 OPPO vivo 魅族和荣耀等 在新能源汽车领域 也与高通 地平线等车载芯片供应商合作[16] * 硬件侧是重要战略之一 其小尺寸语言模型(如1.5B 3B 7B)专为端侧硬件设计[15] **八 其他重要信息** * 由于受到限制 中国的AI基础设施建设速度慢于海外 抑制了国内AI应用爆发[1][5] * 当前国内每日token消耗量约为90万亿 其中阿里的消耗量接近18万亿[20] * 随着多智能体架构AgentScope的发展 单次交互token消耗从两三千增加至两三万倍 明年多模态架构底座将进一步增加token处理量[20] * 国内多模态模型不追求超大参数规模 而是通过极致稀疏激活来优化推理效率[21] * 海外计算中心建设目前以通用算力为主 AI技术作为补充 由于兼容性 合规性等问题 海外市场暂时仍以英伟达的卡为主导[22] * 对于服务器组装业务 一般采用就近原则进行采购和组装 在中国境内则与新华三 富士康或浪潮等厂商合作[22]