Azure/云策略 - Azure/AI工作负载不仅需要AI加速器,还需要大量配套支持,利润空间很大程度上来源于这些配套服务[4] - 将Azure打造成为长尾工作负载的终极平台,这是超大规模云业务的本质[4][8] - 必须在最基础的高端训练硬件层保持绝对竞争力,但不能挤占其他业务,因为微软并非仅与少数客户签订裸金属服务合同[8] - 超大规模云业务归根结底是为AI工作负载提供长尾服务,为此将保持领先的裸金属即服务能力[8][300] 自研芯片策略 - 微软将通过自有模型与定制芯片的闭环优化来降低总拥有成本(TCO),这种垂直整合策略旨在为大规模AI工作负载提供成本优势[4] - 任何新加速器的最大竞争对手甚至是英伟达的上一代产品,评估标准是集群整体的TCO[7][363] - 在自有MAI模型和自研芯片之间建立闭环,这被视为做自研芯片的“天赋人权”,能够根据具体任务设计微架构[7][367] - 微软拥有从计算到AI芯片的扩展成功先例,将管理包含自研芯片、英特尔、AMD等多供应商的平衡集群[365] 与OpenAI的合作关系 - 根据新协议,微软拥有OpenAI所有系统级创新(包括芯片和系统设计)的完整IP授权,除了消费级硬件[4] - 微软对OpenAI的项目拥有全部访问权限,直接获得所有知识产权,同时微软也向OpenAI提供了大量知识产权以帮助其起步[6][369][371] - 双方共同建造了所有超级计算机,微软可以从OpenAI和自家MAI+Maia团队两边汲取最好的技术,甚至直接使用OpenAI的设计[4][372] - OpenAI的无状态API业务(PaaS)是Azure独占的,而其SaaS业务(如ChatGPT)可在任何地方运行,但任何定制协议或涉及无状态API的合作伙伴集成都必须通过Azure[379][382] 模型商业化与行业利润 - 总会有一个相当强大的开源模型可供使用,前提是拥有配套的数据资源和基础设施支撑[4][12] - 模型开发商可能陷入“赢家的诅咒”,即完成艰巨创新后成果易被复制而商品化,而掌握数据根基、情境工程能力及数据流动性的企业可获取检查点进行再训练[4][12][119] - 公司的未来将是工具业务与为AI智能体提供计算资源的结合,微软现有的最终用户工具业务将演变为支持代理工作的基础设施业务[12][177] - 价值不会完全迁移到模型层,拥有数据和“脚手架”(应用层基础设施)的企业同样能获取价值,行业结构将迫使专业化,存在多个模型和赢家的空间[106][150][268] AI基础设施与数据中心 - 公司目标是每18至24个月将训练能力提升10倍,新一代Fairwater 2架构将使训练能力较GPT-5提升整整10倍[5][18] - Fairwater 2数据中心内的光器件数量几乎相当于两年前全球所有Azure数据中心的总和,拥有约500万个网络连接[13][18][19] - 设计支持跨站点聚合算力资源来执行大型训练任务,资源会依次用于训练、数据生成和推理,而非永久处理单一工作负载[13][21] - 基础设施需具备可替换性,避免被单一代际或模型架构锁定,以应对快速的技术迭代和不同的功率密度、冷却要求[34][35][289][294] AI代理(Agent)与GitHub战略 - 提出“Agent HQ”(智能体总部)概念,将其描述为AI代理的“有线电视”,可打包Codex、Claude、Cognition、Grok等任何人的智能体到一个订阅中[11][90][91] - 在GitHub上构建“Mission Control”(任务控制中心),允许用户启动、监控多个智能体,并在独立分支中工作,实现对代码库的控制和多个智能体输出的消化[11][90][92] - GitHub在代码库创建、拉取请求(PRs)等方面处于历史最高水平,每秒有一名开发者加入,其中80%会进入GitHub Copilot工作流程[87][89] - 即使AI编码代理市场竞争加剧,GitHub作为代码托管的平台地位将使其持续增长,无论哪个代理获胜[96][100] 商业模式转型与市场扩张 - AI的转型类似于从服务器到云的迁移,虽然初期可能担心利润率收缩,但实际会大规模扩展市场,例如云端使印度等地的IT购买能力按比例提升[63][64][71] - 商业模式将包括广告、交易、设备毛利润、订阅(消费者和企业)及消费量计费等多种计量方式,订阅本质是对封装消费权利的授权[50][52][54] - 以GitHub Copilot为例,AI编码代理市场从去年约5亿美元年度运营收入增长至当前50-60亿美元,呈现10倍扩张,表明市场在快速扩大[75][76][96] - 从客户端-服务器计算到超大规模计算的转型中,微软的份额可能降低,但所在市场的业务规模数量级更大,只要市场创造价值且有多个赢家,公司表现仍会不错[100][101] 资本支出与投资策略 - 业务正转变为既是资本密集型也是知识密集型,需用软件能力提高资本支出回报率(ROIC),通过优化实现每美元每瓦特token吞吐量的显著提升(季度或年度改善可达5倍、10倍甚至40倍)[384] - 资本支出决策需考虑工作负载多样性、客户多样性、地理分布和技术迭代节奏,避免过度建设单一代际产能而导致资产被困[276][284][294][342] - 将一部分资源分配给研究计算,视作研发投入,允许其在一定时期内(如两年或16个月)进行数量级扩展,其余部分由实际需求驱动[386] - 采用灵活的基础设施建设策略,包括租赁数据中心、购买托管容量、甚至采用GPU即服务,并欢迎其他“新兴云”成为Azure市场的一部分,以服务客户需求[282][283][352][356] 全球战略与主权AI - 美国科技行业和政府的优先事项是确保领先创新,并在全球建立对美国技术栈的信任,美国公司需将资本投向世界各地进行外国直接投资[393][399][400] - 在欧盟等地建设主权云和“Azure主权服务”,提供密钥管理、机密计算(包括GPU中)等服务,以满足当地数据驻留和法律要求,赋予其真正的自主权[402][403][404] - 相信各国会利用AI创造经济价值,开源和多个模型的存在将提供连续性并避免集中风险,这是一种制衡力量[410][411][412] - 超大规模投资需考虑全球布局,应对不同地区的监管需求、数据主权和电力成本等因素,而非仅集中在美国本土[340][341][350]
微软CEO深度访谈:Azure利润很大程度来自配套服务,模型开发商会陷入"赢家诅咒"、平台价值不会消失