微软(04338)
搜索文档
微软和G42将在阿联酋扩建200兆瓦数据中心
格隆汇APP· 2025-11-05 21:49
投资计划 - 微软与阿联酋AI公司G42宣布在阿联酋扩建200兆瓦的数据中心,作为微软在海湾国家超过150亿美元投资承诺的一部分 [1] - 微软在阿联酋的投资将在2023年至2025年底期间达到73亿美元,并计划在2026-2029年间追加79亿美元 [1] 项目执行与时间表 - 数据中心扩建将通过G42旗下的Khazna数据中心实施,预计将在2026年底前开始运营 [1] 技术与监管支持 - 特朗普总统政府已批准向微软在阿联酋的数据中心出口先进的英伟达芯片 [1]
Nebius(NBIS.US)推出开源模型运行平台 挑战微软、亚马逊云业务
智通财经网· 2025-11-05 20:56
公司新产品发布 - 人工智能云服务提供商Nebius推出名为"Token Factory"的新产品,旨在提供开源模型的访问权限以及运行这些模型所需的计算能力 [1] - 该产品专注于推理工作负载,允许客户从一系列领先的开源模型中进行选择,包括OpenAI的GPT-oss、Meta的Llama以及DeepSeek [1] - Token Factory与亚马逊以及微软的云计算产品展开竞争,并且像Fireworks和Baseten这样的初创公司也提供类似的服务 [1] 公司背景与战略 - Nebius去年从俄罗斯互联网公司Yandex分拆出来,现已发展成为较为知名的"新云服务"提供商之一,销售来自美国、欧洲以及以色列的数据中心的人工智能云服务资源 [2] - 在以色列,公司拥有该国首批公开可用的英伟达最新一代人工智能芯片的集群之一 [2] - 对于人工智能基础设施提供商而言,在其云服务之上销售软件服务能够带来更丰厚的利润,但公司更看重的是能够凭借更丰富的产品线吸引更多的客户,而非可能带来的利润增长 [2] - 公司联合创始人兼首席业务官Roman Chernin表示,仅仅拥有基础设施是远远不够的,公司希望成为一家大型企业,但又不想仅仅是一家公用事业公司 [2] 市场机会与产品定位 - 公司看到了一个迎合快速发展的人工智能市场的机会,一些人工智能应用开发者正在重新思考应如何更多地依赖那些来自顶尖人工智能实验室的最强大的模型,而这些模型大多为闭源或专有 [2] - 基于这些封闭系统开发软件可能会限制其进行精细调整的灵活性,并增加成本,因此客户开始从将一切构建在一个封闭的生态系统里面转向采用更加多样化的产品组合模式 [2][3] - 公司所打造的是一个可扩展且可靠的平台,该平台能让客户轻松地从他们最初使用的方案无缝切换到所需的规模化方案 [3] 客户与合作伙伴 - Token Factory的早期客户包括位于阿姆斯特丹科技公司Prosus以及人工智能视频平台Higgsfield [3] - HuggingFace也正在使用Nebius的基础设施进行推理,并与该公司合作,在其推理服务市场中展示Token Factory [3] 重要商业合作 - 微软近期与Nebius达成协议,将从其获得价值高达194亿美元的人工智能计算能力 [1]
AI「智能体组织」时代开启,微软提出异步思考AsyncThink
36氪· 2025-11-05 18:52
核心观点 - 微软团队提出名为“异步思考”(AsyncThink)的新方法,旨在实现LLM从个体智能到“智能体组织”的范式跃迁 [1] - AsyncThink通过“组织者-工作者”协议将内部思考过程组织成可并发执行的结构,以解决现有并行思考方法的高延迟和动态性差等难题 [1][2] - 实验表明,该方法在提高数学推理准确性的同时,将推理延迟降低了28%,并展现出良好的跨任务泛化能力 [1][14][16] 研究方法 - AsyncThink的核心是“组织者-工作者”(Organizer-Worker)思考协议,LLM同时扮演组织者和工作者两个角色 [2] - 组织者负责将复杂问题拆分成子任务,并通过“Fork”和“Join”操作安排任务顺序;工作者负责执行子任务并返回中间结果 [2][4] - 该方法采用两阶段训练过程:冷启动格式微调和强化学习 [4] 训练过程 - 冷启动格式微调阶段使用GPT-4o生成合成训练数据,并对基础LLM进行监督微调,使其掌握AsyncThink框架的组织语法与行动结构 [5] - 强化学习阶段通过改进的群组相对策略优化(GRPO)算法,利用准确性、格式和思考并发奖励来指导模型学习高效、准确的策略 [7][9] 实验评估 - 在多解倒计时任务中,AsyncThink的全对率达到89.0%,显著高于并行思考的68.6%和序列思考的70.5% [11][13] - 在数学推理任务AIME-24和AMC-23上,AsyncThink的准确率分别为38.7%和73.3%,延迟分别为1468.0和1459.5,在保证精度的同时延迟降低约28% [14][15] - 在跨任务泛化实验中,AsyncThink在4×4数独任务上准确率达到89.4%,延迟为2853.0,优于序列思考和并行思考 [16][17] 消融实验 - 格式微调使LLM学会“语言”,即如何Fork与Join;强化学习使LLM学会“策略”,即何时Fork、如何Join才能更快更准;并发奖励则让LLM学会平衡准确率与延迟的效率 [18][19] 未来工作 - 未来研究将围绕扩展智能体的规模和多样性进行,探索异步思考的扩展定律以及由异构专家工作者组成的大型组织 [21] - 将探索递归智能体组织,使工作者可动态提升为子组织者,以解决深度嵌套的复杂问题 [22] - 将研究人类-AI智能体组织,创建人类-AI协作框架,实现混合智能 [23]
微软公布11月Xbox Game Pass游戏阵容 《使命召唤:黑色行动 7》等大作上线
环球网· 2025-11-05 12:54
公司产品更新 - 微软于11月5日公布11月登陆Xbox Game Pass的游戏列表,包括《使命召唤:黑色行动7》等11款游戏 [1][3] - 本月新增游戏阵容涵盖《死寂之旅》、《狙击精英:抵抗》、《虚空列车》、《至高格罗夫》等多款作品 [3] 公司战略方向 - 微软Xbox负责人菲尔・斯宾塞表示公司将降低玩家在PS5和Switch 2上玩Xbox游戏的门槛 [3] - 公司正在执行多平台战略,旨在让其他平台的用户也能轻松玩到其已发布的游戏 [3]
OpenAI合纵亚马逊,微软连横Anthropic,硅谷只有利益没有盟友
36氪· 2025-11-05 11:47
核心观点 - OpenAI与亚马逊AWS达成一项价值380亿美元的战略合作协议,这是OpenAI结束与微软的云服务绑定关系后的首个重大举措,标志着其算力采购策略的重大转变 [4][10][38] - 该协议是OpenAI首席执行官Sam Altman提出的1.4万亿美元算力投资计划的一部分,旨在构建庞大的算力基础设施以支持前沿AI模型的开发 [19][21][23] - 此次合作对亚马逊AWS意义重大,不仅带来巨额合同,还提振了市场信心,使其股价单日飙升超5%,市值增长近1400亿美元 [4][45][47] 合作协议细节 - 合作规模为380亿美元,远超亚马逊AWS此前任何SaaS客户的采购额,被视为史上最大的云服务合同之一 [4][14] - OpenAI将全面接入AWS的算力资源,包括数十万张最新一代英伟达GPU以及数千万颗CPU [10] - AWS为OpenAI部署了基于Amazon EC2 UltraServer平台的高规格算力基础设施,重点优化了性能与能效,并采用NVIDIA GB200和GB300 GPU [11] - 该GPU集群设计灵活,可覆盖从ChatGPT日常推理到新模型训练等各种工作任务 [12] - OpenAI将立即启用AWS资源,并计划在2026年底前完成全部部署,AWS已为其预留2027年及之后的算力扩展空间 [12][13] 市场与股价影响 - 消息公布后,亚马逊股价早盘飙升超过5%,公司市值单日增长近1400亿美元,刷新历史纪录 [4] - 相比之下,微软股价出现小幅下挫 [7] - 此次合作被视为亚马逊在AI云计算市场竞争中的一次重要胜利,有助于缓解其被AI浪潮“颠覆”的担忧 [45][47] OpenAI的战略转型与算力规划 - OpenAI宣布正式转型为公共利益公司,使其能够合法向投资者发股募资,为巨额算力投资计划提供资金支持 [24][25] - 公司计划投资高达1.4万亿美元建设约30吉瓦的算力基础设施,相当于30座核电站的发电功率,足以满足2500万美国家庭的用电需求 [19][20] - 未来目标是每周新增1吉瓦算力,按现有成本估算,每1吉瓦算力约需500亿美元 [21][23] - 公司近期签署了多项巨额算力订单,包括与微软约2500亿美元的Azure服务采购以及与甲骨文约3000亿美元的长期合同,380亿美元的AWS合同在其中相对较小 [44] 合作关系演变 - OpenAI重写了与微软的核心合同,彻底取消了Azure长达近六年的云服务独占权与优先购买权,获得了在多家云平台间自主调配算力的权利 [26][33][36][37] - 此次与亚马逊的合作是“采购现成云服务”模式,而非与微软的“托管共建”模式 [38] - 此次合作并非双方首次合作,今年初OpenAI的开源模型权重已登陆亚马逊Bedrock平台,并成为该平台最受欢迎的模型提供方之一,已有数千家企业高频调用 [16][17][18] 行业竞争格局 - 亚马逊AWS虽然在云计算市场领先,但在AI模型开发生态上起步较晚,面临微软和谷歌的激烈竞争 [47][48] - 微软通过早期绑定OpenAI将Azure打造成“AI原生云”,谷歌则自研了从芯片到模型的完整AI技术栈 [48] - 云服务商普遍采取多模型合作策略,亚马逊在投资OpenAI的同时,去年底也向Anthropic注资40亿美元;微软则在Copilot中集成Anthropic的Claude模型 [41][43]
苹果计划明年上半年推出首款低成本Mac笔记本电脑,售价将低于1000美元,从而与微软竞争
华尔街见闻· 2025-11-05 01:01
公司产品战略 - 公司计划于明年上半年推出首款低成本Mac笔记本电脑 [1] - 该产品售价将低于1000美元 [1] - 此举旨在与微软进行竞争 [1]
微软“新云”交易额超600亿美元
华尔街见闻· 2025-11-05 00:53
投资规模与增长 - 微软公司已向多家“新云”数据中心公司投入超过600亿美元以获取AI算力 [1] - 自10月初以来,公司对“新云”公司的支出承诺大约翻了一番 [1] - 公司近期宣布了两项总计超过100亿美元的新投资承诺 [1] 算力资源合作 - 公司与Nscale的协议将使其能够使用约20万个英伟达最新的GB300芯片 [1] - 这些芯片资源分布在Nscale的多个地点站点 [1]
【环球财经】微软宣布大力投资阿联酋AI项目
新华社· 2025-11-04 21:11
微软在阿联酋的AI投资计划 - 公司宣布对阿联酋人工智能等项目投资总额达152亿美元 [2] - 投资计划分为两个阶段:2023年至2024年底投资超73亿美元,2026年初至2029年底投资超79亿美元 [2] 与G42集团合作细节 - 合作伙伴关系取得关键性进展,包括对G42集团15亿美元的股权投资 [2] - 对阿联酋AI和云数据中心的资本支出将超过46亿美元 [2] 阿联酋AI市场地位 - 阿联酋在AI人均利用率方面位居世界第一,59.4%的人口使用生成式AI [2] - 使用率领先于第二名新加坡的58.6% [2] 与阿布扎比国家石油公司合作 - 公司签署协议共同开发和部署AI应用,推动能源领域智能化转型 [2] - 合作内容包括提供AI工具、员工技能培训及探讨建立联合创新生态系统 [2]
每秒110万个token!微软(MSFT.US)和英伟达(NVDA.US)联手刷新AI推理纪录
智通财经网· 2025-11-04 19:18
技术性能突破 - Azure ND GB300v6虚拟机在Llama2 70B模型上实现每秒110万token的推理速度,创下行业新纪录 [1] - 性能验证在18台ND GB300v6虚拟机上使用NVIDIA TensorRT-LLM引擎完成,一个NVL72机架达到总计110万token/秒 [1] - 新记录较之前基于NVIDIA GB200NVL72机架实现的86.5万token/秒成绩有显著提升 [1] 硬件配置升级 - Azure ND GB300虚拟机采用英伟达Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统 [1] - 系统配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计 [1] - 该虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设计功率提高 [1] 性能效率提升 - Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升27% [2] - 性能提升的同时功率规格仅增加17% [2] 行业意义与合作 - 该成就被视为突破了每秒百万token的障碍 [2] - 技术里程碑在一个能满足现代企业动态使用和数据治理需求的平台上实现 [2] - 微软首席执行官强调此成就是公司与英伟达长期合作及在生产规模运行人工智能方面专业知识的结晶 [1]
OpenAI与AWS达成380亿美元合作,加速AI研发并减少对微软依赖
中国经营报· 2025-11-04 15:06
合作核心内容 - 亚马逊云科技(AWS)与OpenAI达成价值380亿美元的七年战略合作协议,旨在为OpenAI的大模型训练和在线推理提供云端算力支持 [1] - OpenAI已立即启用AWS提供的数十万颗英伟达最新GB200/GB300系列GPU,并具备扩展至千万级CPU的能力 [1] - AWS专门打造全新架构AI集群,通过低延迟互联技术实现训练与推理任务的动态资源分配,全部基础设施预计2026年年底前完成部署 [1] 合作战略意义 - 此次合作被业内视为OpenAI摆脱对微软Azure依赖的关键布局,形成“多云制衡”态势 [2] - 对AWS而言,这一订单有望扭转其AI算力增速落后于Azure的局面,刺激亚马逊股价创下近两年内最佳两日涨幅 [2] - 380亿美元的合作价值相当于AWS未来七年营收的5%~7%,显示其押注AI基础设施的决心 [3] 技术发展与行业影响 - 合作将为OpenAI的“智能体(Agentic)”研究提供高效环境,并为2026年“AI研究实习生”、2028年“全自动AI研究员”等目标提供算力保障 [1][3] - 此次合作延续了双方既有协作,OpenAI开源模型已通过AWS Bedrock平台服务数千企业 [2] - 这场合作将加剧云服务商之间围绕AI算力与生态的竞争格局,将全球AI军备竞赛推向新高度 [3]