Workflow
特斯拉Megapack电池储能系统
icon
搜索文档
马斯克最大算力中心建成了:全球首个GW级超算集群,再创世界纪录
量子位· 2026-01-18 13:29
全球首个GW级超算集群Colossus 2投入运行 - 全球首个功率达到1GW的超算集群Colossus 2已正式投入运行,并计划于2024年4月升级至1.5GW,最终总装机容量目标为2GW [1][2][12] - 该集群由xAI公司独立建设,不依赖亚马逊、微软等科技巨头,从无到有的建设速度极快,前代集群Colossus 1仅用122天建成,Colossus 2的建设耗时不到一年 [6][7][8][10] - 集群配备约20万颗英伟达H100/H200 GPU和约3万颗英伟达GB200 NVL72,规划彻底完工后将内置55.5万张GPU,远超Meta的15万张、微软的10万张以及谷歌的分布式基础设施 [9][13] Colossus 2的规模与影响 - 1GW的功率可为约75万户家庭供电,相当于高峰时期的旧金山,与一座核电站的功率相当,2GW的最终容量将与美国大多数主要城市的用电量相当 [11][12] - 该集群庞大的计算资源将全部用于训练xAI的下一代大模型Grok 5,预计其参数将达到约6万亿,是Grok 4的两倍以上 [14][15] - 随着xAI完成200亿美元的E轮融资,Grok 5的研发筹码增加,意味着更大的模型参数、更快的训练与迭代速度,xAI在算力基础设施上已领先于为2027年发愁的OpenAI [18][19] AI算力竞赛对电网的冲击 - 数据中心建设热潮正导致电力需求激增,美国非营利电网运营商PJM预计未来10年电力需求将以年均4.8%的速度增长,这对一个需求多年变化不大的系统而言相当罕见 [27][28] - 电力供给增速缓慢,新建电厂速度跟不上老电厂退役速度,电网容量面临饱和,供需偏差可能导致电网频率波动并损坏关键基础设施 [29][30] - 为避免风险,PJM可能在极端天气期间对覆盖区域内(美国13个州)的6700万居民实施轮流停电,作为维持电网平衡的卸压手段 [5][22][23][31] 行业应对与xAI的缓解措施 - PJM曾提议数据中心在高峰时段主动降低用电量或改从其他渠道获取电力,但遭到亚马逊、谷歌、微软等公司的反对,认为这是对数据中心的歧视 [33][34] - xAI的Colossus 2位于美国中南部,不在PJM电网覆盖范围内,并且公司部署了168个特斯拉Megapack电池储能系统,旨在用电高峰期提供电力缓冲,以尽量减少对当地电网的冲击和周边居民遭遇停电的风险 [35]
马斯克买了新厂房上GPU,2GW供电规模,“巨硬”更更硬了
搜狐财经· 2025-12-31 15:15
公司动态与战略 - 马斯克旗下xAI公司已确认购买第三栋专属厂房,代号MACROHARDRR,该厂房将具备2GW的供电规模 [1] - 公司此前已建成并运营全球规模最大、运行状态最稳定的单一算力集群Colossus I,从第一个机架落地到开始训练任务仅用19天,总计建设周期122天 [2] - 公司于2025年3月7日启动第二厂Colossus II的建设,收购了一座100万平方英尺的仓库及相邻地块,总面积达100英亩 [4] - 公司近期通过一家子公司从贝莱德旗下关联方手中,收购了位于美国密西西比州Soso地区的一栋81万平方英尺的仓库,该地紧邻Colossus II,并被确认为巨硬计划的第三厂(MACROHARDRR)[8][9] - 公司正计划以2300亿美元估值筹集150亿美元资金,以支持其算力设施的巨额建设与扩容 [11] 算力设施规模与规划 - Colossus I算力集群配备约20万颗英伟达H100/H200 GPU和约3万颗英伟达GB200 NVL72 GPU [2] - Colossus II已安装119台风冷式冷水机组,提供约200MW冷却能力,足以支持约11万台GB200 NVL72 GPU [4] - 按照规划,Colossus II第一阶段部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1GW [5] - 第三厂MACROHARDRR具备2GW供电规模,若参照200MW支持11万台GB200的功耗密度推算,可支持约110万台英伟达GB200 NVL72 GPU,建成后xAI算力储备将再创全球之最 [1][2] 能源与基础设施部署 - 为满足巨大电力需求,xAI通过与Solaris Energy Infrastructure公司合资(Solaris持股50.1%,xAI持股49.9%),在密西西比州建设一座永久性燃气轮机发电厂,预计到2027年初通过该合资企业提供超过1GW的电力 [10] - 为避免对当地电网造成冲击,xAI在Colossus II场址部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力支持 [11] - Colossus II和MACROHARDRR靠近田纳西河谷管理局运营的燃气电厂、一条天然气管线,并与当地公用事业公司有连接 [10] - 公司已修建连接Colossus II与MACROHARDRR的新路,以及连接发电设施的新电力线路 [9][10] 社区关系与应对措施 - 公司算力中心因靠近居民区而遭到投诉,Colossus建成时被投诉在现场使用便携式燃气轮机,被认为加剧了空气污染 [10] - 2025年初,公司从Colossus移除了部分燃气轮机,并将更多基础设施项目迁移至密西西比州 [10] - 新建发电厂场地因发电机和施工噪音再次遭到附近居民投诉,作为应对,公司已在发电厂场地与居民区之间竖起了高墙以降低噪音 [10]
马斯克买了新厂房上GPU,2GW供电规模,“巨硬”更更硬了
量子位· 2025-12-31 13:28
马斯克xAI“巨硬计划”与算力设施扩张 - 公司已确认启动代号为“MACROHARDRR”的第三栋专属厂房建设,此为“巨硬计划”的一部分[1][16] - 该计划下的第三厂位于美国密西西比州Soso地区,是一栋81万平方英尺的仓库,紧邻第二厂Colossus II[15][16] 第三厂MACROHARDRR的规模与意义 - 新厂房将具备2GW的供电规模,电力规模巨大[2] - 2GW电力按美国标准估算,可满足约150万户家庭的用电需求[3] - 参照200MW支持11万台GB200的架构效率推算,2GW电力可支持约110万台英伟达GB200 NVL72 GPU[4] - 该设施建成后,将使xAI的算力储备达到全球之最[5] 第一厂Colossus I的成就 - 第一厂代号为Colossus I,验证了公司大规模自建超级计算集群的可行性[6] - 从无到有建成所有配套设施仅用了122天,从第一个机架落地到开始训练任务只用了19天,建设速度极快[6] - 目前Colossus I仍是全球规模最大、运行状态最稳定的单一算力集群[7] - 该集群配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72 GPU[7] 第二厂Colossus II的规划与进展 - 第二厂Colossus II项目于2025年3月7日正式启动,公司在孟菲斯收购了一座100万平方英尺的仓库及两块相邻地块,总面积达100英亩[9] - 截至2025年8月,Colossus II已安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU[10] - 按照规划,Colossus II第一阶段部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1GW[11] - Colossus II被确认为“巨硬计划”的一部分[12] 项目历史与选址关联 - “巨硬”项目名称由马斯克早在2021年就已构思好[14] - 第三厂MACROHARDRR选址紧邻Colossus II,仅隔州界,且施工人员已修建了一条连接两厂的新路[16] 设施建设引发的社区问题与应对措施 - 由于选址靠近居民区,Colossus建成时因使用便携式燃气轮机而遭到大量投诉,被指加剧空气污染[17] - 2025年初,公司从Colossus移除了部分燃气轮机,并将更多基础设施项目迁移至密西西比州[18] - 公司通过与德州能源公司Solaris Energy Infrastructure合资(Solaris持股50.1%,xAI持股49.9%),在密西西比州建设一座永久性的燃气轮机发电厂,为Colossus II提供电力[18][19] - Solaris在证券文件中表示,预计到2027年初,通过合资企业向xAI提供超过1GW的电力[20] - 发电厂的建设又因发电机和施工噪音遭到附近居民投诉,公司已在发电厂场地与居民区之间竖立高墙以降噪[20] - 为避免对当地电网造成冲击,公司在Colossus II场址部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力支持,确保当地居民用电稳定[20] 巨额资金需求与融资传闻 - 系列算力设施的建设与扩容需要巨额资金支持[21] - 一个月前,多家外媒报道称,xAI正计划以2300亿美元估值筹集150亿美元资金[22] - 针对融资报道,马斯克回应称“消息不实”,但未给出更多解释[23]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
搜狐财经· 2025-09-18 14:34
项目进展 - 6个月建成算力集群 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72 [1] - 项目进度远超行业标准 6个月完成OpenAI和甲骨文等合作方15个月的工作量 [1] - 2025年3月7日启动Colossus II项目 收购100万平方英尺仓库及100英亩地块 [4] - 截至8月22日安装119台风冷式冷水机组 提供200MW冷却能力 [4] - 第一阶段部署11万个GPU 最终目标超过55万个GPU 峰值功率需求超1.1吉瓦 [4] - 部署168个特斯拉Megapack电池储能系统 避免对当地电网造成冲击 [5] 技术架构 - 基于xAI大型语言模型Grok构建多智能体系统 部署数百个专用智能体 [2] - 智能体分工涵盖编码 图像视频生成 软件测试等全流程 [2] - 系统通过虚拟机模拟人类用户交互 实现软件开发生命周期全自动化 [2] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 [4] - 发电厂已运行7台35MW燃气涡轮机 总输出245MW [4] - 通过合资公司获得400MW燃气涡轮机服务 占供应商总容量600MW的67% [5] 战略布局 - 项目命名为"巨硬计划"(MACROHARD) 2021年已有初步构想 [2] - Colossus II专为AI推理设计 规模较Colossus I扩大数十倍 [4] - 与特斯拉形成协同效应 AI软件优化自动驾驶算法及工厂自动化 [6] - 特斯拉提供海量真实世界训练数据 公司定位转向"AI机器人公司" [6] - 长远路线图计划将GPU总量扩展至100万个 [4] 资源投入 - 合资公司第二季度资本支出1.12亿美元 [5] - 密西西比州监管机构特批12个月燃气轮机运行许可 无需正式审批 [4] - 马斯克亲自督导项目 包括电力生产审查和技术评审 [5]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
量子位· 2025-09-18 14:09
巨硬计划项目概述 - 马斯克旗下xAI推进"巨硬计划" 基于Grok大型语言模型构建多智能体系统 部署数百个专门AI代理协同模拟完整软件开发团队[3] - 项目核心逻辑为软件公司不生产实体硬件 因此从编码设计测试到管理的全部流程均可被AI复制[5] - 巨硬计划开发的AI软件将用于优化特斯拉自动驾驶算法 工厂自动化和人形机器人Optimus功能 特斯拉海量真实世界数据反哺训练[17] 算力基础设施部署 - Colossus II算力集群6个月从零建成 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72[1][12] - 项目第一阶段部署11万个GB200 GPU 最终目标超55万个GPU 峰值功率需求超1.1吉瓦 长远规划扩展至100万个GPU[13][14] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 现有7台35MW燃气轮机运行 另部署168个特斯拉Megapack电池储能系统保障供电[15] 建设进度与比较优势 - 仅用6个月完成OpenAI和甲骨文等合作方15个月的工作量 创造行业新纪录[2] - Colossus I集群曾用122天建成约20万台H200 GPU 92天内规模翻倍 至今仍是最大AI训练算力集群[6][8] - Colossus II于2025年3月7日启动 收购100万平方英尺仓库和100英亩地块 7月已开始安装机架[10][11] 资源投入与执行力度 - 与Solaris Energy Infrastructure成立合资公司(Solaris持股50.1% xAI持股49.9%) 第二季度投入1.12亿美元资本支出[15] - 马斯克亲自督战 周末连续进行技术评审 现场审查变压器和电力生产进展 项目进入冲刺阶段[16] - 密西西比州监管机构临时批准发电厂运行燃气轮机12个月 无需正式许可 加速部署进程[15]