AI超级工厂
搜索文档
中国版“CES展”背后的惊喜
新浪财经· 2026-01-13 19:32
阿里云通义智能硬件展与中国AI产业趋势 - 阿里云在深圳举办首届中国版CES智能硬件展 展出面积超5000平米 超1500件AI硬件新品亮相 其中180件在美国CES展同步首发 展品覆盖3C数码 家电 卫浴 玩具 乐器 健身器材 机器人 电动车 飞行器等广泛消费领域 [1][2] - 展会呈现AI硬件“涌现”和“泛化”趋势 AI产品史无前例地爆发并应用到各行各业 展会现场体验包括仅2.7kg的外骨骼助力器 提供十多项运动的智能健身器材 AI导盲眼镜 AI助听器 AI作业批改机等 [7][8] - 中国AI产业正迎来“觉醒时刻” 将全球最厉害的供应链与大模型能力结合应用于所有行业 标志着产业进入“升级领跑”阶段 [10] 2026年AI产业发展第二高潮 - 全球AI领域将在2026年迎来第二波发展高潮 技术迭代速度远超预期 大模型或以星期为单位更新 技术落地周期从5-10年缩短至2-3年 [11] - AI发展进入“第二曲线” 从以手机为主要载体的消费级应用(上半场)转向与企业端和产业端深度结合(下半场) [14] - 企业级人工智能直接重构生产力 其潜在经济影响力有望促使全球GDP增长10% 对应高达11万亿美元的价值重构空间 到2026年 AI创造的新增量市场将占整个人工智能市场的80% [14] - AI应用将以每年百倍的速度增长 未来人工智能预算可能达到信息技术预算的10倍 [14] AI应用趋势:从虚拟到物理世界 - AI入口多元化 突破屏幕限制 全面融入汽车 机器人 可穿戴设备及各类工业终端 手机不再是单一入口 [13] - “物理AI”成为重要方向 其商业天花板比虚拟世界更大 2024年应用重点在汽车智能化 2025年趋势扩展至新能源汽车 低空飞行器 传统燃油车及重型卡车等商用车领域 [11] - 企业级应用与消费级应用的主要区别在于:消费级求广度 演变多元个性化 企业级探深度 与专业属性高度绑定 在丰富产业场景下价值有待深挖 成长空间大 [14] 中国AI产业竞争的双轨态势 - 竞争焦点呈双轨并行:一方面传统产业借助AI转型升级 优势产业实现指数级进化 另一方面 “AI原生企业”用新商业模式开疆拓土 [15] - 中国AI深度聚焦于传统制造业 新能源汽车 锂电池 电子电气 农业等行业 通过云端服务商实现降本增效 例如三一重工借助AI构建“设备维修助手” 潍柴动力运用AI进行设备故障诊断 养猪业使用兽医大模型 [16][18] - 以通义千问 DeepSeek为代表的“开源力量”崛起 快速催生四类“AI原生企业”:AIGC内容创作公司 AI漫剧/短剧公司 智能体(Agent)公司 人工智能硬件公司 [18] - 阿里云通义通过开源300多款模型 衍生出18万款模型 支持了高达百万级的创业者和开发者 其中许多是三人以下的“超级个体” [21] 中国AI生态的现状与挑战 - 中国AI第一波市场聚焦在娱乐 陪聊等消费端场景 而在美国 企业级应用(如SAP Salesforce等SaaS软件对AI的调用)是创造生产力的关键环节 调用量远超C端 [21] - 模型价值需以Token的“质量”与“效率”衡量 而非单纯数量 在AI芯片端 中国公司逐渐将算力从“训练”转向“推理” 使中低端AI芯片有了用武之地 [23] AI基础设施(AI Infra)与云计算的关键作用 - 底层基础设施建设(AI infra)是AI第二个发展高潮期的关键 其趋势正从“Token工厂”升级为“AI超级工厂” 未来的AI云服务如同提供分层用水的“自来水厂” [24][25] - 分层服务包括:“纯净水”(开箱即用的API服务) “工业用水”(供本地化部署的开源模型) “水处理设备”(供训练自有模型的裸金属和算力服务) 阿里云上调用MaaS API与使用GPU部署模型的客户重合度达70% [25][26] - 真正的AI云需具备全栈式能力 融合强大的GPU算力 高效的集群调度与网络存储 先进的大数据处理 以及构建运行Agent的完整框架 “AI infra 即为云计算” 没有云的能力 AI的真正价值无法实现 [26][27] - 为支持企业出海 中国云服务公司大力布局全球基础设施 例如阿里云截至2025年在全球29个地域 92个可用区构建基础设施 承接近八成新增中企出海需求 支撑了100%中国车企的全球化布局 [29] AI产业的终极展望与竞争本质 - 大模型将成为下一代操作系统 下一代的计算机就是“超级AI云” AI通过生产力供给所创造的价值将是互联网的几十倍 [32] - AI增量竞争的本质是全球范围内较量谁最先改造本国优势产业 谁最快孵化出具有AI思维和会使用AI工具的产业人才 目标在于GDP质量提升 产业结构优化升级及劳动者技能进化 [32] - 智能硬件成为连接物理世界的最佳入口 阿里云凭借全栈AI优势 让通义大模型成为智能硬件的标配 [32]
微软 CEO 纳德拉:这一次工业革命,从 “AI 超级工厂”开始
36氪· 2025-11-14 08:34
公司战略核心观点 - 微软将其AI战略重新定位为构建“行星级AI超级工厂”,旨在打造一个能持续生成、调度和交付AI算力(以token为单位)的全球性基础设施系统,而非仅仅开发单一AI模型[1][5][9] - 公司CEO纳德拉将这一转变定性为一场“工业革命”,其核心是从软件许可业务转向资本密集与知识密集相结合的商业模式,重点在于通过软件优化提升资本支出效率[2][8][35][37] - 战略目标是建立长期护城河,其竞争优势不在于某一代模型的领先,而在于构建一个能灵活适应硬件快速迭代、并服务全球长尾客户的闭环系统[9][10][33] AI超级工厂的规模与架构 - 亚特兰大Fairwater 2数据中心拥有500万个网络连接,其网络光缆数量相当于两年半前微软所有Azure数据中心的总和,训练能力比GPT-5所需高出10倍[6] - 通过1 Petabit的高速网络,Fairwater 2与700英里外、横跨5个州的威斯康星州数据中心相连,在系统中被当作同一台机器进行调度[6][25] - 公司内部采用三层架构设计:训练层(为GPT-5及后续模型准备GPU资源)、推理层(确保全球响应速度)、接口层(将AI能力嵌入日常应用场景)[11] 数据中心功能的重构 - 数据中心的功能从传统的“云仓库”转变为“AI发电站”,核心要求变为能像电厂持续发电一样,持续、稳定地输出token[14][15] - 公司为AI数据中心重构了四个核心部件:芯片部署逻辑(从存储优化转向推理/训练优化)、液冷系统、网络连接结构、选址逻辑(转向靠近清洁能源和稳定电力)[16][17] - 建设速度以“光速”执行,例如Fairwater 2数据中心从获得到交付给工作负载仅用了约90天[17] 全球AI算力网络(AI-WAN) - AI-WAN(AI广域网络)的设计目标是实现跨数据中心的智能算力调度,例如在亚洲负载高峰时,可从美国或南美的空闲资源调动算力[23][24] - 调度架构分为三层:园区级调度(单个数据中心内)、区域级调度(通过高速WAN跨州协同)、全球级调度(根据工作负载类型和数据法规动态分配)[25][26] - 该网络旨在使AI算力像水电一样稳定供应,成功标准是用户无感知但系统无处不在,关键指标包括毫秒级响应延迟和高缓存命中率[28][29] 2023年战略调整的动因 - 公司暂停一批数据中心租赁计划,是为了避免成为单一模型公司的主机托管商,其目标是构建能服务长尾客户的超大规模服务网络,而非少数大客户的裸机供应商[31][33] - 面对资本支出在两年内翻三倍的压力,公司强调通过软件优化提升资本效率,例如通过软件改进使特定GPT系列的token生成效率(每瓦特每美元)提升了5倍、10倍甚至可能40倍[34][35][37] - 对于GitHub Copilot市场份额从接近100%降至25%以下,公司认为这反映了市场的快速扩张,其逻辑是“市场比份额更重要”,宁愿在一个大市场中占据25%份额[38][39][41]
微软(MSFT.US)“AI超级工厂“启动!整合数十万GPU,可实现多个数据中心互联
智通财经网· 2025-11-13 16:37
公司战略与设施部署 - 微软在亚特兰大上线新一代AI数据中心,并于10月投入运营,该设施是"Fairwater"系列中的第二个 [1] - 该数据中心通过专用网络与威斯康星州的首个Fairwater站点相连,构建起全球首个真正意义上的跨州AI计算集群 [1] - 公司本季度有超过10万个GB300上线,用于其他基础设施群的推理工作 [2] 技术架构与能力 - 数据中心被称为"AI超级工厂",整合了数十万个最新NVIDIA Blackwell GPU,提供支持AI工作负载的算力 [1] - 该网络支持微软投资的OpenAI,并将多个地理上分散的数据中心融合成一个虚拟的单一超级计算机 [1] - 数据中心通过专用光缆连接的AI广域网进行互联,形成一个统一的分布式系统 [2] 运营模式与行业影响 - "AI超级工厂"模式的核心是在数百万个硬件上运行一个复杂的作业,而非为多个客户运行数百万个独立的应用程序 [1] - 该模式使得一个站点网络能共同支持同一项AI模型训练任务,训练所需的基础设施规模是传统一两个数据中心的数倍 [1][2] - 公司愿景是实现可互换基础设施群,能够在任何地方基于专用加速器和网络路径,以最高性能和效率运行任何工作负载,确保没有GPU被闲置 [2]
微软启用配备数十万块英伟达GPU的AI超级工厂
经济观察网· 2025-11-13 10:15
公司动态 - 微软于当地时间11月12日宣布启用位于亚特兰大的新数据中心站点Fairwater [1] - 该数据中心被微软称为全球首个行星级AI超级工厂 [1] 技术架构 - 新数据中心与普通数据中心不同,直接与其他微软数据中心连接 [1] - 该数据中心使用数十万个英伟达GPU提供支持 [1] 产品服务 - 新站点是微软的Azure AI数据中心 [1]
微软第一座“AI超级工厂”投入运营:将两座数据中心连接,构建分布式网络
华尔街见闻· 2025-11-13 08:29
公司AI基础设施战略 - 微软正在构建一个连接不同州份数据中心的分布式“AI超级工厂”,旨在以前所未有的规模和速度加速AI模型训练,标志着行业竞争从单点建设转向网络化布局 [1] - 位于亚特兰大的新一代AI数据中心已于今年10月投入运营,这是“Fairwater”系列中的第二个设施,并通过专用高速网络与威斯康星州的数据中心连接,形成首个跨州协作的AI计算集群,可将复杂AI训练任务从数月缩短至数周 [1] - 公司计划在未来两年内将其数据中心总面积扩大一倍,以应对激增的算力需求 [1] 资本开支与行业投资 - 微软在刚刚过去的财季中资本支出超过340亿美元,并预计未来一年将继续增加投资 [2] - 整个科技行业今年的AI相关投资总额预计将达到4000亿美元 [2] “AI超级工厂”技术架构 - “AI超级工厂”核心在于将多个地理上分散的数据中心融合成一个虚拟的单一超级计算机,在数百万个硬件上运行一个复杂的作业,而非传统数据中心为多个客户运行数百万个独立应用程序 [3] - 分布式网络将整合数十万个最先进的GPU、EB级的存储空间和数百万个CPU核心,设计目标是支持参数规模达数万亿级别的未来AI模型训练 [3] - 随着AI训练流程日益复杂,涵盖预训练、微调、强化学习和评估等多个阶段,跨站点的协同能力变得至关重要 [3] 新一代数据中心设计 - “Fairwater”系列数据中心从零开始设计,位于亚特兰大的设施占地85英亩,建筑面积超过100万平方英尺,完全为AI工作负载优化 [4] - 采用高密度双层建筑设计,以便在更小空间内容纳更多GPU,缩短内部通信延迟 [4] - 部署英伟达GB200 NVL72机架规模系统,可扩展至数十万个英伟达Blackwell架构GPU [4] - 设计了复杂的闭环液体冷却系统,几乎不消耗水资源,其初次注水量仅相当于20个美国家庭一年的用水量 [4] AI广域网与算力分配 - 微软部署了12万英里的专用光纤电缆构建AI广域网(AI WAN),作为专供AI流量的“高速公路”,使数据能以接近光速的速度无拥堵传输 [6] - 跨州建设而非集中一处,主要是出于土地和电力供应的考量,将电力需求分散到不同地区可避免对任何单一电网或社区造成过度负担 [6] - 随着模型规模增长,训练所需算力已超出单个数据中心承载极限,Fairwater网络的目标是让所有GPU始终保持忙碌状态,避免瓶颈导致训练停滞 [6] 行业竞争格局 - 主要竞争对手亚马逊在印第安纳州启动了占地1200英亩的Project Rainier数据中心集群,预计将消耗2.2吉瓦的电力 [7] - Meta Platforms、甲骨文等公司也公布了庞大的建设计划,AI初创公司Anthropic则宣布计划在美国投资500亿美元用于计算基础设施 [7]
国泰君安期货商品研究晨报:贵金属及基本金属-20250825
国泰君安期货· 2025-08-25 13:53
报告行业投资评级 未提及 报告的核心观点 报告对黄金、白银、铜、锌等多种贵金属及基本金属进行研究分析,给出各金属的走势判断,如黄金受JH会议鲍威尔放鸽影响,白银冲顶前高,铜因美元回落价格上涨等[2][4][5][10]。 各金属总结 黄金 - 走势判断:JH会议鲍威尔放鸽[4] - 基本面数据:沪金2510昨日收盘价773.40,日涨幅 -0.22%;Comex黄金2510收盘价3417.20,日涨幅1.00%等;SPDR黄金ETF持仓956.77,较前日无变动;沪金库存37,455千克,较前日增加813千克等[5] - 宏观及行业新闻:鲍威尔放鸽,强调就业风险,为降息敞开大门,预计关税一次性推升价格,但需时间体现影响[5] - 趋势强度:1 [8] 白银 - 走势判断:冲顶前高[5] - 基本面数据:沪银2510昨日收盘价9192,日涨幅0.33%;Comex白银2510收盘价39.390,日涨幅2.07%等;SLV白银ETF持仓(前天)15,288.82,较前日增加11;沪银库存1,109,123千克,较前日减少5932千克等[5] - 趋势强度:1 [8] 铜 - 走势判断:美元回落,价格上涨[10] - 基本面数据:沪铜主力合约昨日收盘价78,650,日涨幅0.18%,夜盘收盘价79110,夜盘涨幅0.58%;伦铜3M电子盘收盘价9,809,日涨幅0.77%等;沪铜期货库存24,148吨,较前日减少1,009吨;伦铜期货库存155,975吨,较前日减少375吨等[10] - 宏观及行业新闻:鲍威尔宣布美联储货币政策框架调整;加拿大9月起取消多项对美报复性关税;智利国家铜业公司埃尔特尼恩特铜矿的冶炼厂重启运行;Glencore申请将旗下阿根廷铜矿项目纳入投资激励计划;中国2025年7月精炼铜和铜矿砂及其精矿进口量有变化;澳洲Hillgrove资源公司发现新的高品位铜/金矿资源;Codelco下调今年铜产出目标[10][12] - 趋势强度:0 [12] 锌 - 走势判断:区间震荡[13] - 基本面数据:沪锌主力收盘价22275,涨幅0.16%;伦锌3M电子盘收盘价2805.5,涨幅1.39%等;沪锌期货库存32791吨,较前日增加503吨;LME锌库存68075吨,较前日减少1300吨等[13] - 新闻:鲍威尔放鸽及宣布美联储货币政策框架调整[14] - 趋势强度:0 [15] 铅 - 走势判断:库存减少,支撑价格[16] - 基本面数据:沪铅主力收盘价16780,涨幅0.21%;伦铅3M电子盘收盘价1992,涨幅1.12%等;沪铅期货库存58946吨,较前日减少476吨;LME铅库存273050吨,较前日减少6550吨等[16] - 新闻:鲍威尔宣布美联储货币政策框架调整;加拿大9月起取消多项对美报复性关税[16] - 趋势强度:0 [16] 锡 - 走势判断:区间震荡[18] - 基本面数据:沪锡主力合约昨日收盘价265,930,日涨幅 -0.21%;伦锡3M电子盘收盘价33,845,日涨幅1.11%等;沪锡期货库存7,053吨,较前日减少205吨;伦锡期货库存1,785吨,较前日增加45吨等[19] - 宏观及行业新闻:鲍威尔放鸽;中国国常会相关汇报及研究;工信部相关举措;《互联网平台价格行为规则(征求意见稿)》;恒生指数扩容;英伟达相关动态[20][21] - 趋势强度:1 [22] 铝、氧化铝、铸造铝合金 - 走势判断:铝累库放缓,氧化铝横盘小涨,铸造铝合金跟随电解铝[23] - 基本面数据:沪铝主力合约收盘价20630等;LME铝3M收盘价2622等;沪氧化铝主力合约收盘价3138等;国内铝锭社会库存57.90万吨等;国内氧化铝平均价3263等[23] - 综合快讯:新美联储通讯社称鲍威尔释放谨慎降息信号[25] - 趋势强度:铝、氧化铝、铝合金趋势强度均为0 [25] 镍、不锈钢 - 走势判断:镍窄幅区间震荡运行,不锈钢短线低位震荡[26] - 基本面数据:沪镍主力收盘价119,610等;不锈钢主力收盘价12,750等;1进口镍119,650等;8 - 12%高镍生铁(出厂价)929等[26] - 宏观及行业新闻:加拿大安大略省省长针对美国关税威胁表态;印尼CNI镍铁RKEF一期项目进入试生产阶段;印尼IMIP工业园区发现环境违规行为;印尼计划缩短采矿配额期限;印尼镍矿开采商协会公布2025年产量目标;印尼某镍铁冶炼产业园部分产线暂停生产;印尼能源与矿产资源部要求重新提交2026年工作计划和预算;山东某钢厂开启检修;印尼总统表示严惩非法采矿行为[26][27][28][29][30] - 趋势强度:镍、不锈钢趋势强度均为0 [31]
港股通科技ETF(159262)一度涨超3%,盘中价格再创上市以来新高
新浪财经· 2025-08-25 13:13
国产AI大模型与芯片技术突破 - DeepSeek发布V3.1版本采用UE8M0 FP8参数精度 专为下一代国产芯片设计 推动国产AI芯片在推理市场规模化应用 [1] - 国产大模型对国产芯片适配和支持持续加强 国产算力市占率有望提升 增强投资者对国产AI生态信心 [1] - 国产AI芯片在制造工艺和技术设计方面持续进步 为AI算力链国产化替代提供坚实基础 [1] 国产算力板块催化与市场表现 - 国产算力芯片迎来国产创新窗口期 英伟达推出NVIDIA Spectrum-XGS Ethernet技术 面向分布式数据中心跨域互联 [2] - A股英伟达产业链指数8月25日盘中涨幅超2% 中科曙光涨停 奥比中光-UW 铂科新材 中际旭创等涨幅居前 [2] - 港股通科技ETF(159262)一度涨超3% 成分股ASMPT涨超6% 快手-W 中兴通讯跟涨 [2] 港股科技板块资金与流动性动态 - 小米集团 阿里巴巴 腾讯控股三大AI领军企业合计权重近30% 叠加中芯国际 华虹半导体等硬科技标的形成高浓度科技龙头组合 [3] - 港股通科技ETF近4天获得连续资金净流入 最高单日净流入3699.04万元 合计净流入5796.01万元 [3] - 港股通科技ETF最新规模达33.30亿元 创成立以来新高 位居可比基金第一 [3] 市场环境与风险偏好改善 - 鲍威尔释放鸽派信号 市场对美联储降息预期提升 美债收益率下行 提振全球风险偏好 [3] - 科技风格占优 叠加香港本地流动性压力缓解 前期滞涨港股有望得到提振 [3] 港股通科技ETF产品特性 - 紧密跟踪恒生港股通科技主题指数 反映港股通科技主题上市公司表现 指数剔除医药 汽车和家电 聚焦TMT行业 [2] - 跟踪指数前十大权重股合计占比73.3% 权重股中芯国际 阿里巴巴-W上涨5% 金蝶国际等跟涨 [2] - 重点覆盖晶圆厂+AI应用 锚定AI时代纯科技革命发展机遇 [4]
国泰君安期货商品研究晨报-20250825
国泰君安期货· 2025-08-25 13:10
报告行业投资评级 未提及相关内容 报告的核心观点 报告对各期货品种进行分析并给出投资观点,如黄金受JH会议鲍威尔放鸽影响;铜因美元回落价格上涨;铁矿石短期估值有宏微观支撑等[2][11][41]。 根据相关目录分别进行总结 贵金属 - 黄金受JH会议鲍威尔放鸽影响,趋势强度为1 [2][5][9] - 白银有冲顶前高趋势,趋势强度为1 [2][6][9] 有色金属 - 铜因美元回落价格上涨,趋势强度为0 [2][11][13] - 锌呈区间震荡态势,趋势强度为0 [2][14][17] - 铅因库存减少支撑价格,趋势强度为0 [2][18] - 锡区间震荡,趋势强度为1 [2][20][24] - 铝累库放缓,氧化铝横盘小涨,铸造铝合金跟随电解铝,三者趋势强度均为0 [2][25][27] - 镍窄幅区间震荡运行,不锈钢短线低位震荡,趋势强度均为0 [2][28][33] 能源化工 - 碳酸锂宽幅震荡,趋势强度为0 [2][34][37] - 工业硅市场情绪提振,多晶硅区间震荡且以逢低做多为主,趋势强度均为1 [2][38][40] - 铁矿石短期估值有宏微观支撑,趋势强度为2 [2][41][43] - 螺纹钢和热轧卷板宽幅震荡,趋势强度均为0 [2][44][48] - 硅铁和锰硅宽幅震荡,趋势强度均为0 [2][49][51] - 焦炭和焦煤宽幅震荡,趋势强度均为0 [2][52][54] - 原木震荡反复,趋势强度为1 [2][55][58] - 对二甲苯、PTA趋势偏强且正套,MEG趋势偏强,趋势强度均为1 [2][59][61] - 橡胶震荡运行,趋势强度为0 [2][64][65] - 合成橡胶短期偏强,中期区间震荡,趋势强度为0 [2][70][71] - 沥青油价稍偏强但裂解回落,趋势强度为0 [2][72][79] - LLDPE短期偏强震荡,趋势强度为1 [2][87][89] - PP短线反弹,中期震荡市,趋势强度为0 [2][91][93] - 烧碱偏多对待,趋势强度为1 [2][95][98] - 纸浆震荡运行,趋势强度为0 [2][100][101] - 玻璃原片价格平稳,趋势强度为0 [2][105][106] - 甲醇短期震荡有支撑,趋势强度为0 [2][108][111] - 尿素弱势运行,趋势强度为 -1 [2][112][115] - 苯乙烯短期偏强,中期偏空,趋势强度为0 [2][116] - 纯碱现货市场变化不大,趋势强度为0 [2][118][120] - LPG进口成本有支撑但供需无明显改善,丙烯供需紧平衡且价格偏强整理,趋势强度均为0 [2][122][127] - PVC短期震荡,趋势仍有压力,趋势强度为0 [2][130][131] - 燃料油涨势明显且短期强势延续,趋势强度为2;低硫燃料油相对高硫偏弱,外盘现货高低硫价差小幅反弹,趋势强度为1 [2][133] 农产品 - 短纤和瓶片因上游供应波动震荡偏强,趋势强度均为1 [2][150][151] - 胶版印刷纸低位震荡且向上乏力,趋势强度为0 [2][153][154] - 纯苯偏弱震荡,趋势强度为0 [2][155][156] - 棕榈油因美豆油SRE利空出尽国际油脂上涨,趋势强度为1;豆油四季度缺豆交易暂缓,高位震荡整理,趋势强度为0 [2][158][164] - 豆粕隔夜美豆小幅收涨或反弹震荡,豆一反弹震荡,趋势强度均为0 [2][165][167] - 玉米震荡运行,趋势强度为0 [2][168][171] - 白糖窄幅波动,趋势强度为0 [2][172][174] - 棉花期货价格震荡偏强,趋势强度为0 [2][176][180] - 鸡蛋近端关注淘鸡节奏,远端情绪仍偏弱,趋势强度为0 [2][183] - 生猪收储利多落地,等待现货印证,趋势强度为0 [2][186][188] - 花生关注新花生上市,趋势强度为0 [2][190][194] 航运 - 集运指数(欧线)弱势震荡,趋势强度为 -1 [2][135][149]
英伟达推出Spectrum-XGS以太网,助力分布式数据中心迈入十亿瓦级AI超级工厂
华尔街见闻· 2025-08-24 19:34
产品发布 - 英伟达推出NVIDIA Spectrum-XGS以太网技术 实现跨区域扩展(scale-across)能力[1] - 该技术可将多个分布式数据中心组合成十亿瓦级AI超级工厂[1] - Spectrum-XGS是以太网平台新增的突破性产品 打破原有基础设施限制[1] 技术架构 - 跨区域扩展成为继纵向扩展(scale-up)和横向扩展(scale-out)后的AI计算第三大支柱[1] - 技术能将Spectrum-X以太网的极致性能和规模扩展至多个分布式数据中心[1] - 支持不同城市、国家乃至大洲的数据中心互联[1] 行业定位 - AI工业革命已经到来 巨型AI工厂是核心基础设施[1] - 公司定位跨区域扩展技术为AI超级工厂的关键组成要素[1] - 该技术面向具有十亿瓦级规模的智能AI超级工厂建设需求[1]
国产GPU跑满血DeepSeek,已经可以100 tokens/s了!
量子位· 2025-07-26 17:01
核心观点 - 国产GPU厂商摩尔线程的芯片速度达到100 tokens/s,远超国外GPU的50 tokens/s和国内其他产品的15 tokens/s [1][4] - 摩尔线程通过构建"AI超级工厂"实现系统性技术突破,而非单一芯片性能优化 [6][7][10] - AI超级工厂的五大核心要素包括全功能GPU、MUSA架构、全栈软件、KUAE集群、零中断容错技术 [13][49] 技术架构 全功能GPU - 芯片集成四大引擎:AI计算加速引擎(支持训推一体)、3D图形渲染引擎、物理仿真引擎、超高清视频编解码引擎 [21] - 支持全计算精度覆盖(FP32/FP16/FP8/INT8/INT4),是国内极少数提供FP8训练能力的平台 [22][24] - 通用性设计避免ASIC芯片的局限性,适应多样化AI任务需求 [16][17] MUSA统一架构 - 采用"一个架构,万千应用"理念,实现多引擎可伸缩配置 [26] - 资源全局共享机制解决多任务并行卡顿问题,计算资源利用率提升15% [26][27][32] - 自研Transformer引擎使FP8训练性能提升30%,MTLink2.0互联协议带宽高出行业60% [32] 软件系统 - 驱动优化使核函数启动时间缩短50%,支持千任务并发 [41] - muDNN算子库GEMM利用率达98%,Flash Attention利用率超95% [41] - 通信库实现97%带宽利用率,集群性能提升10% [42] - 全面兼容PyTorch/TensorFlow,DeepSeek R1推理加速1.5倍 [42] 集群能力 KUAE计算集群 - 整合5D并行训练策略(DP/PP/TP等),自动优化并行方案 [45] - CheckPoint加速技术将百GB级恢复时间压缩至1秒 [45] - Simumax工具实现超大规模集群性能仿真,缩短训练周期 [45] 稳定性保障 - 零中断容错技术使有效训练时间占比超99% [51] - 动态监测系统提升异常处理效率50%,训练成功率提高10% [51] 行业背景 - 大模型迭代周期从数月缩短至数周,算力成为核心竞争要素 [54][55] - 未来Agentic AI和空间智能将推动算力需求几何级增长 [56] - 万亿参数模型训练需要端到端解决方案,单点性能突破不足 [59][61]