Workflow
Helios AI机架
icon
搜索文档
AI产业跟踪:海外:HPE携手博通推出AMD"Helios"AI机架,搭载业界首创纵向扩展以太网
国泰海通证券· 2025-12-10 16:58
报告行业投资评级 - 报告未明确给出行业投资评级 [1] 报告的核心观点 - 报告跟踪了AI产业的最新动态,核心观点是AI产业正处在技术快速迭代、应用场景拓宽和基础设施创新的活跃期,硬件、软件、模型和应用层面均出现重要进展 [1] 根据相关目录分别进行总结 AI 行业动态 - **OpenAI** 在2025年进行了第四起收购,目标是其付费客户、提供AI模型训练跟踪工具的初创公司 **Neptune** [4] - **Meta** 组建全明星设计团队攻坚AI眼镜,由前苹果设计副总裁 **Alan Dye** 领导,旨在融合时尚与科技,打造非侵入式用户体验的设备 [5] - **Marvell** 宣布收购拥有光子互联技术的半导体初创公司 **Celestial AI**,旨在解决AI算力瓶颈,强化其在AI数据中心连接领域的竞争力,并获得主要客户 **亚马逊** 的支持 [6] - **HPE** 携手 **博通** 推出基于 **AMD Instinct MI455X** 显卡加速器的“Helios”机架级AI解决方案,搭载业界首创的纵向扩展以太网网络,可提供合计 **260TB/s** 的纵向扩展聚合带宽,AI FP4算力达到 **2.9 exaflops**,计划于2026年全球交付 [16] AI 应用资讯 - **苹果** 研究显示,AI可从 **Apple Watch** 光学传感器中挖掘更深入的心脏健康数据,其“高血压提醒”功能基于长达30天的数据趋势分析 [8] - **谷歌** 发布 **Workspace Studio**,支持用户通过自然语言描述创建、管理和分享AI智能体,该工具依托 **Gemini** 模型,可与 **Asana**、**Jira**、**Salesforce** 等第三方平台集成 [9] - **川崎重工** 宣布正式着手生产可载人移动的四足机器人“CORLEO”,计划与户外休闲服务结合,目标在2040年达成 **3000亿日元** 的业务规模 [10] - **XREAL** 发布 **AR** 眼镜新品 **XREAL 1S**,全球首发内容 **2D → 3D** 自动转换功能,重量为 **82g**,搭载自研 **X1** 空间计算芯片,延迟低至 **3ms** [10] AI 大模型资讯 - **亚马逊云科技** 发布 **Nova 2** 系列AI模型,并同步推出 **Nova Forge** 定制服务,使企业客户能够构建专属的定制化模型版本 [11] - **英伟达** 发布专注于自动驾驶的视觉语言动作模型 **Alpamayo-R1**,这是业界首个专注于该领域的开源推理型视觉语言模型 [12] - **Mistral AI** 推出 **Mistral 3** 系列模型,参数规模从 **3B** 到 **675B**,均以 **Apache 2.0** 许可证开源,其中 **Mistral Large** 总参数量为 **675B**,使用 **3000** 块英伟达 **H200 GPU** 训练 [13] - **Runway** 推出 **Gen 4.5** AI视频模型,在独立基准测试中表现超过谷歌和OpenAI的同类产品,登顶 **Video Arena** 榜单 [13] 科技前沿 - **亚马逊** 发布新一代自研AI芯片 **Trainium3**,其系统在训练和高负载推理场景下的速度相较第二代产品提升超过 **4** 倍,内存容量也增至 **4** 倍,可构建搭载最多 **100万** 颗 **Trainium3** 芯片的超大规模集群 [14][15] - **蓝色起源** 公布由AI设计的“月球吸尘器”,该设备能吸入月球尘埃并从中提取热量转化为能源 [16] - **英伟达** 发布 **CUDA Toolkit 13.1**,这是自2006年CUDA平台诞生以来规模最大、最全面的更新,引入了基于 **tile** 的编程模型等新特性 [16][18]
AMD:推理之王
美股研究社· 2025-07-25 20:13
AMD股价与市场表现 - 公司股价跑输标普500和纳斯达克100指数,因前期估值过高 [1] - 当前市值2550亿美元,远低于英伟达的4.1万亿美元,但实际技术差距更小 [1] - 过去一个月股价飙升20%,预期市盈率78倍,高于英伟达的42倍 [29] 新产品与技术优势 - MI400系列GPU将于2026年推出,内存容量提升至432GB,带宽达19.6TB/s,性能为MI355的10倍 [12][13] - MI355X GPU内存带宽比英伟达B200高40%,支持单GPU推理,降低延迟和成本 [10] - Helios AI机架整合自研CPU/GPU/网卡/软件,对标英伟达DGX系统 [13] AI推理领域战略 - 专注AI推理市场,OpenAI已采用MI400X,Meta使用MI300X进行推理 [4][25] - 2023-2028年推理业务CAGR达80%,预计2028年AI处理器TAM达5000亿美元 [15][30] - 推理收入占比未来将超过训练,公司有望挑战英伟达市场份额 [15] CPU市场进展 - 2纳米Zen 5 EPYC CPU已发布,性能超越英特尔至强6s [21][23] - 服务器CPU份额从2014年11%升至2025年24.7%,预计2029年达39.2% [19][24] - 谷歌云、微软、甲骨文等采用EPYC CPU,云领域主导地位增强 [23] 财务与客户动态 - Q1数据中心收入同比增长57%,客户端收入增长28% [26][27] - 董事会批准60亿美元股票回购,总额达100亿美元 [25] - Meta招募AI人才扩大Llama模型规模,将增加AMD GPU需求 [25] 市场增长预测 - 2023年数据中心TAM为450亿美元,公司占比14.44%,2028年TAM预计5000亿美元 [30] - 若主导推理市场,2028年数据中心收入或超722亿美元 [30]
AMD甩出最猛两代AI芯片,全球首推432GB HBM4,OpenAI CEO现场夸
36氪· 2025-06-13 10:04
产品发布 - AMD在Advancing AI大会上发布史上最强AI新品阵容,包括旗舰数据中心AI芯片、AI软件栈、AI机架级基础设施、AI网卡与DPU,展现与英伟达竞争雄心 [1] - 重点产品包括数据中心AI芯片MI350系列和MI400系列,其中MI350系列采用3nm制程,集成1850亿晶体管,基于CDNA 4架构,搭载288GB HBM3e内存,内存带宽8TB/s,单GPU可运行5200参数大模型,FP4/FP6精度下峰值算力20PFLOPS,推理性能达上一代35倍 [5] - MI400系列专为大规模训练和分布式推理设计,FP4精度下峰值算力40PFLOPS,FP8峰值性能20PFLOPS,搭载432GB HBM4内存,内存带宽19.6TB/s,性能相比MI355X提升10倍 [7][9] 性能对比 - MI355X与英伟达B200/GB200相比,内存容量多60%,FP64/FP32和FP6精度下峰值性能翻倍,FP16/FP8/FP4精度下性能相当 [36] - 运行DeepSeek R1模型时,MI350系列推理吞吐量超过英伟达B200 [5] - 8卡MI355X平台总内存2.3TB HBM3e,内存带宽64TB/s,FP4/FP6精度下峰值算力161PFLOPS [39][41] 软件生态 - 全新AI软件栈ROCm 7.0推理性能提升4倍以上,训练性能提升3倍,支持主流模型Day 0级支持,首度支持Windows系统 [12] - ROCm 7引入分布式推理方法,与SGLang、vLLM等开源框架协作,运行DeepSeek R1 FP8精度时吞吐量比B200高30% [85][86] - AMD推出开发者云,提供即时访问MI300X GPU,预装流行AI软件,率先注册开发者可获得25小时免费积分 [92][93] 基础设施 - 下一代"Helios"AI机架级解决方案支持72块MI400系列GPU,FP4峰值算力2.9EFLOPS,HBM4内存容量、带宽等指标比英伟达Oberon机架高50% [14][19][21] - Helios集成EPYC "Venice" CPU、MI400系列GPU和Pensando "Vulcano" NIC,其中EPYC "Venice"采用2nm制程,基于Zen 6架构,最多256核 [21] - AMD剧透2027年将推出下一代机架级解决方案,集成EPYC "Verano" CPU、MI500系列GPU和Pensando "Vulcano" NIC [24] 行业趋势 - 数据中心AI加速器TAM市场将年增60%以上,2028年达5000亿美元,推理将成为AI计算最大驱动力,未来几年年增80%以上 [30] - 全球10大AI公司中有7家正大规模部署AMD Instinct GPU [34] - AMD设定2030年新目标:将机架级能效提高20倍,使目前需275个机架的AI模型能在1个机架内训练,运营用电量减少95% [118]