Workflow
Rubin Ultra
icon
搜索文档
电子掘金:海外算力链还有哪些重点机会?
2025-08-05 11:15
行业与公司分析总结 行业概况 - 北美头部云厂商(谷歌 Meta 微软 亚马逊)2025年资本开支总额预计超3660亿美元 同比增长47% 远超市场预期[1][2] - AI产业持续创新 Anthropic Claude 4和Xai Grok Four等新模型在性能与计算资源上显著提升 计算资源提升达10倍[10] - PCB板块近期波动大 受COVF/SOP技术路径讨论和海外云厂商KPIX预期上调影响显著[14] 核心公司动态 Meta - 将"超级智能"作为战略目标 成立Meta Superintelligence Labs 计划通过五大商业机会实现投资回报:广告系统优化 用户体验增强 企业级服务 AI产品深化 AI硬件拓展[7] - 2025年资本开支下限从640-720亿美元提升至660亿美元 暗示2026年可能接近千亿美元量级[2][4] - 生成式AI项目仍处早期 短期不会成为主要收入驱动力 投资侧重中长期发展[7] 谷歌 - 2025年资本开支从750亿美元上调至850亿美元 同比增62% 超出市场预期的800亿美元[2][4] - 云计算业务单季度收入136亿美元 同比增32% 客户满意度高流失率低[8][9] - 频繁更新Gemini模型和VIVO3视频大模型 打造AI硬件生态闭环[4] 微软与亚马逊 - 微软维持下财季超300亿美元资本开支增长 持续加大基础设施投资[2][4] - 亚马逊预计2025年下半年维持上半年投资力度[2][4] 技术发展趋势 PCB技术 - cobalt工艺通过PCB替代载板简化结构 H100单位价值量约100美元 Rubin Ultra可能增至四五百美元[3][18] - 面临散热和芯片翘曲挑战 需解决GPU与HBM存储裸带直接堆叠问题[18][19] - 高阶HDI向SLP发展 线宽线距从40-60微米缩小至20微米 工艺从减成法转向半加成法[20][21] ASIC供应链 - 2026年需求弹性显著 单机价值量和总数量均有望超过MV[3][16] - 新丰鹏鼎 东山景旺等新兴企业有望切入[3][16] - 谷歌 亚马逊 Meta芯片量将有较大弹性[16] 市场与投资机会 - 2026年KPIX投入将更明确持续 硬件需求确定性增强[15] - 晶胶背板趋势明确 2026年预计使用26×33混压高多层板 市场增量约20多亿美元[24] - 建议关注回调布局机会 因27年仍有大量新需求驱动[12][15][24] - 重点关注PCB板块中的胜宏 沪电 顺鑫科技等标的[15] 潜在风险与挑战 - OpenAI GPT-5发布延期引发市场担忧 但产业整体发展未停滞[10] - 封装工艺变革可能影响现有产能(如台积电COBOS工艺转向Coworks Cobop)[25] - 载板被替代后 前期载板产能如何快速转换为HDI/SLP[25] - 扩产后供需平衡问题 但预计2026-2027年市场需求仍高景气[25]
大摩:市场热议的CoWoP,英伟达下一代GPU采用可能性不大
硬AI· 2025-07-30 23:40
技术路径选择 - 英伟达下一代GPU产品Rubin Ultra仍将沿用现有的ABF基板技术,而非转向CoWoP方案 [2] - 从CoWoS转向CoWoP在技术上仍面临重大挑战,对ABF基板的依赖短期内难以改变 [1][2] - 技术转换的复杂性和供应链重组风险使得短期内大规模采用CoWoP并不现实 [1][2] 技术门槛 - CoWoP技术要求PCB的线/间距(L/S)缩小至10/10微米以下,与目前ABF基板的标准相当 [5] - 当前高密度互连(HDI) PCB的L/S为40/50微米,类基板PCB(SLP)仅达到20/35微米,缩小至10/10微米以下存在显著技术难度 [5] - 技术壁垒是Rubin Ultra不太可能采用CoWoP的主要原因之一 [6] 供应链风险 - 从CoWoS转向CoWoP将带来显著的良品率风险和相关供应链的重组 [8] - 台积电的CoWoS良品率已接近100%,技术切换存在不必要风险 [8] - 技术转换涉及整个供应链生态系统的重新配置,短期内实施的复杂性和风险较高 [8] CoWoP潜在优势 - CoWoP技术优势包括信号路径更短、散热性能显著提升、电源完整性更好、解决有机基板产能瓶颈问题 [10] - 采用CoWoP可解决基板翘曲问题、增加NVLink覆盖范围、实现更高散热效率、消除某些封装材料产能瓶颈 [10] - 不排除英伟达正在并行开发CoWoP技术的可能性,作为当前量产技术的补充 [3][10]
NVIDIA Selects Navitas to Collaborate on Next Generation 800 V HVDC Architecture
Globenewswire· 2025-05-22 04:17
文章核心观点 - 纳微半导体(Navitas)的氮化镓(GaN)和碳化硅(SiC)技术被选中支持英伟达(Nvidia)800V高压直流(HVDC)数据中心电力基础设施,以支持1兆瓦及以上的IT机架 [1][21] 合作信息 - 纳微半导体与英伟达合作,为其下一代800V HVDC架构提供支持,助力为GPU供电的“Kyber”机架级系统 [1] 英伟达800V HVDC架构优势 - 旨在为下一代人工智能工作负载建立高效、可扩展的电力输送,确保更高可靠性、效率并降低基础设施复杂性 [2] - 现有数据中心架构使用传统54V机架内配电,功率受限且存在物理限制,而英伟达将13.8kV交流电网电力直接转换为800V HVDC,可消除多个转换步骤,提高效率和可靠性 [3][4] - 800V HVDC可使铜线厚度最多减少45%,解决传统系统铜需求大的问题,满足人工智能数据中心高功率需求 [5] - 800V HVDC直接为IT机架供电,经DC - DC转换器转换为较低电压驱动GPU [6] - 该架构将端到端电力效率提高达5%,因电源故障减少使维护成本降低70%,通过直接连接HVDC到IT和计算机架降低冷却成本 [13] 纳微半导体技术优势 - 是氮化镓和碳化硅技术支持的人工智能数据中心解决方案的领导者,其高功率GaNSafe功率IC集成多种功能,具有高可靠性和鲁棒性 [7] - 提供中压(80 - 120V)氮化镓器件,针对二次侧DC - DC转换优化,适用于输出48V - 54V的人工智能数据中心电源 [8] - 凭借20年碳化硅创新领导地位,GeneSiC专有技术提供卓越性能,G3F SiC MOSFETs高效高速,可降低温度并延长使用寿命 [9] - 碳化硅技术电压范围广,已应用于多个兆瓦级储能和电网逆变器项目 [10] 纳微半导体产品成果 - 2023年8月推出高速高效3.2kW CRPS,尺寸比同类硅解决方案小40%;后推出4.5kW CRPS,功率密度达137W/in,效率超97% [12] - 2024年11月发布世界首个8.5kW人工智能数据中心电源,效率达98%,符合相关规范;还创建IntelliWeave数字控制技术,结合高功率器件使PFC峰值效率达99.3%,降低30%功率损耗 [12] - 5月21日在“AI Tech Night”展示最新12kW电源 [12] 纳微半导体公司概况 - 成立于2014年,是纯下一代功率半导体公司,拥有GaNFast和GeneSiC技术,专注于人工智能数据中心等多个市场,拥有超300项专利,提供20年GaNFast保修,是世界首个获得碳中和认证的半导体公司 [17]
910C的下一代
信息平权· 2025-04-20 17:33
华为昇腾CloudMatrix与UB-Mesh技术分析 核心观点 - 华为发布的CloudMatrix 384超节点与UB-Mesh论文描述的架构存在显著差异 表明两者属于不同代际或应用场景的技术方案 [1][8] - CloudMatrix已实现384颗NPU光互联商用 而UB-Mesh论文提出8000颗NPU超节点构想 显示技术路线存在分级演进可能 [8][9] - 华为在超节点网络架构积累可能超越英伟达 尤其在分布式交换和拓扑优化方面展现独特优势 [10][11] 技术架构差异 - **硬件形态**:UB-Mesh采用1U机箱 每机柜64NPU 而CloudMatrix单机柜32NPU(384/12) 物理结构完全不同 [1] - **互联协议**:CloudMatrix采用光互联实现384NPU商用 UB-Mesh提出电互联(机柜内)+光互联(机柜间)混合方案 [5][9] - **NPU设计**:UB-Mesh描述的NPU集成分布式交换功能 可能对应昇腾910C下一代设计 当前910C尚未具备此能力 [10] 性能与成本争议 - **功耗对比**:CloudMatrix单机柜约50KW 支持风冷 而英伟达NVL72达145KW 但整体能效需结合电力基础设施评估 [2][5] - **光模块优势**:华为垂直整合光模块产业链 可能通过规模效应将400G模块成本降至竞争对手1/3以下 [3][6] - **传输速率**:华为自研光模块可实现8x64G=512Gbps单模速率 远超行业标准400G(8x50G)设计 [4] 行业竞争格局 - **技术路线**:英伟达转向全电互联(NVL72) 华为坚持光电混合方案 在超大规模集群(8000NPU)领域形成差异化 [8][9] - **生态构建**:中国AI基础设施可能形成独立生态 DeepSeek等应用需求正反向推动国产硬件创新 [11] - **工程能力**:中国企业在1-10阶段工程化优势显著 光模块等核心部件成本压缩速度超国际预期 [6][12] 技术演进方向 - **代际划分**:CloudMatrix 384代表UB1.0商用方案 UB-Mesh论文预示UB2.0将支持8000NPU级超节点 [11] - **拓扑优化**:分级拓扑成为趋势 机柜内电互联+机柜间光互联方案平衡性能与成本 [9][10] - **延迟控制**:分布式交换架构使Mesh拓扑实现all2all通信 逻辑延迟可能低于Clos架构 [10]
NVIDIA GTC 2025:GPU、Tokens、合作关系
Counterpoint Research· 2025-04-03 10:59
AI经济与Tokens化 - Tokens作为新型"货币"用于检索或生成信息 推动AI经济发展 但需要大量算力支持[2] - AI推理模型复杂度提升 对准确性要求更高 需遵循预训练 后训练和测试时扩展三条定律[2] - 进入Agentic时代 组织机构需在训练到推理全流程中遵循扩展流程以实现高效推理[2] NVIDIA技术栈创新 - 公司提供完整AI技术栈 涵盖芯片 系统和软件 以最高效率加速和扩展AI[4] - 技术栈覆盖Agentic AI和Physical AI领域 芯片路线图从计算到硅光子学均有重大发布[4] - 软件专业技术是最大优势 促使高性能芯片广泛应用 与竞争对手差距持续拉大[32] 芯片产品与技术 - 产品组合包括CPU GPU和网络设备 最新Blackwell平台GB300 NVL72性能提升1.5倍[6] - Rubin系列GPU采用FP4精度 性能达50-100 petaFLOPS 配备288GB-1TB HBM4存储器[6] - Vera CPU性能是Grace的两倍 功耗仅50W 更新节奏为每两年一次[6] - 光谱-X硅光子学产品可节省数兆瓦电力 解决横向扩展至数百万GPU的瓶颈问题[9] 系统解决方案 - Blackwell Ultra DGX SuperPOD配备36个Grace CPU和72个Blackwell GPU AI性能比Hopper高70倍[10] - DGX Spark个人超级计算机系统性能达1 petaFLOPS 适用于微调与推理[13] - 系统发布为Dell Lenovo等供应商提供强大AI解决方案基础 直接冲击苹果Mac Studio市场[13] 软件平台 - Dynamo开源框架提升AI推理效率 运行DeepSeek-R1模型Tokens生成能力可提升30倍[19] - Halos平台整合安全系统 覆盖从芯片到算法全流程 吸引众多汽车厂商采用[20][21] - CUDA-X拥有超百万开发者 成为最受欢迎的AI编程工具包 拓展至各行业应用[26] - Aerial平台开发原生AI 6G技术栈 涵盖从无线电设备到网络数字孪生的端到端方案[25][26] 新兴领域布局 - Isaac GR00T N1是全球首个人形机器人基础模型 采用双系统架构模拟人类决策与反射[29] - 与谷歌DeepMind和迪士尼合作开发开源牛顿物理引擎 提升机器人处理复杂任务能力[29] - Omniverse-Cosmos平台通过合成数据训练机器人 在不同场景中微调行为[29]
NVIDIA GTC 2025:GPU、Tokens、合作关系
Counterpoint Research· 2025-04-03 10:59
AI经济与Tokens化 - Tokens是用于检索或生成信息的新型"货币",推动AI经济发展,需要大量算力支持[1] - AI推理模型复杂度提升需要更高准确性,组织机构需遵循预训练、后训练和测试时的扩展流程[1] - NVIDIA愿景聚焦构建跨行业"AI工厂",涵盖企业IT、云计算到机器人技术[1] NVIDIA芯片技术进展 - 发布Blackwell超级AI工厂平台GB300 NVL72,AI性能比GB200 NVL72提升1.5倍[6] - 公布芯片路线图,支持从Hopper系列升级到Rubin/Feynman系列,Rubin Ultra采用四掩模版GPU,FP4精度达100 petaFLOPS,搭载1TB HBM4e存储器[6] - 新款Vera CPU拥有88个Arm核心,性能是Grace CPU两倍,功耗仅50W,更新周期两年[6] - 推出Spectrum-X硅光子学产品,可横向扩展至数百万GPU,节省数兆瓦电力[6] 系统与基础设施 - 发布DGX SuperPOD GB300,配备36个Grace CPU和72个Blackwell GPU,AI性能比Hopper系统高70倍[10] - 采用第五代NVLink技术和大规模共享内存系统,可扩展至数千个GB超级芯片[10] - 推出1 petaFLOPS的个人超级计算机系统GB10,针对桌面优化微调与推理[14] 软件生态系统 - Dynamo开源框架提升AI推理效率,可使GPU的Tokens生成能力提升30倍以上[19] - Halos平台整合自动驾驶安全系统,覆盖从芯片到算法全链条[20] - CUDA-X拥有超100万开发者,成为最受欢迎的AI编程工具包[23] - 发布Isaac GR00T N1人形机器人基础模型,采用双系统架构模拟人类决策与反射[25] 行业应用拓展 - Aerial平台构建端到端AI驱动的6G技术栈,与T-Mobile等合作开发原生AI网络[23] - Omniverse-Cosmos平台支持机器人训练与场景微调,与DeepMind合作开发物理引擎[25] - 软件专业技术是NVIDIA核心优势,推动高性能芯片在HPC、自动驾驶等领域的应用[25]
AMD现在值得抄底吗?GTC 周大涨后我仍持观望态度
美股研究社· 2025-03-24 19:10
文章核心观点 - AMD近期不太可能大幅上涨,最近反弹是对英伟达GTC活动的反应,非基本面转变,虽估值比英伟达贵,但此价格水平不值得卖出,分析师将关注今年MI350 GPU发布及客户端细分市场是否放缓 [1][11] 公司评级与目标价 - 瑞穗证券将AMD目标价从140美元下调至120美元,维持“跑赢大盘”评级,认为其发展AI业务面临挑战,因英伟达在数据中心GPU市场领先 [2] - 花旗银行重申对AMD的中性评级,指出CPU库存可能增加 [3] 公司业务情况 数据中心业务 - 2024年AMD数据中心部门收入125.8亿美元,英伟达计算和网络部门同期收入1152亿美元,差距近10倍,预计2026年MI400系列推出后差距缩小 [3] - 随着第五代EPYC Turin CPU增长及2025年中期推出MI350 GPU,今年数据中心业务有显著上涨空间,2026年推出的MI400系列准备好与英伟达Rubin竞争 [2] 客户端业务 - 花旗银行指出2024年下半年CPU增长率为两位数,PC增长率为个位数中段,CPU库存可能增加,管理层认为客户端CPU收入增长由采用推动而非库存增加,客户细分指导可能夸大需求强度 [3][4] 各业务第一季度业绩指引 - 2025年第一季度总收入(中点)环比下降7%,各部门中数据中心业绩下降幅度与企业平均水平差不多,客户端业务和嵌入式业务降幅更大,游戏业务降幅较小 [5][6] 公司股价情况 英伟达股价 - 英伟达GTC活动前三天(3月11日至14日)股价上涨13.7%,活动相关信息已反映在价格中 [7] AMD股价 - AMD抛售触及100美元左右支撑位底部(最低点95美元),过去一周反弹,英伟达GTC活动推动其本周价格上涨,未来几周上涨趋势预计不会持续,价格将稳定在100美元左右 [1] - AMD股价在GTC活动期间保持势头,日线图显示打破自去年10月以来的下跌趋势,但可能是牛市陷阱,由GTC事件这一暂时外部因素推动 [9] - 从估值看,AMD市盈率为去年收益的107倍,英伟达为40倍;AMD交易价格为去年运营现金流的57倍,英伟达为TTM现金流的45倍,AMD比英伟达更贵 [10][13] 行业动态 - 英伟达首席执行官黄仁勋在GTC开幕式公布开发路线图重大更新,包括今年下半年推出Blackwell Ultra (GB300),2026年推出Rubin,2027年推出Rubin Ultra,2028年推出第三代Feynman,还宣布与通用汽车合作及推出首款人形机器人开源模型Groot N1 [6]
黄仁勋,刷屏!
证券时报· 2025-03-19 12:30
生成式人工智能时代 - 英伟达CEO黄仁勋在GTC 2025演讲中强调,AI技术已从意识AI(Perception AI)演进至生成式AI(Generative AI),目前进入代理式AI(Agentic AI)时代,未来将迈向物理AI(Physical AI)即机器人时代 [3] - 代理式AI正经历拐点,AI智能化程度和应用范围持续扩大,算力需求激增,需关注AI模型的训练与扩展,包括预训练扩展、训练后扩展及测试时间扩展("长思维") [5] 最新硬件与技术路线图 - 发布Blackwell Ultra AI工厂平台,专为AI推理设计,包含GB300(基于Arm的CPU)和B300(GPU)两个版本,带宽为前代GB200的2倍,内存速度提升1.5倍,2025年下半年出货 [8] - 公布2026-2028年数据中心路线图:2026年推出Vera Rubin芯片(NVLink 144技术加持,性能为GB300 NVL72的3.3倍),2027年推出Rubin Ultra(FP4推理能力达15EF,性能为GB300 NVL72的14倍),2028年推出Feynman架构芯片 [8][9] - 首次公开硅光芯片进展,具备高运算速度、低功耗和低时延特性,无需依赖极紫外光刻机(EUV) [10] 市场需求与行业进展 - Blackwell芯片推出一年内,全球前四大云服务商采购量从2024年的130万片Hopper架构芯片增至2025年的360万片Blackwell芯片,预计2028年数据中心建设支出达1万亿美元 [10] 机器人产业布局 - 黄仁勋称机器人产业"很可能是未来最大的产业",发布全球首款开源人形机器人基础模型GR00T N1,并展示与谷歌、迪士尼合作的机器人Blue [11] - 开发开源物理引擎Newton(预计2025年完成),用于机器人模拟学习,迪士尼将首批应用该技术改进娱乐机器人 [13] - 推出机器人开发工具如Mega(测试大规模部署效果),支持现实数据导入进行模仿学习或强化学习 [13] - 与通用汽车合作开发自动驾驶车队,优化智驾体验及工厂设计 [13]
英伟达新AI半导体处理性能提升至1.5倍
日经中文网· 2025-03-19 10:52
文章核心观点 英伟达宣布半导体产品开发计划、发布AI处理优化软件,还公布人形机器人和量子计算机研究相关战略,以维持在AI半导体市场优势地位并推动相关领域发展 [1][2][3] 半导体产品开发计划 - 2025年下半年推出新型人工智能半导体,处理性能提升至当前1.5倍,计划将新型图形处理半导体嵌入AI服务器并通过大型云服务商等渠道提供 [1] - 2025年下半年推出名为“Blackwell Ultra”的新型半导体,相比“Blackwell”,AI处理性能提升1.5倍,有助于推动高级AI应用 [2] - 2026年推出下一代AI半导体“Rubin”,2027年推出性能更强的“Rubin Ultra”,其处理性能达“Blackwell Ultra”的14倍 [2] AI处理优化软件 - 发布名为“Dynamo”的AI处理优化软件,运行高性能AI模型时可控制大量GPU高效分担AI处理任务,运行DeepSeek的R1模型时每个GPU可处理的数据量提升30倍以上 [1][2] - “Dynamo”作为“开源型”软件对外免费开放,公司计划通过硬件与软体技术结合巩固在AI半导体领域的高市场份额 [3] 人形机器人相关技术 - 免费开放名为“Isaac Groot N1”的人形机器人基础模型,面向开发企业开放,旨在实现能抓取和搬运物品的人形机器人 [3] - 与人形机器人技术开发方面与美国谷歌和华特迪士尼的研究机构合作,迪士尼计划利用其基础技术开发模仿角色的机器人等产品 [3] 量子计算机研究战略 - 在美国波士顿设立研究据点,与从事量子技术开发的企业、美国哈佛大学和麻省理工学院等开展联合研究,推动量子领域半导体需求增长 [3]
老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
量子位· 2025-03-19 06:20
文章核心观点 英伟达在GTC大会上发布多款新硬件、软件,涉足以太网领域,还在自动驾驶和具身智能方面取得新进展,同时大会设有“量子日”活动引发关注 [1][18][29][43][56] 新硬件发布 AI芯片 - GB300推理性能是GB200的1.5倍,将于今年下半年出货 [1][2] - 预览下一代AI超级芯片Vera Rubin,2026年下半年发货,整体性能是GB300的3.3倍 [3][6] - 2027年下半年推出的Rubin Ultra性能是GB300的14倍 [6] - 之后的下一代GPU将命名为Feynman [11] 个人AI超级计算机 - DGX Spark售价3000美元,采用GB10芯片,能提供每秒1000万亿次AI运算,官网已开启预定 [20][21][23] - DGX Station采用GB300芯片,将于今年晚些时候从多家厂商推出 [24][26] 以太网网络平台 - 推出全球首个面向AI的以太网网络平台Spectrum - X,可将AI网络性能提升1.6倍 [29][31] - 推出基于硅光学的Spectrum - X Photonics和Quantum - X Photonics网络交换平台,端口数据传输速度提至1.6Tb/s,总传输速度达400Tb/s [32][33] 软件开源 分布式推理服务库 - 发布NVIDIA Dyamo,可让DeepSeek - R1吞吐量提升30倍,已完全开源 [35][37][38] AI推理模型 - 开源新的AI推理模型Llama Nemotron,49B参数量性能远超其他对比模型 [39][41] 自动驾驶与具身智能进展 自动驾驶 - 与通用汽车合作,通用将在自动驾驶上使用英伟达AI技术 [44] - 发布端到端自动驾驶汽车全栈综合安全系统NVIDIA Halos,在三个层面提供支持 [45][47] 具身智能 - 与Google DeepMind和Disney Research合作开发下一代开源仿真物理模型Newton [50] - 推出全球首个开源的、完全可定制的人形机器人基础模型Isaac GR00T N1 [51] 大会其他亮点 - 今年GTC大会首次设立“量子日”活动,老黄将与多家量子计算企业高管讨论行业发展 [56]