Grace Hopper

搜索文档
NVIDIA Powers Europe's Fastest Supercomputer
Globenewswire· 2025-06-10 17:00
文章核心观点 NVIDIA宣布由NVIDIA Grace Hopper™平台驱动的JUPITER超级计算机是欧洲最快的超级计算机,能加速高性能计算和AI工作负载,推动科学发现和创新 [1] 分组1:JUPITER超级计算机性能特点 - 是欧洲最快的超级计算机,相比次快系统,高性能计算和AI工作负载速度提升超2倍 [1] - 即将具备每秒运行100亿亿次FP64运算的能力,有望成为欧洲首台百亿亿次级超级计算机 [2] - 在全球最快超级计算机TOP500榜单前五系统中,能源效率最高,达每瓦60千兆浮点运算 [3] - 预计AI性能超90百亿亿次浮点运算,基于Eviden的BullSequana XH3000液冷架构 [3] 分组2:JUPITER超级计算机组成结构 - 由近24000个NVIDIA GH200 Grace Hopper超级芯片组成,通过NVIDIA Quantum - 2 InfiniBand网络平台互连 [3] - 集成NVIDIA全栈软件以实现优化性能 [3] 分组3:JUPITER超级计算机意义与作用 - 能加速最大AI模型的模拟、训练和推理,助力气候建模、量子研究等多领域科研创新 [2] - 推动欧洲科学技术发展,为科学发现提供动力,促进多领域基础研究 [5] - 代表新一代计算系统,结合NVIDIA端到端软件栈解决多领域挑战 [6] 分组4:JUPITER超级计算机应用领域 - 气候和天气建模:借助NVIDIA Earth - 2开放平台实现高分辨率、实时环境模拟和可视化,助力地球虚拟化引擎项目 [6] - 量子计算研究:利用NVIDIA CUDA - Q™平台和NVIDIA cuQuantum软件开发工具包推进量子算法和硬件开发 [11] - 计算机辅助工程:通过NVIDIA PhysicsNeMo™框架等实现AI驱动的模拟和数字孪生技术,重塑产品设计和制造 [11] - 药物发现:通过NVIDIA BioNeMo™平台简化制药研究中AI模型的创建和部署,加速生物分子科学和药物发现的洞察时间 [11] 分组5:JUPITER超级计算机相关信息 - 由德国于利希研究中心的于利希超级计算中心托管,归欧洲高性能计算联合事业所有 [4] - 德国和其他欧洲研究人员可申请使用 [7] 分组6:NVIDIA公司信息 - 是全球加速计算领域的领导者 [8]
英伟达GPU,在这个市场吃瘪
半导体行业观察· 2025-05-21 09:37
英伟达在电信行业的战略调整 - 英伟达从高端AI芯片转向低端市场,推出ARC-Compact服务器,针对分布式RAN(D-RAN)场景,而非集中式RAN(C-RAN)[1] - ARC-Compact采用Grace CPU和L4 Tensor Core GPU,性能较弱,适合边缘视频处理和推理,但不适合大型语言模型训练[2] - 公司将其定位为"经济高效、节能"的选择,适用于低延迟AI工作负载和RAN加速[2] 主要RAN供应商的态度 - 爱立信、诺基亚和三星是潜在采用英伟达技术的三大RAN供应商,但均未表现出对CUDA架构的强烈兴趣[4] - 爱立信和三星倾向于"lookaside"虚拟RAN模式,主要将软件保留在CPU上,仅使用硬件加速器进行前向纠错(FEC)[4] - 诺基亚采用"inline"模式,但当前使用Marvell Technology的加速器而非英伟达产品[5] 技术迁移与行业趋势 - 爱立信已实现在Grace CPU上运行为英特尔x86编写的软件,仅需极小改动[5] - 三星认为随着CPU技术进步,可能不再需要内联加速器[5] - 诺基亚表示除非电信运营商广泛采用GPU进行AI推理,否则不会大规模重写代码[6] 边缘计算与AI处理前景 - 电信公司对在基站提供AI推理服务持怀疑态度,Omdia调查显示仅17%受访者认为AI处理将在基站进行[8] - 43%受访者认为AI处理将主要在终端用户设备进行[8] - 行业分析师指出超大规模运营商对边缘计算的兴趣减弱,商业模式回报有限[9] 硬件发展趋势 - Grace CPU的出现为虚拟RAN提供了除英特尔外的替代选择[9] - 行业趋势可能从GPU转向更强大的CPU,同时AI模型规模正在缩小[10] - 英伟达CEO黄仁勋曾表示CPU无法跟上ASIC的工作负载[9]
从“能动”到“灵动”,机器人智能化步入新篇章
2025-05-12 09:48
纪要涉及的行业或公司 - **行业**:机器人行业,尤其是人形机器人领域 - **公司**:志远公司、优必选、英伟达、特斯拉、DRECOM、全志、瑞芯微、黑芝麻智能 纪要提到的核心观点和论据 - **技术发展现状**:过去两到三年人形机器人领域技术进步显著,国内优必选等公司在运动能力方面表现突出,能在预设环境完成固定动作达产业推广阶段,但智能化水平未达灵动阶段,如无法完成拿起水杯喝水等细节复杂动作,需与AI和自动化系统结合[2] - **视觉传感方案差异**:海外特斯拉采用纯视觉方案降低硬件成本但对大模型算力要求高,国内因算力限制和传感器供应链优势,预计未来以激光雷达加3D视觉传感器等多传感器融合方案为主[3][10] - **应用前景和商业化进展**:潜在需求覆盖工业制造、物流配送等场景,可弥补劳动力短缺和替代危险工作,目前商业化处于早期,工业场景应用集中在搬运等标准化流程,预计在流程标准化且人力成本高的场景率先落地[1][4] - **商业化面临困难**:硬件方面执行器、传感器精度等需提升,续航短成本高;软件方面人机交互效率低,多模态感知准确性偏低等,导致难以准确理解任务指令和调整行动规划,提高智能水平是关键[1][5] - **解决训练数据集匮乏方案**:增加真实数据采集,如志远公司搭建模拟生活空间,北京、上海等地建创新中心;采用物理仿真方法,如英伟达提供的方法,旨在提高训练数据质量,加速商业应用拓展[1][6][7] - **仿真技术提高数据获取效率**:调整场景参数或变化场景,可基于少量真实数据衍生大量训练数据,提高效率降低成本,但仿真结果与真实世界有偏差,需真实数据校正,未来主流是结合真实与仿真数据采集[8] - **机器人基座大模型发展趋势**:呈现多系统架构趋势,如NVIDIA的Grace Hopper等,未来需解决多模态和泛化能力问题,以适应复杂环境和提高运动技能学习效率[1][9] - **力学和触觉传感发展方向**:朝着更精准的感知及执行方向发展,六维力传感器及电子皮肤是未来方向,实现实时控制需高效机械通信协议及强大算力硬件支撑[11] - **EtherCAT协议优势**:采用分布式架构设计,将通信延迟控制在微秒级别,优于CAN总线协议和其他实时工业以太网协议,有望成机器人主流通信协议[3][12] - **端侧芯片应用现状**:机器人大脑大模型芯片主要有英伟达Orin和特斯拉自研芯片,小脑任务对算力需求低,国产芯片已应用于部分机器人,端侧算力需求预计持续增长,国产芯片性能提升带来机遇[13] 其他重要但是可能被忽略的内容 - DRECOM即将发布NPU与DMC堆叠封装新产品,适合端侧运行大模型,专门定制化硬件预计2025年或2026年进入市场,一级市场股权投资向自动化方向转移[14]
Nvidia(NVDA) - 2025 Q4 - Earnings Call Transcript
2025-02-27 09:48
财务数据和关键指标变化 - Q4营收393亿美元,环比增长12%,同比增长78%,高于375亿美元的预期;2025财年营收1305亿美元,较上年增长114% [7][8] - GAAP毛利率为73%,非GAAP毛利率为73.5%,随着Blackwell架构首批交付,环比下降;预计Blackwell全面投产时,毛利率将回升至70%多的中间水平 [37][178] - 第一季度总营收预计为430亿美元,上下浮动2%;GAAP和非GAAP毛利率预计分别为70.6%和71%,上下浮动50个基点 [39][180] 各条业务线数据和关键指标变化 数据中心业务 - 2025财年数据中心营收1152亿美元,较上年翻倍;Q4营收356亿美元创纪录,环比增长16%,同比增长93% [8][9] - Q4 Blackwell销售额超预期,实现11亿美元营收,是公司历史上最快的产品爬坡;数据中心计算营收环比增长18%,同比增长超2倍 [9][10] - 大型云服务提供商(CSP)约占Q4数据中心营收的一半,销售额同比接近翻倍;消费互联网营收同比增长3倍;企业营收同比接近翻倍 [17][19][21] 网络业务 - 网络营收环比下降3%,但与GPU计算系统配套的网络业务占比超75%;预计Q1网络业务将恢复增长 [27] 游戏和AR PC业务 - Q4游戏营收25亿美元,环比下降22%,同比下降11%;全年营收114亿美元,同比增长9%;预计Q1随着供应增加,营收将实现强劲环比增长 [30] 专业可视化业务 - Q4营收5.11亿美元,环比增长5%,同比增长10%;全年营收19亿美元,同比增长21% [33] 汽车业务 - Q4营收创纪录达5.7亿美元,环比增长27%,同比增长103%;全年营收17亿美元,同比增长55%;预计本财年汽车业务营收将增长至约50亿美元 [34][164] 各个市场数据和关键指标变化 - 数据中心营收的环比增长在美国最为强劲;全球各国都在建设AI生态系统,对计算基础设施的需求激增 [26] - 中国数据中心销售额占总数据中心营收的比例仍远低于出口管制实施前的水平,若无法规变化,预计将维持在当前比例,市场竞争激烈 [27] 公司战略和发展方向和行业竞争 - 推出NVIDIA Cosmos World基础模型平台,用于推动机器人领域的物理AI发展,机器人和汽车公司已开始采用 [25][166] - 持续推进Blackwell产品的生产和供应,以满足市场对AI计算的强劲需求;未来将推出Blackwell Ultra和Vera Rubin等产品 [77][78] - 提供NVLink交换系统、Quantum InfiniBand和SpectrumX等网络解决方案,以满足AI对新型网络的需求 [28][29] 管理层对经营环境和未来前景的评论 - AI已成为主流技术,正融入各个应用领域,未来软件和服务将基于机器学习,计算机将向加速计算和AI方向发展 [98][100] - 目前处于AI新时代的开端,推理AI和推理时间扩展的需求正在增加,未来推理模型的计算需求将大幅增长 [133][275] - 公司认为需求在短期、中期和长期内都将保持强劲,有来自顶级合作伙伴的预测和计划,以及众多创新型初创公司的需求支撑 [67][68] 其他重要信息 - 公司将参加TD Cowen医疗保健会议、摩根士丹利科技、媒体和电信会议以及年度GTC会议 [43][44] - 2026财年第一季度财报电话会议定于2025年5月28日举行 [44] 问答环节所有提问和回答 问题1: 测试时间计算和强化学习使训练和推理界限模糊,对推理专用集群的未来及对公司和客户的影响 - 现在有多种扩展定律,包括预训练、训练后和测试时间计算或推理;推理计算需求已达初始大语言模型的100倍,未来可能更多 [48][192] - Blackwell架构专为推理AI设计,在推理方面性能卓越,数据中心架构具有通用性和易用性,能根据不同需求灵活配置 [53][194] 问题2: GV200在CES的情况,以及系统层面的爬坡挑战和对NVLink 72平台的看法 - 自CES以来,已交付更多产品,有350家工厂生产Blackwell机架的150万个组件;Q4 Grace Blackwell实现11亿美元营收,需求高,将继续扩大规模 [199][200] - 看到很多Grace Blackwell系统上线的庆祝活动,公司和合作伙伴进展顺利 [201] 问题3: Q1是否为毛利率底部,以及对需求持续到明年的信心来源和DeepSeq创新的影响 - 目前专注于加快Blackwell的生产,全面投产后有机会改善成本和毛利率,预计今年晚些时候毛利率将回升至70%多的中间水平 [64][205] - 公司对需求有较好的洞察,软件正转向机器学习,有顶级合作伙伴的预测和计划,还有众多创新型初创公司的需求;目前仅触及部分消费AI领域,未来企业级、物理AI等领域潜力巨大 [67][212] 问题4: 下一代Blackwell Ultra的需求动态,以及客户和供应链如何管理两代产品的同时爬坡 - Blackwell Ultra将于今年下半年推出,系统架构与当前的Blackwell相同,过渡相对容易;公司已与合作伙伴和客户沟通,将做好过渡安排 [77][219] 问题5: 定制ASIC与商用GPU的平衡,以及客户是否会构建异构超级集群 - NVIDIA架构具有通用性,适用于各种模型和应用场景,能提供端到端的解决方案;性能和节奏快,能带来更高的收入和快速的投资回报率;软件栈复杂,公司在部署方面具有优势 [83][226] 问题6: 美国市场增长能否弥补其他地区法规限制的影响,以及中国市场的动态 - 中国市场销售额占比与Q4和之前季度大致相同,约为出口管制前的一半;AI已成为主流技术,融入各个应用领域,未来软件和服务将基于机器学习 [96][237] 问题7: 企业业务在数据中心的增长情况,以及超大规模客户的内部和外部工作负载支出分配,和企业业务未来的增长趋势 - 企业业务营收同比接近翻倍,与大型CSPs表现相似;CSPs约占业务的一半,有内部和外部消费,公司会与他们合作优化内部工作负载 [17][21][249] - 从长期来看,企业业务的增长潜力更大,因为计算机行业中未被服务的部分主要是工业领域,企业和物理AI的应用刚刚起步 [110][252] 问题8: 从替换周期角度看已部署的基础设施,以及未来的更新机会 - 旧架构如Volta、Pascal和Ampere仍在使用,主要用于数据处理和数据策展;由于CUDA的可编程性,所有架构都兼容,可将低强度工作负载分配给旧架构 [120][262] 问题9: 毛利率在下半年回升的信心来源,以及关税的影响 - Blackwell系统有多种配置,有很多机会改善毛利率;关税情况尚不确定,公司将遵循相关规定 [128][272]