推理AI
搜索文档
黄仁勋GTC演讲全文:龙虾就是新操作系统
是说芯语· 2026-03-17 10:09
公司战略定位与业绩展望 - 公司正从一家“芯片公司”蜕变为“AI基础设施和工厂公司” [2] - 公司创始人给出了极为强劲的业绩预期,预计到2027年至少有1万亿美元的高确信度需求,并认为实际需求会更高 [5][9] - 这一乐观预期一度推动公司股价上涨超过4.3个百分点 [7] 核心商业模式:“Token工厂经济学” - 未来的数据中心是生产Token(AI生成的基本单位)的“工厂”,其核心经营指标是“token工厂效率” [12][62] - 在受电力限制(如1吉瓦)的数据中心内,每瓦Token吞吐量最高的平台将拥有最低的生产成本 [14] - AI服务将根据Token生成速度分层定价,从免费层到超高速层(约每百万token 150美元)不等 [18] - 公司的架构能让客户在免费层实现高吞吐量,同时在最高价值的推理层级将性能提升惊人的35倍 [16] 技术平台与产品进展 - CUDA平台是公司战略的核心,拥有20年历史、数亿块GPU的装机量,形成了强大的开发者生态飞轮 [31][32] - 公司推出了下一代AI计算系统Vera Rubin,这是一个100%液冷、端到端优化的完整系统,安装时间从两天缩短至两小时 [19][65] - Vera Rubin系统在两年内将1吉瓦AI工厂的Token生成速率从2200万token/秒提升至7亿token/秒,实现了350倍的增长,远超摩尔定律同期的约1.5倍提升 [20][70] - 公司整合了收购的Groq技术,通过Dynamo软件实现“非对称式分离推理”,将计算密集的预填充阶段交给Vera Rubin,将对延迟敏感的解码阶段交给Groq,以优化高性能推理 [21][23][68] - 公司展示了明确的技术路线图,包括当前在产的Blackwell、已发布的Vera Rubin、即将推出的Vera Rubin Ultra以及下一代Feynman架构 [71] - 公司推出了全球首款量产的共封装光学(CPO)交换机Spectrum X,并强调需要同时扩大铜缆、光芯片和CPO的产能 [24][72] 软件、生态与行业应用 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”,本质上是智能体计算机的“操作系统” [25][74][76] - 公司预测,每一家SaaS公司都将转变为AaaS(智能体即服务)公司,并为此推出了企业级的NeMo Claw参考设计,增加了安全策略引擎和隐私路由器 [26][79] - 公司的CUDA-X库覆盖了自动驾驶、金融服务、医疗健康、工业、机器人、电信等多个垂直行业,是公司作为算法公司的核心资产 [47] - 在自动驾驶领域,公司宣布了新的合作伙伴,其RoboTaxi Ready平台现有合作伙伴的年产量合计达到1800万辆 [83] - 本次GTC大会有110款机器人亮相,公司提供训练、仿真和机载三台计算机以及完整的软件栈 [47][83] 市场地位与合作伙伴 - 公司目前60%的业务来自全球前五大超大规模云服务商,另外40%的业务广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [11][57] - 公司声称其是目前全球唯一能够运行所有AI领域(语言、生物、图形、视觉、机器人等)模型的平台,这种通用性使其成为“成本最低、置信度最高的平台” [10][57] - 公司与主要云服务商(Google Cloud、AWS、Microsoft Azure、Oracle等)建立了深度合作关系,将客户引入云端,形成互利生态 [41][43] - 公司宣布成立Nemotron联盟,投资数十亿美元推进AI基础模型研发,联盟成员包括多家知名AI初创公司和实验室 [82] 未来愿景与新兴领域 - 公司创始人描绘了未来职场形态,工程师将拥有年度Token预算,其额度可能相当于基础年薪的一半,以实现10倍的效率提升,“入职附带多少token配额”已成为招聘新话题 [27][79] - 公司正在研发下一代计算架构Feynman以及部署在太空的数据中心计算机“Vera Rubin Space-1” [27][73] - 公司推出了数字孪生平台NVIDIA DSX,用于在虚拟世界中共同设计和运营吉瓦级AI工厂,预计可将能源利用效率提升约2倍 [73]
黄仁勋GTC演讲全文:推理时代到来,2027营收至少万亿美元,龙虾就是新操作系统
华尔街见闻· 2026-03-17 07:55
公司战略定位与增长预期 - 公司正从一家“芯片公司”向“AI基础设施和工厂公司”蜕变 [2] - 公司创始人提出了驱动未来增长的底层商业逻辑——“Token工厂经济学” [2] - 公司创始人表示,到2027年,公司看到了至少1万亿美元(at least $1 trillion)的高确信度需求,并认为实际计算需求会更高 [6][10] - 公司系统被证明是全球“成本最低的基础设施”,其通用性使得客户投入的1万亿美元能被充分利用并保持长久生命周期 [11] - 公司目前60%的业务来自排名前五的超大型云服务商,40%的业务广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [12][69] 技术架构与产品进展 - 公司推出了有史以来最复杂的AI计算系统Vera Rubin,这是一个100%液冷、完全消灭了传统线缆的完整系统 [19] - Vera Rubin系统在两年内将Token生成速率从2200万提升到了7亿,实现了350倍的增长,远超摩尔定律同期的约1.5倍提升 [20] - 公司整合了Groq技术,通过Dynamo软件系统实现非对称式分离推理,将需要海量计算的“预填充”阶段交给Vera Rubin,将对延迟敏感的“解码”阶段交给Groq [21][23] - 由三星代工的Groq LP30芯片已在量产,预计第三季度出货,首个Vera Rubin机架已在微软Azure云上运行 [24] - 公司展示了全球首款量产的共封装光学(CPO)交换机Spectrum X,并强调需要同时扩大铜缆、光芯片和CPO的产能 [25] - 公司“剧透”了下一代计算架构Feynman,并正在研发部署在太空的数据中心计算机“Vera Rubin Space-1” [29] 商业模式:“Token工厂经济学” - 未来的数据中心是生产Token(AI生成的基本单位)的“工厂”,在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低 [13][15] - AI服务将分为多个商业层级定价:免费层、中级层(~每百万token 3美元)、高级层(~每百万token 6美元)、高速层(~每百万token 45美元)、超高速层(~每百万token 150美元) [16] - 公司的架构能够让客户在免费层实现极高吞吐量,同时在最高价值的推理层级上将性能提升惊人的35倍 [17] - 以简化模型估算,将25%功率分配给四个收费层级,新一代系统可比上一代系统多产生5倍的收入 [75] 软件生态与行业变革 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”,本质上是Agent计算机的“操作系统” [27] - 创始人断言,每一个SaaS公司都将变成AaaS(Agent-as-a-Service,智能体即服务)公司 [28] - 公司推出了企业级的NeMo Claw参考设计,增加了策略引擎和隐私路由器,以确保智能体安全落地 [28] - 未来职场新形态可能包含为工程师提供年度Token预算,其额度可能相当于基础年薪的一半,以实现10倍的效率提升 [29][95] - 过去两年,风险投资流入AI初创企业的资金规模达到1500亿美元,创历史之最,单笔投资规模跃升至数亿乃至数十亿美元 [57] 性能突破与行业合作 - 通过极致的端到端软硬件协同设计,公司在推理性能上实现了历史性飞跃,第三方评测显示其在每瓦token数和每token成本上均遥遥领先 [71][72] - 以客户Fireworks为例,在公司更新全套软件和算法后,其平均token速度从每秒约700个提升至接近每秒5000个,提升约7倍 [73] - 公司与全球主要云服务商(Google Cloud、AWS、Microsoft Azure、Oracle、CoreWeave等)建立了深度合作关系,将客户引入云端并加速其服务 [45][46][47][48][49] - 公司宣布成立Nemotron联盟,投资数十亿美元推进AI基础模型研发,联盟成员包括多家知名AI公司和研究机构 [97] 垂直行业应用与扩展 - 公司的CUDA-X库是其在各垂直行业(自动驾驶、金融服务、医疗健康、工业、娱乐、机器人、电信等)发挥价值的核心 [54][55] - 本次GTC有110款机器人亮相,公司提供训练、仿真、机载三台计算机及完整软件栈 [54][98] - 在自动驾驶领域,公司宣布四家新合作伙伴(比亚迪、现代、日产、吉利,合计年产量1800万辆)加入其RoboTaxi Ready平台 [98] - 公司创建了Omniverse及基于其上的NVIDIA DSX平台,用于所有合作伙伴在虚拟世界中共同设计和运营吉瓦级AI工厂,估计可将能源利用效率提升约2倍 [85]
英伟达GTC大会全文:黄仁勋宣告推理时代到来,龙虾就是新操作系统!
美股IPO· 2026-03-17 07:32
公司战略定位与愿景 - 公司将自身定位为“AI工厂”的构建者,致力于成为全球计算平台转变的核心推动者 [1][5] - 公司提出“Token工厂经济学”,强调每瓦性能是商业变现的核心,未来AI基础设施将按Token产出和成本来衡量价值 [1][31] - 公司CEO断言,到2027年将看到至少**1万亿美元**的高确信度AI基础设施需求,且实际需求可能远高于此 [1][28][29] CUDA生态系统与飞轮效应 - 2024年是CUDA诞生20周年,该架构已积累数千种工具、编译器、框架与库,在开源社区拥有数十万个公开项目,并深度集成至每一个主流生态系统 [6] - 公司通过20年构建了数亿颗运行CUDA的GPU和计算系统,覆盖每一家云服务商和计算机厂商,服务几乎每一个行业,形成了庞大的安装基础 [7] - CUDA的庞大安装基础是飞轮效应的根本原因,吸引开发者、催生新算法(如深度学习)、开辟新市场,进而形成更大的安装基础,该飞轮正在持续加速 [7] - 由于架构兼容性和持续的软件优化,公司六年前发布的Ampere架构云端定价至今仍在上涨,同时计算成本持续下降,形成了“扩大覆盖、加速增长、持续压降成本”的动态组合 [8][9] 技术平台与核心创新 - 公司围绕三大平台展开:CUDA-X平台、系统平台以及全新的AI工厂平台,其中生态系统至关重要 [5] - 公司创建了两个基础库以加速未来AI计算:**cuDF**用于数据框和结构化数据加速;**cuVS**用于向量存储、语义数据和非结构化AI数据加速 [17][18] - 公司核心战略是“垂直整合,水平开放”,深入理解各个垂直领域的算法并将其整合进计算平台,开放给全世界使用 [19][20] - 本届GTC宣布了**100个库**和约**40个模型**的更新,这些库是激活计算平台、解决实际问题的核心资产 [23] - 在图形技术领域,公司推出神经渲染技术**DLSS 5**,融合可控的3D图形与生成式AI,以实现既美观逼真又完全可控的内容生成 [12][13] 推理拐点与AI演进 - AI经历了从“感知”到“生成”,再到“推理”,最终到“执行”的演进,如今的AI能够完成真正富有成效的工作 [25][26] - 推理拐点已经到来,AI每次思考、执行、读取、推理都需要进行推断,导致Token生成需求爆炸式增长 [26] - 过去两年间,驱动AI计算需求的三件大事是:ChatGPT开启生成式AI时代、推理AI(如o1/o3模型)崛起、以及Claude Code与Agentic AI的诞生 [25] - 过去两年,单次工作的AI计算需求提升了约**10,000倍**,使用量提升了约**100倍**,计算总需求的增幅接近**100万倍** [26] 产品路线图与性能突破 - 公司公布了从Blackwell到Feynman的清晰技术路线图,包括Vera Rubin、Rubin Ultra等下一代系统 [38] - 在推理性能上取得根本性突破:从Hopper H200到Grace Blackwell,实际每瓦性能提升达到**35倍**(有分析指出可达50倍),远高于摩尔定律预期的1.5倍 [31] - **Grace Blackwell**在最具商业价值的服务层级,其吞吐量比Hopper提升**35倍**,可将整体数据中心收益提升约**5倍** [32] - 下一代架构**Vera Rubin**专为Agentic系统设计,采用全新“Kyber”机架,支持**144颗GPU**构成单一NVLink域 [36][37] - **Vera Rubin**系统采用**100%液冷**,使用**45°C热水**冷却以降低能耗,安装时间从两天缩短至两小时,并搭载第六代NVLink交换系统 [39] 异构计算与收购整合 - 公司收购了Grok的技术团队并获得技术授权,Grok处理器是确定性数据流处理器,专为推理设计,拥有海量SRAM [40][41] - 公司开发了**Dynamo**推理解耦框架,将推理流程重新架构,使Vera Rubin与Grok芯片协同工作,将延迟降低约**50%**,并在最具商业价值的服务层级实现**35倍**性能提升 [42][43] - **Grok LP30**由三星代工,已投入量产,预计**2026年第三季度**开始出货 [44] - 对于Grok的最优部署策略建议:若工作负载以高吞吐量为主,则采用100% Vera Rubin;若有大量高价值代码生成或高速Token需求,则建议将**25%**算力配置为Grok,其余**75%**保持Vera Rubin [45] AI工厂与基础设施 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [62] - 在一个吉瓦级AI工厂中,通过架构优化,仅用两年时间Token生成速率可从**2200万**提升至**7亿**,提升幅度达**350倍** [46] - 公司创建了**英伟达 DSX平台**,基于Omniverse进行全系统仿真,让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂,该平台预计能释放约**两倍**的效率提升 [48][49] - 公司业务构成多元:**60%**来自五大超大规模云服务商,**40%**来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域 [30] Agentic AI与OpenClaw - **OpenClaw**成为一个重大新发现,是有史以来最受欢迎的开源项目之一,在短短几周内超越了Linux三十年的传播速度,它本质上是Agentic计算机的操作系统 [50][51] - 企业IT正经历范式转变,旧模式是“数据中心-软件工具-人类”,新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS公司 [53][54] - 每家企业的关键问题已变为制定自己的OpenClaw战略和Agentic系统战略 [52] - 公司与OpenClaw开发者合作,推出企业级安全参考架构**NemoClaw**,配备策略引擎、网络护栏和隐私路由器 [54] 行业应用与生态合作 - 本届GTC涵盖了公司生态的几乎所有垂直领域,包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人、电信等 [21][22] - 在自动驾驶领域,宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴,加上已有的奔驰、丰田、通用,这些合作伙伴每年合计生产**1800万辆**汽车 [60] - 在电信领域(约**2万亿美元**规模),未来的无线基站将演变为AI边缘计算基础设施(英伟达 Aerial AI RAN) [22][60] - 公司宣布与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等众多企业达成重要合作 [19][21] - **110台**机器人参展GTC,几乎每家机器人公司都在与英伟达合作 [22] 开放模型与物理AI - 公司已在每个AI领域的前沿模型上确立领导地位,并宣布成立**Nemotron联盟**,与多家公司合作共同打造Nemotron 4模型 [55][56] - 公司长期致力于物理AI与机器人领域,为机器人系统打造了三台关键计算机:训练计算机、合成数据生成与仿真计算机、以及机器人本体内置计算机 [57][58][59] - 展示了与迪士尼联合开发的“奥拉夫”机器人,基于Jetson计算平台和Omniverse训练环境,实现了真实物理世界中的自适应运动 [61]
黄仁勋:下一波浪潮就是物理AI 所有能力都能融入物理世界
每日经济新闻· 2025-07-18 12:42
链博会盛况 - 第三届中国国际供应链促进博览会(链博会)于7月16日开幕,英伟达首次参展并吸引超高人气 [1] - 宇树科技等国内新锐企业也是首次参加链博会 [1] - 多个省份的地方团前来参观,热门企业展台前出现排队看展的火爆场景 [1] - 人工智能相关展台热闹非凡,人形机器人、灵巧手等产品备受关注 [1] 行业领袖观点 - 英伟达创始人黄仁勋与阿里云创始人王坚在链博会先进制造主题活动上进行交流 [2] - 黄仁勋认为下一波浪潮将是物理AI [2] - 黄仁勋指出AI发展从2012年深度学习技术大爆炸开始,计算机视觉和语音识别能力已超越人类 [4] - 生成式AI能够进行跨模式翻译(如中文到英文、图形到图形、中文到视频) [4] 技术发展趋势 - AI已从人为编写代码预测结果发展为算法自主学习预测 [4] - 生成式AI具备理解信息、生成信息、推理和解决问题的能力 [4] - 物理AI将成为未来趋势,AI能力将融入物理世界(如机器人) [5] - AI在解决认知性任务方面已取得显著成果,很快将在解决问题能力上超越人类 [5]
英伟达250529
2025-07-16 14:13
纪要涉及的公司 NVIDIA 纪要提到的核心观点和论据 1. **数据中心业务** - **营收增长**:数据中心营收达390亿美元,同比增长73%,主要得益于AI工作负载向推理的强劲转变以及AI工厂建设的推动[2]。 - **产品表现**:Blackwell推动数据中心营收增长,本季度贡献近70%的计算收入,从Hopper的过渡基本完成;GB200 NBL实现架构变革,制造良率显著提高,机架出货量强劲[3]。 - **市场需求**:推理需求急剧增长,如Microsoft在Q1处理超100万亿个token,同比增长五倍;推理服务初创公司使用B200使token生成率和收入大幅提升[4]。 - **产品路线图**:GB300系统本月开始在主要CSP抽样,预计本季度晚些时候投入生产;公司致力于年度产品节奏,路线图延伸至2028年[3]。 2. **中国市场影响** - **出口管制**:4月9日美国政府对H20实施新出口管制,无宽限期处理库存;Q1确认46亿美元H20收入,同时因库存减记和采购义务确认45亿美元费用,无法发货25亿美元收入[2]。 - **市场规模**:预计中国AI加速器市场未来将增长至近500亿美元,失去该市场将对业务产生重大不利影响,有利于竞争对手[2]。 3. **游戏和AI PC业务** - **营收情况**:游戏营收创纪录达38亿美元,环比增长48%,同比增长42%;AI推动PC和游戏变革,GeForce用户基数达1亿[8]。 - **产品推出**:本季度推出支持Microsoft Copilot Plus的AI PC笔记本电脑;GeForce RTX 5060和5060 Ti桌面和笔记本电脑上市;Nintendo Switch 2采用NVIDIA技术提升游戏性能[8][9]。 4. **专业可视化业务** - **营收表现**:营收5.09亿美元,环比持平,同比增长19%;关税相关不确定性暂时影响Q1系统,预计Q2营收将恢复增长[9]。 - **产品创新**:DGX Spark和DGX Station将AI超级计算机功能集成到桌面,分别提供高达1 petaflop和20 petaflop的AI计算能力;Omniverse与领先软件平台集成加深,在工业运营中应用广泛[9]。 5. **汽车业务** - **营收情况**:营收5.67亿美元,环比下降1%,同比增长72%,增长得益于自动驾驶业务的增长和强劲的终端需求[10]。 - **合作项目**:与GM合作构建下一代车辆、工厂和机器人;为Mercedes - Benz提供全栈解决方案;推出用于人形机器人的基础模型Isaac Group N1和Cosmo World Foundation models[10]。 6. **网络业务** - **营收增长**:Q1网络业务营收环比增长64%至50亿美元,客户利用平台扩展AI工厂工作负载[6]。 - **产品优势**:NVLink Compute Fabric第五代带宽是PCIe Gen5的14倍,Q1出货量超10亿美元;Spectrum X营收年化超80亿美元,本季度新增Google Cloud和Meta客户;推出的Spectrum X和Quantum X硅光子交换机提升AI工厂扩展能力[7]。 7. **财务展望** - **营收预期**:第二季度总营收预计为450亿美元,上下浮动2%,各平台预计实现适度环比增长;数据中心业务中,Blackwell的持续增长将部分抵消中国市场营收下降[11]。 - **利润率**:GAAP和非GAAP毛利率预计分别为71.8%和72%,上下浮动50个基点;预计Blackwell盈利能力提升将推动毛利率适度环比改善[11]。 - **费用**:GAAP和非GAAP运营费用预计分别约为57亿美元和40亿美元;预计2026财年全年运营费用增长处于30%左右[11]。 - **其他**:GAAP和非GAAP其他收入和费用预计约为4.5亿美元;GAAP和非GAAP税率预计为16.5%,上下浮动1%[12]。 其他重要但是可能被忽略的内容 1. **出口管制影响**:出口管制促使中国创新和规模发展,屏蔽中国芯片制造商与美国竞争会削弱美国地位;公司虽在探索有限竞争方式,但Hopper已无法在中国市场使用[13]。 2. **开源AI价值**:中国的DeepSeek和QN等开源AI模型在全球获得关注,推理AI推动推理需求激增;美国平台应支持与全球开发者合作,确保成为开源AI首选平台[14]。 3. **美国本土制造**:TSMC、Spill和Amcor等在亚利桑那州投资建设工厂,公司与Foxconn、Wistron合作在美国建设AI超级计算机工厂;公司为鼓励投资做出长期采购承诺[14][15]。 4. **AI扩散规则**:特朗普总统撤销AI扩散规则,提出新政策促进美国AI技术与可信伙伴合作;宣布在沙特阿拉伯和阿联酋的AI基础设施项目投资[15]。 5. **推理业务需求**:Grace Blackwell NVLink 72是推理AI的理想引擎,与Hopper相比,速度和吞吐量提高约40倍,可降低成本并提高响应质量[17]。 6. **企业AI发展**:企业AI准备起飞,RTX Pro企业AI服务器可运行企业和AI应用;企业IT包括计算、存储和网络,公司将三者整合推向市场[25]。 7. **工业AI机遇**:全球制造业回流和新工厂建设为Omniverse、AI和机器人技术带来机遇,每个工厂都将配备AI工厂[26]。 8. **网络平台优势**:公司有NVLink、SpectrumX、InfiniBand和Bluefield四个网络平台,Spectrum X提高以太网在集群中的利用率,从50%提升到85% - 90%[27][28]。
英伟达(NVDA):FY26Q1业绩点评及业绩说明会纪要:Blackwell占比已到7成,推理agent、工业AI、主权AI开启算力新投资时代
华创证券· 2025-05-31 15:49
报告公司投资评级 未提及 报告的核心观点 2025年5月29日英伟达发布FY2026Q1报告并召开业绩说明会,该季度营收显著高于市场预期和公司指引,主要受益于数据中心业务爆发,虽H20产生费用且预计二季度有收入损失,但各业务表现良好,公司预计FY26Q2营收及毛利率可观,且AI处于发展早期阶段,多领域有广阔应用前景 [2][3][5] 根据相关目录分别进行总结 NVIDIA FY2026Q1业绩概况 - FY26Q1营收441亿美元,同比增长69%,环比增长12%,高于市场预期和公司指引,主要因数据中心业务爆发,Blackwell贡献数据中心计算收入7成,H20一季度产生45亿美元费用,预计二季度损失80亿美元收入 [3][7] - FY26Q1,GAAP和非GAAP毛利率分别为60.5%和61.0%,不计45亿美元费用,第一季度非GAAP毛利率达71.3%;GAAP和非GAAP稀释每股收益分别为0.76美元和0.81美元,不计相关费用及税费影响,第一季度非GAAP稀释每股收益为0.96美元 [3][7] - 供应链管理优化,存货周转天数59天,环比下降27天,待交付金额298亿美元,环比下降3%,预付采购41亿美元,环比下降17.6% [7] - 公司预计FY26Q2营业收入为450亿美元,上下浮动2%,考虑H20收入损失约80亿美元;预计GAAP和非GAAP毛利率分别为71.8%和72.0%,上下浮动50个基点,力争下半年将毛利率提高到70%左右 [5][8] 细分业务情况 - 数据中心:FY26Q1营收创历史新高,达391亿美元,环比增长10%,同比增长73%,其中计算营收342亿美元,同比增长76%,环比增长5%,网络营收49.57亿美元,同比增长56%,环比增长64%,Blackwell GPU产能爬坡快,贡献近70%的数据中心计算营收,从Hopper的转型接近完成 [4] - 游戏:FY26Q1收入为37.63亿美元,环比增长48%,同比增长42%,Blackwell架构显卡产能爬坡快 [4] - 专业可视化:FY26Q1收入为5.09亿美元,环比几乎持平,同比增长19%,关税影响一季度系统和需求,AI工作站需求强劲,预计二季度营收环比增长 [4] - 汽车和机器人:FY26Q1收入为5.67亿美元,环比下降1%,同比增长72%,由自动驾驶产能爬坡和新能源汽车终端需求推动 [4] 会议内容(问答环节) - 关于推理需求,Grace Blackwell NVL72是推理AI理想引擎,与Hopper相比,速度和吞吐量高出约40倍,可降低成本、提高响应质量和服务质量 [9] - H20第一季度确认46亿美元营收,未出货25亿美元,二季度中国数据中心营收将大幅下降,预计损失80亿美元,未来还有其他订单无法履行,估计未来该市场规模接近500亿美元 [10][11] - AI处于起步阶段,将改变各行业,推理成为计算工作负载重要组成部分,除云端,AI将进入企业、电信、工厂等领域 [12][13] - 目前订单增多,供应链正在建设,欧洲有大量AI工厂正在规划和建设 [14][15] - H20二季度损失80亿美元,非中国业务表现好于预期,因Blackwell增长和供应链供应增加 [16] - 推理AI需求增长、AI扩散、企业AI和工业AI发展带来积极影响,推理AI突破障碍,AI扩散创造机会,企业AI准备腾飞,工业AI与新工厂建设契合 [17][18] - 出口管制对Hopper限制大,目前无适合中国市场的产品,正在思考解决方案 [20] - 网络业务有NVLink、Spectrum - X、Bluefield等平台,增强以太网功能,提高集群利用率,上个季度增加两家重要CSP采用SpectrumX [21]
英伟达(NVIDIA)FY26Q1 业绩点评及业绩说明会纪要
华创证券· 2025-05-31 15:20
报告行业投资评级 未提及 报告的核心观点 报告对英伟达 FY26Q1 业绩进行点评,指出营收显著高于预期,主要受益于数据中心业务爆发,各细分业务有不同表现,公司对 FY26Q2 给出业绩指引,同时会议问答中探讨了推理需求、中国市场影响、AI 发展阶段等多方面问题 [2][3][5] 根据相关目录分别进行总结 NVIDIA FY26Q1 业绩概况 - FY26Q1 营收 441 亿美元,高于市场预期和公司指引,主要因数据中心业务爆发,Blackwell 贡献数据中心计算收入 7 成,H20 一季度产生 45 亿美元费用,预计二季度损失 80 亿美元收入,GAAP 和非 GAAP 毛利率分别为 60.5%和 61.0%,GAAP 和非 GAAP 稀释每股收益分别为 0.76 美元和 0.81 美元,供应链管理优化存货周转天数等指标 [7] - 公司预计 FY26Q2 营业收入为 450 亿美元,上下浮动 2%,考虑 H20 收入损失约 80 亿美元,预计 GAAP 和非 GAAP 毛利率分别为 71.8%和 72.0%,上下浮动 50 个基点,力争下半年将毛利率提高到 70%左右 [8] 会议内容 问答环节 - 对于推理需求,Grace Blackwell NVL72 是推理 AI 理想引擎,与 Hopper 相比速度和吞吐量高出约 40 倍,可降低成本、提高响应质量和服务质量 [9] - H20 第一季度确认 46 亿美元营收,未出货 25 亿美元,第二季度中国数据中心营收将大幅下降,预计损失 80 亿美元,未来还有其他无法履行订单,估计未来中国市场 TAM 接近 500 亿美元 [10][11] - AI 处于起步阶段,将成为新基础设施,除在云端建设外,还将进入企业、电信、工厂等领域,企业 AI 正在腾飞,6G 将建立在 AI 之上,每个工厂都将伴随 AI 工厂 [12][13] - 目前订单比之前更多,正在增加供应链建设,未来几年供应链将忙碌,欧洲有大量未公布的 AI 工厂建设规划 [14][15] - H20 损失 80 亿美元,为达 450 亿美元营收目标,非中国业务需表现更好,主要驱动因素是 Blackwell 增长和供应链供应增加 [16] - 与年初相比有四个积极惊喜,包括推理 AI 需求增长、AI 扩散、企业 AI 腾飞、工业 AI 发展 [17][18] - 出口管制使 Hopper 受限,目前无适合中国市场产品,正在思考解决方案 [20] - 网络业务有 NVLink、Spectrum - X、Bluefield 等平台,增强以太网功能提高集群利用率,上个季度增加两家重要 CSP 采用 SpectrumX [21][22]
英伟达Q1财报电话会议纪要
新浪财经· 2025-05-30 10:33
财务表现与指引 - 公司Q1收入超预期 但业绩及指引受出口管制影响 [1] - Q1面向中国数据中心确认收入46亿美元 但无法出货25亿美元 原本总额应为71亿美元 [4] - Q2面向中国数据中心收入将显著下降 受影响订单量达80亿美元 [4] - 评估未来无法服务的中国市场规模接近500亿美元 因缺乏合规产品 [4] - 公司指引中Blackwell增长、客户增长和供应增长是基础 非中国业务表现可能高于预期 [6] 产品与技术进展 - Grace Blackwell架构在推理AI场景性能显著提升 某些情况下比Hopper快40倍 [3] - 公司重新设计超级计算机构建方式 Grace Blackwell已进入全面生产阶段 [3] - 推出RTX Pro企业级AI服务器 整合计算、存储和网络三大支柱 [6] - 网络业务取得突破 Spectrum-X新增两家重要云服务提供商采用 [7][8] - 以太网利用率从50%提升至85%-90% 在100亿美元集群中相当于创造40亿美元价值 [7] 市场需求与行业趋势 - AI建设处于开端阶段 全球约100座AI工厂正在建设中 [5] - 企业级AI刚起步 本地部署需求强烈因数据访问控制要求 [5] - 工业AI加速发展 每个实体工厂都将配套AI工厂训练海量数据 [6] - 未来6G基础设施将构建在AI之上 智能生产需求类似能源基础设施 [5] - 推理AI需求巨大增长 智能体AI有效性得到市场认可 [6] 地缘政治影响 - 出口管制新规严格限制Hopper架构产品 公司目前无合规产品可向中国出货 [7] - AI扩散规定被取消 推动美国技术栈全球推广 [6] - 各国加速主权AI基础设施建设 欧洲等多国需求旺盛 [5] 供应链与订单情况 - 当前订单量比GTC时更多 正在美国本土扩建供应链 [5] - 工业格局重组推动区域化制造 带动电子和芯片制造需求 [6] - 大量未公开的AI工厂项目正在规划中 将持续拉动需求 [5]
【招商电子】英伟达(NVDA.O)FY26Q1跟踪报告:本季H20禁令影响弱于预期,Q2营收指引为450亿美元
招商电子· 2025-05-29 14:51
英伟达FY26Q1季报核心分析 财务表现 - FY26Q1营收440.62亿美元,同比+69.18%/环比+12.03%,超430亿美元指引预期 [1] - 剔除H20相关费用影响后毛利率为71.3%,同比-2.2pcts/环比-7.6pcts [1] - H20产品库存过剩和采购义务产生45亿美元费用,低于预期 [1] - FY26Q1 H20产品营收46亿美元,无法交付约25亿美元产品 [1] 业务部门表现 数据中心 - 营收390亿美元,同比+73%/环比+10% [3] - 大型云服务提供商占营收约50% [3] - 计算产品营收342亿美元,同比+76%/环比+5% [3] - 网络产品营收50亿美元,同比+56%/环比+64% [3] 游戏和AI PC - 营收38亿美元,同比+42%/环比+48% [3] - GeForce拥有1亿用户安装基础 [3] - 新增支持微软Copilot Plus的AI PC产品 [3] 专业可视化 - 营收5.09亿美元,同比+19%/环比持平 [3] - 人工智能工作站需求强劲 [3] 汽车和机器人 - 营收5.67亿美元,同比+72%/环比-1% [3] - 推出NV Halos安全系统和Isaac GROOT N1人形机器人基础模型 [3] 未来展望 - FY26Q2营收指引中值450亿美元(±2%),同比+49.8%/环比+2.13% [4] - 预计H20收入损失约80亿美元 [4] - 毛利率指引72%(±0.5pct),目标年底达75% [4] - 中国AI芯片市场规模约500亿美元 [4] 产品与技术进展 - GB200系统获主要云服务商每周部署近1000个NVL72机架 [5] - 微软已部署数万Blackwell GPU,计划提升至数十万 [5] - GB300系统本季度将向商业客户发货 [5] - B300较B200 HBM容量+50%,FP4推理性能+50% [5] 制造与供应链 - 台积电亚利桑那州6个晶圆厂和2个先进封装厂预计年底量产 [5] - 与富士康合作建造百万平方英尺AI超级计算机工厂 [5] - 目标一年内实现从芯片到超级计算机的美国制造 [5] 市场与竞争 - H20出口禁令结束中国Hopper数据中心业务 [5] - 无法进一步降低Hopper规格以遵守规定 [5] - 中国AI市场将增长至近500亿美元 [11] 行业趋势 - 从生成式AI向代理式AI转变 [15] - 推理需求呈阶梯式跃升 [13] - 全球近100个NVIDIA驱动AI工厂在建 [14] - 主权AI成为新增长引擎 [29]
英伟达电话会全文!黄仁勋点赞DeepSeek,痛失H20巨额收入但Blackwell芯片周产7.2万颗GPU
华尔街见闻· 2025-05-29 09:48
财报核心表现 - Q1营收达440亿美元 同比增长69%超预期 其中数据中心收入390亿美元 同比增长73% [11][12] - Q2营收指引450亿美元 但受H20出口限制影响 预计中国数据中心收入将减少80亿美元 [2][12][27] - 非GAAP毛利率预计72% 主要受益于Blackwell产品线盈利能力提升 [27][28] 中国市场影响 - H20出口限制导致Q1减少25亿美元交付 Q2预计损失80亿美元订单 中国AI加速器市场规模约500亿美元 [2][12][29] - 中国占全球AI研究人员50% 是通往全球成功的跳板 但当前500亿美元市场对美国关闭 [2][29][30] - 公司正探索符合新规的替代方案 但Hopper架构已无法满足性能降级要求 [29][53] Blackwell产品进展 - 产能爬坡速度创纪录 每周生产72,000颗GPU 主要客户平均每周部署1,000个NVL72机架 [3][13] - 贡献数据中心计算收入近70% 从Hopper过渡接近完成 GB300系统本季度末量产 [3][13] - 软件优化使性能提升1.5倍 预计生命周期内持续改进 类似Hopper两年提升4倍 [3][16] AI推理需求爆发 - 微软Q1处理100万亿Token 同比增长5倍 OpenAI等客户Token生成量呈阶跃式增长 [4][14] - 推理工作负载从简单问答转向复杂推理 需要更多计算资源 Blackwell架构针对性设计 [4][14] - 代理式AI推动需求激增 每任务Token量达一次性推理的100-1000倍 [35][36][50] 全球AI基础设施 - 主权AI成为新增长引擎 沙特、阿联酋、台湾等地启动国家级AI工厂项目 [6][33][44] - 全球在建近100个AI工厂 同比翻倍 单个工厂平均GPU使用量同步翻倍 [16][33] - 未来需数十吉瓦级AI基础设施 类比电力和互联网成为国家核心基建 [6][33][45] 企业及工业AI应用 - RTX PRO服务器、DGX Spark等产品瞄准5000亿美元企业IT现代化市场 [7][51] - Omniverse平台助力工业仿真 台积电节省数月晶圆厂设计时间 富士康提升热仿真效率150倍 [24][51] - Isaac GR00T基础模型推动人形机器人发展 与通用汽车、梅赛德斯等合作自动驾驶系统 [25][51] 技术生态与合作 - 黄仁勋高度评价DeepSeek和通义千问 称其为最佳开源模型之一 在美国及欧洲受关注 [5][30] - NVLink网络平台季度收入达50亿美元 Spectrum-X获微软、Meta等采用 年化收入超80亿美元 [18][20][56] - 与台积电、富士康合作美国本土制造 亚利桑那州晶圆厂年底量产 休斯顿建百万平方英尺AI超级计算机工厂 [32][51]