推理

搜索文档
英伟达高管解读Q1财报:未来每个制造业工厂都会有匹配的“AI工厂”
新浪科技· 2025-05-29 08:48
财报业绩 - 2026财年第一财季营收440.62亿美元 同比增长69% [1] - 调整后净利润198.94亿美元 同比增长31% [1] 推理业务发展 - Grace Blackwell NVLink 72超级计算平台是推理AI的理想引擎 设计核心是提升推理性能 [2] - 与Hopper相比 Grace Blackwell的速度和吞吐量提高约40倍 显著降低成本并提升回答质量 [3] - 推理处理的token量比单样本聊天机器人多100到1000倍 机器通过自我思考拆解问题 [2] AI行业前景 - AI将改变每个行业 包括医疗保健 金融服务 零售 交通 制造业等 目前处于起步阶段 [3] - AI需要基础设施和"工厂"生成token 这项技术的应用还处于非常早期阶段 [3] - 6G将基于AI构建 目前处于非常早期阶段 制造业工厂将配套AI工厂 [5] 企业级AI部署 - 企业进行AI本地部署 因大量数据留在本地 访问控制非常重要 [4] - 公司发布RTX PRO企业级AI服务器 DGX Spark和DGX Station等新产品 企业级AI刚起步 [4] - 美国是早期启动者 云端有可用资源 是最大市场和设备安装基地 [4]
英伟达业绩:better than feared
信息平权· 2025-05-29 07:42
DeepSeek更新 - DeepSeek更新版本为R1-0528而非R2 推理能力确有提升 但公司认为该版本不足以称为R2 [1] - 真正的R2版本预计基于V4而非V3 需要更多时间开发 预期将有更大进步 [1] - DeepSeek将尝试一些新的技术方向 [1] 英伟达业绩分析 - H20库存过度计提10亿美金 从55亿下调至45亿 部分材料可重新利用 [1] - 4月9日前H20出货46亿美金 但禁令导致Q1少发货25亿美金 对应约200亿美金的资本支出缺口 [1] - H20在Q2影响80亿美金收入 若加回则Q2收入可达540亿美金 显示Blackwell需求强劲 [1] - Blackwell在数据中心收入占比从Q1的100亿美金跃升至Q2的300亿美金 过渡速度超预期 [1] - 微软已部署数万个Blackwell GPU 对应数百至1000个机柜 未来将扩展至几十万GPU 对应5000+机柜 [1] 行业趋势 - 推理需求呈现急剧增长 微软 谷歌等公司日均处理数万亿token [1] - Agent应用推动推理需求 超级agent集群所需计算量远超单次聊天机器人 [1] - 幻觉问题担忧正在被行业克服 多模态和agentic应用发展快于chatbot [1] - 美国AI商业化进程快于中国 两地生态差异明显 [1] 中国市场影响 - 出口禁令导致500亿美金中国市场对美国芯片关闭 Hopper产品线无法继续供应 [2] - 中国AI自主生态发展已成必然 但需关注付费生态和企业支持能否形成健康商业循环 [2] - 出口限制刺激中国本土芯片创新 可能增强中国厂商海外竞争力 [2] - 公司强调美国市场仍是其最大市场 同时肯定中国市场的战略重要性 [2]
英伟达CEO黄仁勋:AI推理需求激增,特朗普取消AI扩散制度是利好
快讯· 2025-05-29 06:29
AI行业趋势 - AI推理需求增长超过计算能力提升速度 [1] - 特朗普政府取消拜登AI扩散制度 被认为对美国AI发展有利 [1] AI技术应用 - 企业级AI领域 Agentic AI表现优于通用AI [1] - 全球各地积极投资本土AI制造和应用 [1] - 新建工厂普遍采用AI技术 [1]
英伟达CEO黄仁勋列举出四大意外:1、推理AI已经创造更多的计算需求。2、(美国总统特朗普)取消(前总统拜登任期内出台的)AI扩散制度的决定是极好的。特朗普希望美国获胜。3、在企业级AI,Agentic AI正在发挥作用。它甚至比通用AI更好。4、对于行业AI,诸多地区热衷于本土制造并到处修建工厂。所有的新工厂都在使用AI。
快讯· 2025-05-29 06:07
英伟达CEO黄仁勋的四大意外观点 推理AI计算需求 - 推理AI已经创造更多的计算需求 [1] 政策环境对AI的影响 - 取消AI扩散制度的决定有利于美国AI发展 [1] - 特朗普希望美国在AI领域获胜 [1] 企业级AI应用 - Agentic AI在企业级AI中发挥重要作用 [1] - Agentic AI表现优于通用AI [1] 行业AI与本土制造 - 多个地区热衷于本土制造并修建工厂 [1] - 所有新建工厂均采用AI技术 [1]
Nvidia(NVDA) - 2026 Q1 - Earnings Call Transcript
2025-05-29 06:02
财务数据和关键指标变化 - 第一季度营收440亿美元,同比增长69%,超出预期 [6] - GAAP和非GAAP毛利率分别为60.5%和61%,排除45亿美元费用后,Q1非GAAP毛利率为71.3% [31] - 第一季度GAAP和非GAAP运营费用分别环比增长7%和6% [31] - 第一季度以股票回购和现金股息形式向股东返还创纪录的143亿美元 [32] - 预计第二季度总营收450亿美元,上下浮动2% [32] - 预计第二季度GAAP和非GAAP毛利率分别为71.8% - 72%,上下浮动50个基点 [33] - 预计第二季度GAAP和非GAAP运营费用分别约为57亿美元和40亿美元,预计2026财年全年运营费用增长处于30%中段水平 [34] - 预计第二季度GAAP和非GAAP其他收入和费用约为4.5亿美元,GAAP和非GAAP税率为16.5%,上下浮动1% [34] 各条业务线数据和关键指标变化 数据中心业务 - 数据中心营收390亿美元,同比增长73%,AR工作负载向推理业务强劲过渡,AI工厂建设推动显著营收增长 [6] - Blackwell推动数据中心营收同比增长73%,本季度贡献近70%的数据中心计算营收,从Hopper的过渡基本完成 [9] - 4月9日美国政府对专为中国市场设计的H20数据中心GPU实施新出口管制,Q1确认46亿美元H20营收,同时因库存减记和采购义务确认45亿美元费用,因新出口管制无法在第一季度发货25亿美元H20营收 [7] - 预计第二季度中国数据中心营收将大幅下降,预计损失约80亿美元H20营收 [21][33] 游戏和AI PC业务 - 游戏营收达创纪录的38亿美元,环比增长48%,同比增长42% [22] - 本季度增加AI PC笔记本电脑产品,包括能够运行微软Copilot Plus的型号 [23] - GeForce RTX 560和560 Ti桌面GPU和笔记本电脑已上市,可使帧率翻倍并大幅降低延迟 [24] 专业可视化业务 - 营收9000万美元,环比持平,同比增长19%,关税相关不确定性暂时影响Q1系统业务,AI工作站需求强劲,预计Q2营收将恢复环比增长 [26] 汽车业务 - 营收5.67亿美元,环比下降1%,同比增长72%,同比增长得益于多家客户自动驾驶业务的增长以及新能源汽车的强劲终端需求 [28] 网络业务 - 网络业务营收环比增长64%,达到50亿美元 [18] - Spectrum X营收同比和环比均实现强劲增长,目前年化营收超过80亿美元,本季度新增谷歌云、Meta等客户 [20] 各个市场数据和关键指标变化 - 中国市场数据中心营收占比略低于预期且环比下降,预计Q2中国数据中心营收将大幅下降 [21] - 新加坡代表了近20%的Q1营收,但产品几乎都运往其他地区,超过99%的H100、H200和Blackwell数据中心计算营收开票给新加坡的订单来自美国客户 [22] 公司战略和发展方向和行业竞争 - 公司致力于保持每年推出新产品的节奏,产品路线图延伸至2028年,与客户的多年规划周期紧密契合 [11] - 推出LAMA Nemotron系列开放推理模型,用于增强企业的智能AI平台,多家领先平台公司正在使用该推理模型改变工作方式 [15][16] - 与百胜餐饮集团合作,今年将把NVIDIA AI引入其500家餐厅,并逐步扩展到6.1万家餐厅 [17] - 与台积电、富士康等合作在美国建设芯片制造和AI超级计算机工厂,目标是在一年内实现从芯片到超级计算机的美国制造 [45][46] - 出口管制使中国AI市场对美国企业关闭,公司正在评估有限的供应合规产品的选项,失去中国AI加速器市场将对公司业务产生重大不利影响,并使外国竞争对手受益 [9] 管理层对经营环境和未来前景的评论 - 公司认为AI是推动各行业变革的重要基础设施,目前正处于早期发展阶段,推理业务需求激增,未来增长潜力巨大 [62][63] - 企业AI、电信AI和工业AI等领域正处于起步阶段,将成为公司新的增长动力 [64][65][66] - 全球各国都在积极建设国家AI平台,主权AI将成为公司新的增长引擎 [49][50] 其他重要信息 - 公司将参加6月4日的美国银行全球技术会议、6月10日的罗森布拉特虚拟AI峰会和纳斯达克投资者会议以及6月11日的GTC巴黎和Viva Tech活动 [36] - 2026财年第二季度财报电话会议定于8月27日举行 [36] 总结问答环节所有的提问和回答 问题1: 推理业务需求的满足情况、业务规模以及是否需要全NBL 72机架规模解决方案 - 公司希望满足所有需求,目前正朝着满足大部分需求的方向发展,Grace Blackwell NVLink 72是当前推理AI的理想引擎,相比Hopper,其推理速度和吞吐量提高了约40倍,能够在降低成本的同时提高响应质量和服务质量 [53][54] 问题2: 中国市场影响及AI支出建设进度和增长预期 - 第二季度中国数据中心营收将大幅下降,预计损失约80亿美元H20营收,未来还有其他订单无法履行,评估中国市场潜在规模接近500亿美元 [60][61] - AI技术处于早期发展阶段,推理业务将成为计算工作负载的重要组成部分,公司正在云、企业、电信和工业等领域建设AI基础设施,企业AI刚刚起步,未来增长潜力巨大 [62][63][64] 问题3: 是否有其他未宣布的大规模GPU集群投资订单以及对Blackwell交货时间和可见性的影响 - 目前订单比上次在GTC会议上提到时更多,公司正在增加供应链产能,未来会有更多国家建设AI基础设施,预计会有更多相关订单宣布,AI作为基础设施的建设才刚刚开始 [70][71][75] 问题4: 关于第二季度指导和非中国业务增长的原因以及对全年连续增长的信心 - 若没有出口管制,第二季度H20订单可能达到80亿美元,Blackwell在众多客户中的增长以及供应链的改善共同促成了公司给出的指导 [80] - 与年初相比,有四个积极因素:推理AI需求呈指数级增长;AI扩散规则被撤销,为公司创造了更多机会;企业AI准备起飞;工业AI因全球制造业回流和新工厂建设而迎来发展机遇,这些因素使公司对全年连续增长更有信心 [82][83][85] 问题5: 是否获批向中国运送新的修改版本产品以及能否恢复之前的季度营收水平 - 总统有相关计划和愿景,但新的出口管制限制使Hopper在中国市场的应用基本结束,公司目前没有可宣布的产品,正在考虑相关选项,需了解限制并与政府进行讨论 [93][94] 问题6: 网络业务增长的原因以及以太网解决方案在CSP的采用情况和网络附加率的变化 - 公司有NVLink、Spectrum X、BlueField等四个网络平台,这些平台都在增长,Spectrum X通过增强以太网功能,将集群利用率从50%提高到85% - 90%,本季度新增两家重要CSP客户 [100][101]
英伟达CEO黄仁勋谈及Deepseek,称:推理模型要求更大的算力(支持),这正驱动推理需求。
快讯· 2025-05-29 05:41
行业趋势 - 推理模型对算力的需求正在增加,推动推理相关需求增长 [1] 公司动态 - 英伟达CEO黄仁勋提及Deepseek,强调推理模型需要更大算力支持 [1]
MedBench最新榜单出炉!深兰科技医疗大模型综合测评第一
证券日报· 2025-05-28 22:14
医疗大模型评测 - 深兰科技DeepBlue-MR-v1医疗大模型以94.2的高分在MedBench多个综合评测中排名第一 [1] - 该模型在复杂医学推理评测中持续霸榜并扩大领先优势 [1][2] - MedBench评测平台由上海人工智能实验室与上海市数字医学创新中心联合多家机构设立 已评测全球超过387个模型 [1] 技术能力与研发 - DeepBlue-MR-v1基于Transformer架构 通过海量医学数据预训练构建医学推理语义空间 [2] - 模型采用自研训练体系 包括监督微调 指令增强和多阶段自适应强化学习算法 [2] - 在医学语言理解 生成 知识问答 复杂推理 安全伦理五个维度综合得分领先 [2] 产品应用与商业化 - 基于DeepBlue-MR-v1开发的AI医疗产品包括问诊助手 远程视频问诊 辅助诊断系统等 [3] - 已与武汉市中心医院 协和医院等多家医疗机构达成合作 [3] - 合作重点为问诊 诊断和专科服务等场景的AI技术深度应用 [3]
英伟达(NVDA.US)绩前大摩坚定唱多:更关注推理需求爆发 下半年增长路径已打开
智通财经网· 2025-05-28 16:59
英伟达2026财年第一季度业绩前瞻 - 公司将于周三美股盘后公布2026财年第一季度业绩 分析师共识预期营收433亿美元(上年同期260亿美元) 调整后每股收益0 88美元(上年同期0 61美元) [1] - 摩根士丹利认为H20芯片对华销售禁令带来重大冲击 估算第一季度营收损失10亿美元(23天影响) 第二季度损失50亿美元 [1] - 大摩维持英伟达"增持"评级 目标价160美元 认为若管理层能证明Blackwell供给持续改善且下半年加速增长 短期负面因素将弱化 [1] H20芯片对华销售禁令影响 - 公司无产品能完全替代H20 正在游说争取许可但短期难有结果 传言将推出中国特供AI芯片但交付时间与需求不明确 [2] - 大摩模型已计入禁令影响 预计第一季度营收422亿美元 第二季度435亿美元 低于市场普遍预期的470亿美元 [2] - 公司与美国政府关系密切 部分H20业务可能恢复 [2] GB200机架生产与交付进展 - 三家主要ODM在4月交付约1500台GB200机架 预计全年持续增长 部分OEM和超大规模客户尚未获得足够机架但解决方案在推进 [2] - 当前月交付节奏达1 8万台的年化水平 全年无法交付2万台的说法过于悲观 三家ODM均预测快速爬坡 [3] - GB200无直接竞品 公司自2月起鼓励客户聚焦其产能爬坡 GB300将在今年晚些时候推出 具体季度差异不大 [3] 推理需求与长期增长动力 - 推理需求爆发式增长是重要长期变量 所有超大规模客户均报告远超预期的推理需求增长 [3] - 产业链访谈显示市场急于添加GPU 在GB200短缺情况下客户请求扩充Hopper和B200容量 [3] - 液冷和ARM处理器生态未成熟 客户采购传统形态产品(如B200)满足推理需求 [3] 短期风险与股价展望 - 大摩认为短期风险已充分反映 下半年增长路径清晰 [4] - 若财报电话会能明确Blackwell供给改善和推理需求爆发 即使业绩未大幅超预期 股价仍将表现良好 [4]
AI算力需求涌向模型推理,国产芯片站上竞技台了
第一财经· 2025-05-28 15:22
中国数据中心加速卡市场 - 2024年中国数据中心加速卡市场中34.6%是国产算力,预计上半年国产算力占比超四成[1][2] - 2022-2023年英伟达占据中国数据中心加速卡市场85%-90%,2024年其份额降至65.2%[11] - 国产算力占比可能在短期内超过50%,寒武纪、沐曦等国产芯片厂商开始进入主流应用[11][12] AI算力需求结构变化 - 2024年中国数据中心加速卡中57.6%是推理卡,33%是训练卡,DeepSeek推动推理需求增长[9] - 训练算力需求未减少但占比下降,推理芯片占比预计2025年进一步大幅增加[1][9] - 腾讯等企业反映推理token需求超预期,GPU资源无法满足现有AI需求[9] 智算中心建设动态 - 2024年中国加速计算服务器市场出货量同比增长97.3%,2025年预计增长52.9%[4] - 2024年国内智算中心中标信息213条,是2023年53条的4倍,显示建设明显加速[4] - 香港数码港超算中心算力将从1300PFLOPS提升至3000PFLOPS,第一阶段使用率超95%[6][7] 国产芯片应用突破 - 推理环节降低对芯片性能要求,国产AI芯片如华为、沐曦、壁仞等获得测试机会[10][12] - 寒武纪2024年Q1营收11.11亿元(接近2023全年),净利润3.55亿元实现扭亏[12] - 电信运营商建设基于国产算力的万卡集群,国产算力适配DeepSeek后利用率提升[8] 英伟达市场策略调整 - 英伟达在中国市场份额从95%降至50%,黄仁勋称出口管制存在根本性缺陷[13] - 拟推出采用Blackwell架构的新款中国特供AI芯片,定价低于H20以应对竞争[13] - H20芯片出口需许可证,英伟达面临国产替代加速的压力[11][13] 高校与企业算力需求 - 香港科技大学采购英伟达H800计算卡但仍需补充算力,高校采用混合云架构降本[5] - 华东理工大学将AI用于锂电池催化设计,私有云与公有云混合模式成为主流[5] - 企业AI应用处于早期尝试阶段,缺乏人才配套导致转型进度缓慢[7]
大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%
量子位· 2025-05-28 12:22
大模型数独能力研究 - Sakana AI推出全新基准测试Sudoku-Bench 包含4x4至9x9传统及变异数独问题 旨在测试AI创造性推理能力[1][6][15] - 测试结果显示大模型总体正确率仅15% 9x9数独中高性能模型o3 Mini High正确率低至2 9%[1][25] - 变异数独需多步逻辑推理 无法通过记忆模板解决 成为测试AI推理能力的理想选择[11][12] 模型表现分析 - 在辅助条件下部分模型表现较好 但原始谜题中先进模型平均连一个正确数字都难以放置[20][21] - 4x4网格模型正确率40%-73% 但9x9网格接近0% 常见错误包括错误解答 放弃解题及误判规则[25] - 多步推理模式下O3 Mini High在4x4数独正确率达60% 但单次推理模式总体正确率仅14%[23] Sakana AI技术布局 - 公司由Transformer作者Llion Jones创立 专注生成文本和图像的AI基础模型研究[24] - 已发布AI科学家和AI审稿人 前者可独立完成十篇学术论文 后者能评审AI论文[26][27] - 开发连续思维机器(CTM)模型 通过逐步思考解决复杂问题 如迷宫[29] 行业合作与数据 - 与Cracking The Cryptic合作 获取数独解题视频数据用于训练推理模型[31][32] - 数独公司Nikoli提供100道手工题目 出题人定制"奇偶鱼"变异数独游戏[16][34] - 项目在2025 NVIDIA GTC大会展示 黄仁勋认为此类谜题可提升AI推理能力[3][4]