Workflow
Reasoning
icon
搜索文档
Nvidia(NVDA) - 2026 Q1 - Earnings Call Transcript
2025-05-29 06:00
财务数据和关键指标变化 - 第一财季营收440亿美元,同比增长69%,超出预期 [5] - 数据中心营收390亿美元,同比增长73% [5] - Q1确认H20营收46亿美元,同时因库存减记和采购义务确认45亿美元费用,因出口管制无法发货25亿美元 [6] - GAAP和非GAAP毛利率分别为60.561%,排除45亿美元费用后,Q1非GAAP毛利率为71.3% [30] - Q1以股票回购和现金股息形式向股东返还创纪录的143亿美元 [31] - 预计第二财季总营收450亿美元,上下浮动2%,GAAP和非GAAP毛利率分别为71.8 - 72%,上下浮动50个基点 [31][32] - 预计GAAP和非GAAP运营费用分别约为57亿美元和40亿美元,预计2026财年全年运营费用增长处于30%左右的中间水平 [33] - 预计GAAP和非GAAP其他收入和费用为约4.5亿美元,GAAP和非GAAP税率为16.5%,上下浮动1% [33] 各条业务线数据和关键指标变化 数据中心业务 - 数据中心营收390亿美元,同比增长73%,AR工作负载向推理过渡,AI工厂建设推动显著收入增长 [5] - Blackwell推动数据中心营收同比增长73%,本季度贡献近70%的数据中心计算营收,从Hopper的过渡基本完成 [7] 网络业务 - 网络业务收入环比增长64%,达到50亿美元 [17] - NVLink一季度出货量超过10亿美元,Spectrum X年收入超过80亿美元,本季度新增谷歌云、Meta等客户 [18][19] 游戏和AI PC业务 - 游戏营收创纪录达到38亿美元,环比增长48%,同比增长42% [21] 专业可视化业务 - 营收900万美元,环比持平,同比增长19% [24] 汽车业务 - 营收5.67亿美元,环比下降1%,同比增长72% [27] 各个市场数据和关键指标变化 - 中国市场数据中心营收占比略低于预期且环比下降,预计Q2中国数据中心营收将大幅下降 [20] - 新加坡代表近20%的Q1建设营收,但产品大多运往其他地区,超过99%的H100、H200和Blackwell数据中心计算营收开票给新加坡的订单来自美国客户 [21] 公司战略和发展方向和行业竞争 - 公司致力于保持每年推出新产品的节奏,产品路线图延伸至2028年,与客户的多年规划周期紧密契合 [10] - 引入LAMA Nemotron系列开放推理模型,用于增强企业的代理AI平台 [14] - 与Yum Brands合作,将NVIDIA AI引入其餐厅,优化运营和服务 [16] - 与GM合作构建下一代车辆、工厂和机器人,为梅赛德斯 - 奔驰提供全栈解决方案 [27] - 推出世界首个用于人形机器人的开放、完全可定制的基础模型Isaac Groot和One,以及新的开放NVIDIA Cosmo World基础模型 [28] - 出口管制使公司失去中国AI加速器市场,对业务产生重大不利影响,且有利于外国竞争对手 [7] 管理层对经营环境和未来前景的评论 - 经营环境具有挑战性,但公司仍实现强劲增长 [5] - AI推理需求激增,各行业对AI基础设施的需求处于早期阶段,公司处于构建AI基础设施的开端 [11][62] - 主权AI是新的增长引擎,各国正在建设国家AI工厂 [49] 其他重要信息 - 公司将参加多个金融活动,包括6月4日的BofA全球技术会议、6月10日的Rosenblatt虚拟AI峰会和纳斯达克投资者会议、6月11日的GTC巴黎和Viva Tech活动 [34] - 公司第二财季财报电话会议定于8月27日举行 [34] 总结问答环节所有的提问和回答 问题1: 公司能满足多少推理需求,推理业务规模如何,推理是否需要全NBL 72机架规模解决方案 - 公司希望满足所有需求,且有望满足大部分需求Grace Blackwell NVLink 72是推理AI的理想引擎,相比Hopper,速度和吞吐量提高约40倍,能降低成本并提高响应质量 [52][53] 问题2: 中国市场影响及未来建模,以及AI支出建设进度和增长模式 - Q1 H20本应实现70亿美元营收,Q2中国数据中心营收将大幅下降,预计损失约80亿美元H20营收,未来还有其他订单无法履行,评估中国市场潜在规模接近500亿美元 [58][59][60] - AI处于早期阶段,推理将成为计算工作负载的重要部分,公司正在云、企业、电信、工厂等领域构建AI基础设施 [61][62] 问题3: 是否有未宣布的大规模GPU集群投资订单,订单对Blackwell交货时间和可见性的影响 - 目前订单比上次在GTC讲话时更多,公司正在扩大供应链,未来几年供应链将保持忙碌,还有很多未宣布的AI工厂建设计划,AI基础设施建设处于开端 [69][70] 问题4: 关于Q2指导的数学逻辑及非中国业务表现的驱动因素,以及AI扩散规则取消对全年增长的信心 - 若没有出口管制,Q2 H20订单可能达到80亿美元,公司的指导考虑了Blackwell的增长和供应需求 [80] - 有四个积极因素:推理AI需求呈阶梯式增长;AI扩散规则取消带来机会;企业AI准备起飞;工业AI兴起 [81][82][84] 问题5: 是否获批向中国运送新的修改版本产品,能否恢复之前的季度营收水平 - 总统有计划和愿景,但目前新的出口管制限制使Hopper无法进一步调整以用于中国市场,公司暂无可宣布的产品,正在考虑相关可能性 [92][93] 问题6: 网络业务中以太网解决方案在CSP的采用情况及网络附加率的变化 - 公司有NVLink、SpectrumX、InfiniBand和BlueField等多个网络平台,通过增强以太网功能,将集群利用率从50%提高到85 - 90%,SpectrumX取得成功,本季度新增两个重要CSP客户 [96][97][100]
小学数学题,大模型集体不及格!达摩院推出新基准VCBench
量子位· 2025-05-22 22:29
大模型数学能力评估 - 人类在小学数学题测试中平均得分93.30%,显著优于所有AI模型 [1][17] - 闭源模型Gemini2.0-Flash(49.77%)、Qwen-VL-Max(47.03%)、Claude-3.7-Sonnet(46.63%)表现最佳但未突破50%准确率 [1][17] - 开源模型整体表现低于闭源模型且参差不齐,可能与架构差异、多模态整合程度或训练数据质量有关 [17] VCBench基准特点 - 专为评估具备显式视觉依赖性的多模态数学推理任务设计,面向小学1-6年级数学问题 [4][5] - 强调vision-centric而非knowledge-centric,与儿童学习路径相符 [8][9][10] - 平均每个问题包含3.9张图像,显著高于现有基准,要求模型整合多图视觉线索 [12] 模型能力差异分析 - 大模型在逻辑推理类问题表现较好,但空间几何表现差,显示视觉和几何感知严重不足 [17] - 单图场景下模型表现平均比多图提升42.3%,Emu2-Chat单图性能飙升281.5% [22] - 思维链(CoT)对多步逻辑推理任务提升显著(Qwen-VL-Max在reasoning任务提升40%),但对感知型任务效果有限 [24] 错误类型分布 - 视觉感知错误占比最高(超50%),Gemini2-Flash达62%,是当前多模态模型主要瓶颈 [27][29] - 计算错误率4-7%,上下文误解错误率3-6%,Gemini2-Flash(3%)和Claude(4%)表现最佳 [27] - Claude逻辑错误率最高(33%),GPT-4o答案整合错误率最高(23%) [27][29]
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!
机器之心· 2025-05-19 12:03
文本生成视频技术发展 - 当前T2V技术正从视觉质量与模型规模扩展阶段转向物理一致性与现实合理性推理驱动阶段 [2] - 物理规律作为建模现实世界的基本知识体系,是高质量视频生成的关键约束 [2] - 主流模型如Sora、Pika、CogVideoX已能生成复杂逼真场景,但在物理规则遵守方面存在显著不足 [5] PhyT2V框架核心机制 - 通过LLM引导的链式推理与迭代自我修正机制优化文本提示,增强现有T2V模型的物理一致性 [3] - 采用三步流程:1)识别物理规则与对象 2)检测提示与视频语义不匹配 3)生成修正提示 [12][13][14] - 无需模型重训练或额外数据,支持3-4轮迭代即可显著提升效果,改进在最初两轮最明显 [14][23] 技术优势与实验表现 - 在CogVideoX-5B模型上实现PC指标2.2倍提升、SA指标2.3倍提升 [23] - 跨模型测试显示对CogVideoX-2B/OpenSora/VideoCrafter均有显著增强效果 [17][21][22] - 在固体力学、流体交互、光学现象等物理场景中表现优异,尤其擅长分布外场景 [18][20] 行业应用价值 - 框架可即插即用适配不同架构T2V模型,落地门槛极低 [3][18] - 突破传统数据驱动方法的泛化瓶颈,通过知识嵌入实现物理规则遵守 [7][10] - 为构建理解物理世界的T2V模型提供新路径,推动技术商业化进程 [26]
Meta, Microsoft, Alphabet, and Amazon Just Delivered Incredible News for Nvidia Stock Investors
The Motley Fool· 2025-05-06 06:05
英伟达股价表现与市场担忧 - 英伟达股价在2025年经历显著波动 年内累计下跌15% 投资者担忧特朗普关税政策可能降低对其数据中心芯片的需求 该芯片在AI应用开发领域处于行业领先地位 [1] - 尽管半导体未被纳入最激进的关税政策 但英伟达客户仍面临成本上升和潜在销售下滑风险 可能导致资本支出缩减 主要客户包括Meta、微软、Alphabet和亚马逊 [2] 技术优势与产品迭代 - 英伟达H100 GPU在2023-2024年主导AI数据中心芯片市场 现已被性能更高的Blackwell架构取代 Blackwell Ultra GB300 GPU在特定配置下AI推理速度可达H100的50倍 对下一代"推理模型"开发至关重要 [4] - 推理模型通过后台"思考"减少错误 但消耗更多计算资源 需传统模型100倍算力以维持用户体验 Blackwell Ultra芯片将于2025年下半年交付 下一代Rubin GPU预计再提升3.3倍算力 2026年发布 [6][7] 主要客户资本支出动态 - 四大科技巨头2025年资本支出计划:Meta上调至640-720亿美元(原600-650亿) 微软维持约800亿 Alphabet保持750亿 亚马逊仍计划1050亿 [12] - 数据中心运营商通常提前多年规划基础设施支出 尽管仅提供12个月指引 当前未下调资本支出预示可能忽略关税导致的短期经济放缓 [15] 财务数据与行业前景 - 英伟达2025财年(截至1月26日)数据中心收入达1152亿美元 同比激增142% 公司预测2028年数据中心年支出将突破1万亿美元 因推理模型催生更大算力需求 [14] - 当前股价对应市盈率39倍 显著低于10年平均和中位数水平(均超50倍) 芯片供不应求态势下 客户取消订单风险极低 长期投资价值凸显 [11][16] 关税政策影响分析 - 英伟达芯片主要由台积电代工 属进口产品 但半导体获得特朗普"解放日"关税豁免 因保持美国AI技术领先地位的战略意义 [8] - 亚马逊等客户因实体商品进口受关税冲击 但云服务、数字广告等业务不受直接影响 Meta等数字服务为主的企业抗风险能力更强 [9][10]
DeepSeek开源新模型,数学推理能力大提升
虎嗅· 2025-05-01 08:48
模型发布与版本 - DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2,同步上线模型卡及示例代码,共推出两个版本:7B和671B [1][4] - DeepSeek-Prover-V2-7B基于上一代V1.5模型,支持最长32K上下文输入 [4] - DeepSeek-Prover-V2-671B在DeepSeek-V3-Base基础上训练,推理性能最强 [4] 训练方法与技术 - 训练核心采用"递归+强化学习"组合,由DeepSeek-V3拆解复杂定理生成子目标和推理思路,再通过GRPO算法从候选方案中学习最优解 [3] - 训练分为两阶段:第一阶段采用"专家迭代"方法,模型通过解决难题反哺自身 [5];第二阶段迁移DeepSeek-V3数学知识并引入形式化数据,构建复杂推理路径 [6] - GRPO强化学习算法引导模型在32个候选证明方案中选择被Lean验证系统判定为正确的答案(奖励1分,否则0分) [8][9] 模型能力与特点 - 671B模型能力被"蒸馏"到7B模型,使小模型在资源有限设备上获得接近大模型的数学推理能力 [10][11] - 提供两种解题风格:快速模式(non-CoT)直接生成精炼答案;逻辑模式(CoT)详细展示推理过程 [12] - DeepSeek-V3负责拆解定理生成推理草图,7B模型完成子证明并拼接完整推理,形成"模糊思考+精确证明"机制 [14][15] 性能评估与数据集 - DeepSeek-Prover-V2-671B在MiniF2F测试中通过率达88.9%,成功解出PutnamBench数据集49道难题 [17] - 推出全新数学形式化数据集ProverBench,包含325道题目,涵盖AIME竞赛题、数论、代数、微积分等10个领域 [18][19] - 在15道AIME竞赛题中,DeepSeek-Prover-V2解出6道,DeepSeek-V3通过多数投票解决8道 [20] 行业趋势与方向 - 大型语言模型在"非正式数学推理"与"正式数学推理"间的表现差距明显缩小,逐步学会写出规范可验证的数学证明 [21][22] - 模型从生成内容迈向生成结构化逻辑,可能最早触碰通用人工智能的底层结构,推理能力成为知识系统边界的关键 [32][33][34] 商业化与部署 - 新模型遵循公开许可证,可通过Hugging Face平台免费下载并支持Transformers接口部署 [23][24] - Novita AI成为首批上线Prover-V2-671B推理服务的第三方提供商 [24]
Alibaba launches new Qwen LLMs in China's latest open-source AI breakthrough
CNBC· 2025-04-29 15:32
阿里巴巴发布Qwen3大语言模型 - 公司推出新一代开源大语言模型Qwen3,标志着中国开源人工智能领域的又一突破 [1][2] - Qwen3采用混合推理模型架构,结合传统LLM能力和高级动态推理技术 [1][3] - 新模型包含8种不同架构和规模的变体,适用于移动设备等边缘计算场景 [2] 技术性能与优势 - 在推理、指令遵循、工具使用和多语言任务方面显著提升,性能对标DeepSeek R1等顶尖模型 [2] - Qwen3-235B-A22B MoE模型相比同类前沿模型显著降低部署成本 [4] - 支持"思考模式"和"非思考模式"动态切换,分别应对编程等复杂任务和通用快速响应需求 [3] 商业化应用与生态 - 模型已免费开放给个人用户,可通过Hugging Face、GitHub和阿里云平台获取 [4] - 技术已集成至公司AI助手Quark产品线 [4] - 强调高性能AI的可及性战略,强化开源生态建设 [4]
九章云极DataCanvas公司双论文入选全球顶会ICLR,推动AI解释性与动态因果推理核心进展
金投网· 2025-04-28 08:22
技术突破:从理论根基到系统能力的全栈创新 全球人工智能领域再传DataCanvas强音!九章云极DataCanvas公司科研团队的两项原创成果《A Solvable Attention for Neural Scaling Laws》与《DyCAST: Learning Dynamic Causal Structure from Time Series》被人工智能三大顶级会议之一 ICLR(International Conference on Learning Representations)正式收录。这两项成果分别从神经网络基础理解与动态因果 系统建模两大方向取得进展,标志着九章云极DataCanvas团队在AI底层技术创新与国际学术影响力上实现跨越式提 升。 顶会严选:印证DataCanvas AI科研实力 ICLR与NeurIPS、ICML是人工智能领域公认的全球三大顶级学术会议之一,由深度学习先驱Yoshua Bengio、Yann LeCun等人于2013年发起成立。ICLR凭借其对深度学习核心问题的持续深耕、严苛的学术标准与开放协作的社区文 化,已成为全球AI学者发布里程碑成果的首选平台,在谷歌 ...
自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构
量子位· 2025-03-13 11:28
核心观点 - 提出自结构化推理链(SCoT)新范式,通过分解推理过程为最小语义原子步骤,动态生成适配不同复杂度问题的CoT结构,解决现有方法在推理多样性和效率上的不足 [1][2] - 开发AtomThink全过程框架,包含数据构造、训练、推理和评估模块,显著提升多模态大模型在复杂推理任务上的表现 [3][14] - SCoT使模型能根据问题复杂度自动调整推理链长度,复杂问题的推理步骤更长 [4][19] - AtomThink框架在多个数据集上显著提升基线模型准确率,数据利用效率和推理效率均表现出显著优势 [5][17][18] 技术细节 SCoT设计 - 将推理过程分解为最小语义单元——原子步骤,通过多轮预测方法动态生成推理链 [10] - 模型每次仅预测一个原子步骤,并将其附加到历史推理步骤中作为下一轮输入 [11] - 引入基于规则的过滤机制和温度累积策略,增强推理多样性和流畅性 [12] AtomThink框架 - 数据引擎:通过动态提示策略和短推理增强方法生成高质量多步推理路径,构建包含20k多模态数学问题和124k原子步骤标注的AMATH数据集 [14] - 原子步骤微调:采用步骤级掩码训练迫使模型学习独立推理步骤 [14] - 策略引导的多轮推理:结合路径搜索和步骤搜索策略扩展推理空间 [14] - 原子能力评估:基于推理行为聚类和步骤利用率计算评估模型表现 [14] 实验结果 性能提升 - 在MathVista、MathVerse和MathVision数据集上,AtomThink框架使Llama3.2-Vision-11B准确率分别提高10.9%、10.2%和7.2% [17] - AtomThink-LLaVA在MathVista-M数据集上准确率提升3.2个百分点,结合PRM后提升达7.8个百分点 [16] - AtomThink-LlamaV在MathVista数据集上准确率提升9.6个百分点,结合PRM后提升达10.9个百分点 [16] 效率优势 - 与现有结构化CoT方法相比,AtomThink在准确率超越LLaVA-CoT条件下数据利用效率提升5倍,推理效率提升85.3% [18] - 使用20k数据集(减少80%)和161.5 tokens(减少87.8%)即达到更高准确率 [18] 能力特征 - SCoT能动态生成涵盖图像描述、数据提取、逻辑推理、因果推理等多种能力的多样化推理结构 [19] - 原子能力评估揭示模型存在推理误差累计现象,早期阶段错误率较高 [21]
从 R1 到 Sonnet 3.7,Reasoning Model 首轮竞赛中有哪些关键信号?
海外独角兽· 2025-03-03 21:10
行业竞争格局 - 头部AI实验室在过去一个月密集发布三个SOTA推理模型:OpenAI的o3-mini和deep research、xAI的Grok 3、Anthropic的Claude 3.7 Sonnet,标志着新范式第一轮竞赛暂告段落 [1] - 当前尚无全面领先的SOTA模型:OpenAI和xAI在基础模型和竞赛解题能力占优,Anthropic更擅长真实世界工程问题,Claude 3.7 Sonnet的混合推理模型可能成为行业新标准 [1][3] - DeepSeek R1在有限资源下实现开源创新,虽表现暂时落后但技术扩散价值显著 [7][8] 模型能力对比 - **数学推理**:o3-mini-high在AIME 2024测试中Pass@1达87.3,显著优于Claude 3.7 Sonnet的61.3/80.0和Grok 3的83.9/93.3 [9] - **工程代码**:Claude 3.7 Sonnet在SWE-bench验证中准确率领先20%+,可靠代码输出长度从3.5版的200行提升至1000-1500行 [19][20] - **多模态**:Gemini 2.0 Flash在多模态理解能力上绝对领先,但高阶融合能力尚未涌现 [6] 技术范式演进 - 基础模型预训练仍具关键价值:高质量基础模型是强化学习的前提,且当前评估方法已落后于模型智能发展 [12] - 混合推理成为趋势:Claude 3.7 Sonnet通过"extended thinking"设置实现快慢思考切换,未来模型需具备动态计算能力 [13][14][16] - RL Scaling效果优于垂直微调:OpenAI竞争性编程报告显示通用RL scaling比领域RL finetuning效果更好 [34][35] 产品应用创新 - Claude Code定位为AI Coding基建:通过命令行界面帮助AI扎根传统代码库,结合action scaling能力实现类Devin的agentic工作流 [22][23] - OpenAI Deep Research确立PMF形态:在网页理解深度、信息准确性、意图识别等方面领先,支持可配置的研究广度/深度控制 [29][31][32] - Agent能力升级关键:action scaling实现连续tool use,verifiable environment构建(如OS browser/Coding)及online learning机制 [25][27][28] 性能基准数据 | 测试维度 | Claude 3.7 Sonnet | Grok 3 Beta | o3-mini-high | |----------------|-------------------|-------------|--------------| | GPQA Diamond | 78.2/84.8 | 80.2/84.6 | 79.7 | | Codeforces评分 | - | - | 2130 | | SWE-bench | 49.3 | - | 49.2 | [9]
Nvidia(NVDA) - 2025 Q4 - Earnings Call Transcript
2025-02-27 09:48
财务数据和关键指标变化 - Q4营收393亿美元,环比增长12%,同比增长78%,高于375亿美元的预期;2025财年营收1305亿美元,较上年增长114% [7][8] - GAAP毛利率为73%,非GAAP毛利率为73.5%,随着Blackwell架构首批交付,环比下降;预计Blackwell全面投产时,毛利率将回升至70%多的中间水平 [37][178] - 第一季度总营收预计为430亿美元,上下浮动2%;GAAP和非GAAP毛利率预计分别为70.6%和71%,上下浮动50个基点 [39][180] 各条业务线数据和关键指标变化 数据中心业务 - 2025财年数据中心营收1152亿美元,较上年翻倍;Q4营收356亿美元创纪录,环比增长16%,同比增长93% [8][9] - Q4 Blackwell销售额超预期,实现11亿美元营收,是公司历史上最快的产品爬坡;数据中心计算营收环比增长18%,同比增长超2倍 [9][10] - 大型云服务提供商(CSP)约占Q4数据中心营收的一半,销售额同比接近翻倍;消费互联网营收同比增长3倍;企业营收同比接近翻倍 [17][19][21] 网络业务 - 网络营收环比下降3%,但与GPU计算系统配套的网络业务占比超75%;预计Q1网络业务将恢复增长 [27] 游戏和AR PC业务 - Q4游戏营收25亿美元,环比下降22%,同比下降11%;全年营收114亿美元,同比增长9%;预计Q1随着供应增加,营收将实现强劲环比增长 [30] 专业可视化业务 - Q4营收5.11亿美元,环比增长5%,同比增长10%;全年营收19亿美元,同比增长21% [33] 汽车业务 - Q4营收创纪录达5.7亿美元,环比增长27%,同比增长103%;全年营收17亿美元,同比增长55%;预计本财年汽车业务营收将增长至约50亿美元 [34][164] 各个市场数据和关键指标变化 - 数据中心营收的环比增长在美国最为强劲;全球各国都在建设AI生态系统,对计算基础设施的需求激增 [26] - 中国数据中心销售额占总数据中心营收的比例仍远低于出口管制实施前的水平,若无法规变化,预计将维持在当前比例,市场竞争激烈 [27] 公司战略和发展方向和行业竞争 - 推出NVIDIA Cosmos World基础模型平台,用于推动机器人领域的物理AI发展,机器人和汽车公司已开始采用 [25][166] - 持续推进Blackwell产品的生产和供应,以满足市场对AI计算的强劲需求;未来将推出Blackwell Ultra和Vera Rubin等产品 [77][78] - 提供NVLink交换系统、Quantum InfiniBand和SpectrumX等网络解决方案,以满足AI对新型网络的需求 [28][29] 管理层对经营环境和未来前景的评论 - AI已成为主流技术,正融入各个应用领域,未来软件和服务将基于机器学习,计算机将向加速计算和AI方向发展 [98][100] - 目前处于AI新时代的开端,推理AI和推理时间扩展的需求正在增加,未来推理模型的计算需求将大幅增长 [133][275] - 公司认为需求在短期、中期和长期内都将保持强劲,有来自顶级合作伙伴的预测和计划,以及众多创新型初创公司的需求支撑 [67][68] 其他重要信息 - 公司将参加TD Cowen医疗保健会议、摩根士丹利科技、媒体和电信会议以及年度GTC会议 [43][44] - 2026财年第一季度财报电话会议定于2025年5月28日举行 [44] 问答环节所有提问和回答 问题1: 测试时间计算和强化学习使训练和推理界限模糊,对推理专用集群的未来及对公司和客户的影响 - 现在有多种扩展定律,包括预训练、训练后和测试时间计算或推理;推理计算需求已达初始大语言模型的100倍,未来可能更多 [48][192] - Blackwell架构专为推理AI设计,在推理方面性能卓越,数据中心架构具有通用性和易用性,能根据不同需求灵活配置 [53][194] 问题2: GV200在CES的情况,以及系统层面的爬坡挑战和对NVLink 72平台的看法 - 自CES以来,已交付更多产品,有350家工厂生产Blackwell机架的150万个组件;Q4 Grace Blackwell实现11亿美元营收,需求高,将继续扩大规模 [199][200] - 看到很多Grace Blackwell系统上线的庆祝活动,公司和合作伙伴进展顺利 [201] 问题3: Q1是否为毛利率底部,以及对需求持续到明年的信心来源和DeepSeq创新的影响 - 目前专注于加快Blackwell的生产,全面投产后有机会改善成本和毛利率,预计今年晚些时候毛利率将回升至70%多的中间水平 [64][205] - 公司对需求有较好的洞察,软件正转向机器学习,有顶级合作伙伴的预测和计划,还有众多创新型初创公司的需求;目前仅触及部分消费AI领域,未来企业级、物理AI等领域潜力巨大 [67][212] 问题4: 下一代Blackwell Ultra的需求动态,以及客户和供应链如何管理两代产品的同时爬坡 - Blackwell Ultra将于今年下半年推出,系统架构与当前的Blackwell相同,过渡相对容易;公司已与合作伙伴和客户沟通,将做好过渡安排 [77][219] 问题5: 定制ASIC与商用GPU的平衡,以及客户是否会构建异构超级集群 - NVIDIA架构具有通用性,适用于各种模型和应用场景,能提供端到端的解决方案;性能和节奏快,能带来更高的收入和快速的投资回报率;软件栈复杂,公司在部署方面具有优势 [83][226] 问题6: 美国市场增长能否弥补其他地区法规限制的影响,以及中国市场的动态 - 中国市场销售额占比与Q4和之前季度大致相同,约为出口管制前的一半;AI已成为主流技术,融入各个应用领域,未来软件和服务将基于机器学习 [96][237] 问题7: 企业业务在数据中心的增长情况,以及超大规模客户的内部和外部工作负载支出分配,和企业业务未来的增长趋势 - 企业业务营收同比接近翻倍,与大型CSPs表现相似;CSPs约占业务的一半,有内部和外部消费,公司会与他们合作优化内部工作负载 [17][21][249] - 从长期来看,企业业务的增长潜力更大,因为计算机行业中未被服务的部分主要是工业领域,企业和物理AI的应用刚刚起步 [110][252] 问题8: 从替换周期角度看已部署的基础设施,以及未来的更新机会 - 旧架构如Volta、Pascal和Ampere仍在使用,主要用于数据处理和数据策展;由于CUDA的可编程性,所有架构都兼容,可将低强度工作负载分配给旧架构 [120][262] 问题9: 毛利率在下半年回升的信心来源,以及关税的影响 - Blackwell系统有多种配置,有很多机会改善毛利率;关税情况尚不确定,公司将遵循相关规定 [128][272]