Workflow
RTX 50系列
icon
搜索文档
写在英伟达业绩前、谷歌十年磨一剑
傅里叶的猫· 2025-11-19 22:56
Gemini 3 模型性能表现 - 在多项基准测试中表现卓越,尤其在 Humanity's Last Exam 学术推理测试中,无工具辅助得分为 37.5%,使用搜索和代码执行后提升至 45.8%,显著优于 Gemini 2.5 Pro (21.6%)、Claude Sonnet 4.5 (13.7%) 和 GPT-5.1 (26.5%) [1] - 在 ARC-AGI-2 视觉推理测试中得分 31.1%,远超 Gemini 2.5 Pro (4.9%) 和 Claude Sonnet 4.5 (13.6%) [1] - 在 AIME 2025 数学测试中,无工具辅助得分 95.0%,使用代码执行后达到 100%,在 MathArena Apex 高难度数学竞赛题中得分 23.4%,远高于其他模型(0.5% 至 1.6%)[1] - 在多模态理解(MMMU-Pro 81.0%)、屏幕理解(ScreenSpot-Pro 72.7%)、图表信息合成(CharXiv Reasoning 81.4%)及视频知识获取(Video-MMMU 87.6%)方面均领先 [1] - 在编程能力上,LiveCodeBench Pro Elo 评级达 2,439,代理终端编码(Terminal-Bench 2.0)成功率为 54.2%,代理工具使用(t2-bench)成功率为 85.4%,长周期代理任务(Vending-Bench 2)平均净值达 5,478.16 美元,优势明显 [1] Gemini 3 的技术突破与优势 - 模型性能的巨大提升源于预训练和后训练的改进 [3] - 其核心突破体现在处理20%高难度任务的能力上,如复杂逻辑推理和精妙创意决策,在需要额外"脑力"的场景下优势完全显现 [4] - Gemini 3 Pro 完全使用谷歌自研TPU训练,未使用英伟达GPU,标志着谷歌在AI全栈能力上的成熟 [7] - 优异表现建立在暴力计算之上,证明了"compute = better model"以及scaling law仍有空间 [15] 谷歌TPU的成本与生态优势 - 根据摩根士丹利测算,使用TPU V7训练400B参数Llama-3模型的硬件投资为2.34亿美元,总拥有成本为4400万美元,显著低于英伟达B200方案(硬件投资6.84亿美元,总拥有成本4800万美元)[8][9] - TPU V6的推理成本不到英伟达GB200超级芯片的一半,优势非常大 [9] - 在非通用计算平台TPU上成功训练出Gemini 3,表明谷歌的软件生态已非常完善,是"十年磨一剑"的成果 [12] 英伟达业绩前景与增长动力 - 机构普遍看好英伟达Q3业绩,高盛预测营收555.56亿美元,EPS 1.28美元;瑞银预测营收562亿美元,EPS 1.29美元;花旗预测营收567.54亿美元,并预计Q4指引可能突破625.66亿美元 [17] - 截至Q3末,Blackwell GPU已售出600万片,订单金额超1200亿美元;Rubin系列早期订单200万片,预计2026年Q1量产 [19] - 增长逻辑转变,供给端改善:云厂商云业务营收同比增长25%以上,GPU采购量环比增30%-40%;台积电CoWoS封装产能Q3环比增15%,70%供给英伟达 [19] - GPU + 网络 + 软件的整套解决方案占比达45%,环比增5个百分点,提升营收弹性 [19] 英伟达产品路线图与供应链 - Blackwell客户结构分散:大云厂商占65%,AI初创公司占25%,企业客户占10%,显示AI需求正向各行业扩散 [20] - Rubin系列是2026年增长重点,预计贡献13%营收,高端VR200和CPX性能比Blackwell强30%到50%,单价3万美元以上 [20] - 全球大模型训练每月需120万片GPU,但Blackwell月产仅80万片;Rubin在2026年Q1月产20万片,Q4达50万片,将弥补产能缺口 [20] - 供应链瓶颈存在于CoWoS封装(英伟达需求占其产能71%)、HBM内存(Q3 HBM3E价格涨20%)及光学元件 [21] 英伟达盈利能力与业务结构 - 机构预测Q3毛利率能稳定在73.5%-74%,数据中心业务毛利率可达77% [22][23] - 高毛利维持得益于高毛利率的解决方案占比提升至45%、数据中心营收增长22%带来的规模效应以及高端型号提价5%-10% [23] - Q3数据中心营收预计493.88亿美元(占比88.9%),游戏业务营收47.32亿美元(同比增44%),汽车业务营收6.2亿美元(同比增38%)[24] 英伟达面临的挑战与竞争 - 中国市场受出口管制影响,高端AI芯片份额从95%降至0%,中低端H20芯片Q3仅售2亿美元,远低于预期,且有45亿美元库存待消化 [25] - 面临AMD MI300(Q3销量80万片,市场份额升至12%)、云厂商自研芯片(如谷歌TPU、亚马逊Trainium2)以及AI初创公司专用芯片的竞争 [26] - 但其CUDA软件生态覆盖95%以上AI开发者,"GPU + 网络 + 软件"解决方案仍具优势 [26] AI资本支出可持续性 - 2026年全球AI基础设施支出预计达2046亿美元,同比增长45% [19][27] - 企业采用生成式AI的比例预计从当前的15%提升至2027年的50%,将支撑AI capex持续增长,2027年全球AI capex可能达2682亿美元 [27][28] - 即使AI初创公司支出减少,大云厂商和企业的需求也能支撑英伟达增长,2026年数据中心业务营收有望突破3000亿美元 [28]
直击黄仁勋Computex演讲:将于三季度推出下一代GB300系统、个人AI计算机DGX Spark已全面投产
华尔街见闻· 2025-05-19 12:18
公司动态 - 英伟达创始人兼CEO黄仁勋在台北国际电脑展(Computex 2025)开幕式发表主题演讲,分享AI与加速运算技术的最新突破和进展 [1] - 公司有望推出一款全新的CPU(首次)并发布RTX 50系列相关新闻 [1] - Project DIGITS的个人AI计算机DGX Spark已全面投产,即将在未来几周上市,面向个人用户 [1] - 公司正在为中国台湾的AI基础设施和生态系统建造第一台巨型AI超级计算机 [5] - Grace Blackwell系统已全面投入生产,被多家云服务提供商采纳并在社交媒体获得广泛认可 [5] - 计划本季度升级到Grace Blackwell GB300版本,配备升级版Blackwell芯片 [6] 技术突破 - 下一代超算实现每秒14.4TB全连接带宽,利用NVLink Spine等技术达到每秒130TB带宽 [5] - 系统整合72个Blackwell处理器或144个GPU芯片,配备两英里长铜线,拥有1.3万亿个晶体管 [5] - GB200 Grace Blackwell超级芯片展示,AI算力每10年提升约100万倍 [9] - 与台积电合作开发COOS-L新工艺,实现大规模芯片制造 [9] - 开发全球最快交换机NVLink,运行速度达7.2TB [9] - CUDA库可将人工智能代入5G/6G网络并进行计算 [11] - 推出Grace Blackwell:会思考的机器,作为机器人革命的基石 [13] 产品发布 - 手持RTX 5060 GPU并展示搭载该芯片的全新MSI笔记本电脑,将于五月上市 [17] - 推出Grace Blackwell系统,将普通计算机转变为强大的超级计算机 [5] - GB300版本推理性能提升1.5倍,HBM内存容量增加1.5倍,网络连接能力翻倍 [6] 行业趋势 - 展会以"AI Next"为主轴,聚焦"智慧运算&机器人""次世代科技"以及"未来移动"三大主题 [1] - 展会规模:1400家厂商参展,4800个摊位,展示面积8万平方公尺 [1] - 黄仁勋预测十年后人工智能将像互联网和电力一样无处不在 [19] - CUDA-X库应用于天气分析的Earth-2和深度学习的Megatron Dynamo等领域 [15]