Workflow
华尔街见闻
icon
搜索文档
英伟达GTC大会全文:黄仁勋宣告推理时代到来,龙虾就是新操作系统
华尔街见闻· 2026-03-17 06:57
公司核心战略与平台优势 - 公司战略围绕三大平台展开:CUDA-X平台、系统平台和全新的AI工厂平台,并强调生态系统的重要性 [1] - 公司是首家垂直整合、同时水平开放的计算公司,通过深入理解应用和算法,为每个垂直领域带来显著加速和成本降低 [9] - 公司拥有庞大的CUDA安装基础,全球有数亿颗运行CUDA的GPU和计算系统,覆盖所有云服务商和计算机厂商,服务于几乎每个行业,这构成了其飞轮效应的基础 [3] - CUDA平台已积累数千种工具、编译器、框架与库,在开源社区有数十万个公开项目,并深度集成至每个主流生态系统 [2] - 庞大的安装基础和持续软件优化使公司架构的计算成本不断下降,同时基础设施拥有极长使用寿命,例如六年前发布的Ampere架构云端定价至今仍在上涨 [3][4] - 公司宣布了与IBM、戴尔、Google Cloud、AWS、Microsoft Azure、CoreWeave、Oracle、Palantir等企业在结构化与非结构化数据平台上的多项重要合作 [11] 技术演进与架构发布 - 今年是CUDA诞生20周年,其基础是革命性的SIMT(单指令多线程)架构,近年来新增了Tiles支持以优化对Tensor Core和AI数学结构的编程 [2] - 公司展示了图形技术的未来——神经渲染(DLSS 5),将可控的3D图形与生成式AI融合,以生成既美观逼真又完全可控的内容 [7] - 公司宣布了下一代架构Vera Rubin,该系统专为Agentic系统设计,采用100%液冷,安装时间从两天缩短至两小时,并使用45°C热水冷却以降低能耗 [19][21] - Vera Rubin系统的核心是全新的Vera CPU,这是全球唯一使用LPDDR5的数据中心CPU,兼具高单线程性能、出色数据处理能力和无与伦比的能效比 [19] - Rubin Ultra采用全新"Kyber"机架,支持144颗GPU构成单一NVLink域,计算节点从正面插入,NVLink交换机从背面连接,构成一台巨型计算机 [22] - 公司发布了技术路线图,包括当前Blackwell(Oberon系统,支持NVLink 72)、Vera Rubin(Kyber机架)、Vera Rubin Ultra以及下一代Feynman架构 [25] - 公司收购了Grok的技术团队并获技术授权,通过开发的Dynamo推理解耦框架,将Grok处理器与Vera Rubin架构耦合,在最具商业价值的服务层级实现性能提升35倍 [22][27] - 全球首款CPO Spectrum-X交换机(共封装光学)已量产,光子直接集成至芯片,该工艺与台积电联合研发 [24] 市场拐点与需求展望 - AI发展经历了从“感知”到“生成”,再到“推理”和“执行”的演进,推理拐点已经到来,AI每次思考、执行、读取、推理都需要进行推断,导致Token生成需求爆炸式增长 [13][14] - 过去两年间,单次工作的计算需求提升了约10,000倍,使用量提升了约100倍,计算总需求的增幅接近100万倍 [14] - 公司对未来的需求展望从去年预测的至2026年约5000亿美元,更新为至少到2027年需求将达到1万亿美元,且确信实际计算需求将远高于此 [15] - 公司业务构成多元化,60%来自五大超大规模云服务商,40%来自区域云、主权云、企业、工业、机器人、边缘和超算等多个领域,这种覆盖本身就是韧性所在 [16] 推理性能与成本优势 - 公司在推理优化上取得根本性突破,从Hopper H200到Grace Blackwell,实际每瓦性能提升达到35倍(有分析指出实际为50倍),远高于摩尔定律预期的约1.5倍 [18] - 极致的性能提升使得公司的每Token成本是全球最低,在吉瓦级数据中心建设成本固定的前提下,安装性能最优的计算系统是实现最低Token成本的关键 [18] - 以Fireworks AI为例,更新软件后,同一套系统的Token速率从约700 tokens/秒提升至近5,000 tokens/秒,提升7倍 [18] - 从Token工厂的商业逻辑看,与Hopper相比,Grace Blackwell在最具商业价值的服务层级,其吞吐量提升了35倍,可将整体数据中心收益提升约5倍 [18] - 在一个吉瓦级AI工厂中,通过架构优化,仅用两年时间Token生成速率将从2200万提升至7亿,提升幅度达350倍 [29] AI工厂与效率提升 - 数据中心正在从存储文件的“数据中心”演变为生产Token的“AI工厂” [40] - 公司创建了英伟达 DSX平台,基于Omniverse,让合作伙伴在虚拟世界中共同设计吉瓦级AI工厂,进行全系统仿真,公司相信该平台能释放约两倍的效率提升 [29] - 公司还将进军太空,Thor芯片已通过辐射认证部署于卫星,并正与合作伙伴开发Vera Rubin Space-1,以在太空中建设数据中心 [29] Agentic AI 与 OpenClaw - OpenClaw成为一个重大新发现,它是一个Agentic系统,能连接大型语言模型、访问工具和文件系统、执行调度、分解任务、生成子Agent并支持多模态交互,本质上是Agentic计算机的操作系统 [30][33] - 企业IT正经历范式转变,旧模式是数据中心存储文件供人类使用软件工具,新模式是每一家SaaS公司都将成为提供专业化Agent服务的AaaS(Agentic as a Service)公司 [30] - 针对企业级Agentic系统的安全挑战,公司与OpenClaw开发者合作,推出了企业级安全的参考架构NemoClaw [31] - 公司宣布成立Nemotron联盟,与BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam、Thinking Machines等公司合作,共同打造Nemotron 4模型,并将NemoClaw等工具深度集成到各自产品中 [34][37] 物理AI、机器人及行业应用 - 公司长期致力于物理AI与机器人领域,为机器人系统打造了三台关键计算机:训练计算机、合成数据生成与仿真计算机、机器人本体内置计算机 [35][38] - 自动驾驶的“ChatGPT时刻”已经到来,公司宣布新增比亚迪、现代、日产、吉利四家RoboTaxi合作伙伴,加上之前的奔驰、丰田、通用,每年合计生产1800万辆汽车将接入其RoboTaxi Ready平台,并与Uber达成重大合作 [35] - 在工业机器人领域,公司与ABB、Universal Robots、KUKA及卡特彼勒等合作,将物理AI模型与仿真系统整合部署至全球制造产线 [35] - 在电信领域,未来的无线基站将演变为英伟达 Aerial AI RAN,能够动态推理流量、自适应调整波束赋形,在提升信号质量的同时显著节省能耗 [35] - 公司展示了与迪士尼联合开发的“奥拉夫”机器人,基于Jetson计算平台和Omniverse训练环境,实现了真实物理世界中的自适应运动 [36] - 公司的生态系统覆盖多个垂直领域,包括自动驾驶、金融服务、医疗健康、工业制造、娱乐与游戏、机器人(110台机器人参展)以及电信(约2万亿美元规模)等 [12] 软件、模型与生态系统更新 - 本届GTC大会上,公司宣布了100个库和约40个模型的更新,这些库是公司的核心资产 [10] - 其中最重要的库之一是cuDNN(CUDA深度神经网络库),它被指出彻底革命性地改变了人工智能,点燃了现代AI的大爆炸 [10] - 公司创建了用于加速结构化数据的数据框(Data Frame)的基础库cuDF,以及用于加速非结构化AI数据的向量存储(Vector Store)的基础库cuVS [9][11] - 公司已在每个AI领域的前沿模型上确立领导地位,包括Nemotron(大型语言模型)、Cosmos(世界基础模型)、GROOT(通用机器人模型)、Alpamayo(自动驾驶)、BioNeMo(数字生物学/药物发现)、PhysicsNeMo(AI物理仿真)等 [34]
三星发布HBM4E并深化与英伟达合作,AI算力“存储竞赛”再提速
华尔街见闻· 2026-03-17 06:23
行业技术趋势 - 在AI算力需求持续爆发的背景下,存储技术正成为决定下一代数据中心性能的关键瓶颈 [1] - HBM技术通过3D堆叠方式将多个DRAM芯片垂直连接,大幅提高内存带宽并降低功耗,目前已成为AI GPU和加速器的核心组件 [2] - 业内普遍认为,三星发布HBM4E标志着AI芯片生态中“算力—存储”协同升级进入新阶段 [1] 三星电子新产品发布 - 三星电子在英伟达年度开发者大会GTC上首次公开展示下一代高带宽存储芯片HBM4E [1] - HBM4E是三星的第七代高带宽内存技术,定位为HBM4的升级版本 [2] - 该产品预计单引脚速度可达16Gbps、总带宽达到4TB/s [1][3] - HBM4E目标面向未来AI加速器、超大规模数据中心以及下一代AI和高性能计算系统 [1][3] - 该性能水平进一步提升了AI模型训练和推理所需的数据吞吐能力,被认为是支撑万亿参数模型与AI数据中心扩张的关键基础设施 [2] 市场竞争格局 - 三星此次发布加剧了其与SK海力士等厂商在HBM市场的竞争 [1]
英伟达发布DLSS 5,黄仁勋高呼图形学的GPT时刻来了
华尔街见闻· 2026-03-17 02:52
文章核心观点 - 英伟达在GTC开发者大会上正式发布DLSS 5,公司将其定位为自2018年实时光线追踪以来在计算机图形学领域的“最重大突破” [1] - 该技术旨在通过实时神经渲染模型,在游戏中实现接近好莱坞视觉效果的“电影级”可交互画面 [1] - 公司创始人兼CEO黄仁勋将DLSS 5比作“图形学的 GPT 时刻”,强调生成式AI在视觉表达与艺术可控性之间达成的新平衡 [1] 技术细节与演进路径 - DLSS技术从最初的超采样/AI上采样,演进至帧生成,现已发展到将“材质与光照”也纳入AI学习对象的阶段 [3] - DLSS 4.5已能生成大量像素并实现多倍帧生成(Dynamic Multi Frame Generation) [3] - DLSS 5在此基础上,将神经网络训练为理解场景语义与复杂光材质交互,从而输出具备次表面散射、纤维反射等细腻表现的像素 [3] - 该技术可在实时4K下运行,能理解场景语义(如人物、头发、皮肤次表面散射、布料光泽等)并把“物理感”注入每一帧 [1] - 对玩家而言,在相同或接近的渲染资源下,画面细节和真实感将跃升;对开发者而言,这是新的美术与性能优化工具链 [3] 技术特性与优势 - DLSS 5采用一个端到端训练的AI模型,基于每帧的颜色与运动向量输入,生成带有光照与材质交互的像素结果 [5] - 目标是在实时交互条件下,接近离线影视级渲染的视觉效果 [5] - 系统强调“可控且确定性强”,为游戏艺术家提供强度、色彩分级与局部蒙版等参数,确保画面改动在艺术设定范围内,与通用视频生成模型不同 [5] - DLSS 5会集成到现有的Streamline框架,与DLSS、英伟达Reflex等共用,以降低开发者的适配成本 [3] - 该技术支持在现有RTX平台上运行,但高质量表现更依赖于高端GPU的算力与带宽 [3] 商业化进程与行业支持 - DLSS 5将于今年秋季面向主流游戏推出 [1] - 已获得包括Bethesda、CAPCOM、网易、腾讯、育碧等大型厂商的支持 [1] - 公司通告中列出多款支持或计划支持的作品,如“Starfield”、“Resident Evil Requiem”、“Assassin‘s Creed Shadows”、“Hogwarts Legacy”等 [5] - 包括大型一线厂商在内的合作伙伴已参与或测试集成 [5]
英伟达发布NVIDIA DLSS 5
华尔街见闻· 2026-03-17 02:34
公司技术突破 - NVIDIA推出DLSS 5,引入全新的实时神经渲染模型,能为每一个像素注入具有照片级真实感的光照和材质属性 [1] - 该技术被公司创始人兼首席执行官黄仁勋称为“图形学领域的GPT时刻”,将手工渲染与生成式AI完美融合 [1] - 这是自2018年实时光线追踪技术首秀以来,公司在计算机图形领域取得的最具深远意义的突破 [1] 行业意义与影响 - DLSS 5被定位为自NVIDIA发明可编程着色器25年后的又一次重塑计算机图形学的重大创新 [1] - 该技术在实现视觉真实感大幅飞跃的同时,保留了艺术家进行创意表达所需的控制力 [1]
英伟达股价沉寂数月,今夜开幕的GTC能否力挽狂澜?
华尔街见闻· 2026-03-16 18:00
公司当前股价与估值状况 - 公司股价年内表现平平,市场疑虑尚未消散,但多数分析师看好其基本面 [1] - 公司目前以下一财年预期盈利的17倍交易,低于标普500指数的整体估值水平 [2] - 覆盖公司的70位分析师中,93%给出买入评级,平均目标价约为267美元 [2] - 公司本财年(截至2027年1月)自由现金流有望较上年增长85%,达到逾1780亿美元,若兑现将刷新全球企业自由现金流的历史纪录 [2] - 预计下一财年自由现金流将进一步升至2330亿美元,但当前预测区间的高低端相差达980亿美元,反映出市场对未来盈利的不确定性相当大 [2] GTC大会的核心关注点 - 年度GTC大会为公司提供了重新点燃投资者信心的最佳窗口 [1] - 投资者最关心公司对推理芯片的战略布局、芯片路线图的最新规划,以及晶圆、内存与光学器件的供应前景 [1] - 大会最值得关注的是公司战略重心从训练向推理的变化以及其供应链布局的调整 [3] - 预计公司将展示新一代产品阵列,核心看点包括整合Groq技术的语言处理单元(LPU)机架系统、新一代高速交换机及共封装光学(CPO)方案 [3] - 存在与英特尔联合推出定制x86处理器的可能性 [3] - 外界预计公司将详细阐述如何将LPU整合进其芯片组合,以全面覆盖训练、预填充与解码三大应用场景 [4] 公司在AI推理市场的战略布局 - 公司去年斥资约200亿美元购入私有公司Groq的语言处理单元(LPU)技术及相关人才,以补齐在推理解码场景的短板 [4] - Groq专注于为推理解码场景设计专用芯片,公司此举旨在抵御超大规模云厂商自研芯片的竞争压力 [4] - 公司或宣布借助整合Groq技术大举切入AI推理市场 [3] - 在代工端,公司或首度引入三星以打破台积电的垄断 [3] - OpenAI有望成为公司推理芯片的首批大客户 [3] AI基础设施资本开支与行业前景 - 公司的业绩前景在很大程度上依赖于亚马逊、微软等超大规模云厂商对AI基础设施投资的持续加码 [5] - 以亚马逊为例,其资本支出今年预计将从每年500亿至600亿美元的区间跃升至1900亿美元,增量几乎全部指向AI基础设施建设,其中包括大量公司芯片采购 [5] - 巴克莱银行预测,AI领域的行业整体资本支出将于2028年达到约1万亿美元的峰值,此后将“温和回落” [5] - 该行同时认为,市场对超大规模云厂商2028年资本支出的一致预期被低估了约3000亿美元 [5] 市场对公司GTC大会的预期与分歧 - 美银认为,市场对超大规模云厂商资本支出可持续性的疑虑,叠加地缘政治不确定性,是公司估值持续承压的核心原因 [1][6] - 美银认为,GTC上即便是与一致预期大体吻合的销售展望,只要附带具体的供需可见性细节,亦足以支撑股价出现阶段性修复 [1][6] - 瑞银指出,要依靠此次大会的言论触发“改变投资逻辑”式的股价飙升,“难以预见” [1][6] - 瑞银承认,公司亮眼的盈利预期与其折价估值之间的反差,处于一种“看似难以为继”的状态 [1][6] - 市场在等待一个足以打消疑虑、重塑预期的明确信号,GTC大会的演讲是近期最重要的一次机会 [6]
英伟达GTC大会前瞻:整合Groq技术大举进攻推理芯片,三星首度代工生产,OpenAI或成首批客户
华尔街见闻· 2026-03-16 09:07
英伟达GTC大会核心观点 - 英伟达年度GTC开发者大会被视为AI产业重要风向标,本届大会将释放公司战略重心从训练向推理转变、供应链调整及扩展应用生态三大关键信号 [1] 战略重心转向AI推理市场 - AI产业正从“训练优先”转向“推理驱动”,英伟达在训练领域优势稳固,但在推理市场面临Cerebras等竞争者以更高速度、更低成本方案的挑战 [2] - 公司预计将宣布融合英伟达与Groq技术的新型芯片系统,以切入AI推理市场,该系统是英伟达首次将另一家公司的AI处理器(Groq LPU)直接整合进其服务器机架体系 [2] - 为获得Groq的LPU技术,英伟达在去年底斥资约200亿美元 [2] 供应链布局调整 - 新的Groq LPU芯片预计将在2024年下半年由三星代工生产,这可能是英伟达服务器芯片首次由台积电以外的代工厂制造 [3] - 这一供应链变化或为阶段性安排,由于下一代LPU需与未来AI芯片更紧密整合,后续生产仍可能回归台积电 [3] - 在需求端,OpenAI预计将成为该新系统的首批客户之一,芯片系统可能用于驱动AI代理执行编码等任务 [3] 技术架构与整合路线 - 新系统架构与现有系统明显不同,每个机架将搭载256颗Groq芯片,并由Intel处理器负责通信管理,显示现有架构尚未与LPU完全融合 [4] - 公司有长远整合计划,内部正在探索将LPU更深层整合进未来产品路线图,其中一个方案是将Groq处理器与下一代Feynman GPU融合为单芯片,以提升性能并降低成本 [4] AI应用与生态扩展 - 随着“AI摩尔定律”(算力效率约每四个月翻倍)持续推进,公司在机器人和物理AI领域的布局备受关注,尤其是在中国人形机器人产业加速发展的背景下 [6] - 公司在开源模型领域快速推进,已发布1200亿参数的Nemotron 3 Super模型,并表示将推出参数规模扩大四倍的Nemotron 4 Ultra [6] - 模型能力的提升有望进一步降低企业AI推理成本,并改善整体投资回报率 [6] - 本届GTC释放的信号或将在很大程度上影响2026年AI产业格局 [6]
天风郭明錤:英伟达下一代Rubin平台启动新材测试,PCB升级周期将至
华尔街见闻· 2026-03-13 15:28
英伟达M10 CCL材料测试与供应链动态 - 英伟达新一代AI服务器平台的供应链布局正在加速推进,新一轮PCB材料升级周期的轮廓逐渐清晰 [1] - 英伟达已与PCB厂商就下一代覆铜板(CCL)材料M10启动测试,目标应用涵盖Rubin Ultra及Feynman平台的正交背板与交换刀片主板 [1] - 若测试进展顺利,M10 CCL及PCB有望于2027年下半年进入量产阶段,届时将开启新一轮AI服务器PCB材料的规模化采购周期 [1][3] M10测试进展与应用场景 - 英伟达与沪电股份已正式开启M10 CCL材料的测试工作,采样工作于2026年第一季度启动,初步测试结果预计于2026年第二季度出炉 [2] - M10的目标应用场景主要包括两类:一是专为取代现有插槽式架构而设计的正交背板(中平面),二是面向Rubin Ultra及Feynman平台的交换刀片主板 [2] - 上述应用处于英伟达下一代AI服务器架构的核心位置,对PCB材料的性能要求较现有方案大幅提升 [2] - 测试进展表明沪电股份在Kyber机架及Rubin Ultra、Feynman平台的PCB开发中已取得领先地位 [2] 供应链格局变化与影响 - M10测试在供应商结构上出现显著变化,上一代M9材料测试中仅有台光电一家CCL供应商通过认证,而M10阶段测试范围已扩展至三家供应商(包括台光电和两家新增的中国厂商) [1][3] - 供应商多元化的引入,意味着英伟达在高端CCL采购端的议价能力和供应链韧性均有望得到改善,同时也为相关供应商之间创造了更为直接的竞争态势 [3] - 从材料技术演进看,M10所采用的石英布存在被Low Dk-2玻璃纤维替代的可能性,该变化或对材料成本结构及供应商资质产生进一步影响 [3]
理想汽车第四季度营收287.8亿元人民币,同比下降35%,预估288.4亿元人民币。调整后每ADS收益0.25元人民币,上年同期3.79元人民币
华尔街见闻· 2026-03-12 16:32
公司第四季度财务表现 - 第四季度营收为287.8亿元人民币,低于市场预估的288.4亿元人民币 [1] - 第四季度营收同比大幅下降35% [1] - 第四季度调整后每ADS收益为0.25元人民币,远低于上年同期的3.79元人民币 [1]
英伟达豪掷260亿美元下场造AI模型,直接叫板OpenAI
华尔街见闻· 2026-03-12 16:02
公司战略转型 - 英伟达宣布未来五年将斥资260亿美元开发开源AI大模型,标志着公司从硬件与软件栈供应商向全栈AI企业转型,直接挑战OpenAI、Anthropic与DeepSeek等前沿模型实验室的市场地位 [1] - 此次巨额投资已获公司管理层确认,是公司战略重心的深刻转变 [1] - 公司未来的AI模型将服务于芯片研发,并用于优化超算级数据中心的整体架构,以构建硬件架构路线图 [4] 新产品发布与性能 - 英伟达发布迄今最强开源模型Nemotron 3 Super,拥有1280亿参数,规模与OpenAI GPT-OSS最大版本大体相当 [2] - 在人工智能指数综合评分中,Nemotron 3 Super获得37分,而GPT-OSS为33分,尽管部分中国模型得分更高 [2] - 在专门评估模型对OpenClaw控制能力的新型基准测试PinchBench中,Nemotron 3 Super位列第一 [2] - 公司公开了训练该模型所采用的多项创新方法,涵盖提升推理能力、长上下文处理能力及强化学习响应能力的架构与训练技巧 [2] - 公司近期已完成一个5500亿参数模型的预训练工作 [2] 技术生态与商业逻辑 - 英伟达的开源模型专门针对自家硬件进行优化,有助于进一步巩固其在AI算力市场的主导地位 [1] - 开源策略通过公开模型权重及技术细节,方便初创公司和研究人员在其技术基础上修改创新,有助于形成围绕英伟达硬件生态的开发者网络,强化其芯片的市场黏性 [4] - 公司高管表示,帮助生态系统发展符合公司的利益 [5] - 自2023年11月发布首个Nemotron模型以来,公司已陆续推出面向机器人、气候建模及蛋白质折叠等垂直领域的专用模型 [2] 行业评价与影响 - 行业研究人士高度评价英伟达此次布局,认为这是其对开放性信念的一次史无前例的表态 [6] - 有行业研究员称英伟达处于众多开放与封闭AI项目的前沿交汇点,并呼吁美国政府也为开源模型提供资金支持 [6] - 此举对市场影响不容低估,英伟达的芯片是训练大型AI模型的行业标准,其战略将直接挑战现有顶级AI实验室 [1]
巴西糖业巨头Raízen启动126亿美元债务重组,法国巴黎银行持债8亿美元居首
华尔街见闻· 2026-03-12 07:55
债务重组进程与方案 - 巴西糖业和乙醇生产商Raízen已同意启动庭外债务重组程序 涉及约650亿雷亚尔(约合126亿美元)债务 并暂停还款 给予自身90天时间争取债权人支持更全面的重组方案 [2] - 此次重组方案可能涉及股东追加资本注入 部分债务转股权 或出售资产等多种选项 [2] 主要债权人及债权敞口 - 法国巴黎银行为已知单一银行债权人中敞口最大者 所持债权约达42亿雷亚尔(约合8.1亿美元) [3] - 巴西布拉德斯科银行 西班牙桑坦德银行 荷兰合作银行和日本三井住友银行 各自持有约20亿雷亚尔的债权 伊塔乌联合银行控股公司的敞口则超过10亿雷亚尔 [3] - 证券化公司True Securitizadora跻身最大债权人之列 所持债权约为64亿雷亚尔 [4] - 受托银行纽约梅隆银行在文件中被列为等值约260亿雷亚尔的债权人 但该数字通常反映其作为受托人代表债券持有人所管理的资产规模 [4] 公司财务困境成因 - 高利率环境 连续歉收以及尚未产生回报的大规模前期投资 共同侵蚀了公司的偿债能力 [6] - 公司美元计价债券价格已跌至通常预示企业陷入困境的水平 信用评级亦被大幅下调至垃圾级深处 [6] - 市场对公司债务规模的忧虑持续升温 围绕主要股东施以援手的谈判久拖未决 进一步加剧了投资者对该公司前景的担忧 [7]