Workflow
NemoClaw软件栈
icon
搜索文档
黄仁勋100分钟交流会,信息量巨大
第一财经· 2026-03-18 12:13
英伟达的增长前景与收入预期 - 公司CEO黄仁勋将Blackwell和Rubin芯片在2025年至2027年的预期收入从5000亿美元大幅上调至1万亿美元,该预测仅包含芯片收入,不包含CPU、Groq、存储系统等其他多元业务收入[7] - 公司上一季度获得了史上最多的订单,且增长仍在加速,驱动因素是计算机使用方式改变带来大量的token(词元)需求,AI推理制造token的过程才刚刚开始[7] - 为应对计算需求增长,公司正重新发明存储系统以大幅提高性能,并在数据中心应用LPDDR5等技术,下一代产品将使用LPDDR6,同时与三星等内存供应商合作以保证供应[8] 业务多元化与市场拓展 - 公司业务远不止芯片,其数据中心业务平台(如Rubin架构)包含7颗芯片,并集成了Groq 3 LPU,在网络方面推出了NVL72、ConnectX-9 SuperNIC等新产品[10] - 公司正针对AI推理等新市场需求做出反应,2025年将向AI推理投资大量资源,通过引入NVLink72等技术,实现了性能提升35倍、成本降至原来1/5的效果[10] - 公司收入来源多元化,约40%收入来自物理AI等多元业务(如自动驾驶、机器人),约60%收入来自云厂商,但强调云厂商的很多业务是由公司产品带来的[11] - 公司通过投资等方式与AI厂商深化关系,旨在投资下一个“谷歌”或“亚马逊”,以帮助生态系统快速扩大规模[12] - 公司计划将50%的自由现金流用于回购以回报投资者,这一比例高于去年,同时强调需要现金支持供应商、合作伙伴及生态投资[13] 自动驾驶与机器人业务发展 - 公司CEO认为自动驾驶汽车的“OpenAI时刻”已经到来,该业务包括用于训练、数据生成与模拟的计算机以及AV系统三台计算机,目前全球许多汽车公司都从英伟达购买其中一台或多台[11] - 在机器人领域,公司CEO预计关节运动、机器人认知等问题将在3年内被解决,类似OpenClaw的系统将在机器人内部运行,整体上非常好的机器人将在不到5年内出现[12] 对AI应用与OpenClaw的展望 - 公司CEO高度看好OpenClaw这类代理式AI产品,认为其作为一个开源代理式AI系统,可以成为一个标准,加速智能体的普及,使每个公司都能由此构建自己的代理式AI策略[15] - 公司针对OpenClaw推出了NemoClaw软件栈,并认为在接下来30到60年里,人们将持续为OpenClaw贡献能力,就像过去为Linux做贡献一样[15] AI对工作与社会的影响 - 公司CEO认为AI不会导致失业,反而会让人们越来越忙碌,因为AI加速了任务完成和反馈速度,他本人感觉比6个月前更忙,公司所有项目都在加速推进[17] - 公司CEO预测,由于AI让任务快速完成(例如30分钟完成过去一个月的工作),人们将一直处于执行关键任务的过程中,忙碌将成为普遍状况[18] - 展望公司未来,预计10年后员工人数将从约4.2万人增至7.5万人,同时将拥有750万个全天候工作的智能体,公司规模将尽可能小但达到必要规模[18] - 对社会而言,AI将改变就业结构,机器人将填补劳动力空白并促进经济增长,同时会创造新的工作岗位来管理机器和帮助智能体成长,总体就业岗位会增加[19]
英伟达塑造“Token经济学”
21世纪经济报道· 2026-03-18 07:10
Vera Rubin平台与芯片发布 - 公司宣布Vera Rubin平台开启Agentic AI新时代,旨在构建全球最大的AI工厂,该平台包含七款已全面投入生产的新芯片[1][14] - 七款芯片包括:NVIDIA Vera CPU(服务器CPU)、NVIDIA Rubin GPU、NVIDIA NVLink 6(第六代交换机芯片)、NVIDIA ConnectX-9 SuperNIC(超级网卡)、NVIDIA BlueField-4 DPU(存储芯片)、NVIDIA Spectrum-6(支持CPO技术的以太网交换机芯片)以及新集成的NVIDIA Groq 3 LPU[1][15] - 这些芯片能够组成五种机架在数据中心运行,标志着公司从单一芯片竞争进入全方位的系统级竞赛阶段[1][16] 技术规格与性能突破 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,Vera CPU(88核自研架构)与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成[4][18] - 采用“去PCIe化”紧耦合设计,单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍[4][18] - 平台为Agentic AI与长上下文推理设计,引入Transformer Engine 3.0等技术,使AI能处理数万个Token的上下文,单机柜NVL72内部互联总带宽达260 TB/s[5][19] - Vera CPU机架集成256个Vera CPU,基于MGX液冷基础设施,其效率是传统CPU的两倍,速度提升50%[5][19] 市场预测与客户进展 - 公司CEO预测,Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍[2][15] - 已确认合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius和Nscale,芯片已全面投产并将于今年下半年供货[6][20] Groq LPU与混合算力战略 - 公司通过200亿美元战略授权并集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽[6][21] - LPU采用确定性流水线架构,消除计算抖动,专为Agentic AI与实时交互设计,能保证毫秒级任务的执行时间恒定,将复杂Agent链条的思考时间从数分钟缩短至数秒[9][22] - 公司构建混合算力帝国:GPU负责万亿参数模型训练与长文本预处理,LPU阵列以10倍于对手的能效比统治实时推理市场,实现训练与推理分离[10][23] 软件、模型与生态系统建设 - 面向OpenClaw社区推出NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装Nemotron模型和OpenShell运行时环境,为AI代理增加安全与隐私控制[11][23] - NemoClaw支持本地与云端模型混合调用,可运行于GeForce RTX设备、RTX PRO工作站及DGX系统,为全天候AI代理提供算力[12][24] - 宣布成立Nemotron联盟,联合全球AI实验室推进开放前沿模型发展,并扩展Nemotron 3系列多模态模型,包括Ultra、Omni和VoiceChat等版本[12][24] - 发布应用于物理世界的新模型,包括面向类人机器人的Isaac GR00T N1.7模型、面向自动驾驶的Alpamayo 1.5模型,以及即将推出的统一世界基础模型Cosmos 3[13][25] 行业趋势与战略定位 - 公司CEO强调“Token”是AI时代的新货币,AI工厂是生成Token的基础设施,公司通过Vera Rubin DSX AI Factory参考设计和Omniverse数字孪生蓝图提供构建最高生产力AI工厂的基础[6][20] - 行业趋势显示,巨头正通过聚集能力、补齐短板、延伸上下游来构建强大壁垒,单一比拼芯片性能的阶段已过去,系统级竞赛正在上演[2][16]
黄仁勋塑造“Token经济学” 英伟达拥抱智能体时代
21世纪经济报道· 2026-03-18 06:29
英伟达GTC大会核心发布 - 公司宣布其最新芯片架构Vera Rubin平台已全面投入生产,该平台包含七款新芯片和五种机架,旨在开启Agentic AI新时代并构建全球最大的AI工厂 [1] - 公司创始人预测,基于Blackwell与Rubin架构的AI芯片,到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍 [2] - 发布会标志着行业竞争从单一芯片性能比拼进入全方位的系统级竞赛阶段 [2] Vera Rubin平台技术革新 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成,是“去PCIe化”的紧耦合设计 [2] - 单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍 [3] - 平台引入Transformer Engine 3.0与Inference Context Memory存储平台,并配备支持硅光子技术的Spectrum-X网络,单机柜NVL72内部互联总带宽达260 TB/s [3] 新芯片产品组合 - 七款新芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以及新集成的NVIDIA Groq 3 LPU [1] - Vera CPU机架集成256个Vera CPU,其效率是传统CPU的两倍,速度提升50% [4] - 与公司合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure等,该产品已全面投产并将于今年下半年供货 [4] Groq LPU推理芯片战略 - 公司通过200亿美元战略授权并深度集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽 [5] - LPU采用确定性流水线架构,旨在实现极低延迟和确定性算力,专为实时交互场景设计,如自动驾驶和高频交易 [6] - LPU与GPU通过NVFusion技术协同,构建混合算力帝国:GPU负责训练,LPU负责高效实时推理,能效比号称可达对手的10倍 [7] AI代理与软件生态进展 - 公司推出面向OpenClaw社区的NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装模型和OpenShell运行时环境,并增强安全与隐私控制 [8] - NemoClaw支持本地模型与云端模型的混合调用,可运行在多种计算平台上,为全天候运行的AI代理提供算力 [9][10] - 公司宣布成立Nemotron联盟,联合全球AI实验室共同推进开放前沿模型发展,并扩展了Nemotron 3系列多模态模型 [10] 物理智能与行业应用扩展 - 公司发布用于机器人和自动驾驶的新模型,包括面向类人机器人的NVIDIA Isaac GR00T N1.7模型和面向自动驾驶的NVIDIA Alpamayo 1.5模型 [11] - 即将推出的NVIDIA Cosmos 3被称为首个统一“世界生成、物理推理和行动仿真”的世界基础模型 [11] - 公司正搭建一个覆盖数字世界与物理世界的AI技术体系,推动人工智能在机器人、自动驾驶等领域的创新与落地 [11]
【太平洋科技-每日观点&资讯】(2026-03-18)
远峰电子· 2026-03-17 22:05
大盘指数与板块表现 - 2026年3月17日,A股主要指数普遍下跌,其中创业板指跌幅最大,为-2.29%,科创50指数下跌-2.23%,深证成指下跌-1.87%,上证指数下跌-0.85%,北证50指数下跌-1.85% [1] - TMT板块领跌市场,SW通信线缆及配套板块跌幅最大,为-7.23%,SW分立器件板块下跌-5.37%,SW通信网络设备及器件板块下跌-5.32% [1] 国内新闻与产业动态 - 光迅科技将在2026年光纤通信博览会上展示全球首款3.2T硅光单模NPO模块,该产品已完成送样测试,送样涵盖完整NPO系统方案,包括光引擎、外置光源模块及光纤管理模组 [1] - 华为发布面向中心推理的AI数据平台与边缘场景FusionCube A1000 AI超融合一体机,平台整合知识库、KV Cache加速等能力,可提升知识检索精度、降低推理时延,边缘一体机实现“开箱即用”,上线周期缩短80% [1] - 京东方正加快在北京和成都布局下一代显示生产线投资,以扩大用于虚拟现实设备的超高分辨率面板以及IT设备OLED面板的产能 [1] - vivo宣布因全球半导体及存储成本持续大幅上涨,将于2026年3月18日起调整vivo及iQOO部分产品的建议零售价 [1] - 追觅芯际穿越公司首个“瑶台”算力基站搭载快舟十一号遥七火箭成功发射,该基站部署在光学遥感卫星中,预期在距地球表面约561千米的轨道开展系统性测试 [4] - 江西大一新材料科技有限公司年产4亿平方米光学功能膜材料项目生产车间进入设备安装调试阶段,项目投产进入倒计时 [4] 海外新闻与供应链动态 - 安森美宣布自2026年4月1日起对旗下部分产品上调价格,调价核心源于成本与需求的双重驱动,其中关键材料均价涨幅超30% [2] - 美光科技宣布其专为英伟达Vera Rubin GPU平台设计的36GB 12-Hi HBM4显存已实现量产,同时宣布了业界首款PCIe 6.0数据中心SSD和全新SOCAMM2模块的量产消息 [2] - 全球MLCC龙头村田制作所发出通知,将于2026年4月1日起针对AI服务器和高端车规级MLCC产品启动全面涨价,涨幅在15%-35%之间 [2] - ASML已联手EUV光刻机核心供应商Prodrive和VDL-ETG,启动混合键合设备的研发,积极布局“超越摩尔”关键赛道 [2] - 英国政府宣布未来四年将在量子计算研究上投入超过10亿英镑(13亿美元),以资助企业在制药、金融服务和能源领域的应用开发,并支持量子导航研究 [4] AI与算力发展 - Manus宣布在桌面端“My Computer”将AI Agent从云端扩展到用户本地电脑,使其能够通过终端命令访问和操作本地文件、应用和开发工具,并可调用本地GPU进行模型训练或推理 [3] - 英伟达推出针对“小龙虾”OpenClaw智能体平台的NemoClaw软件栈,主打“一键安装”体验,用户只需一条指令即可快速部署英伟达Nemotron模型与OpenShell运行环境 [3] - 苹果收购了为Final Cut Pro开发插件、模板及高级功能的公司MotionVFX,预计将把其工具整合进自身服务体系 [3] - Nebius与Meta签署五年长期协议,获得120亿美元专属算力容量,总合同价值270亿美元,此前英伟达已宣布向其投资20亿美元,双方将合作建设数据中心,Nebius计划2026年底运营16个全球站点,签约近3吉瓦电力容量 [3] - 地瓜机器人完成1.2亿美元B1轮融资,资金将用于全栈软硬件研发与产品迭代,专注芯片、算法、软件全链路优化,已在扫地机、无人机、机器狗等领域实现商用落地 [4] GTC 2026大会亮点 - Feynman 1.6nm芯片亮相,综合性能较上一代提升300%,功耗降低40%,预计2028年正式上市,将广泛应用于智能驾驶、生成式AI等多个领域 [7] - Rubin Ultra超级计算平台发布,单柜可集成144颗GPU,算力密度提升50%,每兆瓦推理吞吐量提高35倍,配备全液冷散热系统,将于2026下半年量产,已获得OpenAI、DeepMind等企业订单 [7] - NemoClaw开源平台推出,作为全栈式AI智能体开发工具,涵盖设计、训练、部署全流程,安装仅需两行命令,可无缝接入OpenClaw生态 [7] - Space-1太空计算服务上线,专为太空极端环境设计,其中Vera Rubin太空模块的Rubin GPU能为天基推理提供25倍于H100的AI算力,可实现太空数据在轨实时处理 [7] - 英伟达宣布与Nebius公司合作,投资20亿美元共建5吉瓦级AI云平台,专为代理式人工智能设计,聚焦太空制药、气候模拟等前沿领域 [7][8] 存储与半导体材料价格 - 2026年3月17日国际DRAM颗粒现货价格多数上涨,其中DDR3 4Gb 512M×8 1600/1866涨幅最大,为1.64%,DDR5 16Gb (2G×8) eTT上涨1.42%,DDR5 16G (2G×8) 4800/5600上涨0.42% [5] - 同日,百川盈孚半导体材料价格中,6N高纯镓、7N高纯镓、7N高纯镓粒价格均上涨30元/千克,其他镓系粉体、高纯金属及晶片衬底产品价格保持稳定 [6]
英伟达在GTC大会推出多项AI相关新产品
新华社· 2026-03-17 12:16
英伟达GTC大会发布新产品与技术 - 公司于年度GTC大会上推出多项人工智能相关新产品,包括用于支持OpenClaw智能体开发和部署的软件栈“NemoClaw” [1] - 公司发布新一代AI图形渲染技术DLSS 5,称该技术能进一步提升图像逼真度,同时降低计算资源消耗 [1] - 在硬件方面,公司宣布将推出新一代AI计算平台“薇拉·鲁宾”,预计其每瓦特性能将达到上一代系统的10倍 [1] 新一代芯片与计算系统 - 基于从初创企业格罗克公司获得的技术,公司推出了新一代格罗克3语言处理单元芯片 [1] - 公司展示了可容纳256个LPU的配套机架系统,该系统与“薇拉·鲁宾”平台协同工作,可将每瓦特“词元”生成效率提升约35倍 [1] 自动驾驶领域合作与规划 - 在自动驾驶领域,公司宣布与优步的合作计划,优步计划从2027年开始在洛杉矶和旧金山部署由英伟达自动驾驶软件驱动的自动驾驶出租车车队 [2] - 优步计划到2028年将上述自动驾驶出租车服务扩展到全球28个城市 [2] 行业趋势与需求展望 - 英伟达GPU芯片已成为全球人工智能计算的重要基础设施 [2] - 随着AI应用从聊天机器人向具备自主执行能力的AI智能体扩展,全球对AI计算能力的需求持续快速增长 [2] - 如果企业能够获得更多算力产能,就可以生成更多“词元”,从而提高业务收入 [2]
王炸!英伟达连发7款芯片,黄仁勋演讲刷屏
21世纪经济报道· 2026-03-17 09:53
公司核心动态与市场反应 - 英伟达在年度GTC大会上宣布多项重磅技术突破,公司创始人兼CEO黄仁勋预测新一代AI加速芯片架构等将至少创收1万亿美元 [1] - 黄仁勋演讲后,英伟达股价应声上涨,盘中最高涨4.31%,收盘涨1.65% [2] - 东方财富概念板块显示,A股市场涉及英伟达概念的个股有近60只,合计总市值超2.7万亿元 [3] - 今年以来,英伟达概念股走势分化,近六成个股录得上涨,其中利通电子大涨1.3倍居首 [4] 新一代AI芯片架构与平台:Vera Rubin - 英伟达宣布Vera Rubin(最新芯片架构)目前已有七款新芯片全面投入生产,该平台正在开启Agentic AI新时代,旨在构建全球最大的AI工厂 [6] - Vera Rubin平台是一次代际跃迁,包含七个突破性芯片、五种机架、一台巨型超级计算机,为AI的每一个阶段提供动力 [6] - 黄仁勋预测,Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,相比去年10月的5000亿美元销售预测已经翻倍 [6] - Vera Rubin架构全面转场台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现物理意义上的同封装集成 [11] - 单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,其规模化推理能效较Blackwell提升了5倍 [11] - 在训练大型混合专家模型时,与Blackwell平台相比,Rubin仅需四分之一数量的GPU,并实现每瓦推理吞吐量最高10倍,同时每token成本为十分之一 [12] - 英伟达推出了Vera Rubin DSX AI工厂参考设计,教大家如何设计、建设和运营整个AI工厂基础设施堆栈 [15] - 公司预告了下一代Feynman系统,预计将于2028年发布 [15] 系统级创新与战略转型 - 英伟达的技术路径预览明确,从Hopper、Blackwell、到Rubin、再到Feyman,锁定了至少未来5年的算力交付能力 [7] - 算力的较量已经从单芯片过渡到AI基础设施系统化建设,2026年正式开启了系统级进化的新纪元 [7] - 英伟达正转型为AI基建企业,通过构建从算力到应用的完整体系,试图成为AI时代的基础平台 [8] - 巨头们正在不断聚集能力,补齐短板,延伸上下游,形成更强大的壁垒,单一比拼芯片的阶段已经过去 [9] - 公司越来越关注能耗问题,与能源提供商及超200家数据中心基础设施合作伙伴合作,发布DSX平台 [14] - 新的DSX平台包括DSX Max-Q和DSX Flex软件,旨在在固定电力的数据中心内部署30%更多的AI基础设施,并释放100 gigawatts的闲置电网电力 [14] 推理芯片与混合算力:Groq LPU - 英伟达通过200亿美元战略授权并深度集成了Groq LPU架构,标志着公司将AI竞争从“训练效率”扩展到“推理效率” [18] - 推出的Groq 3 LPX机架包含256个 LPU处理器,具有128GB片上SRAM和640 TB/s的扩展带宽 [18] - 当与Vera Rubin NVL72一起部署时,Rubin GPU和LPU通过共同计算AI模型每一层来提升解码速度 [18] - LPX与Vera Rubin结合,将实现每兆瓦推理吞吐量最高35倍,并为万亿参数模型带来最高10倍的收入机会 [19] - LPU舍弃了HBM,密布高达230MB的片上SRAM,内存带宽升至80 TB/s,达到顶级 Blackwell GPU的十倍 [20] - LPU能够在单批次推理中实现极低的首字延迟,Token生成速度稳定维持在1600 tokens/s以上 [20] - 英伟达将训练和推理分离,构建了一个混合算力帝国,正式宣告了“推理即时化”时代的到来 [21] AI代理、开放模型与生态建设 - 英伟达围绕AI代理、开放模型以及跨行业应用发布了一系列重要进展 [23] - 公司推出面向OpenClaw生态的NemoClaw软件栈,被黄仁勋评价为“个人AI的操作系统” [24] - NemoClaw支持本地模型与云端模型的混合调用,可以运行在多种专用计算平台上 [25] - 英伟达宣布成立Nemotron Coalition,联合全球多家领先AI实验室与模型开发机构,共同推进开放前沿模型的发展 [25] - 联盟的首个项目将由Mistral AI与英伟达联合开发基础模型,该模型将成为NVIDIA Nemotron 4开放模型家族的重要基础 [26] - 英伟达扩展了多条开放模型产品线,包括强化多模态理解能力的NVIDIA Nemotron 3系列模型 [26] - 公司发布用于机器人和自动驾驶系统的多种基础模型,如NVIDIA Isaac GR00T N1.7、NVIDIA Alpamayo 1.5以及即将推出的NVIDIA Cosmos 3 [26]
王炸!英伟达连发7款芯片,黄仁勋演讲刷屏
21世纪经济报道· 2026-03-17 09:44
文章核心观点 - 英伟达在GTC 2026大会上发布了新一代Vera Rubin AI加速芯片架构及平台,标志着AI基础设施从单芯片竞争进入系统级建设的新纪元,公司预测其Blackwell与Rubin芯片到2027年底的收入将达到1万亿美元[1][5] - 公司通过整合CPU、GPU、LPU、DPU及交换机芯片等全系产品,构建从芯片、机架到完整AI工厂的集成系统,旨在成为AI时代的基础平台,并开启“代理型AI”的新时代[4][5][7] - 英伟达的股价在GTC大会主题演讲后应声上涨,盘中最高涨4.31%,收盘涨1.65%[1] 英伟达GTC 2026技术发布总结 新一代Vera Rubin平台与芯片 - 宣布Vera Rubin平台开启“代理型AI”新时代,目前已有七款新芯片全面投入生产,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6、ConnectX-9 SuperNIC以及新集成的NVIDIA Groq 3 LPU[4][5] - Vera Rubin是一次代际跃迁,集成了七个突破性芯片、五种机架,可形成一台强大的AI超级计算机,为AI的每一个阶段提供动力[5] - Rubin架构全面采用台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成,单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops[9] - 与Blackwell平台相比,Rubin在训练大型混合专家模型时仅需四分之一数量的GPU,实现每瓦推理吞吐量最高10倍,同时每token成本为十分之一[10] - 公司推出了Vera Rubin NVL72机架,通过NVLink 6连接72个Rubin GPU和36个Vera CPU,内部互联总带宽达到260 TB/s[9][10] - 推出了基于MGX构建的Vera CPU机架,集成256个Vera CPU,其效率是传统CPU的两倍,速度提升50%[11] - 与英伟达合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius和Nscale,芯片已全面投产并将于2026年下半年供货[11] - 公司预告了下一代Feynman系统,预计将于2028年发布,配备全新的GPU、LPU、名为Rosa的全新CPU、Bluefield 5以及Kyber架构[14] Groq LPU推理芯片与混合算力 - 英伟达通过200亿美元战略授权并深度集成了Groq LPU架构,推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s的扩展带宽[17] - 当LPX与Vera Rubin NVL72一起部署时,通过共同计算AI模型每一层来提升解码速度,实现每兆瓦推理吞吐量最高35倍,并为万亿参数模型带来最高10倍的收入机会[17] - LPU采用确定性流水线架构,密布高达230MB的片上SRAM,内存带宽升至80 TB/s,是顶级Blackwell GPU的十倍,能在单批次推理中实现极低延迟,Token生成速度稳定在1600 tokens/s以上[19] - LPU与GPU构建混合算力帝国:GPU负责后方模型训练,LPU阵列在前方以高能效比与极速响应统治实时推理市场[20] 系统级创新与AI工厂 - AI基础设施的较量已从单芯片过渡到系统级建设,英伟达带来了系统级创新[6] - 公司推出了DSX平台,包括DSX Max-Q和DSX Flex软件,旨在优化能源使用,可在固定电力的数据中心内部署30%更多的AI基础设施,并释放100 gigawatts的闲置电网电力[13] - 推出了Vera Rubin DSX AI工厂参考设计,教客户如何设计、建设和运营整个AI工厂基础设施堆栈[14] - 黄仁勋表示,在AI时代,智能token是新的货币,而AI工厂是生成这些token的基础设施[14] 软件、模型与生态布局 - 推出面向OpenClaw生态的NemoClaw软件栈,提供基础软件能力,支持本地与云端模型混合调用,可运行在多种专用计算平台上[22][23][24] - 成立Nemotron Coalition联盟,联合全球多家领先AI实验室与模型开发机构,共同推进开放前沿模型的发展,创始成员包括Mistral AI、Perplexity等[24] - 联盟的首个项目将由Mistral AI与英伟达联合开发基础模型,该模型将成为NVIDIA Nemotron 4开放模型家族的重要基础[25] - 扩展了多条开放模型产品线,包括强化多模态理解能力的Nemotron 3系列模型,以及用于机器人、自动驾驶系统的多种基础模型,如Isaac GR00T N1.7和Alpamayo 1.5[25] 市场与行业影响 英伟达自身市场表现 - GTC大会主题演讲后,英伟达股价盘中最高涨4.31%,截至收盘涨1.65%,报183.220美元[1][2] - 公司预测Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,相比去年10月的5000亿美元预测已翻倍[5] A股英伟达概念股表现 - 东方财富概念板块显示,当前A股市场涉及英伟达概念的个股有近60只,合计总市值超2.7万亿元[2] - 工业富联总市值遥遥领先,胜宏科技、英维克总市值也超千亿元[2] - 2026年以来,近六成英伟达概念股录得上涨,利通电子大涨1.3倍居首,和林微纳、罗博特科分别上涨86.82%和62.42%[3]
黄仁勋抛出万亿美元收入预期
第一财经· 2026-03-17 09:21
新芯片平台与产品发布 - 公司推出全新的Rubin芯片平台,该平台包含7颗芯片(包括首次亮相的Groq 3 LPU)和5个机架,共同构成一台AI超级计算机[5][6] - Groq 3 LPU芯片正在由三星全力生产,计划于今年下半年发货[6] - 平台中的Vera CPU是全球首款专为智能体AI和强化学习打造的处理器,效率是传统机架级CPU的两倍,计划部署于阿里巴巴、字节跳动、Cloudflare等云服务提供商[6] - 采用共封装光学器件的Spectrum-X以太网交换机正在全力生产,其相比传统可插拔光学器件,光功率效率提高5倍,容错能力提高10倍[9] - 集成72个Rubin GPU和36个Vera CPU的Vera Rubin NVL72系统,训练大型混合专家模型所需GPU数量是Blackwell平台的1/4,每瓦推理吞吐量提高10倍,每token成本降低至1/10[9] - 公司已建立供应链,每周可生产数千个Rubin系统,用于吉瓦级数据中心[9] - 公司展示了Rubin之后的下一代架构Rubin Ultra,其新机架将通过新的NVLink连接144个GPU[9] 财务预测与市场机遇 - 公司CEO预测,来自Blackwell和Rubin两大芯片平台的收入,在2025年至2027年间将达到1万亿美元,较一年前对2025-2026年的5000亿美元预测翻倍[10] - 公司收入构成中,60%来自超大规模云服务商,40%来自广泛的AI需求,包括区域云、企业云、工业AI、机器人、边缘AI等[10] - 过去两年,AI工作负载所需的计算需求增加了1万倍[13] - 2024年,AI原生初创企业吸引了约1500亿美元的投资,创下历史记录,投资规模已从数百万美元增长至数亿甚至数十亿美元[13] 战略定位与业务生态 - 公司强调其通过协同设计与垂直整合,实现了全球最低的每token成本,并认为未来每家计算机公司和云厂商都会考虑token生产效率[12] - 公司业务覆盖自动驾驶、金融服务、健康与生命科学、工业、娱乐、量子计算、机器人和电信等多个领域,拥有庞大的上下游生态系统[12] - 在汽车领域,公司宣布新增比亚迪、吉利、五十铃和日产四个客户,共同开发基于DRIVE Hyperion平台的L4级别车辆,并与Uber合作将Robotaxi接入其网络[14] - 公司认为自动驾驶汽车的“OpenAI时刻”已经到来,未来Robotaxi的数量将非常庞大[14] 软件、模型与新兴领域布局 - 公司推出开源模型Nemotron 3系列,并与Cursor、LangChain、Mistral AI等成立Nemotron联盟,共同开发开放式前沿基础模型[15] - 在机器人领域,公司推出Isaac仿真框架、Cosmos和Isaac GROOT等新开源模型,其中Cosmos 3是首个统一合成世界生成、物理AI推理和动作模拟的世界基础模型[15] - 在自动驾驶领域,公司推出用于增强推理能力的视觉动作语言模型Alpamayo 1.5[15] - 在医疗领域,公司推出了用于蛋白质结合剂设计的生成模型Protein-Complexa等基础模型和数据集[15] - 针对智能体应用,公司推出集成Nemotron模型和OpenShell运行环境的NemoClaw软件栈,以提供开放模型和隔离沙箱[15] - 在太空计算领域,公司发布Vera Rubin太空模块,其上的Rubin GPU能为天基推理提供比H100高25倍的AI算力[14]