物理AI
搜索文档
黄仁勋GTC完整演讲:生成Token的成本与效率,决定科技企业的营收与生死
虎嗅APP· 2026-03-17 22:03
英伟达的战略定位与产业愿景 - 公司正从芯片制造商转型为AI时代的“发电商”,通过全面掌控能源、芯片、基础设施、模型、应用这五层蛋糕,构建统治下一个时代的AI工厂 [2] - AI时代正从单纯的数字生成时代,深化为物理AI大爆炸以及代理式AI全面普及的时代,AI将拥有在三维物理世界中行动与交互的实体能力 [2] - 公司致力于打造全球每Token成本最低的计算方案,因为Token是AI时代新的基础货币,其生成成本与效率直接决定了科技企业的营收 [3] 市场规模与算力需求 - 到2027年,全球计算需求将突破1万亿美元大关 [3] - 过去两年计算需求增长了10000倍,使用量可能增长了100倍,公司相信计算需求在过去两年里增长了一百万倍 [32] - 到2026年,Blackwell和Rubin架构的采购订单总额将达到5000亿美元,而到2027年这一数字将至少达到1万亿美元 [32] 下一代计算架构与平台 - 下一代Vera CPU + Rubin GPU架构专为AI代理系统打造,能在一个系统中连接多达144个GPU,并实现硬件与软件的彻底垂直整合 [5] - 新架构结合液冷技术和封装光学器件,预期能为企业带来高达5倍的营收产出比 [5] - Vera Rubin平台提供3.6 Exaflops算力和每秒260 Terabytes的全对全带宽,算力在10年内提升了4000万倍 [43] - Vera Rubin系统已实现100%液冷,安装时间从两天缩短至两小时,并使用45度温冷却以降低散热成本 [44] 软件生态与CUDA护城河 - CUDA生态诞生20周年,已在全球累积数亿GPU的装机量,渗透进每一个技术生态 [6][12] - 庞大的CUDA装机量是推动飞轮效应的核心动力,吸引了开发者并催生了新市场 [12] - 公司发布了用于结构化数据处理的cuDF和用于非结构化AI数据的cuVS两个基础库 [16] - 公司正在研发下一代图形技术DLSS 5.0,这是3D图形与人工智能(神经渲染)的融合 [15] 代理式AI与操作系统 - 公司推出了NemoClaw参考堆栈,相当于为代理式计算机打造了一个专用的操作系统底座,让开发者能快速构建、部署和加速个性化AI Agent [7] - OpenClaw成为人类历史上最受欢迎的开源项目,它是一个超级连接器和全局化的智能体系统,本质上是一个操作系统 [69][71] - 公司宣布全力支持OpenClaw生态,并推出了具备企业级安全和隐私保护能力的NemoClaw参考实现 [69][74] 物理AI与机器人技术 - 公司强调物理AI的概念,AI必须学会理解重力、摩擦力以及复杂的三维物理空间 [8] - 在自动驾驶领域,比亚迪、现代、日产等头部车企已加入公司的Robotaxi就绪平台 [8] - 公司发布了专为人形机器人打造的通用基础模型Project GR00T,并大幅更新了Isaac机器人平台 [8] - 自动驾驶汽车的ChatGPT时刻已经到来,公司自动驾驶出租车平台新增四位合作伙伴,其年产量达1800万辆 [80] 垂直整合与横向开放 - 公司是一家垂直整合但同时横向开放的公司,深入理解各垂直行业和领域,并开发相应的库 [26][27] - 通过将软件、库和技术与合作伙伴的技术结合,集成到任何目标平台,将加速计算带给世界上的每一个人 [27] - 公司拥有触达各大垂直领域的领域特定库,例如金融服务、医疗保健、工业、量子计算等 [27][28] 推理之年与Token经济学 - 2025年是公司的推理之年,致力于在AI的每一个阶段都表现出色 [35] - 公司60%的业务来自前五大超大规模云服务商,另外40%的业务遍布区域云、主权云、企业、工业等领域 [35][36] - Token正在成为一种新的大宗商品,市场将出现细分,从免费层级到每百万Token收费150美元的高级模型服务 [45][46] - 在给定的功率下,AI工厂的吞吐量和Token生成速度将直接决定明年的收入 [44] 收购与架构整合 - 公司收购了Groq芯片研发团队并获得技术授权,以打破同时兼顾高吞吐量与极低延迟的物理瓶颈 [52] - 通过名为Dynamo的软件实现解耦推理,将高吞吐量计算任务交给Vera Rubin,将解码生成等负载卸载给Groq [54] - 整合Groq技术的新一代Vera Rubin系统实现了高达35倍的性能飞跃 [55] 产品路线图与未来架构 - 公司正以每年一次的极速节奏推进架构迭代,从芯片公司蜕变为提供AI工厂和基础设施的系统级公司 [64] - 下一代Rubin Ultra芯片正在流片中,将首发搭载革命性的NVFP4计算架构 [61] - 之后将迎来代号为Feynman的全新一代架构,拥有全面革新的GPU和由公司与Grok团队打造的全新LPU——LP40芯片 [62] AI工厂设计与运营 - 公司打造了Omniverse及其延伸的DSX平台,这是一个用于联合设计吉瓦级超级AI工厂的数字孪生平台 [64] - DSX平台能直接与现实世界的电网连接,动态统筹调度数据中心功耗以节约能源,并引入Max-Q技术进行动态负载均衡 [64] - 公司计划在太空中建设数据中心,正研发名为Vera Rubin Space One的新型计算机 [66] 开放模型与主权AI - 公司处于每一个AI模型领域的最前沿,拥有涵盖语言、视觉、生物学、物理学等领域的近三百万个开放模型 [74][75] - 公司宣布成立Nemotron联盟,致力于开发更出色的基础模型,以帮助每个国家建立其主权AI [76] - 公司的开放模型为研究人员和开发人员提供了构建其专业领域AI的基础,模型在多个领域位列排行榜第一 [75][76]
GTC2026黄仁勋主题演讲点评:CPO/液冷/LPU重构算力底座,英伟达定义下一阶段算力范式
中银国际· 2026-03-17 21:18
报告行业投资评级 - 强于大市 [1] 报告的核心观点 - 英伟达在GTC 2026上发布的技术路线演进,特别是CPO(共封装光学)、液冷和LPU(大容量SRAM集成)的应用,将重构AI算力底座,定义下一阶段算力范式 [1] - 智能体AI(Agentic AI)和物理AI将成为未来AI的重要增长点 [1][5] - 随着AI发展重心向推理端性能和收益表现聚焦,CPO、液冷、LPU三大技术将共同重构AI算力基建基石 [5] 根据相关目录分别进行总结 英伟达GTC 2026技术发布与展望 - 英伟达发布Rubin至Feynman的技术路线演进图,其中最大变化是CPO和液冷技术的应用,并同步引入集成大容量SRAM的LPU以增强推理性能 [1] - 英伟达发布旗舰计算平台Vera Rubin,集成7种芯片和5种机架,包括Rubin GPU、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU、NVLink 6 Switch、Spectrum-X 102.4T CPO、Groq 3 LPU [5] - Rubin架构下的Oberon系统支持铜缆和光学纵向拓展 [5] - 英伟达预计Feynman计算平台将在2028年发布,有望集成Feynman GPU(定制HBM)、LP40 NVLink、Rosa CPU、Bluefield-5 DPU、NVLink 8 CPO、Spectrum7 204T CPO、ConnectX-10 SuperNIC [5] - Feynman架构下的Kyber系统将同时支持铜缆和共封装光学的纵向拓展 [5] - 英伟达推出的Groq 3 LPU单颗将集成500MB SRAM,可提供150TB/s的带宽,为推理应用带来显著的性能提升 [5] - 英伟达Vera Rubin另一大重要变化是100%采用液冷解决方案,互联不再依赖外部线缆,而是在液冷模块内部做板级/背板式集成互联 [5] - 黄仁勋透露,英伟达正在和合作伙伴积极开发应用于太空数据中心的计算机Space One [5] - 展望2027年,英伟达预计营收至少达到1万亿美元 [5] AI未来增长点与架构 - 黄仁勋提出AI的“五层架构”,即能源、芯片、基建、模型、应用 [5] - 在生成式AI时代,数据中心(算力节点)将成为生成AI推理Tokens的“工厂”,而企业软件将转向具备“长上下文推理”能力的“智能体AI(Agentic AI)” [5] - 英伟达推出开源智能体基础设施NemoClaw和开源模型Nemotron 3 Super,以支持Agentic AI行业的发展 [5] - 物理AI有望成为AI的下一个重要增长点,数字工厂、人形机器人、自动驾驶对算力的需求都在快速增长 [5] 投资建议与关注方向 - 建议关注CPO芯片及封装相关公司:天孚通信、中际旭创、晶方科技、长电科技、环旭电子 [3] - 建议关注光纤相关公司:长飞光纤、亨通光电、中天科技 [3] - 建议关注PCB及材料相关公司:深南电路、沪电股份、鹏鼎控股、胜宏科技、生益科技、菲利华、国际复材、中材科技、宏和科技 [3] - 建议关注服务器组装相关公司:工业富联 [3] - 建议关注电源和散热相关公司:英维克、麦格米特、领益智造、飞龙股份、中富电路、顺络电子、铂科新材、江海股份、海星股份 [3] - 建议关注高速铜缆相关公司:兆龙互连、沃尔核材 [3]
黄仁勋再预言:AI结合实体经济,市场90万亿美元
经济观察报· 2026-03-17 18:43
文章核心观点 - AI发展正从处理语言符号的“符号空间”突破,迈向能够理解并与物理世界交互的“物理AI”或“世界模型”阶段 这一转变被认为是AI发展的下一个浪潮 将重塑庞大的制造业、汽车与交通等行业 并创造巨大的经济价值 [2][3][4] - 智能体AI的实用性和算力需求已迎来爆发拐点 而下一波技术浪潮是面向真实世界的“实体AI” 其核心是让AI理解自然法则和物理规律 如重力、摩擦、惯性、因果等 [2][3][4] - 人工智能与物理世界的结合 即“信息和现实世界结合的产业” 被预估为一个价值90万亿美元的庞大产业 [1][13] AI发展阶段的演进与行业布局 - 2026年 AI跨越重要门槛 模型性能显著提升 推理能力增强 幻觉减少 落地应用能力大幅提升 基于AI构建的应用首次开创真实的经济价值 [2] - 智能体AI已迎来发展拐点 其实用性在全球企业中得到广泛验证 由此带来的算力需求呈爆发式增长 [2] - 下一阶段是“实体AI” 即将AI和智能体系统应用于制造业、机器人等物理领域 这将带来巨大的发展机遇 [3] - 不止英伟达 硅谷围绕世界AI的布局动作频频 例如Google DeepMind的Genie3可生成可交互三维环境 并被Waymo改造为自动驾驶仿真工具 [5] - 图灵奖得主Yann LeCun离开Meta后创立AMI Labs 并于2026年3月完成10.3亿美元种子融资 投前估值达35亿美元 成为欧洲有史以来最大的种子轮融资 其判断大语言模型无法真正理解物理世界 新公司押注JEPA架构 [5][6] - “AI教母”李飞飞的World Labs在2026年2月完成新一轮10亿美元融资 估值逼近50亿美元 其首款产品Marble专注于生成物理规律正确的三维世界 [6] 物理AI/世界模型的技术内涵与价值 - 物理AI被定义为“能够理解自然法则的AI” 其核心是让AI不再只处理语言符号 而是真正理解并与物理世界交互 [4] - 现实世界具有恒常性、因果关系以及摩擦力、重力、惯性等物理规律 过去的AI对此几乎一无所知 物理AI正是为填补这一鸿沟而生 [4] - 理解真实世界的AI将通过自动驾驶与机器人 重塑庞大的汽车、交通与制造业 [4] - 物理AI的意义不亚于当年互联网将信息流通成本压至接近零 那场革命重塑了信息的生产与分配 而这场革命重塑的则是物理世界本身的设计与运转方式 [13] - 当AI扎根于科学、物理学及经过验证的工业知识时 它将成为人类智慧的倍增器 [14] 工业制造领域的应用与合作 - 2026年2月 英伟达与法国工业软件巨头达索系统宣布达成长期战略合作伙伴关系 共同为各行业关键业务场景搭建共享工业的AI架构 这被称为“25年来规模最大”的战略合作 [3][9] - 达索系统旗下的SOLIDWORKS、CATIA是工业领域主流设计软件 其3DEXPERIENCE平台服务超过4500万用户和40万家客户 [3][9] - 合作核心目标是构建“工业世界模型”——经过科学验证、扎根于物理学的AI系统 可作为生物学、材料科学、工程和制造领域的关键任务平台 [9] - 达索系统的核心优势在于工业“硬知识”已沉淀在其软件中 而许多大语言模型公司不具备这些专业知识 [10] - 通过AI协助 可以在数字世界中以极低成本完成大量平行迭代 替代需要反复制作物理原型的测试 从而更有效、更快速地完成产品开发 [11] - 达索系统通过旗下云品牌OUTSCALE 在全球三大洲基于英伟达最新AI基础设施部署“AI工厂” 旨在为平台上的AI模型提供增强功能 同时确保客户数据隐私与主权 [9] 虚拟孪生与制造业变革 - 虚拟孪生技术用数字模型精确映射物理系统 让工程师在虚拟世界中测试、迭代 达索系统在此方向已耕耘多年 [12] - 该技术大规模落地的根本瓶颈是算力 足够真实复杂的物理仿真需要远超以往的计算能力 如今这个瓶颈正在被打破 [12] - 与英伟达的合作 使达索系统高度真实的虚拟孪生模型能够在大规模、高精度和接近实时的条件下运行 并被AI直接使用 从而让虚拟孪生从工程工具升级为可持续运行的系统级能力 [11] - 黄仁勋表示 过去工业化企业三分之一的时间在设计和数字化上 更多时间花在构建物理形态上 未来可以将100%的时间花在数字化上 从设计到操作“都由软件定义” [12] - 人工智能与机器人的结合能够重塑制造业流程和效率 AI可以在数字世界中模拟由数百万物体组成的工厂集合体 并更合理地安排生产线和组织机器人运作 [13] - AI进入工业的价值在于 通过提升仿真建模效率和机器人智能水平 让占据全球供应链绝大部分的中小企业也能够使用这些前沿技术 从而重塑整个工业的效率 [13]
英伟达再与比亚迪合作!黄仁勋官宣
深圳商报· 2026-03-17 14:38
公司核心产品与技术发布 - 全面量产的Vera Rubin超级AI平台正式登场,这是一个由七款芯片垂直整合而成的超级系统,专为智能体AI设计 [1][2] - Vera Rubin平台相比Hopper架构,在每瓦特Token生成能力上提升35倍,在1GW数据中心内,Token生成速率从每秒200万提升至7亿,增幅达350倍 [2] - 公司通过收购整合Groq团队,推出第三代LPU(Groq LPU 30),其确定性数据流架构和海量SRAM擅长低延迟解码,可与擅长高吞吐量预填充的Rubin GPU形成互补架构 [1][2] - 公司建议,对于高吞吐工作负载可100%使用Vera Rubin,对于高价值、低延迟场景,可在数据中心中配置25%的Groq LPU节点以实现性能与成本最优解 [3] - 公司发布了企业级智能体操作系统NemoClaw,通过内置策略引擎、网络护栏和隐私路由器,确保智能体在企业内部安全运行,并支持企业利用开放模型构建主权AI [1][4] 行业趋势与公司战略观点 - 人工智能行业已跨越“生成式AI”阶段,进入“推理拐点”与“智能体(Agentic)时代” [2] - 未来的软件是为AI智能体设计的,而非人类,每一家SaaS公司都将成为一家AaaS(Agentic as a Service)公司 [4] - 数据中心已转变为“Token工厂”,在功率受限前提下,每瓦特产生的Token数量直接决定收入,公司的系统能效在Token生产成本方面具有优势 [5] - 公司预测2027年营收将达到1万亿美元,并认为计算需求将持续高涨,会出现短缺 [5] 物理AI与产业合作落地 - 在自动驾驶领域,公司宣布与比亚迪、现代、日产、吉利及Uber合作,部署Robotaxi网络 [6] - 在机器人领域,公司与ABB、库卡、迪士尼等合作,利用Isaac Lab、Newton物理引擎和Cosmos世界模型训练人形机器人 [6] - 在太空计算领域,公司发布了Vera Rubin Space One计划,将在轨道上建设数据中心,利用辐射散热技术解决冷却难题 [6] 开源生态与开发者社区 - 近期火爆的开源项目“龙虾”OpenClaw在演讲中被高度评价,其普及速度被称超越Linux,是“智能体计算机的操作系统” [4]
英伟达连发7款芯片;阿里设立Token事业群丨新鲜早科技
21世纪经济报道· 2026-03-17 10:59
英伟达GTC大会发布多项重磅产品与战略 - **核心观点**:英伟达在年度GTC大会上发布多项新产品与战略,宣布其最新Vera Rubin架构已有七款新芯片全面投入生产,并预测算力需求将进入“百万倍增长”阶段,将2027年前算力需求预测从5000亿美元翻倍至1万亿美元 [2] - **算力需求与经济重构**:公司CEO黄仁勋提出“代币工厂”概念,指出未来数据中心将生产智能代币,并要求全球CEO管理“代币产出率” [2] - **新芯片架构与推理加速**:发布下一代Vera Rubin架构,采用全液冷设计及Vera CPU,整合Groq技术,通过Dynamo软件实现“解耦推理”,使吉瓦级工厂代币生成速度提升350倍 [2] - **开源操作系统与软件转型**:推出开源项目OpenClaw,定义为AI时代的Linux,是支持AI智能体自主调用工具、执行代码的操作系统级框架,并推出NeMo Claw参考设计,推动软件产业从SaaS向AaaS转型 [3] - **自动驾驶与物理AI进展**:宣布自动驾驶进入大规模商用阶段,NVIDIA RoboTaxi Ready平台新增比亚迪、现代等合作伙伴,覆盖年1800万辆新车并与Uber达成部署协议,同时展示基于Omniverse的迪士尼机器人 [3] - **下一代架构与太空计算**:披露下一代GPU架构Feynman,将搭载LP 40处理器和Rosa CPU,支持共封装光学技术,并宣布进军太空计算,研发Vera Rubin Space-1计算机,通过Omniverse DSX平台构建“数字孪生”全球及太空设计体系 [3] 阿里巴巴成立新AI事业群 - **核心观点**:阿里巴巴正式成立Alibaba Token Hub(ATH)事业群,建立以“创造Token、输送Token、应用Token”为核心目标的新组织,由公司CEO吴泳铭直接负责 [4] - **组织架构**:新事业群包括通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部 [4] 字节跳动与智谱AI动态 - **字节跳动模型发布暂停**:据市场消息,在与好莱坞主要电影公司和流媒体平台发生版权纠纷后,字节跳动已暂停在全球推出其最新视频生成模型Seedance 2.0 [5] - **智谱AI发布新模型并涨价**:智谱宣布推出面向OpenClaw场景的基座模型GLM-5-Turbo,同时上调新模型API价格20%,系近期第二次涨价,粗略计算2026年第一季度其API价格已涨83% [7] - **智谱股价表现**:受新模型消息影响,公司股价16日开盘涨超13%,截至发稿前涨幅回落至8.77% [7] 哈啰出行与行业监管动态 - **哈啰租电动车平台下架产品**:在315晚会曝光哈啰租赁电动车违规解除限速后,哈啰租电动车平台已下架所有租赁电动车,据知情人士透露内部已启动自查 [6] 机器人及算力领域融资活跃 - **地瓜机器人完成大额融资**:地瓜机器人完成1.2亿美元(约合8亿元人民币)B1轮融资,A轮、B轮两轮融资总额达到2.2亿美元,本轮新进资方数量超过15家,产业方资本包括Synstellation Capital、滴滴、美团龙珠等,多家财务投资方及老股东参与 [8] - **蓝芯算力完成多轮融资**:蓝芯算力宣布连续完成A轮、A+轮及A++轮融资,总金额达数亿元人民币,其自研的全球首创RISC-V+AI融合架构智算服务器CPU已顺利完成芯片点亮并成功启动Linux操作系统 [9] 新产品发布与技术更新 - **智谱发布专有场景模型**:智谱发布首个专为龙虾OpenClaw场景深度优化的通用大模型GLM-5-Turbo,在OpenClaw场景中的表现相比GLM-5提升显著 [10] - **苹果折叠屏iPhone新功能**:据市场消息,苹果首款折叠屏iPhone将搭载iOS 27系统,iPhone历史首次原生支持分屏功能,该功能为iPhone Fold专属,预计2026年9月与iPhone 18系列一同发布 [11]
英伟达发布新平台:每机柜配备256个LPU
财联社· 2026-03-17 09:45
英伟达发布Groq 3 LPU芯片及Vera Rubin平台 - 英伟达在GTC 2026上正式推出全新AI超级计算机平台Vera Rubin,该平台搭载七款芯片,包括Groq 3 LPU、Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU和Spectrum-6以太网交换机 [1] - 公司计划构建包含256个LPU的Groq 3 LPX机架,每个机架提供128GB SRAM(每个LPU集成500MB SRAM)、40 PB/s的推理加速带宽,并通过每个机架640 TB/s的专用扩展接口连接芯片 [1] - Vera Rubin平台由Groq 3 LPX机架与Vera Rubin NVL72、Vera CPU等另外四款机架共同构成,Groq 3 LPX被设计为Vera Rubin的推理加速器,旨在满足智能体系统对低延迟和大上下文的需求 [1] Groq 3 LPU的性能优势与市场预期 - 英伟达表示,LPX与Vera Rubin平台结合后,推理吞吐量/功耗比将能提升35倍 [2] - 分析师预测,在英伟达投资Groq之后,LPU的出货量预测已大幅上调,预计2026至2027年的总出货量将达到400万至500万颗 [2] - 新架构机柜预计于2024年第四季度开始量产,2026年与2027年机柜出货量分别约为300至500个,以及15000至20000个 [2] - LPU芯片将由三星代工,预计机架将于2024年下半年开始出货 [2] LPU的技术特点与应用驱动因素 - LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟,核心瓶颈在于内存带宽 [3] - 基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感 [3] - LPU需求快速增长主要来自两方面:一是LPU与英伟达生态系(如CUDA)高度整合,大幅降低应用开发与部署门槛;二是业内超低延迟推理需求快速增加,包括AI智能体、即时处理、终端用户与物理AI等类型应用 [2] - AI已完成从感知智能到生成智能,再到物理智能和智能体智能的关键跃迁 [3] 行业影响与相关投资机会 - 目前Tokens的消耗量大幅增长,带动推理芯片市场规模的高增长,LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间 [3] - 机构看好LPU的高成长性及LPU以机柜出货时带来的PCB机会 [3] - 建议关注的相关公司包括:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路 [3]
5分钟速览黄仁勋最新演讲
财联社· 2026-03-17 08:09
公司财务与市场预期 - 公司CEO确认,其旗舰芯片将帮助公司在2027年创造1万亿美元的营收[4] - 此前公司对数据中心设备销售额的展望为2026年底达5000亿美元,最新预测将时间延长一年至2027年,且累积金额翻倍至1万亿美元[6] - 该财务预期发布后,公司股价盘中最高上涨超4%,最终收盘上涨1.6%[7] 新产品与平台战略 - 公司强调其Vera Rubin并非单一芯片,而是由7种芯片和5种机架系统组成的完整AI超级计算机平台[8] - 新发布的Vera CPU机架单机架集成256颗CPU,与传统CPU相比,计算效率提升2倍,运行速度提升50%[10] - Groq 3 LPX机架搭载256个LPU处理器,提供128GB片上SRAM和640TB/s扩展带宽,与Vera Rubin平台结合后,推理吞吐量/功耗比将提升35倍[10] - 公司推出的Spectrum-6 SPX采用了共封装光学技术,带来5倍更高光功率效率和10倍更高网络可靠性[13] - 公司推出Space-1 Vera Rubin模块,将数据中心级AI计算能力部署到卫星和轨道数据中心,面向在轨推理、实时地理空间智能等任务[16] - 公司产品组合形成从轨道边缘计算到地面AI数据中心再到云端分析的完整算力架构[18] 技术路线与生产规划 - LPU芯片将由三星代工,预计相关机架将于今年下半年开始出货[10] - 公司发布的三款新机架均采用液冷架构[12] - 未来的Rubin Ultra在Kyber机架中将采用垂直插入排列,使单个NVLink域中可连接144块GPU[15] - 下一代费曼架构GPU将采用堆叠芯片和定制HBM技术[15] 软件与生态系统 - 公司通过NemoClaw进军AI智能体基础设施赛道,其定位为OpenClaw智能体平台的基础设施层,可通过“一条命令”部署AI代理[19] - NemoClaw可运行在从RTX PC到DGX Spark等多种设备上,旨在推动“始终在线的AI助手”需要专用计算设备[19] - 公司宣布进一步扩展其“开放模型体系”,重点覆盖智能体AI、物理AI和医疗AI三大领域[19] 图形技术突破 - 公司在GTC大会上发布DLSS 5,并称这是自2018年实时光线追踪推出以来,在计算机图形领域最重要的一次突破[20] - 公司CEO将DLSS 5描述为图形领域的“GPT时刻”,该系统将传统3D图形数据与生成式AI模型结合,通过预测和补全图像内容来提升渲染效率[21]
黄仁勋 GTC 2026 演讲实录:所有SaaS公司都将消失;Token成本全球最低;“龙虾”创造了历史;Feynman 架构已在路上
AI前线· 2026-03-17 07:30
公司战略定位 - 公司已从单一的图形处理器供应商转型为为“数万亿美元AI基建时代”提供完整技术栈的“总包工头” [2] - 公司的核心壁垒是CUDA软件生态及其庞大的安装基数,这形成了强大的“飞轮效应”,吸引了开发者、催生新市场并持续降低算力成本 [3][6] - 公司业务覆盖AI全领域,是全球唯一能运行语言、生物、图形、视觉、机器人、边缘及云端所有AI领域的平台 [18] CUDA生态与飞轮效应 - CUDA架构诞生20年,其单指令多线程(SIMT)架构和“tiles”功能降低了编程难度,并围绕其形成了包含数千种工具、编译器、框架和库的庞大生态 [4] - 公司在全球建立了数亿块运行CUDA的GPU和计算系统,服务每一朵云、每一家计算机公司和几乎每一个行业,构成了飞轮效应的基础 [6] - 飞轮效应表现为:安装基数吸引开发者,开发者创造新算法和技术突破,催生新市场并扩大生态,进而进一步扩大安装基数,同时使计算成本持续下降 [6][7] - 庞大的安装基数使得公司愿意持续优化软件,因为每项新优化都能让数百万用户受益,这延长了硬件(如六年前出货的Ampere架构)的生命周期,甚至在云上出现定价上涨 [6][7] 数据处理基础设施变革 - AI的快速发展正推动全球数据处理体系发生结构性变革,核心是结构化数据与非结构化数据的全面加速 [8] - 企业计算长期建立在结构化数据(数据框)之上,未来AI系统和智能体也将直接访问和使用这些数据库,要求数据处理基础设施获得数量级性能提升 [10] - 全球每年产生的数据中约90%是非结构化数据(如向量数据库、PDF、视频、语音),AI的多模态理解能力正将其转化为可计算的信息资源 [12] - 为支持这一转变,公司构建了两项关键基础技术:用于加速结构化数据处理的cuDF和用于处理非结构化数据及AI数据的cuVS [13] - 这些技术正逐步融入全球数据处理生态,例如IBM正利用cuDF加速其IBM watsonx.data平台 [13] AI原生行业爆发与市场前景 - 2025年风险投资对AI初创公司的投入高达1500亿美元,创历史之最,投资规模跃升至数十亿美元级,因为这些公司普遍需要海量算力和Token [15] - AI行业爆发源于三件大事:ChatGPT开启生成式AI时代、推理AI(如o1/o3)的出现以及Claude Code开启代理(Agentic)时代 [15] - AI已从“感知”进化到“生成”、“推理”,现在可以执行高效的实际工作,“推理拐点”已经到来,过去两年计算需求增长了约10,000倍,使用量增长约100倍 [17] - 公司预见通过2027年的营收将至少达到1万亿美元,2025年是公司的“推理之年” [17] - 公司业务中,60%来自顶级云服务商,40%来自区域云、主权云、企业级服务器及工业自动化 [18] AI推理性能与成本优势 - AI推理是最困难也是最关键的商业环节,它直接决定AI服务的收入来源 [22] - 衡量AI系统效率的关键指标是每瓦特生成多少token,公司从Hopper H200到Grace Blackwell NVLink 72架构,实现了每瓦特性能提升约35倍(分析师认为接近50倍),并带来更低的token成本 [22] - 通过极致的软硬件协同设计(如NVFP4计算架构、NVLink 72、Dynamo、TensorRT-LLM等),公司构建了完整的大模型推理技术体系 [20] - 仅通过更新软件栈,就能将部分AI推理平台的生成速度从约700 token/秒提升至接近5000 token/秒,性能提升约7倍 [25] - 公司的Token成本在全球范围内具有绝对优势,即便竞争对手的架构免费,其总成本(如1GW数据中心工厂15年摊销成本高达400亿美元)也不够便宜 [25] - 数据中心正从存储和计算中心转变为生产token的“AI工厂”,token成为新的数字商品 [27] Vera Rubin AI超级计算平台 - Vera Rubin是一个全新的计算平台,由七款芯片组成,涵盖计算、网络和存储,是目前最先进的POD规模AI平台 [28] - 该平台包含40个机架、1.2千万亿个晶体管、近2万个公司芯片、1152个NVIDIA Rubin GPU、60 exaflops运算能力以及10 PB/s总扩展带宽,目前已全面投产 [28] - 该平台得到了Anthropic、OpenAI、Meta、Mistral AI及所有主要云提供商的支持 [28] - 过去十年间AI计算能力实现了约4000万倍的提升,推动数据中心向“AI超级计算机”形态演进 [30] - Vera Rubin是一套从硬件到软件完全纵向整合的计算平台,专为智能体AI设计,重新设计了计算、存储和网络架构 [31] - 平台硬件包括全新的NVIDIA Vera CPU,该CPU针对高性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,并已开始单独销售,有望成为一项数十亿美元级业务 [33] - 系统采用100%液冷架构,通过45°C热水散热降低制冷成本,并将整机安装时间从两天缩短至约两小时 [33] - 网络互连采用第六代NVLink架构,并推出了全球首个CPO光电共封装的NVIDIA Spectrum-X以太网交换机 [35] - 通过Kyber机架架构的Rubin Ultra Compute System,可以在一个NVLink域中连接144个GPU,形成大规模统一计算机 [35] Feynman GPU架构与深度整合 - Feynman GPU架构将采用定制化HBM技术,可能基于HBM4E增强版或定制化HBM5方案,允许将部分GPU数据处理逻辑嵌入存储底层,实现超高带宽与低延迟 [41][42] - Feynman平台将搭载代号为Rosa的全新CPU,该CPU被设计为AI智能体的编排中枢,旨在高效调度GPU、存储与网络之间的Token流动 [43] - Feynman时代标志着公司将计算、存储和封装进行了深度耦合,正将数据中心演进为一台高度集成的“巨型超级计算机” [44] AI基础设施与数字孪生平台 - 公司推出NVIDIA DSX平台,这是一个面向“AI工厂”的基础设施平台,用于数据中心的数字仿真、虚拟调试和运行期动态优化 [46][47] - 数据中心建设阶段可通过工程仿真工具进行虚拟调试,大幅缩短建设周期;运行后其数字孪生系统可作为“操作系统”,由AI智能体动态调度冷却、电力和网络系统以优化效率 [46] - NVIDIA Omniverse平台被设计用于承载全球规模的数字孪生模型 [49] - 公司的AI计算基础设施正在向太空延伸,计划开发Vera Rubin Space One轨道数据中心 [49] 智能体操作系统与软件生态 - 公司高度评价并正式支持开源项目OpenClaw,其增长速度甚至超过了Linux,被视为智能体计算机的操作系统 [52][54] - OpenClaw能够连接大语言模型,管理计算资源,调用工具和服务,具备任务调度与多模态交互能力 [54] - 公司认为未来所有科技和软件公司都需要制定“OpenClaw战略”,因为企业软件正在从传统SaaS转向以智能体为核心的AaaS(Agentic as a Service) [55] - 公司与OpenClaw作者合作推出NVIDIA NemoClaw参考架构,增加了OpenShell安全组件,提供企业级安全扩展,使企业能安全部署智能体系统 [56][58] 开放模型生态与行业应用 - 公司推进开放模型生态,目前生态已包含接近300万个开放模型,覆盖语言、视觉、生物、物理和自动驾驶等多个领域 [59] - 公司已发布多条开放模型产品线(如Nemotron、Cosmos World Foundation Model、Project GR00T等),并开放训练数据和方法,策略是“纵向整合、横向开放” [59][60] - 公司宣布成立Nemotron Coalition联盟,与多家技术公司合作共同推进模型发展 [61] - 在物理AI领域,全球几乎所有机器人公司与公司合作,公司提供从训练平台、仿真到部署的完整技术体系 [62] - 自动驾驶的“ChatGPT时刻已经到来”,车辆具备推理和语音指令执行能力,公司宣布与比亚迪、现代、日产、吉利(合计年产量约1800万辆)以及Uber成为新的Robotaxi合作伙伴 [64] - AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命,以及物理AI与机器人时代 [65]
STMicroelectronics (NYSE:STM) Update / briefing Transcript
2026-03-16 23:32
公司及行业研究电话会议纪要关键要点 一、 公司及行业概述 * 公司为意法半导体,专注于智能传感技术,特别是MEMS传感器和光学传感器,以支持物理人工智能的发展 [4][5][6] * 行业为半导体传感器行业,涵盖MEMS和成像两大领域,服务于汽车、工业、消费电子、物联网和医疗等多个终端市场 [8][9][10] 二、 财务业绩与市场展望 * **2025年传感器业务收入为22亿美元,同比增长10%** [5] * **整体传感器市场规模预计从2025年的约490亿美元增长至2028年的约570亿美元,年复合增长率约为4.7%** [10] * 公司目标是在此基础上显著超越市场增速,**计划到2028年实现传感器收入以中双位数(mid-teens)的年复合增长率增长** [11][24] * 若排除新收购业务(NXP MEMS业务)的影响,**内生增长率预计在低双位数(low double digits)** [42] 三、 核心产品与技术战略 * **产品组合**:包括智能MEMS传感器(运动、压力等)和光学传感解决方案(飞行时间、专用CMOS图像传感器等) [5][6][23] * **技术领导力**:公司是少数同时掌握MEMS和光学传感技术的厂商之一,并利用IDM模式进行制造 [5][6] * **智能传感器战略**:传感器正变得“智能”,集成了算法和本地处理能力(如ISPU智能传感器处理单元),以实现边缘AI、降低延迟和功耗 [13][14][15][17] * **制造布局**:拥有全球均衡的制造足迹,前端在法国(包括300毫米晶圆厂)、意大利和新加坡设有工厂,后端在欧洲和亚洲,确保了韧性、规模和控制力 [8] 四、 终端市场增长驱动力 * **汽车市场**:安全和法规标准趋严、电动化及自动驾驶推动单车传感器数量和价值提升 [9] * **工业市场**:机器人化、基础设施数字化及能源转型推动对MEMS、机器视觉和环境传感器的需求 [9] * **消费电子与物联网**:高端智能手机、可穿戴设备、AR/VR持续增加MEMS运动传感器和3D成像器;低功耗物联网节点推动超低功耗环境MEMS和紧凑型成像器需求 [9][10] * **医疗健康**:向持续性和预防性监测转变,提高了运动和压力传感器的渗透率 [10] 五、 近期收购(NXP MEMS业务)的影响 * 收购在技术和产品组合上具有高度互补性,增加了THELMA传感器、Petra致动器、UMems和Pcell等新技术 [12] * 显著**重新平衡了公司的MEMS市场分布**:**2025年汽车市场占MEMS收入的比例达到37%(备考基础),工业市场占比提升至18%** [13] * 巩固了公司在汽车安全应用加速度计领域的领导地位,并进入压力传感器前五名 [13] * 使公司成为所服务市场的**第二大厂商** [25] 六、 人形机器人机遇 * 公司视人形机器人为一个长期增长驱动力,并已与全球主要OEM厂商合作 [20][21] * **目前每台人形机器人中,ST可触达的物料清单价值约为600美元** [20][25] * 其中,**传感器部分占总物料清单的30%-40%**,是核心差异化组件,也是附加其他ST产品(如MCU、功率器件)的关键入口 [35][51][82] * 传感器部分具体包括:用于运动检测和平衡的MEMS(IMU、加速度计、陀螺仪等)、压力/温湿度传感器,以及用于视觉的2D/3D视觉传感器 [23] * 公司正与英伟达合作,以加速物理AI解决方案的端到端开发 [22] 七、 成像业务增长领域 * 核心业务三大支柱:智能手机前置(面部认证第一)、智能手机后置(相机辅助和光感)、PC笔记本电脑(低功耗存在检测、面部认证第一) [18] * 三大新增增长驱动力:**汽车(驾驶员监控和座舱乘员监控,预计年复合增长率约40%)、工业(机器人、人数统计等)、新兴应用(AR/VR/MR、人形机器人)** [19][43] * 成像业务正在集成更多智能,如32位MCU和卷积神经网络加速器 [18] 八、 竞争格局与差异化优势 * 公司认为其**同时拥有领先的MEMS和成像传感技术,并能将低功耗本地计算能力嵌入传感器,这是关键的差异化优势** [94][95] * 在人形机器人领域,传感器性能(精度、低延迟、低能耗)直接决定机器人性能,公司在该领域的广度和深度构成竞争壁垒 [95] * 公司已与全球(包括中国)主要人形机器人制造商建立合作 [35][94] 九、 其他重要信息 * **目标市场增速**:公司专注的细分市场增速快于整体传感器市场,其中专用CMOS图像传感器市场约40亿美元,至2028年年复合增长率约5.7%;运动与压力MEMS传感器市场超70亿美元,年复合增长率约5.3% [11] * **技术路线图**:为增强智能传感器的处理能力,计划将内部逻辑工艺从130纳米向90纳米迁移,以集成更多计算功能,而非单纯缩小芯片面积 [60][106][111] * **业务模式**:在人形机器人市场,公司将结合标准产品和定制解决方案,并优先通过与关键平台商(如处理器厂商)合作以嵌入生态系统 [67][68][88] * **供应链**:机器人市场的资格要求不如汽车严格,更接近工业要求 [50]
英伟达GTC大会前瞻:三大看点!
美股IPO· 2026-03-16 09:26
文章核心观点 本届英伟达GTC大会被视为AI产业的重要风向标,其释放的战略信号可能重塑2026年的产业格局,核心关注点在于公司战略重心从AI训练向推理市场的转变、供应链的潜在重构以及在AI应用生态上的扩展 [3][4][5][11] 战略重心转变:切入AI推理市场 - 当前AI产业正从“训练优先”逐步转向“推理驱动”,英伟达在训练领域优势稳固,但在推理市场面临Cerebras等竞争者的挑战 [5][6] - 公司预计将宣布一套融合英伟达与Groq技术的新型芯片系统,以应对推理市场竞争,该系统是公司首次将另一家公司的AI处理器(Groq LPU)直接整合进其服务器机架体系 [5][6] - 此次整合基于公司在2023年底斥资约200亿美元获得Groq技术许可的背景,Groq LPU是专门针对推理工作负载优化的芯片 [6] 供应链布局调整:引入三星代工 - 新的Groq LPU芯片预计将在2024年下半年由三星代工生产,这可能是英伟达服务器芯片首次由台积电以外的代工厂制造,旨在打破长期依赖单一供应商的格局 [5][7] - 这一变化可能主要是阶段性的,由于下一代LPU需要与英伟达未来AI芯片更紧密整合,后续生产仍可能回归台积电 [7] - 在需求端,英伟达预计将宣布OpenAI成为该新系统的首批客户之一,该芯片系统可能用于驱动AI代理执行编码等任务 [5][8] 技术架构与未来路线图 - 新系统架构设计显示,每个服务器机架将搭载256颗Groq芯片,并由Intel处理器负责通信管理,这表明英伟达现有架构尚未与LPU完全融合 [9] - 公司有长远整合计划,内部正在探索将Groq处理器与下一代Feynman GPU(Rubin架构后继产品)融合为单芯片的方案,旨在提升性能并降低整体成本 [9] AI应用生态扩展 - 随着“AI摩尔定律”(算力效率约每四个月翻倍)持续推进,公司在机器人和物理AI领域的布局备受关注,特别是在中国人形机器人产业加速发展的背景下,其能否在自动驾驶等场景提供更具成本优势的解决方案成为市场焦点 [10] - 公司在开源模型领域快速推进,已发布1200亿参数的Nemotron 3 Super模型,并计划推出参数规模扩大四倍的Nemotron 4 Ultra,模型能力提升有望进一步降低企业AI推理成本并改善投资回报率 [10]