生成式AI
搜索文档
英伟达万亿预期,还能否托住美股?
财富FORTUNE· 2026-03-18 21:06
英伟达的算力需求指引与市场反应 - 公司首席执行官在GTC 2026上宣布,对Blackwell和Rubin芯片的需求和采购订单指引从一年前预测的约5,000亿美元,提升至展望到2027年的至少1万亿美元 [1] - 公司认为“推理拐点”是核心逻辑支撑,过去两年间单次工作的计算需求提升了约1万倍,使用量提升了约100倍,计算总需求的增幅接近100万倍 [3] - 尽管有巨额订单指引,市场反应相对克制,公司股价在演讲当日盘中一度涨超4%,但最终收跌0.7% [3] 宏观环境对科技股(尤其是纳指)的压制 - 中东地缘冲突(进入第19天)导致布伦特原油价格站稳在每桶100美元之上,引发通胀担忧 [4] - 高油价使得市场对美联储的降息预期从年内约两次,压缩至仅剩一次(约25个基点),对依赖低利率环境的科技股估值构成压力 [4] - 能源成本上升可能侵蚀消费者购买力,进而威胁依赖数字广告和电商订阅的科技巨头的增长 [4] - 高盛报告指出,市场可能低估了地缘政治的尾部风险,纳指100 ETF(QQQ)成交量远低于平均水平,显示反弹缺乏大型资金支撑 [4] 支撑科技股/纳指的两股关键力量 - **算法效率提升**:Kimi公司引入“Attention Residuals”方案,将48B模型的训练效率提升了1.25倍,这使每块GPU变得更“聪明”,可能通过解锁更复杂的推理任务来扩大算力总需求 [5] - **政治护盘预期**:为护航中期选举,若美股因冲突出现非理性深度下跌,政府可能通过释放战略石油储备或外交缓和等手段进行干预,构成市场的隐性安全垫 [5] 当前美股市场状态与板块轮动 - 纳指年初至今已累计下跌4%,若要追平过去十年平均年回报率(17%),需在年底前再涨21% [6] - 市场在22,000点附近找到支撑,截至3月17日,纳指收于22000点上方,当日反弹0.5% [6] - 美股正告别由AI驱动的单边牛市,进入一个由“地缘恐惧”和“政治护盘”共同划定的剧烈震荡箱体 [6] - 公司股价过去六个月几乎原地踏步,其角色从“领跑者”转变为科技板块的“压舱石” [7] - 市场出现板块轮动,今年美股能源股整体上涨近30%,成为表现最佳板块,而科技和非必需消费品板块在风险调整后表现相对落后 [7]
ICLR 2026|首个微观世界模型MicroVerse来了,AI开始模拟看不见的世界
机器之心· 2026-03-18 19:02
世界模型演进方向与微观世界模拟的重要性 - 过去两年,世界模型(World Model)正成为大模型演进的重要方向,其目标是从理解数据转向在内部构建可预测、可推演的“世界”[2] - 当前几乎所有世界模型都局限于理解“人类肉眼可见的世界”,如街道、人物和机械运动[3] - 一旦尺度缩小到细胞、组织乃至分子层级,现有模型往往只是在生成视觉纹理,而非真实过程本身[4] - 微观世界建模面临尺度跨度巨大、动态过程高度复杂、真实数据稀缺且必须满足物理与生物约束的挑战[5] - 本文提出的MicroVerse框架,旨在让生成模型从“宏观场景建模”走向微尺度科学过程模拟,其核心目标是让AI像科学模拟系统一样理解并重建微观世界的运行机制[5] 当前微观模拟的现状与问题 - 在微观尺度,生命活动的本质(如血液流动、DNA复制)发生在肉眼不可见的方寸之间,无法通过摄像头简单记录[9] - 现有医学世界模型(如MedOS、CLARITY、MeWM)大多锚定于宏观层面的临床决策支持或医疗影像模拟,服务于诊疗逻辑[11] - 当前视频生成模型在模拟“细胞分裂”或“DNA复制”等微观过程时存在三大致命硬伤:违反物理结构、生物形态错误、时间动态不一致[11][12][13] - 这些模型生成的微观视频“像真的”,但机制全错,因为它们只学习了宏观视觉统计,未学习微观物理规律[14] - 当前顶尖视频生成模型陷入“像素级真实,机制级崩塌”的尴尬境地,宏观统计规律无法推导微观物理约束[23][24] MicroWorldBench评测基准 - 研究团队提出了MicroWorldBench,这是全球首个针对微观生物模拟的量表化评测基准,旨在纠正模型在微观世界的“信口开河”[16] - 该基准从数万个候选任务中精选出459项核心模拟任务,构建了一个跨越器官级、细胞级、亚细胞级的三层模拟体系[21] - 评测引入LLM加领域专家的联合评审机制,主要评估三个维度:科学真实性(具有一票否决权)、视觉质量、指令一致性[21] - 在MicroWorldBench评测中,商业模型Veo3表现最佳,平均得分为77.2,科学真实性为65.7,视觉质量高达97.0[23] - 评测揭示了当前模型的普遍问题:视觉高分,科学低分,模型本质上是在学习像素流的统计关联,缺乏对微观生物逻辑的理解[24] MicroVerse框架的核心创新与架构 - MicroVerse的核心基石是MicroSim-10K,这是全球首个专注于微观机制的大规模专家级数据集,包含9,601段经专家验证的视频[28][29] - 该数据集配备了“机制级标注”,用精准的语义引导模型完成从视觉信号到生物逻辑的映射,例如描述免疫细胞追踪细菌的完整过程[29] - 在模型层面,MicroVerse通过引入初级的物理约束与领域知识监督,实现了从像素统计转向机制对齐的生成表现跨越[29] - 在最复杂的亚细胞级模拟中,MicroVerse-1.3B模型取得了53.3的高分,意味着模型开始呈现出具有生物学意义的动态机制[30] - 实验证明,随着模型参数扩展至14B,模型对信号级联反应等极高复杂过程的理解出现了明显的“性能涌现”,验证了Scaling Law[31] MicroVerse的性能表现与突破 - 在科学真实性方面,经过MicroSim-10K数据微调的Wan2.1-14B模型得分达到48.3,比基线(42.7)提升了5.6分[31] - 在视觉质量方面,经过通用数据与MicroSim-10K联合微调的Wan2.1-14B模型得分达到87.7,比基线(86.0)提升了1.7分[31] - 在指令遵循方面,经过联合微调的Wan2.1-14B模型得分达到56.9,比基线(53.8)提升了3.1分[31] - MicroVerse能够精准还原DNA复制中解旋酶推进、引物结合以及新链合成的动态秩序,而非通用模型生成的无规则旋转丝带[37] - 在模拟细胞凋亡时,MicroVerse能细腻呈现出细胞膜起泡、染色质固缩等一系列具有病理学意义的特征,而非模糊的淡出[37] 微观世界模拟的意义与行业影响 - 微观模拟是理解生命运作的钥匙,其意义远非“视觉奇观”,可用于加速科学洞察、降低实验成本、以及教育与科普[18] - MicroVerse的确立了科学模拟的新秩序,标志着视频生成的下一场革命不再是分辨率的竞赛,而是世界知识嵌入的竞赛[26] - 该工作构建了生命知识的数字基底,证明只要喂给模型正确的“真理”,AI就能建立起对底层机制的直觉[38] - MicroVerse的成功完成了范式转移的概念验证,标志着生成大模型正从“宏观视觉统计”向“微观机制模拟”跨越[38] - 这本质上是一条从“世界模型”通往“生命模型”的必经之路,使AI有望成为一个运行在硅基芯片上的虚拟生命实验场[35]
【招商电子】英伟达GTC 2026跟踪报告:25-27年DC收入超1万亿美元,Kyber将使用铜光等多种互连形式
招商电子· 2026-03-18 11:48
文章核心观点 英伟达GTC 2026大会展示了公司在AI计算领域的全面布局和战略演进,核心观点是AI推理拐点已至,计算需求正经历百万倍级别的爆发式增长,公司通过推出Rubin计算平台、深化垂直整合、构建AI工厂以及推动OpenClaw等生态战略,旨在巩固并扩大其在下一代AI基础设施中的领导地位,为万亿美元级别的市场机会奠定基础 [2][3][51][59][61]。 根据相关目录分别进行总结 1 CUDA生态与计算平台演进 - CUDA平台诞生20周年,其庞大的装机量(数以亿计的GPU和计算系统)形成了强大的飞轮效应,吸引了大量开发者并创造了新的市场和生态系统,使英伟达基础设施具有非凡的使用寿命和持续降低的计算成本 [8][9][10] - 公司通过GeForce将CUDA带入世界,并开启了AI大爆炸,随后通过RTX架构和DLSS 5技术,将3D图形的结构化数据与生成式AI的概率计算融合,实现了可控且逼真的内容生成 [10][13][14] - 英伟达构建了加速计算平台,包括RTX、cuDF、cuVS等核心库,并将其深度集成到全球云服务和OEM设备中,持续降低客户的计算成本 [25][26] 2 数据处理技术:cuDF与cuVS - 英伟达创建了cuDF和cuVS两个基础库,分别用于加速处理结构化数据(如SQL数据帧)和非结构化数据(如PDF、视频),旨在为AI时代重塑数据处理方式 [15][18][21] - 公司与IBM、戴尔、谷歌云等客户合作,加速其数据处理平台,例如使用cuDF加速IBM Watsonx.data,为雀巢将数据处理速度提高5倍,成本降低83% [22][24] - 加速数据处理带来了速度、规模和成本优势,是超越摩尔定律极限的新方法 [25][26] 3 垂直整合与行业应用 - 英伟达是一家垂直整合但横向开放的计算公司,通过深入理解特定领域算法并构建领域特定加速库(如CUDA-X),将加速计算整合进入各个行业 [41][43][48] - 公司业务覆盖金融服务(算法交易)、医疗保健(药物研发)、工业(AI工厂建设)、机器人、电信(AI-RAN)等多个价值数万亿美元的垂直行业 [46][47][48] - 通过加密计算等技术,公司能够将AI平台安全地部署在任何环境,包括云端、本地、边缘或特定国家 [32][41] 4 AI推理拐点与计算需求爆发 - AI推理的拐点已经到来,AI从感知、生成演进到能够执行生产性工作的推理阶段,这导致计算需求暴增 [59] - 过去两年中,工作的计算需求可能增长了一百万倍,生成输出所需的Token数量增加了约一万倍 [2][59][60] - 风险投资向AI初创企业注入了1500亿美元的历史最高资金,这些公司需要海量的算力和Token,推动了行业爆发式增长 [52] 5 数据中心业务与订单前景 - 英伟达数据中心业务60%来自前五大云服务提供商(CSP),其余40%来自区域云、主权云、企业、工业等领域,展现了业务的多样性 [3][66] - 公司对Blackwell和Rubin架构的订单预期大幅上调,从去年GTC提到的2026年前5000亿美元订单,更新为2027年前至少1万亿美元订单 [3][61][62] - 英伟达平台是唯一能够运行所有AI模型(语言、生物学、机器人学等)且在所有方面都表现优异的平台,这使其成为成本最低、置信度最高的基础设施投资选择 [65] 6 AI工厂与token经济学 - 数据中心正转变为受物理功率限制的“AI工厂”,其产出(Token)是新的商品,工厂的吞吐量(Token/秒)和交互速度直接决定其收入 [4][68][75] - Token商品将根据模型能力、速度和上下文长度细分为不同价值层级(如免费层、每百万Token 3美元至150美元不等),形成新的定价体系 [4][90] - 通过极端协同设计,Grace Blackwell NVLink 72系统相比Hopper,在最高价值量层级的每瓦性能(吞吐量)提高了35倍,而Vera Rubin系统在Blackwell基础上再提高10倍,结合Groq LPU后能再提升35倍 [4][71][93][98][105] 7 Rubin计算平台详解 - Vera Rubin平台是为智能体AI设计的革命性系统,包含7个芯片、5个机架级计算机和1台AI超级计算机,10年内计算能力提升4000万倍 [3][81] - 平台关键组件包括:100%液冷、无线缆设计的Rubin计算板;集成巨大片上SRAM的Groq 3 LPU计算板(已量产);使用台积电COUPE工艺的CPO Spectrum-X交换机(已量产);以及每瓦性能为世界任何CPU两倍的Vera CPU [3][81][83][86][87] - Rubin Ultra芯片正在流片,将首次整合NVFP4计算结构,下一代Feynman平台将包含新GPU(LP40)、新CPU(Rosa)和BlueField-5 [3][128][129] 8 性能比较与收入影响 - 在1吉瓦的AI工厂中,假设将电力平均分配给四个价值层级客户,R系列(Rubin)收入是B系列(Blackwell)的5倍,Rubin结合LPU的收入是B系列的10倍 [4][101][107] - 通过架构创新和协同设计,英伟达在两年内将1吉瓦工厂的Token生成速度从200万/秒提升至7亿/秒,提高了350倍 [126] - Groq LPU(500MB SRAM,150TB/s带宽)与Vera Rubin通过Dynamo软件解耦集成,专门处理解码的前馈网络部分,两者结合实现每兆瓦吞吐量35倍的提升 [5][81][113] 9 下一代架构与供应链 - 公司同时推进铜缆和光缆scale up方案,Oberon架构支持铜缆scale up及通过光scale up至NVLink 576,Kyber架构则实现NVLink 144,所有这些方案均已投产 [2][3][128] - Feynman平台将同时使用铜缆和共封装光学(CPO)进行纵向扩展,公司呼吁供应链扩大铜缆、光学和CPO的产能以满足增长需求 [129] - 公司已建立强大的供应链,每周可生产数千套系统,每月能生产多吉瓦的AI工厂,Vera Rubin机架已开始在Microsoft Azure上运行 [119][121] 10 生态战略:Nemotron联盟与OpenClaw - 英伟达建立Nemotron联盟,联合Black Forest Labs、Cursor、Mistral、Perplexity等公司,推动领域特定模型与主权AI定制化,并推出OpenClaw战略及NemoClaw参考设计,旨在将企业IT从工具时代转型为“智能体”时代 [6][143] - OpenClaw是开源的智能体计算机操作系统,其受欢迎程度和重要性被类比为开启PC时代的Windows,它使得每一家IT公司、SaaS公司都将转型为智能体即服务(AaaS)公司 [5][6][151][152] - 公司宣布与比亚迪、现代、日产、吉利及优步在自动驾驶领域合作,并集结了110个机器人及ABB、库卡等巨头,通过Isaac Lab等工具加速机器人行业应用 [6] 11 前沿领域拓展:太空算力与数字孪生 - 英伟达正与客户研发抗辐射的Vera Rubin Space One新型计算机,旨在未来于太空中建立数据中心 [5][141] - 公司推出英伟达 DSX平台,这是一个基于Omniverse的数字孪生蓝图,用于设计和管理AI工厂,以实现最大的Token吞吐量、韧性和能效,涉及从仿真、设计到动态运营的全流程 [135][136][137]
英伟达-GTC-2026-黄仁勋主题演讲
2026-03-18 10:31
NVIDIA GTC 2026 电话会议纪要分析 一、 公司概况与战略定位 * **公司定位**:公司是全球首家垂直整合且横向开放的公司[10] 其战略核心是构建一个由庞大安装基数驱动的加速计算平台[2] * **核心战略**:构建世界一流的基础模型,并在此基础上实现垂直整合与水平开放[37] 垂直整合旨在通过特定领域的加速实现应用加速并大幅降低成本[10] 横向开放体现在将技术集成到任何客户需要的平台上[10] * **飞轮效应**:公司通过20年投入建立的数亿台运行CUDA的GPU安装基数吸引了开发者[2] 开发者创造突破性算法催生新市场[2] 新市场吸引更多公司加入并再次扩大安装基数[2] 目前飞轮正加速转动,公司库的下载量正以创纪录的速度增长[2] 二、 市场前景与需求规模 * **需求规模**:截至2026年3月,所看到的需求覆盖至2027年,规模至少达到1万亿美元[1][14] 作为对比,2025年同期看到的需求规模约为5,000亿美元,覆盖至2026年[14] * **需求驱动**:需求激增的核心驱动力是AI推理业务的拐点已经到来[14] 2025年是公司的推理之年[14] 过去两年计算需求增长了约100万倍[13] * **行业变革**:AI原生企业的风险投资规模已飙升至1,500亿美元,创下历史纪录[12] 数据中心正在从传统的存储设施演变为生产tokens的“AI工厂”[17] 未来所有企业都将依赖AI工厂[44] 三、 核心技术:CUDA与平台生态 * **CUDA起源**:CUDA的征程始于25年前发明的可编程着色器[3] 20年前CUDA正式诞生[3] 公司当时将CUDA搭载在GeForce产品上,培养了庞大的用户群体和开发者[3] * **CUDA现状**:CUDA架构的核心是单指令多线程技术,并新增了分片功能、张量核心及数学结构[2] 公司提供了数千种工具、编译器、框架和库[2] 开源领域有数十万个基于CUDA的公开项目[2] * **CUDA X库**:CUDA X库是公司业务的核心,是激活计算平台的关键[12] 公司本质上是一家算法公司[12] 仅在本次展会就将发布70个算法库和约40个模型[12] 其中CUDA DNN库彻底革新了人工智能领域[12] 四、 产品迭代与性能突破 * **架构演进**:公司规划每年推出全新架构,并保持向后兼容[30] 从Hopper到Grace Blackwell,再到Vera Rubin,以及未来的Rubin Ultra、Fineman[1][30] * **性能飞跃**: * **推理吞吐量**:Blackwell较Hopper推理吞吐量提升35倍[1] Vera Rubin吞吐量再增10倍[1] * **能效与成本**:Grace Blackwell Envy 72在2025年实现了每瓦性能提升35倍的成果[16] 公司实现了全球领先的低每token成本[16] * **令牌生成速率**:在短短两年内,通过新架构在一个千兆瓦(1 GW)的工厂中,令牌生成速率将从2,200万提升至7亿,增幅达到350倍[29] * **具体产品**: * **Vera Rubin平台**:算力达3.6 Exaflops[1] 通过NVLink 72实现260TB/s带宽[1] 单机架可连接144个GPU[1] 实现100%液冷[1] 安装时间从两天缩短至两小时[20] * **Blackwell**:通过NVLink连接72块GPU,全互联带宽达到130TB/秒[18] 五、 关键收购与技术整合:Groq * **收购与整合**:公司收购Groq团队并集成其技术[1] 通过名为Dino的软件拆分推理流程[1][25] 在极高速度区间实现35倍性能提升[1] 解决了高吞吐量与低延迟之间的冲突[23] * **技术原理**:Grok是一种采用静态编译和编译器调度的确定性数据流处理器[24] 配备了海量的SRAM[24] 与Vera Rubin整合后,在主流工作负载由Vera Rubin处理,解码生成、低延迟工作负载则由Grok处理[25] * **生产进展**:Groq LP3芯片由三星负责生产[26] Grok LPX预计将于2026年下半年开始发货[26] 六、 软件与操作系统布局 * **智能体操作系统**:推出OpenClaw开源智能体操作系统[1] 它被视为“通用人工智能计算机的操作系统”,其意义可与Windows推动个人计算机普及相提并论[34] * **企业安全方案**:推出NeMo Claw企业级安全、私有部署解决方案[1][34] 该方案具备策略机制、网络防护措施和隐私路由器[34] * **对SaaS公司影响**:OpenClaw意味着SaaS公司将从传统的软件工具提供商转型为生成式AI服务公司[1][34] 七、 数据处理与加速 * **数据布局**:公司正全力加速结构化与非结构化数据的处理[6] 全球数据中约90%为非结构化数据[6] * **核心库**:创建了两个基础库:为数据帧和结构化数据开发的CUDF,以及为向量存储和语义数据开发的CUVS[6] * **合作案例**: * 与IBM合作,加速其Watsonx.data SQL引擎,帮助雀巢将工作负载运行速度提升了5倍,成本降低了83%[6] * 与谷歌云合作加速BigQuery,帮助Snapchat将计算成本降低了近80%[7] 八、 云计算与合作伙伴生态 * **合作模式**:与云服务提供商(CSP)的合作模式是互惠共赢的[8] 公司通过将加速库集成到云平台中来加速其工作负载,并为云服务商带来客户[8] * **主要合作伙伴**: * **AWS**:2026年将把OpenAI引入AWS[8] 公司加速了AWS的EMR、SageMaker和Bedrock[8] * **微软Azure**:首个为公司打造的A100超级计算机项目部署在Azure[9] 深度参与Azure的AI Foundry项目[9] * **谷歌云**:长期合作,加速其Vertex AI平台和BigQuery[8] * **甲骨文**:公司不仅是其供应商,更是其首个AI客户[9] * **垂直行业合作**:与Palantir和戴尔三方携手,为Palantir打造了全新的AI平台,能够在任何国家、任何物理隔离区域实现完全本地化部署[9] 九、 垂直行业应用与进展 * **金融服务**:该行业是本次GTC大会参会者中占比最大的群体[11] 算法交易正从传统量化交易转向由超级计算机自主分析海量数据的阶段[11] * **医疗健康**:医疗健康领域正经历类似ChatGPT的技术突破,公司在此开展了多项工作[11] * **汽车/自动驾驶**:公司认为自动驾驶的“ChatGPT时刻”已经到来[42] 自动驾驶出租车平台新增比亚迪、现代、日产和吉利四家合作伙伴,合计年产汽车1,800万辆[42] 宣布与优步达成重大合作[43] * **机器人技术**:公司已深耕机器人技术十年[11] 提供了三类核心计算机硬件和完整的软件栈[40] 推出开源的Isaac Lab用于机器人训练[41] 合作伙伴包括ABB、优傲机器人、库卡、卡特彼勒等[45] * **通信**:公司认为遍布各地的基站将从上一代计算基础设施重塑为AI基础设施平台[11] 公司的Ariel平台已与T-Mobile等企业建立了重要合作关系[11] * **零售与制造业**:在规模达35万亿美元的零售和快消行业,公司利用技术优化供应链[11] 在规模达50万亿美元的制造业领域有深入布局[11] * **太空计算**:公司正在将业务拓展至太空领域,目标是在太空建设数据中心[33] 正在开发名为Vera Rubin Space 1的新型计算机[33] 十、 AI模型与开放生态 * **开放模型计划**:公司是开源AI领域最大的贡献者之一[36] 构建并发布了六大系列开源前沿模型[36] 涵盖语言、视觉、物理AI、机器人、自动驾驶、数字生物学和AI物理等领域[36] * **核心模型**:Neonotron 3 Ultra被定位为目前世界上顶级的多模态基础模型之一[37] 推出了Earth Two气候预测模型[38] * **生态构建**:公司通过打造世界级的开放基因框架和推出名为NimbleClaw的参考设计来构建生态系统[39] 宣布成立联盟推动NemoTran 4模型发展,成员包括Blackforce Labs、Cursor、Perplexity等[39] 十一、 业务结构与客户分布 * **业务结构**:目前,公司60%的业务来自超大规模数据中心客户,包括全球前五大超大规模数据中心企业[15] 其余40%的业务覆盖了区域云、主权云、企业、工业、机器人、边缘计算等领域[16] * **客户选择**:Anthropic和MSL在2025年均选择了公司,这些客户占据了全球开源AI模型计算量的三分之一[14] 十二、 未来路线图 * **产品规划**:路线图规划每年推出全新架构[30] Rubin Ultra芯片已流片[1] 后续Fineman平台将联合Groq开发LP40芯片并配备Rosa CPU[1][30] * **网络与互联**:将推出用于Rosalind的Bluefield 5,连接新一代CPU与新一代SuperNIC CX 10[30] 互联方案将同时推进铜缆和共封装光学两种方案[30]
扩大版图…英伟达赶搭“养龙虾”商机 推NemoClaw软件
经济日报· 2026-03-18 07:52
公司战略与产品发布 - 英伟达在年度GTC大会上宣布推出NemoClaw,作为OpenClaw的企业级参考架构,旨在通过多层安全机制协助企业在内网安全部署代理型AI [3] - 公司宣布将进军太空打造数据中心,正与伙伴共同研发“Vera Rubin Space One”太空电脑,但需克服新型辐射冷却技术以确保在真空与强辐射环境下的稳定运作 [4] - 公司宣布将在自动驾驶平台扩大与车厂的合作对象 [3] 行业观点与市场展望 - 英伟达执行长黄仁勋表示持续看好AI芯片的需求 [3] - 黄仁勋指出,OpenClaw让AI代理可透过“一键完成”彻底改变AI行业,即“AI领域的Windows时刻来了”,因此每家企业都需要制定“OpenClaw战略” [3] - 黄仁勋认为,当AI进入后代理时代,每家软件即服务公司都是“代理即服务”的公司,将专属领域知识转化为可租用的“数位代理劳动力”,这将成为一次企业IT的文艺复兴和一个数兆美元的产业 [4] 技术趋势与产品演示 - OpenClaw是近来爆红的开源AI代理系统,其标志是一只龙虾,主打可自动分解任务、呼叫工具并执行多步骤操作,被视为代理型AI的代表性框架 [3] - 黄仁勋坦言,OpenClaw在企业环境中的最大挑战在于安全性,因其可存取敏感资料、执行程式码并与外部系统互动,缺乏适当控管可能引发资安与合规风险 [3] - 在GTC大会尾声,黄仁勋与迪士尼合作研发的机器人“雪宝”同台互动,该机器人能以高度拟真的动作与语音即时回应指令并进行自然对话与肢体表演,展现出接近真人的互动能力 [1][5] - 黄仁勋表示,未来AI将不只存在于云端与荧幕,而将进入现实世界成为能理解、思考并执行任务的实体,通过结合生成式AI、推理能力与机器人控制技术,AI将从“会说话”进化到“会做事” [5]
腾讯研究院AI速递 20260318
腾讯研究院· 2026-03-18 00:03
英伟达发布新一代AI平台与芯片 - 英伟达发布Vera Rubin平台,包含5大机架级系统及7款量产芯片,训练大型MoE模型所需GPU数量降至Blackwell平台的1/4,推理吞吐量提升10倍,token成本降至1/10 [1] - 同步发布Groq 3 LPU,其150TB/s的SRAM带宽与Rubin GPU形成互补,协同推理可将万亿参数模型的每兆瓦吞吐量提升35倍,该芯片由三星代工已量产,预计第三季度出货 [1] - 公司还发布了NemoClaw智能体安全框架、DGX Spark/Station本地部署设备及Nemotron 3 Ultra等开放模型,并预测其订单将在2027年翻番至万亿美元级别 [1] 智能体操作系统与本地应用竞争加剧 - Meta旗下Manus推出Desktop App,AI智能体可在macOS/Windows本地终端执行命令、读写文件、调用GPU,突破了云端沙盒限制 [2] - 该产品定位为“全本地资源调用+云端智能规划”,每条命令需用户显式批准,与OpenClaw的开源路线和Claude Cowork的会话协作路线形成差异化 [2] - Perplexity Computer、Claude Cowork、OpenClaw、Manus四大产品在三周内密集更新,标志着智能体操作系统的争夺战全面升级 [2] 腾讯与百度深化AI智能体生态建设 - 腾讯ima上线Skills功能,首期推出笔记skill,支持龙虾在笔记模块进行内容查询、读取和写入操作,知识库skill也将在近期上线 [3] - 该功能已全面适配OpenClaw、WorkBuddy、QClaw等多个Claw类产品,用户可通过复制提示词并获取API Key完成接入,若龙虾已接入微信、QQ,用户可在手机端直接发起需求,实现跨端协作 [3] - 百度发布覆盖多终端场景的龙虾全家桶,包括桌面智能体DuMate、手机端RedClaw、云端DuClaw及小度家用龙虾等产品 [4] - 百度搜索Skill在OpenClaw官方技能商店下载量超过4.5万次,位列全球第一的搜索引擎官方技能插件,公司强调安全机制贯穿数据层到系统层,并同步开放伐谋和秒哒等Skill [4] 阿里巴巴推进企业级AI智能体平台 - 钉钉完成底层代码重写与全面CLI化改造,其悟空Agent可原生操作核心能力,而非模拟GUI点击 [5] - 阿里巴巴成立Token Hub事业群,计划将淘宝、1688、支付宝等B端能力以Skill形式接入,打造toB Skill市场 [5] - 同步发布OPT十大行业解决方案,首批覆盖电商、跨境、法律、财税等场景,以一人跨境电商为例,其核心环节耗时从一周压缩到一个下午 [6] AI前沿技术创新与突破 - MIT团队在Transformer权重中实现了WebAssembly解释器,可将任意C代码编译为token序列在模型内部执行,全程无外部调用且每步透明可见 [7] - 该技术将注意力头限制为2维并利用凸包查询,使每步解码复杂度从Θ(t)降至O(log t),CPU吞吐量超过3万token/秒,在数独测试中达到100%准确率 [7] - 英伟达发布DLSS 5,其核心是实时神经网络渲染技术,AI可对游戏画面进行光照和材质实时重绘,处理次表面散射、织物光泽等传统渲染极难实现的效果,接入成本几乎为零,首发游戏中近半数为国产游戏 [8] 具身智能发展前景与挑战 - 行业观点认为,具身智能的“ChatGPT时刻”预计在1-2年内到来,其标志是机器人在80%陌生场景中仅通过语言指令完成80%的任务 [9] - 实现该目标需解决三大瓶颈:模型动作表达能力与泛化、多元数据利用效率、强化学习可复用规模效应,行业看好世界模型和视频生成路线 [9] - 春晚机器人采用了预训练全身RL模型而非单动作策略,支持动作间稳定切换,行业已在探索用人形机器人进工厂生产机器人 [9] AI工具使用效率与认知影响研究 - 哈佛大学一项针对近1500名员工的研究发现,过度使用AI导致14%的用户出现注意力下降、决策力减弱等认知过载症状 [10] - 高强度监管AI的员工比低强度者多消耗14%的脑力,信息过载可能性增加19%,同时使用1-2个AI工具时生产力显著提升,但从第4个工具起反而下降 [10] - 认知过载还导致重大错误率上升39%,离职意愿从25%升至34%,研究建议控制单人同时管理的Agent在3个以内 [10]
英伟达龙虾登场!黄仁勋暴论频出,「人车家天地芯」冲击万亿收入
36氪· 2026-03-17 17:47
文章核心观点 - 英伟达在GTC 2026上宣布其战略重心全面转向智能体(Agentic AI)时代,并发布了专为此设计的Vera Rubin架构及一系列芯片、系统和软件,旨在构建一个从底层硬件到上层应用、从地面到太空的完整智能体生态系统,巩固并扩大其在AI时代的统治地位 [6][8][39][96] 英伟达Vera Rubin架构发布 - 发布专为智能体AI和强化学习时代打造的全新Vera CPU,其效率是传统机架式CPU的两倍,速度提升50% [16] - Vera Rubin架构包含七款芯片:Vera CPU、Rubin GPU、NVLink™ 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum™-6以太网交换机及新集成的Groq 3 LPU [17] - 包含五套机架系统:Vera Rubin NVL72机架、Vera CPU机架、Groq 3 LPU机架、BlueField-4 STX存储机架及Spectrum-6 SPX以太网机架 [17] - Rubin GPU单片芯片拥有高达288GB的海量内存,用于装载超大语言模型和处理海量上下文KV缓存 [19] - 新一代NVLink带宽翻倍至260TB/s,并推出全新Kyber机架,在一个NVLink域内直接互联144张GPU [20] 智能体操作系统与开源生态 - 黄仁勋判断开源项目OpenClaw将堪比这个时代的Linux或HTML,是一套能调用大模型、管理任务、协调子智能体并进行多模态沟通的智能体操作系统 [28] - 每一家SaaS公司最终都将转变为“智能体即服务”(AgaaS)公司,CEO必须思考自己的OpenClaw战略 [31] - 为解决企业安全顾虑,英伟达联合推出NeMoClaw参考架构,内置OpenShell等技术,让企业能在私有环境中安全运行智能体系统 [33][35] - 英伟达提供一整条开源模型产品线,包括Nemotron(语言推理)、Cosmos(世界建模)、Groot(通用机器人)、Alpha Mayo(自动驾驶)、BioNeMo(数字生物学)、Earth-2(AI物理仿真),并将持续迭代更新 [37] - 宣布与Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Sarvam及Thinking Machines等合作伙伴共同推进Nemotron 4研发 [37] 算力架构创新与性能突破 - 为应对智能体对极致低延迟的需求,英伟达通过Dynamo软件首创“解耦推理”,将推理任务的前段Prefill和Attention交给Vera Rubin处理,后半段Decode卸载给Groq LPU以降低延迟 [24][30] - 在高阶推理层级,这种组合使性能提升35倍,每兆瓦吞吐量也提升35倍 [26] - Grace Blackwell NVLink 72的实际每瓦性能提升达到50倍,远超摩尔定律预期的约1.5倍 [74] - 通过更新算法与软件,Fireworks等服务商的token生成速度从每秒700个跃升至接近5000个,提升7倍 [80] 重塑数据处理与数据中心 - 英伟达发布底层杀器cuDF,用GPU并行算力直接处理结构化数据,绕过传统CPU [59] - 发布针对向量数据库和非结构化数据的cuVS,旨在用AI方式重新定义企业数据处理方式 [61] - 雀巢公司采用英伟达加速的IBM Watsonx.data后,处理全球供应链数据的速度提升5倍,成本降低83% [61] - 英伟达通过深度嵌入云端的算法库,使云服务巨头(Google Cloud、AWS、微软Azure、Oracle)成为其算力和框架的分销渠道 [62] - 发布NVIDIA DSX平台,基于Omniverse数字孪生技术,在虚拟空间中仿真整座AI工厂以优化设计,配合Max-Q技术动态调节功耗与算力 [76][77] 市场前景与收入预测 - 根据黄仁勋判断,到2027年底,其Blackwell和Rubin芯片将至少创造1万亿美元收入,且实际需求可能远超此保守估计 [69] - 高难度推理被视为AI领域最重要且最难的事,因为它直接带来收入增长,英伟达为此彻底改变架构并优化整个技术栈 [71][72] - 未来每一家公司都会认真思考其“token工厂”的效率问题,因为算力即收入本身 [80] 垂直整合与生态构建 - 英伟达自称为世界上第一家“垂直整合,却又水平开放”的公司,向下自造芯片和系统,向上深入理解各行业应用场景 [63][64] - 其业务覆盖金融量化交易、医疗研发、电信边缘计算等多个行业,并通过机密计算技术打消企业数据安全顾虑 [65] - 公司通过将自身封装成底层算法库,像水电一样接入全球基础设施,看似分享利润,实则掌握AI时代命脉 [67] 物理AI与自动驾驶布局 - 黄仁勋宣告自动驾驶的“ChatGPT时刻”已经到来 [85] - RoboTaxi Ready平台新增比亚迪、吉利、五十铃、日产四位伙伴,这四家车企年产量合计约1800万辆,加上已有的梅赛德斯、丰田和通用,覆盖全球重要整车制造商 [86] - 与Uber签署协议,计划将无人出租车部署至多个城市并接入其全球出行网络 [88] - 在工业机器人领域与ABB、Universal Robots、库卡等合作,卡特彼勒的加入意味着重型工程机械走向智能化 [88] 前沿探索与未来愿景 - 英伟达Thor芯片已通过抗辐射认证并应用于卫星,正与合作伙伴研发名为NVIDIA Space-1 Vera Rubin的新型计算机,目标是在太空中建设数据中心 [81] - 与迪士尼、Google DeepMind联合研发的Newton物理引擎,用于在Omniverse中训练机器人(如雪宝),使其适应现实物理规律,未来迪士尼乐园角色将拥有真正智能并与游客互动 [91] - 从游戏显卡到AI算力,英伟达用20年时间“造了一台造风机”,如今已化身为永不停歇的Token生产厂,算力即权力,生态即壁垒 [47][96]
日经BP精选:中国在“半导体奥运”持续跃进,美国陷入颓势
日经中文网· 2026-03-17 14:18
行业趋势:半导体集成电路研发领域 - 在半导体集成电路研发领域 中国持续崛起 在2026年2月于美国举办的国际半导体会议"ISSCC 2026"上 来自中国的入选论文占总数的近四成[3] - 曾坐拥近五成入选率的美国 受英特尔业绩低迷等因素影响 占比跌破两成 以大学和研究机构的研究为主 中美两国之间的实力天平已大幅向中国倾斜[3] 行业事件:ISSCC 2026会议情况 - ISSCC是半导体集成电路领域的顶级国际会议 被誉为半导体界的奥林匹克[5] - 受生成式AI运算能力需求扩大以及各国半导体振兴政策的推动 ISSCC 2026的投稿论文数量达到1025篇 同比增长12% 首次突破1000篇大关[5] - 最终入选论文257篇 入选率仅25.1% 创历史新低 竞争较往年更为激烈[5] - 入选论文中 8成来自大学和研究机构 2成由企业提交[5] 公司/机构表现:论文入选情况 - 中国提交的入选论文数量在2023年首次跃居第一 之后与第二名以下的差距越来越大[5]
黄仁勋GTC演讲全文:龙虾就是新操作系统
是说芯语· 2026-03-17 10:09
公司战略定位与业绩展望 - 公司正从一家“芯片公司”蜕变为“AI基础设施和工厂公司” [2] - 公司创始人给出了极为强劲的业绩预期,预计到2027年至少有1万亿美元的高确信度需求,并认为实际需求会更高 [5][9] - 这一乐观预期一度推动公司股价上涨超过4.3个百分点 [7] 核心商业模式:“Token工厂经济学” - 未来的数据中心是生产Token(AI生成的基本单位)的“工厂”,其核心经营指标是“token工厂效率” [12][62] - 在受电力限制(如1吉瓦)的数据中心内,每瓦Token吞吐量最高的平台将拥有最低的生产成本 [14] - AI服务将根据Token生成速度分层定价,从免费层到超高速层(约每百万token 150美元)不等 [18] - 公司的架构能让客户在免费层实现高吞吐量,同时在最高价值的推理层级将性能提升惊人的35倍 [16] 技术平台与产品进展 - CUDA平台是公司战略的核心,拥有20年历史、数亿块GPU的装机量,形成了强大的开发者生态飞轮 [31][32] - 公司推出了下一代AI计算系统Vera Rubin,这是一个100%液冷、端到端优化的完整系统,安装时间从两天缩短至两小时 [19][65] - Vera Rubin系统在两年内将1吉瓦AI工厂的Token生成速率从2200万token/秒提升至7亿token/秒,实现了350倍的增长,远超摩尔定律同期的约1.5倍提升 [20][70] - 公司整合了收购的Groq技术,通过Dynamo软件实现“非对称式分离推理”,将计算密集的预填充阶段交给Vera Rubin,将对延迟敏感的解码阶段交给Groq,以优化高性能推理 [21][23][68] - 公司展示了明确的技术路线图,包括当前在产的Blackwell、已发布的Vera Rubin、即将推出的Vera Rubin Ultra以及下一代Feynman架构 [71] - 公司推出了全球首款量产的共封装光学(CPO)交换机Spectrum X,并强调需要同时扩大铜缆、光芯片和CPO的产能 [24][72] 软件、生态与行业应用 - 开源项目OpenClaw被形容为“人类历史上最受欢迎的开源项目”,本质上是智能体计算机的“操作系统” [25][74][76] - 公司预测,每一家SaaS公司都将转变为AaaS(智能体即服务)公司,并为此推出了企业级的NeMo Claw参考设计,增加了安全策略引擎和隐私路由器 [26][79] - 公司的CUDA-X库覆盖了自动驾驶、金融服务、医疗健康、工业、机器人、电信等多个垂直行业,是公司作为算法公司的核心资产 [47] - 在自动驾驶领域,公司宣布了新的合作伙伴,其RoboTaxi Ready平台现有合作伙伴的年产量合计达到1800万辆 [83] - 本次GTC大会有110款机器人亮相,公司提供训练、仿真和机载三台计算机以及完整的软件栈 [47][83] 市场地位与合作伙伴 - 公司目前60%的业务来自全球前五大超大规模云服务商,另外40%的业务广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [11][57] - 公司声称其是目前全球唯一能够运行所有AI领域(语言、生物、图形、视觉、机器人等)模型的平台,这种通用性使其成为“成本最低、置信度最高的平台” [10][57] - 公司与主要云服务商(Google Cloud、AWS、Microsoft Azure、Oracle等)建立了深度合作关系,将客户引入云端,形成互利生态 [41][43] - 公司宣布成立Nemotron联盟,投资数十亿美元推进AI基础模型研发,联盟成员包括多家知名AI初创公司和实验室 [82] 未来愿景与新兴领域 - 公司创始人描绘了未来职场形态,工程师将拥有年度Token预算,其额度可能相当于基础年薪的一半,以实现10倍的效率提升,“入职附带多少token配额”已成为招聘新话题 [27][79] - 公司正在研发下一代计算架构Feynman以及部署在太空的数据中心计算机“Vera Rubin Space-1” [27][73] - 公司推出了数字孪生平台NVIDIA DSX,用于在虚拟世界中共同设计和运营吉瓦级AI工厂,预计可将能源利用效率提升约2倍 [73]
早报 | 李成钢:中美就一些议题取得初步共识;永辉发公开信喊话山姆;胖东来称若检测无错会起诉博主;特朗普暗示袭击哈尔克岛石油设施
虎嗅APP· 2026-03-17 08:08
昨夜今晨 - 美国总统特朗普暗示美军可能袭击伊朗石油出口重要枢纽哈尔克岛的石油基础设施 [1] - 伊朗武装部队警告若美国攻击哈尔克岛,将作出果断而有力的回应 [1] - 英伟达在GTC大会发布DLSS 5,称其为自2018年实时光线追踪以来在计算机图形学领域的最重大突破 [2] - 英伟达CEO黄仁勋将DLSS 5比作“图形学的GPT时刻”,强调生成式AI在视觉表达与艺术可控性间达成新平衡 [2] - DLSS 5将于今年秋季面向主流游戏推出,并已获得Bethesda、CAPCOM、网易、育碧等大型厂商支持 [2] - 美国总统特朗普抱怨部分盟友对协助保障霍尔木兹海峡航行安全“不热心”,称一些国家积极性不高 [3] - 欧盟、德国、英国、澳大利亚及韩国均表现出不参与霍尔木兹海峡护航的立场 [3] - 马斯克旗下AI初创公司xAI正招募华尔街银行家和信贷专家,以强化其聊天机器人Grok的金融场景处理能力 [4] - xAI此举旨在企业客户市场追赶竞争对手,并折射出AI开发商争相渗透投资专业领域的行业趋势 [4] - xAI面临年初以来人员流失严重及企业客户收入高度依赖马斯克旗下关联公司合同的多重压力 [5] - Meta旗下雷朋联名智能眼镜在美国遭遇集体诉讼,被指控将用户私人视频内容发送给肯尼亚外包公司进行人工标注以训练AI模型 [6] - 诉讼称,外包审核人员看到了大量涉及性行为、金融信息处理及家庭私密场景的用户隐私内容 [6] 热点追踪 - 中美双方在巴黎举行经贸磋商,就一些议题取得初步共识,并同意继续保持磋商进程 [7] - 磋商议題包括双边关税水平、非关税措施安排可能的延期,以及美方最新关税调整 [7] - 中方对美方近期连续启动两起涉及中方的301调查表达严正关切 [7] - 中美进一步认同稳定的经贸关系利于中美并惠及世界 [8] - 市场监管总局部署开展网络食品安全合规提质系列行动,重点解决直播带货乱象、入网食品资质及虚假宣传三大问题 [9] - 行动将督促相关方严格执行自3月20日施行的《直播电商经营者落实食品安全主体责任监督管理规定》 [9] - 阿里巴巴正式成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭直接负责,旨在以创造、输送、应用Token为核心目标,强化AI业务战略协同 [10][11] - ATH事业群覆盖通义实验室、MaaS业务线、千问事业部、悟事业部及AI创新事业部,形成从基础模型研发到B/C端AI应用的完整布局 [11] - 悟事业部定位为B端AI原生工作平台,意味着阿里巴巴除C端千问APP外,还将重点发力B端AI应用市场 [11] - 永辉超市自有品牌发布公开信,呼吁竞争对手山姆不要让供应商“二选一”,反对不正当竞争行为 [12] - 中国人民银行上海市分行等部门通知,自2026年3月16日起,上海市商业用房(含“商住两用房”)购房贷款最低首付款比例调整为不低于30% [13] - 银行需根据经营及客户风险状况确定具体首付比例,并充分考虑在途交易等因素便民利民 [14] 回应来了 - 胖东来回应博主指控其销售鲜鸡蛋检出角黄素一事,称若最终确认问题将下架召回并担责,若无问题将依法维权 [15] - 胖东来强调其鲜鸡蛋采购手续齐全,每周抽检结果合格并公示,符合国家标准 [16] - 胖东来认为指控方混淆标准误导公众,此前“王海测评”称其鸡蛋角黄素含量9.54mg/kg超出规范上限8mg/kg [16] - 商务部就美对包括中国在内的60个经济体发起301调查回应,表示已向美方提出交涉,敦促其立刻纠正错误做法 [17][18] - 商务部称将密切关注调查进展,保留采取一切必要措施的权利,坚决捍卫自身正当权益 [18] - 格力电器在互动平台表示,公司多年前已开展铝代铜相关技术研究,但在铝材性能、质量和可靠性不能完全保证的情况下,暂时没有铝代铜技术的应用计划 [19] - 国家气候中心回应“超级厄尔尼诺”相关话题,称拉尼娜事件结束后当年进入厄尔尼诺状态的概率约为三分之一 [20] - 国家气候中心指出目前多个国际气候预测模型结果存在较大分歧,尚未形成共识,断定今年出现“超级厄尔尼诺”为时过早 [20] - 神农种业在互动平台回应“收到春耕补贴款1亿多”传闻,称该传闻不属实,系市场误读 [21] 今日关注 - 英伟达年度开发者大会(GTC)3月16-19日举行,黄仁勋主题演讲聚焦AI从生成式向代理式转型 [22] - 第二届商业航天产业发展大会将举行,聚焦商业航天技术创新、产业政策、国际合作等议题 [23] - 澳洲联储(RBA)将公布3月利率决议,市场普遍预期加息25个基点至4.10% [24] 一个说法 - 英伟达CEO黄仁勋在GTC大会宣布AI技术进入工业化新时代,指出AI已成为必不可少的基础设施 [25] - 黄仁勋的声明标志着AI产业正从模型竞赛迈向全栈基建的新纪元 [25] - 此观点引发了业界广泛关注,预示着AI技术将深刻影响未来的工业发展 [26]