Workflow
Feynman架构
icon
搜索文档
通信行业周报:GTC、OFC总结:光互联、全液冷大时代
开源证券· 2026-03-23 08:45
报告行业投资评级 - 投资评级:看好(维持)[2] 报告核心观点 - 全球AI产业共振,持续看好“光、液冷、国产算力、卫星”四大投资主线[6] - AI算力驱动下,光互连已成为突破AI算力瓶颈的核心支撑,高速率迭代、先进封装、光路交换三大方向的商业化进程持续提速[24] - 展望2026年,AI“虹吸效应”显著,全球AI或继续共振,看好“光、液冷、国产算力”三大AI核心主线[25] GTC大会要点 - **全新Rubin系统亮相**:采用台积电3nm EUV工艺,搭载HBM4内存(288GB,带宽是HBM3e的2.75倍),推理性能是H100的5倍、训练性能提升3.5倍,单Token成本降低10倍[12] - **系统组成与量产**:由7颗芯片组成,针对不同场景推出5套机架式架构,其中Groq 3 LPU亮眼,单机柜可搭载256颗LPU,带宽80TB/s,首Token延迟<0.1秒,推理性能是H100的10倍,将于2026下半年量产[12][13] - **技术与标准趋势**:英伟达宣布2026年起CPO技术将成标配,全液冷也将成为高密度算力标配[4][13] - **下一代架构前瞻**:曝光专为“世界模型”设计的Feynman架构,采用台积电1.6nm制程,晶体管密度较前代提升1.1倍,同性能功耗降15%,推理性能较前代提升5倍,单GPU算力达50 PFLOPS,首次实现CPO和铜的混合扩展,计划2028年量产[4][14] - **“Token工厂经济学”**:黄仁勋提出Token将成为新大宗商品并按层级定价(从免费到约150美元/百万Token),“每瓦Token吞吐量”成为核心商业竞争力[4][15] - **市场预测**:黄仁勋预测到2027年,英伟达AI芯片需求将达至少1万亿美元[4][15] OFC大会要点 - **标准化突破**:Arista牵头发布XPO MSA,与Open CPX、OCI三大AI光互连MSA集中亮相,填补标准化空白,其中XPO的12.8Tbps液冷模块带宽密度较主流OSFP提升4倍[16] - **NPO(近封装光学)作为中期方案**:获头部云厂商定为2026-2027年首选方案,中际旭创、光迅科技、华工科技等推出高性能新品,预计全球NPO市场规模从2026年的15亿美元增至2027年的45亿美元[5][18][19] - **CPO(共封装光学)迭代落地**:华工科技等展出3.2T CPO液冷光引擎,传输能效≤5pJ/bit,能耗较传统模块降低近70%,部署后集群PUE可从1.25降至1.12,单机架算力密度提升40%[20] - **OCS(光电路交换)走向商用**:谷歌、英伟达推动OCS从实验室走向规模化商用,可将延迟从微秒级降至纳秒级,功耗降低80%以上,带宽密度提升10倍[5][22] - **空芯光纤实现突破**:长飞等国产厂商将空芯光纤损耗降至0.04dB/km,时延较传统光纤降低30%-50%,单纤带宽超200THz[5][23] 行业数据追踪 - **5G建设**:截至2025年12月底,我国5G基站总数达484万站,比2024年末净增58.8万站[35] - **5G用户**:2025年12月,三大运营商及广电5G移动电话用户数达12.04亿户,同比增长18.74%[35] - **5G手机出货**:2025年12月,5G手机出货2213.2万部,占比90.4%,出货量同比下降27.3%[35] - **运营商云业务**: - 中国移动:2025年上半年移动云营收561亿元,同比增长11.3%[53] - 中国电信:2025年上半年天翼云营收573亿元,同比增长3.8%[53] - 中国联通:2025年前三季度联通云营收529亿元[53] - **运营商ARPU值**: - 中国移动:2025年前三季度移动业务ARPU值为48.0元,同比略减3.0%[53] - 中国电信:2025年上半年移动业务ARPU值为46.0元,同比略减0.6%[53] - 中国联通:2023年移动业务ARPU值为44.0元,同比略减0.7%[53] 投资建议与推荐标的 - **光网络设备**: - 光模块&光器件&CPO:推荐中际旭创、新易盛、天孚通信、源杰科技、华工科技等[24][25] - 光纤光缆:推荐亨通光电、中天科技[24][25] - 交换机路由器及芯片:推荐盛科通信、紫光股份、中兴通讯[25] - **计算设备**: - 国产AI芯片:推荐中兴通讯[26] - AI服务器:推荐中兴通讯、紫光股份[26] - 服务器电源:推荐欧陆通[26] - **AIDC机房建设**: - 液冷:推荐英维克[28] - AIDC机房:推荐光环新网、奥飞数据、宝信软件、润泽科技等[28] - **卫星互联网&6G**:受益标的包括海格通信、信科移动-U等[32] - **市场表现**:本周(2026.03.16—2026.03.20)通信指数上涨2.10%,在TMT板块中排名第一[33]
7位专家拆解GTC,结论让英伟达难堪
雷峰网· 2026-03-19 08:41
英伟达GTC 2026核心叙事转变 - 英伟达在GTC 2026上宣布AI正从“模型训练时代”加速迈入“模型推理时代”,整个AI技术栈的组织方式被重新定义 [7] - 叙事重心从“更强的GPU”转向“如何组织算力”,数据中心被重新定义为生产Token的“AI工厂”,衡量标准从单卡性能转向Token产出效率(Tokens/W)[3][4][17] - 公司推出包括Vera Rubin平台、LPX推理机架及Feynman架构在内的新叙事,从单一GPU主导转向多处理器协同的“AI工厂” [3][7] 推理时代硬件架构的演变 - 英伟达承认GPU并非推理最优解,推出专用推理处理器LPU,标志着AI基础设施从通用走向分工 [3][8] - 在Transformer推理中,Prefill、Decode、Orchestration三个阶段开始由不同硬件承担,LPX专门优化Decode阶段 [9] - GPU依然是训练和复杂推理(如视频生成)的最优解,而LPU等专用架构在低延迟、轻算力推理场景显示出优势,未来数据中心将是多元处理器各安其位的图景 [9][12] - 公司推出Vera CPU,其核心是掌握AI工厂内部的算力编排权,而非直接与x86竞争,短期内对x86格局冲击有限 [13] LPU的定位与市场影响 - LPU的推出是英伟达对GPU在推理场景非最优解的承认,但公司仍将LPU与GPU捆绑组合,以维持生态延续 [8] - LPU短期内难以成为主力,其经济性存疑:单芯片集成500MB片上SRAM,而SRAM价格是HBM的6-8倍,会抬高成本,且受工具链融合滞后影响 [10][11] - 头部云厂商的推理需求将坚定走向自研ASIC路线,英伟达的GPU+LPU方案重点客户可能是中小互联网客户 [8] - CPX(负责Prefill阶段)在发布会上未被提及,出乎部分行业人士意料 [12] Token经济与万亿美元营收愿景 - 黄仁勋认为Token已成为AI时代的硬通货,并宣称英伟达的Token成本全球最低 [17] - 公司预测到2027年,仅Blackwell和Vera Rubin两条产品线的AI芯片营收将至少达到1万亿美元,相比去年预测翻倍,原因是“过去两年计算需求增长了一百万倍” [18] - 若叠加CPU、Groq、存储及网络设备,总规模或将达到1.25万亿美元 [18] - 行业竞争的核心正转向Token的生产、计量与分配主导权,如同电力时代的电网,AI时代正围绕Token形成全新产业生态 [20][22] - 推理环节才是算力消耗的主力,需持续生成Token,Token的成本高低直接决定AI的普及程度 [22] 系统级竞争与生态闭环 - 英伟达的竞争护城河正从“算力垄断”转向“生态闭环”,通过绑定上下游构建垂直整合的产业链控制力 [21] - 算力竞争的度量体系正在从芯片峰值参数走向端到端系统能效(Tokens/W),英伟达在系统级优化上具有优势 [19] - 公司正以Vera CPU、Rubin GPU、NVLink 6、Spectrum-X交换机等“全家桶”组合重构系统解决方案,叙事重心从单颗芯片转向系统级交付 [26] - 英伟达尝试构建包括台积电、美光、三星等在内的联盟,以锁定先进封装与存储资源 [26] 互连技术与CPO的挑战 - 英伟达在Vera Rubin平台部署第六代NVLink,并推出全球首个CPO(光电共封装)Spectrum-X以太网交换机,目前已进入量产阶段 [25] - CPO的推广面临挑战:维护便利性及成本较高、核心芯片良率偏低导致系统成本高、在短距离内铜互联比光互联更有优势 [27] - 技术的庞杂产品矩阵与“加法”生态,被部分观点认为是对手(如谷歌简洁ASIC架构)用“减法”定义下一代基础设施时的包袱 [26] - 随着Scaling Law对带宽需求的极致放大,铜与光的界限在发生改变,光互联替代铜互联是明确方向,但尚需时日 [28] 智能体(Agent)与AaaS时代 - 英伟达将OpenClaw定位为定义“智能体计算机”的下一代操作系统,重要性类比Linux之于服务器 [32] - 黄仁勋判断未来绝大多数SaaS都将演变为AaaS(智能体即服务),“你的OpenClaw战略是什么?”将成为科技公司的核心命题 [32] - AI智能体对当前SaaS业态带来冲击,按席位订阅的商业模式逐步失效,企业必须走向AI化,打造和运营自主智能体 [33] - Token分层定价将成为AI时代商业模式的自然演进,实现成本与价值的精准匹配 [33] - OpenClaw是以CPU为主的控制与编排系统,外接GPU推理后端,因此Agent越流行,CPU的总需求就越高 [35] - 未来数据中心的基础设施衡量标准将从比拼“模型能力”转向“同等投资下可支撑的持续在线Agent数量”,推动从单一GPU算力转向GPU+CPU双芯驱动 [35]
【招商电子】英伟达GTC 2026跟踪报告:25-27年DC收入超1万亿美元,Kyber将使用铜光等多种互连形式
招商电子· 2026-03-18 11:48
文章核心观点 英伟达GTC 2026大会展示了公司在AI计算领域的全面布局和战略演进,核心观点是AI推理拐点已至,计算需求正经历百万倍级别的爆发式增长,公司通过推出Rubin计算平台、深化垂直整合、构建AI工厂以及推动OpenClaw等生态战略,旨在巩固并扩大其在下一代AI基础设施中的领导地位,为万亿美元级别的市场机会奠定基础 [2][3][51][59][61]。 根据相关目录分别进行总结 1 CUDA生态与计算平台演进 - CUDA平台诞生20周年,其庞大的装机量(数以亿计的GPU和计算系统)形成了强大的飞轮效应,吸引了大量开发者并创造了新的市场和生态系统,使英伟达基础设施具有非凡的使用寿命和持续降低的计算成本 [8][9][10] - 公司通过GeForce将CUDA带入世界,并开启了AI大爆炸,随后通过RTX架构和DLSS 5技术,将3D图形的结构化数据与生成式AI的概率计算融合,实现了可控且逼真的内容生成 [10][13][14] - 英伟达构建了加速计算平台,包括RTX、cuDF、cuVS等核心库,并将其深度集成到全球云服务和OEM设备中,持续降低客户的计算成本 [25][26] 2 数据处理技术:cuDF与cuVS - 英伟达创建了cuDF和cuVS两个基础库,分别用于加速处理结构化数据(如SQL数据帧)和非结构化数据(如PDF、视频),旨在为AI时代重塑数据处理方式 [15][18][21] - 公司与IBM、戴尔、谷歌云等客户合作,加速其数据处理平台,例如使用cuDF加速IBM Watsonx.data,为雀巢将数据处理速度提高5倍,成本降低83% [22][24] - 加速数据处理带来了速度、规模和成本优势,是超越摩尔定律极限的新方法 [25][26] 3 垂直整合与行业应用 - 英伟达是一家垂直整合但横向开放的计算公司,通过深入理解特定领域算法并构建领域特定加速库(如CUDA-X),将加速计算整合进入各个行业 [41][43][48] - 公司业务覆盖金融服务(算法交易)、医疗保健(药物研发)、工业(AI工厂建设)、机器人、电信(AI-RAN)等多个价值数万亿美元的垂直行业 [46][47][48] - 通过加密计算等技术,公司能够将AI平台安全地部署在任何环境,包括云端、本地、边缘或特定国家 [32][41] 4 AI推理拐点与计算需求爆发 - AI推理的拐点已经到来,AI从感知、生成演进到能够执行生产性工作的推理阶段,这导致计算需求暴增 [59] - 过去两年中,工作的计算需求可能增长了一百万倍,生成输出所需的Token数量增加了约一万倍 [2][59][60] - 风险投资向AI初创企业注入了1500亿美元的历史最高资金,这些公司需要海量的算力和Token,推动了行业爆发式增长 [52] 5 数据中心业务与订单前景 - 英伟达数据中心业务60%来自前五大云服务提供商(CSP),其余40%来自区域云、主权云、企业、工业等领域,展现了业务的多样性 [3][66] - 公司对Blackwell和Rubin架构的订单预期大幅上调,从去年GTC提到的2026年前5000亿美元订单,更新为2027年前至少1万亿美元订单 [3][61][62] - 英伟达平台是唯一能够运行所有AI模型(语言、生物学、机器人学等)且在所有方面都表现优异的平台,这使其成为成本最低、置信度最高的基础设施投资选择 [65] 6 AI工厂与token经济学 - 数据中心正转变为受物理功率限制的“AI工厂”,其产出(Token)是新的商品,工厂的吞吐量(Token/秒)和交互速度直接决定其收入 [4][68][75] - Token商品将根据模型能力、速度和上下文长度细分为不同价值层级(如免费层、每百万Token 3美元至150美元不等),形成新的定价体系 [4][90] - 通过极端协同设计,Grace Blackwell NVLink 72系统相比Hopper,在最高价值量层级的每瓦性能(吞吐量)提高了35倍,而Vera Rubin系统在Blackwell基础上再提高10倍,结合Groq LPU后能再提升35倍 [4][71][93][98][105] 7 Rubin计算平台详解 - Vera Rubin平台是为智能体AI设计的革命性系统,包含7个芯片、5个机架级计算机和1台AI超级计算机,10年内计算能力提升4000万倍 [3][81] - 平台关键组件包括:100%液冷、无线缆设计的Rubin计算板;集成巨大片上SRAM的Groq 3 LPU计算板(已量产);使用台积电COUPE工艺的CPO Spectrum-X交换机(已量产);以及每瓦性能为世界任何CPU两倍的Vera CPU [3][81][83][86][87] - Rubin Ultra芯片正在流片,将首次整合NVFP4计算结构,下一代Feynman平台将包含新GPU(LP40)、新CPU(Rosa)和BlueField-5 [3][128][129] 8 性能比较与收入影响 - 在1吉瓦的AI工厂中,假设将电力平均分配给四个价值层级客户,R系列(Rubin)收入是B系列(Blackwell)的5倍,Rubin结合LPU的收入是B系列的10倍 [4][101][107] - 通过架构创新和协同设计,英伟达在两年内将1吉瓦工厂的Token生成速度从200万/秒提升至7亿/秒,提高了350倍 [126] - Groq LPU(500MB SRAM,150TB/s带宽)与Vera Rubin通过Dynamo软件解耦集成,专门处理解码的前馈网络部分,两者结合实现每兆瓦吞吐量35倍的提升 [5][81][113] 9 下一代架构与供应链 - 公司同时推进铜缆和光缆scale up方案,Oberon架构支持铜缆scale up及通过光scale up至NVLink 576,Kyber架构则实现NVLink 144,所有这些方案均已投产 [2][3][128] - Feynman平台将同时使用铜缆和共封装光学(CPO)进行纵向扩展,公司呼吁供应链扩大铜缆、光学和CPO的产能以满足增长需求 [129] - 公司已建立强大的供应链,每周可生产数千套系统,每月能生产多吉瓦的AI工厂,Vera Rubin机架已开始在Microsoft Azure上运行 [119][121] 10 生态战略:Nemotron联盟与OpenClaw - 英伟达建立Nemotron联盟,联合Black Forest Labs、Cursor、Mistral、Perplexity等公司,推动领域特定模型与主权AI定制化,并推出OpenClaw战略及NemoClaw参考设计,旨在将企业IT从工具时代转型为“智能体”时代 [6][143] - OpenClaw是开源的智能体计算机操作系统,其受欢迎程度和重要性被类比为开启PC时代的Windows,它使得每一家IT公司、SaaS公司都将转型为智能体即服务(AaaS)公司 [5][6][151][152] - 公司宣布与比亚迪、现代、日产、吉利及优步在自动驾驶领域合作,并集结了110个机器人及ABB、库卡等巨头,通过Isaac Lab等工具加速机器人行业应用 [6] 11 前沿领域拓展:太空算力与数字孪生 - 英伟达正与客户研发抗辐射的Vera Rubin Space One新型计算机,旨在未来于太空中建立数据中心 [5][141] - 公司推出英伟达 DSX平台,这是一个基于Omniverse的数字孪生蓝图,用于设计和管理AI工厂,以实现最大的Token吞吐量、韧性和能效,涉及从仿真、设计到动态运营的全流程 [135][136][137]
英伟达Feynman架构引爆PCB板块,沪电股份逼近涨停
格隆汇· 2026-03-18 11:14
市场表现 - 2025年3月18日,A股市场PCB概念股普遍走强,多只个股涨幅显著[1] - 奥士康涨停,涨幅为10.00%,总市值162亿[1][2] - 沪电股份盘中一度逼近涨停,收盘涨4.81%,总市值1726亿[1][2] - 金禄电子涨超9%,涨幅为9.24%,总市值54.49亿[1][2] - 澳弘电子涨8%,涨幅为8.03%,总市值49.81亿[1][2] - 金安国纪涨超5%,涨幅为5.31%,总市值249亿[1][2] - 广合科技涨超4%,涨幅为4.01%,总市值483亿[1][2] - 协和电子、芯碁微装、明阳电路、弘信电子、四会富仕、依顿电子、满坤科技、金百泽等多股涨超3%[1] 上涨驱动因素 - 消息面上,英伟达在GTC 2026大会上发布了Feynman架构[2] - 新一代AI服务器对PCB的层数要求达到32-44层,并对耐热性和信号传输速率提出极端要求[2] - 上述技术要求直接拉升了高端高多层板和高密度互连板的单机价值量[2] - 根据GTC发布会信息,单LPU服务器由32个托盘组成,单托盘中集成8张LPU芯片[3] - 相比于过往的机柜架构,单机柜托盘数量显著提升,这等效于PCB数量增加,为PCB环节带来新增量[3] 相关公司年初至今表现 - 金安国纪年初至今涨幅达104.31%[2] - 广合科技年初至今涨幅达38.63%[2] - 芯碁微装年初至今涨幅达31.47%[2] - 明阳电路年初至今涨幅达47.23%[2] - 奥士康年初至今涨幅为19.14%[2] - 沪电股份年初至今涨幅为22.77%[2] - 金禄电子年初至今涨幅为24.05%[2] - 澳弘电子年初至今涨幅为14.19%[2]
黄仁勋凌晨发布英伟达版龙虾,特意提及中国龙虾热,Rubin Ultra算力较前代提升35倍
新浪财经· 2026-03-17 17:27
公司战略与市场定位 - 公司CEO黄仁勋通过展示中国市场的“龙虾热”现象,强调OpenClaw开源项目已成为人类历史上最受欢迎的开源项目,其普及速度在几周内超过了Linux三十年的成就 [1][4] - 公司描绘了从芯片到软件再到智能体的完整AI技术版图,并在GTC大会上发布了包括Nemo Claw企业级AI智能体平台、Rubin平台、Vera CPU及多款开放模型在内的多项产品与技术 [3] - 公司强调其技术积累,包括可编程着色器面世25周年和CUDA面世20周年,是当前Rubin平台得以实现的基础 [6] 核心产品发布:Nemo Claw 与 OpenClaw - OpenClaw被定义为一个智能体操作系统,其功能类似于Windows之于个人计算机,旨在让个人智能体成为可能,用户可通过一行命令自动下载、安装并构建智能体以执行任务 [6] - 基于OpenClaw,公司推出了企业级参考设计Nemo Claw,该平台集成了OpenShell安全层,提供网络护栏和隐私路由器,以确保智能体在企业网络中安全运行且不泄露敏感信息 [8] - Nemo Claw是公司与“龙虾之父”Peter Steinberg合作的成果,并已吸引Black Forest Labs、Cursor、Mistral、Perplexity等公司加入其Nemo Tron联盟,共同推进智能体技术 [8] 新一代硬件平台:Rubin 与 Vera CPU - Rubin平台在高端推理层级上相比前代Hopper实现了10倍的性能提升,其设计目标是让数据中心成为高效的“token工厂”,在1GW的数据中心里,Rubin能带来5倍的收入提升 [14] - Vera CPU是公司全新设计的数据中心CPU,专为智能体应用打造,是世界上唯一使用LPDDR5的数据中心CPU,公司CEO称其拥有无与伦比的单线程和每瓦性能,并预计其单独销售将成为一个数十亿美元的业务 [11] - Vera Rubin系统实物采用100%液冷设计,消除了所有线缆,将安装时间从过去的两天缩短到两小时,第一台系统已在Microsoft Azure上运行 [10][15] 高性能计算与下一代架构:Rubin Ultra 与 Feynman - Rubin Ultra是Rubin平台的高性能版本,采用全新的垂直插入式Kyber机架设计,每个机架能连接144个GPU形成一个NVLink域,其芯片即将流片,并配合LPDDR35内存及NVFP计算结构,在最需要高性能的推理层级实现了35倍的性能提升 [14][18] - Rubin GPU通过NVLink 72实现72个GPU间130TB/s的全互联带宽,使整个系统能作为一个巨大的GPU运行,以满足智能体系统处理海量token、频繁访问内存和快速使用工具的需求 [15] - Feynman是公司规划的下一代计算平台,将采用LPDDR40内存,配备全新的Rosa CPU、BlueField-5 DPU和CX-10 SuperNIC,并首次同时支持铜缆和共封装光学器件的scale-up,以满足未来的巨大容量需求 [17][20] 开放模型生态系统 - 公司发布了六大系列开放前沿模型,全部位居各自领域排行榜前列,构成了世界上最大、最多样化的生态系统之一,这些模型全部开源,供开发者下载、微调和部署 [21][23] - 发布的六个模型包括:用于语言和视觉理解的Nemo Tron推理模型(其中Nemo Tron 3 Ultra被称为有史以来最好的基础模型)、用于物理世界生成和理解的Cosmos、首个会思考和推理的自动驾驶基础模型Alpamayo、用于通用机器人的GROOT、用于生物学和分子设计的BioNemo,以及用于天气预报和气候预测的FourCastNet [21] 行业合作与生态建设 - 全球100%的存储行业正在加入公司的存储加速生态,因为未来的存储系统将被AI频繁访问,需要cuDF和cuVS的加速支持 [14] - 公司通过Nemo Tron联盟与多家领先的AI公司合作,共同推进智能体技术的发展 [8]
黄仁勋狂扔“王炸”:1万亿营收、太空芯片、一键“养虾”…李彦宏牵头的AI生命科学公司被曝赴港上市;永辉公开喊话山姆丨邦早报
创业邦· 2026-03-17 08:09
AI行业战略与产品发布 - 英伟达CEO黄仁勋在GTC大会上宣布,计算需求进入“百万倍增长”阶段,并将2027年前算力需求预测从**5000亿美元翻倍至1万亿美元**,提出“代币工厂”概念,认为未来数据中心将生产智能代币 [2] - 英伟达发布下一代**Vera Rubin**架构,采用全液冷设计及Vera CPU,整合Groq确定性流处理器技术,通过Dynamo软件实现“解耦推理”,使吉瓦级工厂代币生成速度提升**350倍** [3] - 英伟达推出开源项目**OpenClaw**,将其定义为AI时代的Linux,是支持AI智能体自主调用工具、执行代码的操作系统级框架,并推出NeMo Claw参考设计,推动软件产业从SaaS向AaaS转型 [3] - 英伟达披露下一代GPU架构**Feynman**,将搭载LP 40处理器和Rosa CPU,支持共封装光学技术,并宣布进军太空计算,研发Vera Rubin Space-1计算机 [4] - 英伟达发布**DLSS 5**,引入全新的实时神经渲染模型,黄仁勋称其为图形学领域的“GPT时刻”,将手工渲染与生成式AI融合 [22] - 智谱宣布推出面向OpenClaw龙虾场景的基座模型**GLM-5-Turbo**,并上调新模型API价格**20%**,粗略计算2026年第一季度智谱API价格已涨**83%** [11] - 智谱在海外官推宣布将发布首个专为龙虾OpenClaw场景深度优化的通用大模型**GLM-5-Turbo**,受此消息影响公司股价开盘大涨**10个点** [25] - 马斯克的AI初创公司**xAI**正在招聘银行家和私募信贷人员,以提升其Grok聊天机器人在金融策略方面的能力 [14] 公司组织与战略调整 - **阿里巴巴**正式成立Alibaba Token Hub事业群,建立以“创造Token、输送Token、应用Token”为核心目标的新组织,由CEO吴彦宏直接负责,覆盖从基础模型研发到个人与企业端AI应用的完整布局 [4] - **Meta**计划大规模裁员,员工规模或缩减**20%**,以抵消人工智能基础设施的巨额投入 [4] - **OpenAI**与TPG、贝恩资本等多家私募股权公司深入洽谈,拟成立一家合资企业,将其企业产品进行推广,该拟议交易的投前估值约为**100亿美元**,私募股权投资者将投入约**40亿美元** [12] - **安能物流**发布声明,否认网传“中通快运将并购安能”的消息,称相关内容失实 [12] - 前金立集团全球副总裁**俞雷**已正式入职MOVA,任手机和AI硬件业务负责人 [9] - **许思敏**接手杭州娃哈哈保健食品公司,宗庆后卸任法定代表人、董事长 [12] - **郭德纲**名下的上海魔德文化传媒工作室登记状态由存续变更为注销 [16] 资本市场与融资动态 - 由百度支持、李彦宏牵头创立的生命科学AI大模型公司**百图生科**被曝已秘密向香港联交所递交上市申请,有望筹集**数亿美元**资金 [5] - **Meta**与AI云公司Nebius签署新的五年期AI基础设施供应协议,协议总价值最高可达近**270亿美元**,其中**120亿美元**为专用计算能力,Meta承诺在五年内购买最高**150亿美元**的剩余可用计算能力 [5][6] - **蚂蚁集团**发起的对耀才证券的要约收购已获中国有关部门批准,预计将于3月30日完成交割,交易总金额为**28.14亿港元** [11] - **地瓜机器人**完成**1.2亿美元** B1轮融资,A轮与B轮两轮融资总额达到**2.2亿美元**,新进资方超过15家 [20] - **汇天**完成了近**2亿美元**的新一轮股权融资,此轮融资后历史股权融资总额约**10亿美元** [20] - **蓝芯算力**连续完成A轮系列融资,总金额达**数亿元人民币**,其自研的RISC-V+AI融合架构智算服务器CPU已成功点亮 [20] - **天鹜科技**完成超**2亿元**的A+轮融资,本轮由中国石油昆仑资本等机构联合领投 [20] - **中科融合**宣布完成新一轮近**亿元**融资 [22] - **佰特微医疗**完成近**亿元** B轮融资 [22] 行业合作与商业进展 - 英伟达自动驾驶平台**NVIDIA RoboTaxi Ready**新增比亚迪、现代等合作伙伴,覆盖年**1800万辆**新车,并与Uber达成部署协议 [3] - 八家科技巨头包括**谷歌、亚马逊和OpenAI**签署新的《反网络诈骗服务协议》,承诺共享有关诈骗者滥用其服务的威胁情报 [19] - **自变量机器人**与58集团合作,全球首个机器人保洁员在深圳正式“上岗”,由58到家平台调度阿姨与机器人组成搭档提供服务 [24] - **拓竹科技**与泡泡玛特就IP版权相关问题达成和解,相关问题内容已全面下架 [8] - **字节跳动**因版权纠纷暂停在全球推出其最新视频生成模型**Seedance 2.0** [11] 市场数据与产品销售 - 2026年2月,中国国内游戏市场实际销售收入为**332.31亿元**,同比增长**18.96%**,同比增速创近10个月新高 [25] - 2026年2月,中国客户端游戏市场实际销售收入达**88.7亿元**,同比增长**56.75%** [25] - 2026年2月,中国移动游戏市场实际销售收入达**227.29亿元**,同比增长**9.05%** [25] - 2026年2月,中国自主研发游戏在海外市场的实际销售收入达到**21.14亿美元**,同比增长**40.46%** [25] - 2026年2月份皮卡市场销售**4.1万辆**,同比下降**13.2%** [25] - **苹果公司**宣布推出Airpods MAX 2,将于3月25日起接受订购 [25] 企业运营与公关事件 - **永辉超市**自有品牌发布致山姆的公开信,呼吁山姆不要让供应商“二选一”,反对不正当竞争 [6] - **刘文祥麻辣烫**针对多地门店存在食材问题发布致歉信,宣布对涉事门店立即停止合作,全国门店开展自查自纠 [6] - **哈啰租电动车**平台在315晚会曝光违规解除限速后,已下架所有租赁电动车,并启动内部自查 [11] - 央视315晚会曝光的**乖媳妇鸡爪**关联公司,其股东名下关联8家企业,其中4家已注销或被吊销 [11] - **乐刻健身**就“安心付”、退款违约金存在隐形条款一事道歉,称已启动全面排查与整改工作 [14] - **黄天鹅**董事长冯斌直播回应“角黄素”质疑,称给鸡喂万寿菊是为了天然地让鸡蛋更好看,公司声明检出的角黄素含量为**0.399mg/kg**,属于天然本底水平 [19]
黄仁勋 GTC 2026 演讲实录:所有SaaS公司都将消失;Token成本全球最低;“龙虾”创造了历史;Feynman 架构已在路上
AI前线· 2026-03-17 07:30
公司战略定位 - 公司已从单一的图形处理器供应商转型为为“数万亿美元AI基建时代”提供完整技术栈的“总包工头” [2] - 公司的核心壁垒是CUDA软件生态及其庞大的安装基数,这形成了强大的“飞轮效应”,吸引了开发者、催生新市场并持续降低算力成本 [3][6] - 公司业务覆盖AI全领域,是全球唯一能运行语言、生物、图形、视觉、机器人、边缘及云端所有AI领域的平台 [18] CUDA生态与飞轮效应 - CUDA架构诞生20年,其单指令多线程(SIMT)架构和“tiles”功能降低了编程难度,并围绕其形成了包含数千种工具、编译器、框架和库的庞大生态 [4] - 公司在全球建立了数亿块运行CUDA的GPU和计算系统,服务每一朵云、每一家计算机公司和几乎每一个行业,构成了飞轮效应的基础 [6] - 飞轮效应表现为:安装基数吸引开发者,开发者创造新算法和技术突破,催生新市场并扩大生态,进而进一步扩大安装基数,同时使计算成本持续下降 [6][7] - 庞大的安装基数使得公司愿意持续优化软件,因为每项新优化都能让数百万用户受益,这延长了硬件(如六年前出货的Ampere架构)的生命周期,甚至在云上出现定价上涨 [6][7] 数据处理基础设施变革 - AI的快速发展正推动全球数据处理体系发生结构性变革,核心是结构化数据与非结构化数据的全面加速 [8] - 企业计算长期建立在结构化数据(数据框)之上,未来AI系统和智能体也将直接访问和使用这些数据库,要求数据处理基础设施获得数量级性能提升 [10] - 全球每年产生的数据中约90%是非结构化数据(如向量数据库、PDF、视频、语音),AI的多模态理解能力正将其转化为可计算的信息资源 [12] - 为支持这一转变,公司构建了两项关键基础技术:用于加速结构化数据处理的cuDF和用于处理非结构化数据及AI数据的cuVS [13] - 这些技术正逐步融入全球数据处理生态,例如IBM正利用cuDF加速其IBM watsonx.data平台 [13] AI原生行业爆发与市场前景 - 2025年风险投资对AI初创公司的投入高达1500亿美元,创历史之最,投资规模跃升至数十亿美元级,因为这些公司普遍需要海量算力和Token [15] - AI行业爆发源于三件大事:ChatGPT开启生成式AI时代、推理AI(如o1/o3)的出现以及Claude Code开启代理(Agentic)时代 [15] - AI已从“感知”进化到“生成”、“推理”,现在可以执行高效的实际工作,“推理拐点”已经到来,过去两年计算需求增长了约10,000倍,使用量增长约100倍 [17] - 公司预见通过2027年的营收将至少达到1万亿美元,2025年是公司的“推理之年” [17] - 公司业务中,60%来自顶级云服务商,40%来自区域云、主权云、企业级服务器及工业自动化 [18] AI推理性能与成本优势 - AI推理是最困难也是最关键的商业环节,它直接决定AI服务的收入来源 [22] - 衡量AI系统效率的关键指标是每瓦特生成多少token,公司从Hopper H200到Grace Blackwell NVLink 72架构,实现了每瓦特性能提升约35倍(分析师认为接近50倍),并带来更低的token成本 [22] - 通过极致的软硬件协同设计(如NVFP4计算架构、NVLink 72、Dynamo、TensorRT-LLM等),公司构建了完整的大模型推理技术体系 [20] - 仅通过更新软件栈,就能将部分AI推理平台的生成速度从约700 token/秒提升至接近5000 token/秒,性能提升约7倍 [25] - 公司的Token成本在全球范围内具有绝对优势,即便竞争对手的架构免费,其总成本(如1GW数据中心工厂15年摊销成本高达400亿美元)也不够便宜 [25] - 数据中心正从存储和计算中心转变为生产token的“AI工厂”,token成为新的数字商品 [27] Vera Rubin AI超级计算平台 - Vera Rubin是一个全新的计算平台,由七款芯片组成,涵盖计算、网络和存储,是目前最先进的POD规模AI平台 [28] - 该平台包含40个机架、1.2千万亿个晶体管、近2万个公司芯片、1152个NVIDIA Rubin GPU、60 exaflops运算能力以及10 PB/s总扩展带宽,目前已全面投产 [28] - 该平台得到了Anthropic、OpenAI、Meta、Mistral AI及所有主要云提供商的支持 [28] - 过去十年间AI计算能力实现了约4000万倍的提升,推动数据中心向“AI超级计算机”形态演进 [30] - Vera Rubin是一套从硬件到软件完全纵向整合的计算平台,专为智能体AI设计,重新设计了计算、存储和网络架构 [31] - 平台硬件包括全新的NVIDIA Vera CPU,该CPU针对高性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,并已开始单独销售,有望成为一项数十亿美元级业务 [33] - 系统采用100%液冷架构,通过45°C热水散热降低制冷成本,并将整机安装时间从两天缩短至约两小时 [33] - 网络互连采用第六代NVLink架构,并推出了全球首个CPO光电共封装的NVIDIA Spectrum-X以太网交换机 [35] - 通过Kyber机架架构的Rubin Ultra Compute System,可以在一个NVLink域中连接144个GPU,形成大规模统一计算机 [35] Feynman GPU架构与深度整合 - Feynman GPU架构将采用定制化HBM技术,可能基于HBM4E增强版或定制化HBM5方案,允许将部分GPU数据处理逻辑嵌入存储底层,实现超高带宽与低延迟 [41][42] - Feynman平台将搭载代号为Rosa的全新CPU,该CPU被设计为AI智能体的编排中枢,旨在高效调度GPU、存储与网络之间的Token流动 [43] - Feynman时代标志着公司将计算、存储和封装进行了深度耦合,正将数据中心演进为一台高度集成的“巨型超级计算机” [44] AI基础设施与数字孪生平台 - 公司推出NVIDIA DSX平台,这是一个面向“AI工厂”的基础设施平台,用于数据中心的数字仿真、虚拟调试和运行期动态优化 [46][47] - 数据中心建设阶段可通过工程仿真工具进行虚拟调试,大幅缩短建设周期;运行后其数字孪生系统可作为“操作系统”,由AI智能体动态调度冷却、电力和网络系统以优化效率 [46] - NVIDIA Omniverse平台被设计用于承载全球规模的数字孪生模型 [49] - 公司的AI计算基础设施正在向太空延伸,计划开发Vera Rubin Space One轨道数据中心 [49] 智能体操作系统与软件生态 - 公司高度评价并正式支持开源项目OpenClaw,其增长速度甚至超过了Linux,被视为智能体计算机的操作系统 [52][54] - OpenClaw能够连接大语言模型,管理计算资源,调用工具和服务,具备任务调度与多模态交互能力 [54] - 公司认为未来所有科技和软件公司都需要制定“OpenClaw战略”,因为企业软件正在从传统SaaS转向以智能体为核心的AaaS(Agentic as a Service) [55] - 公司与OpenClaw作者合作推出NVIDIA NemoClaw参考架构,增加了OpenShell安全组件,提供企业级安全扩展,使企业能安全部署智能体系统 [56][58] 开放模型生态与行业应用 - 公司推进开放模型生态,目前生态已包含接近300万个开放模型,覆盖语言、视觉、生物、物理和自动驾驶等多个领域 [59] - 公司已发布多条开放模型产品线(如Nemotron、Cosmos World Foundation Model、Project GR00T等),并开放训练数据和方法,策略是“纵向整合、横向开放” [59][60] - 公司宣布成立Nemotron Coalition联盟,与多家技术公司合作共同推进模型发展 [61] - 在物理AI领域,全球几乎所有机器人公司与公司合作,公司提供从训练平台、仿真到部署的完整技术体系 [62] - 自动驾驶的“ChatGPT时刻已经到来”,车辆具备推理和语音指令执行能力,公司宣布与比亚迪、现代、日产、吉利(合计年产量约1800万辆)以及Uber成为新的Robotaxi合作伙伴 [64] - AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命,以及物理AI与机器人时代 [65]
英伟达CEO黄仁勋:Feynman架构将采用定制高带宽内存(HBM)。
新浪财经· 2026-03-17 04:35
公司产品与技术规划 - 英伟达下一代Feynman架构将采用定制的高带宽内存[1] 行业供应链动态 - 高端AI芯片对定制化HBM的需求持续存在[1]
聚焦Rubin落地、Feynman前瞻与基础设施重构:英伟达GTC前瞻与基础设施重构
国泰海通证券· 2026-03-11 22:11
报告行业投资评级 - 行业投资评级:增持 [1] 报告核心观点 - 本次GTC 2026的核心看点不在于单一芯片参数刷新,而在于英伟达能否通过Rubin平台量产落地、Feynman架构前瞻以及光互联、供电与液冷一体化升级,推动AI产业从“购买GPU”迈向“部署AI工厂”的新阶段 [3] - 2026年GTC最值得关注的并非某颗芯片的参数刷新,而是英伟达是否会通过Rubin的系统化落地、Feynman的路线图释放,以及光互联、供电和液冷一体化升级,正式把行业推进到“部署AI工厂”的新阶段 [6][28] 根据目录总结 1. Rubin平台的量产兑现与系统化落地 - Rubin平台已不再只是单颗GPU产品,而是由CPU、GPU、互联、网络和系统组件共同构成的集成式AI超算平台,其核心目标是通过系统级整合降低token成本,并压缩大规模MoE训练和推理所需的GPU占用规模 [6][10] - 英伟达正在把AI基础设施的交付单位从板卡提升到整柜系统,市场关注点正从单卡参数转向机柜级和机架级形态,如NVL72、NVL144和NVL576等rack-scale配置 [6][11] - 随着Vera Rubin平台在CES 2026上确认进入量产阶段,本次GTC很可能揭晓其强化版——Rubin Ultra,一个Rubin Ultra机柜将集成144颗GPU,构建高达**1.5PB/s**的Scale-up网络,单颗芯片双向互联带宽达到**10.8TB/s** [6][15] - 为实现高密度互联,Rubin或将采用双层网络拓扑结构,并在机柜内部实现“光进铜退” [6][16] - Rubin平台开始推动推理基础设施从统一GPU池走向更细分的分层优化,例如Rubin CPX被定义为面向massive-context inference的GPU类别,Vera Rubin NVL144 CPX单机柜可实现约**8 exaflops** AI性能、**100TB** fast memory以及**1.7PB/s**带宽 [18] 2. Feynman架构的前瞻披露与后Rubin时代的推理路线 - Feynman架构的前瞻披露预计将构成大会最具战略意义的看点,其价值在于向市场说明英伟达如何理解后Rubin时代的AI计算需求 [6][19] - Feynman可能成为首批采用台积电A16工艺的芯片,并首次集成Groq的LPU硬件栈,其生产预计在2028年启动,客户出货可能落在2029至2030年 [6][20] - Feynman可能引入以SRAM为核心的广泛集成或3D堆叠技术,单芯片功耗预计将突破**5000W** [6][20] - 英伟达可能会展示一款整合了Groq“语言处理单元”技术的新推理芯片,旨在满足市场对高效能、低成本推理方案的需求,Groq LPU路径更适合实时语音、交互式Agent等对响应时间高度敏感的场景 [6][21][23] 3. 光互联、供电与液冷共同驱动的数据中心基础设施重构 - 在互联层面,CPO与硅光正成为超大规模AI系统的重要方向,未来数据中心内部将逐步从传统铜互联走向更高带宽密度、更低损耗的光连接体系 [6][25] - 本届GTC被视为CPO商业化落地的关键里程碑,Rubin Ultra被普遍视为“光入柜内”的关键节点,光互联将进入机柜内部和scale-up路径 [25] - 在供电层面,Rubin单芯片功耗将超过**2000W**,Feynman目标功耗将超过**5000W**,800V高压直流供电被视为未来主电源的重要发展方向 [6][26] - 在散热层面,风冷正失去对超高功耗算力平台的适应性,液冷将从可选方案转向标准配置,并带动冷板、热界面材料和机柜级液冷系统同步升级 [6][27] - 液冷技术迭代重点指向散热材料和热界面材料升级,例如冷板从传统铜材升级到铜合金甚至金刚石相关材料,热界面材料方面液态金属和金刚石散热片是重要方向 [27]
一文了解英伟达GTC2026有望带来哪些新产品/技术
选股宝· 2026-03-11 08:58
英伟达GTC 2026前瞻技术产品 - 公司下一代AI超级计算平台Rubin Ultra,属于Rubin架构的“终极性能”版本 [1] - 公司规划了以物理学家费曼命名的Feynman架构,预计在2028年及以后推出 [1][2] 关键硬件技术进展 - 共同封装光学(CPO)技术将光引擎与交换芯片共同封装,相较于传统网络,功率转换效率提升5倍、网络韧性提升10倍,部署时间加快5倍 [2] - HBM4内存频宽较HBM3E提升2倍以上,能效提升40%,可显著提升AI服务效能 [2] - 公司在收购Groq技术后,推出了专用推理加速单元(LPU)芯片 [2]