ComputeX 前瞻、如何评价英伟达Windows 处理器

AI基础设施进入系统设计新阶段 - AI基础设施的评判标准正从单一组件转向交付完整AI系统的能力，包括机架、供电、散热、网络、PCB/基板、先进封装、测试和制造规模 [3] - 行业叙事发生重大转变，关注点从GPU、HBM、CoWoS产能等具体部件，扩展到更广泛的系统级组件，如CPU、网络、内存、CPO、液冷和高压供电架构 [6] - 核心信息是AI基础设施演变为完整的“AI工厂”，采用可组合的模型，包含多种专门功能的机架类型，如GPU机架、CPU机架、网络机架和电源机架 [7] 英伟达N1处理器与消费级市场策略 - 英伟达发布面向Windows PC市场的ARM架构N1处理器，集成20个CPU核心和相当于RTX 5070级别的GPU，支持完整CUDA软件栈，最高配128GB LPDDR5X内存 [4] - N1的核心规格与英伟达此前发布的DGX Spark“最小的AI超级计算机”几乎一致，后者售价3000-4000美元，但市场表现远低于预期 [4] - 多家PC厂商将推出搭载N1的产品，但其成功关键在于能否推动软件生态发展，将英伟达的CUDA资源与Windows生态结合，促进AI应用在PC端的部署 [5] Vera CPU在AI数据中心的作用演进 - Vera CPU是英伟达针对AI数据中心编排层设计的专用CPU，其定位与传统追求通用性的服务器CPU不同 [8] - 随着AI应用从训练转向推理，CPU的角色转变为AI工厂的“交通控制器”，负责请求调度、Agent工作流控制、工具调用协调、内存索引、检索管理、模拟、网络控制和系统遥测 [8] - 英伟达CEO认为CPU市场规模约2000亿美元，公司为Vera CPU准备了约200万台的年产能 [9] - AI服务器中CPU与GPU的配比可能从过去的1:8走向1:1甚至更高，反映出CPU重要性提升，两大海外CPU厂商的交货周期已从3-4周延长至8-10周 [9] 网络与CPO（共封装光学）技术发展 - 随着AI系统规模扩大至Pod级别，瓶颈从芯片计算转向数据搬运，网络成为焦点 [10] - 英伟达推动以太网成为专门的AI网络结构，其Spectrum-X路线图包含Ethernet Photonics和Quantum-X Photonics [10] - CPO对Rubin Ultra平台至关重要，因为其NVL576配置（组合8个72-GPU机架成576-GPU域）的物理规模超出了铜缆的有效处理范围，需使用直接光学连接 [10] - CPO的采用将提升对光引擎、硅光子PIC、光纤阵列单元(FAU)、主动对准设备、光学连接器、光纤管理及液冷兼容光子封装等组件的需求 [11] 冷却与供电架构面临挑战与转型 - 冷却和供电可能成为Rubin平台部署的实际瓶颈 [12] - 功率密度急剧上升：Rubin NVL8服务器TDP约24kW，2U系统级超过32kW；Rubin NVL72机架TDP估计在180-220kW之间 [13] - 高功率带来供电挑战：在54V电压下，216kW机架意味着约4000A电流，对铜缆、母线、连接器和热管理造成困难 [13] - 英伟达推动供电架构向800V直流供电、110kW电源货架和电池备份单元(BBU)支持的方向发展 [16] - 冷却方案演进：Hopper机架功率40-60kW，采用风冷或混合冷却；Blackwell NVL72机架功率120-180kW，直接液冷成为标准；Rubin NVL72机架功率180-220kW；Rubin Ultra可能达到数百千瓦 [15] - 未来机架演变为需要协调电源转换、备用能源、液体流动、遥测和安全系统的电热机器 [17]