Helios机架系统
搜索文档
黄仁勋新年首场采访,谈了做CEO的秘诀
第一财经· 2026-01-07 18:47
文章核心观点 - 文章围绕2026年CES展上英伟达CEO黄仁勋的对话展开,核心观点是:AI算力需求正经历爆炸式增长,推动芯片公司进行技术革命,从单纯追求芯片制程提升转向整个计算系统的协同优化,并积极拓展至机器人、自动驾驶等多元应用领域,预示着一场新的工业革命 [3][4][6] AI算力需求与芯片性能迭代 - 行业面临严重的“算力焦虑”,AMD CEO预测未来几年需将全球计算能力增加**100倍**,英伟达CEO指出模型规模年增**10倍**,推理输出年增**5倍** [3] - 为匹配需求,英伟达推动芯片架构快速迭代,从Hopper到Blackwell,再到Rubin,每代产品吞吐量提升**10倍**,成本降低**10倍**,致力于保持此节奏 [6] - 性能提升不再仅依赖芯片工艺,晶体管密度年增约**1.7倍**已接近物理极限,公司通过协同设计整个数据中心(CPU、GPU、存储、网络)来实现年**10倍**的性能提升 [8][9] - 性能提升伴随能源效率优化,每代产品吞吐量增**10倍**,功耗增**2倍**,能源效率提升**5倍**,形成新的“摩尔定律” [7] 英伟达的战略与技术创新 - 公司采取从芯片到系统堆栈的全面协同设计,覆盖从内存到存储的整个数据处理流程,并在模型层进行代码优化 [9] - 在CES上一次性发布新架构Rubin的**6颗**芯片,包括GPU、CPU、交换机、网卡、DPU等,构建庞大的计算机系统,此类大规模同时应用新芯片属首次 [9][10] - 为开发Rubin,公司每年投入**1.5万**名工程师,预计部署时还需额外投入**2.5万**名工程师一年的工作量 [10] - 公司重新发明存储系统,推出由BlueField-4 DPU支持的推理上下文内存存储平台,以应对AI工作负载对记忆量的快速增长需求,并可能成为全球最大的存储公司之一 [10][11] 供应链、投资与行业生态 - 公司是全球最大的内存采购商之一,直接向所有内存供应商采购,以应对AI计算对内存的庞大需求 [14] - 投资策略多元:1)投资建造尚不存在的东西(如NVLink、Grace CPU);2)投资生态系统(内存厂商、系统伙伴);3)投资供应链下游公司及多个层面(土地电力、芯片、基础设施、模型应用);4)投资或收购初创公司以建立紧密合作 [14] - 获得ASIC公司Groq的知识授权并吸纳其人才,计划整合其技术以开拓新领域 [15] - 开源模型(如DeepSeek-R1、Qwen)推动需求增长,目前每**4个**token中就有**1个**由开源模型生成,这促进了公有云对前代Hopper芯片的使用,导致其现货价格上涨 [16] - 公司预测Blackwell和Rubin架构在2025及2026年带来的收入将超过**5000亿**美元,且因新客户(如Anthropic)加入和开源模型发展,预期可能进一步上调 [16] AI在自动驾驶与机器人领域的应用 - 公司业务多元化,通过算力硬件和开源模型切入自动驾驶与机器人领域 [18] - 其DRIVE AV软件将用于梅赛德斯奔驰车辆,L4级自动驾驶汽车计划于2026年第一季度在美国上路,随后进入欧亚市场 [19] - 预计未来10年,全球**10亿**辆行驶汽车中,将有**数亿**辆具备强大自主能力,自动驾驶可能是增长最快的技术领域之一 [19] - 预计机器人在**2026年**将具备人类水平的能力,运动与抓握问题将优先解决,认知技术也在快速发展 [20] - 机器人革命将应对劳动力短缺,增加就业机会,推动经济增长,许多工作长期内不会被AI取代 [20] 行业趋势与市场观察 - AI原生初创公司在2025年吸纳的投资达到**1500亿**美元,显示业界对AI的巨大热情 [6] - AI计算需求暴涨,驱动芯片厂商竞争焦点从单一GPU扩展到集成CPU、GPU的机架系统(如AMD的Helios)及多芯片解决方案 [9] - AI将深刻改变游戏行业,未来游戏中的每个角色都将由独立的AI驱动,实现动画化,游戏真实性将大幅提升 [19]
苏姿丰对话李飞飞:少量图片生成一个世界,是AI下一章的开始
YOUNG财经 漾财经· 2026-01-06 18:45
文章核心观点 - AI技术正从语言智能向空间智能演进,能够将少量图片生成实时可探索的三维世界,这代表了AI发展的新篇章 [1][4][5] - 空间智能等AI技术的快速发展,带来了对算力需求的急剧增长,硬件制造商面临巨大压力 [5][6][7][8] - 主要AI芯片厂商(如AMD和英伟达)在CES前夕竞相发布新一代高性能芯片和系统,以应对激增的算力需求并提升市场竞争力 [1][9][10] AI技术演进:从语言智能到空间智能 - 斯坦福大学教授李飞飞指出,基于语言的智能在过去几年开启了AI能力和应用的扩散,而空间智能旨在将感知与行动联系起来,使机器智能更接近人类水平 [4] - 空间智能模型能够通过大量数据学习三维、四维结构,仅需一个或几个图像即可填补细节、预测物体背后内容,并生成丰富、一致、永久、可导航的三维世界 [4] - 李飞飞展示的案例中,团队用手机拍摄办公室照片后,AI在几分钟内生成了具有深度和真实比例的窗户、门、家具等物体,并可变换风格,而传统方法通常需要数月 [4] - 空间智能将带来多方面改变:创作者可先用AI描绘脑海中的构想;机器人或车辆可在AI虚拟世界中安全学习感知;建筑师可在建造前直观看到材料和空间,超越静态计划 [5] AI算力需求激增与硬件挑战 - OpenAI联合创始人格雷格·布洛克曼强调,更多的计算能力是最重要的,AI发展的关键在于考虑GPU上不同资源的平衡 [5] - 布洛克曼指出,为保障人类与AI互动时的极低延迟,需要海量计算资源持续高吞吐量运行,这给AMD等硬件制造商带来压力 [6] - AMD CEO苏姿丰透露,自ChatGPT推出以来,使用AI的活跃用户已从100万人增加至10亿人,预计2030年将达到50亿人 [8] - 为让AI无处不在,苏姿丰预计未来几年内需要将全世界的计算能力增加100倍 [8] - 李飞飞指出,空间智能需要教会AI理解三维结构和运动,这需要非常大的内存、大量并行计算和快速的推理,计算需求巨大 [5] 主要厂商技术进展与产品发布 - **英伟达**:发布新一代芯片平台Rubin,其NVFP4格式的推理算力达50 PFLOPS,训练算力达35 PFLOPS,分别是前代Blackwell的5倍和3.5倍,推理token成本比Blackwell低10倍 [9] - **英伟达**:同时推出ConnectX-9 Spectrum-X超级网卡、新一代NVLink 72和新一代超节点DGX SuperPOD [9] - **AMD**:展示新一代机架系统Helios,重近7000磅,具备2.9 exaflops的AI计算能力,配备31TB HBM4显存,采用Instinct MI455X加速器、EPYC Venice CPU和Pensando Vulcano NIC,计划今年晚些时候推出 [10] - **AMD**:下一代AI芯片MI455 GPU将采用两纳米和三纳米工艺及先进封装,搭载HBM4,其AI性能相比MI355提升10倍 [10] - **AMD**:MI500系列芯片正在开发中,将采用两纳米工艺,公司预计在2027年MI500系列推出时,有望在4年内将AI性能芯片提升1000倍 [10] - **AMD**:展示EPYC Venice Zen 6 CPU,采用两纳米工艺,内存和GPU带宽是上一代的两倍,在Helios机架中可与MI455配合;下一代Helios机架将包含72个GPU,可连接数千个机架构建大AI集群 [11] - **AMD**:推出面向AI PC的Ryzen AI 400系列处理器(包括Ryzen AI 400和PRO 400),提供60 NPU TOPS算力,首批搭载系统将于今年1月出货 [11] - **AMD**:推出Ryzen AI Max+ 392和388用于扩展设备内AI计算,并推出基于该处理器的迷你主机Ryzen AI Halo,计划今年第二季度推出 [11] - **AMD**:推出x86架构Ryzen AI Embedded处理器,用于物理AI范畴中的机器人、汽车座舱等 [11]
苏姿丰对话李飞飞:少量图片生成一个世界,是AI下一章的开始
第一财经· 2026-01-06 15:58
行业趋势与市场需求 - AI活跃用户数自ChatGPT推出后从100万人增长至10亿人,预计2030年将达到50亿人,为达到AI无处不在的目标,未来几年全球计算能力需增加100倍 [6] - 空间智能等AI应用对算力提出巨大需求,需要非常大的内存、大量并行计算和快速推理以理解三维结构和运动,运行模型的速度需足够快以保证实时交互的连贯性 [3] - AI发展的关键之一是GPU上不同资源的平衡,人类注意力成为宝贵资源,要求与AI互动时具有非常低的延迟,这需要海量且高吞吐的计算资源持续运行 [5] 主要厂商动态与竞争 - AMD与英伟达在CES开幕前均展示了提升AI算力的能力,行业竞争激烈 [1] - 英伟达发布新一代芯片平台Rubin,其NVFP4格式的推理和训练算力分别达到50 PFLOPS和35 PFLOPS,是Blackwell平台的5倍和3.5倍,推理token成本比Blackwell低10倍 [7] - AMD展示了新一代AI机架系统Helios,该系统AI计算能力为2.9 exaflops,配备31TB HBM4显存,采用Instinct MI455X加速器等组件,计划于今年晚些时候推出 [7] 技术产品进展:AMD - AMD下一代AI芯片MI455 GPU将采用2纳米和3纳米工艺及先进封装,搭载HBM4,其AI性能相比MI355提升10倍 [8] - MI500系列芯片正在开发中,采用2纳米工艺,计划于2027年推出,届时有望在4年内实现AI芯片性能提升1000倍 [8] - AMD推出面向AI PC的Ryzen AI 400系列处理器(包括Ryzen AI 400和PRO 400),提供60 NPU TOPS算力,首批搭载该处理器的系统将于今年1月出货 [9] - AMD推出用于扩展设备内AI计算的Ryzen AI Max+ 392/388处理器,以及基于此的迷你主机Ryzen AI Halo(计划第二季度推出),并推出x86架构Ryzen AI Embedded处理器用于机器人、汽车座舱等物理AI领域 [9] - AMD还展示了EPYC Venice Zen 6 CPU,采用2纳米工艺,其内存和GPU带宽是上一代产品的两倍,将在Helios机架系统中与MI455 GPU配合使用 [8] 技术产品进展:英伟达 - 英伟达推出NVFP4(4位浮点数格式),以在可损失精度处实现更高吞吐量,同时推出了ConnectX-9 Spectrum-X超级网卡、新一代NVLink 72和新一代超节点DGX SuperPOD [7] 前沿AI应用:空间智能 - 空间智能旨在将AI感知与行动联系起来,使机器智能更接近人类水平,其应用包括将少数图片转化为实时可探索、可导航的连贯三维世界 [2][3] - 该技术可大幅提升效率,例如将以往需要数月完成的三维建模工作缩短至几分钟,应用场景涵盖机器人模拟、游戏开发、建筑设计及车辆测试等领域 [2][3]