加速计算
搜索文档
黄仁勋Computex演讲:个人AI计算机已全面投产,将推出下一代GB300人工智能系统
36氪· 2025-05-19 19:04
个人AI计算机DGX Spark - 个人AI计算机DGX Spark已全面进入量产阶段,预计数周内上市,配备GB10超级芯片及先进张量核心,支持用户定制化定价,圣诞节前实现大规模交付 [1] - 同时推出DGX Station工作站,华硕、戴尔、惠普等厂商将在今年晚些时候推出该产品 [1] - 公司将联合台积电、富士康在中国台湾建立首座人工智能超级计算机,作为当地AI生态系统核心支柱 [1] Blackwell RTX Pro 6000系列工作站 - 展示Blackwell RTX Pro 6000工作站系列,包含8块GPU,支持CX8网卡,通信速度更快、功耗更低,适合训练和推理更强大AI模型 [5] - CX8已进入量产阶段,通过PCI Express接口实现GPU间高效通信,网络带宽高达800Gbps,每颗GPU配备独立网络接口,显著提升通信速度与效率 [5] - 现场展示RTX 5060显卡及搭载该显卡的MSI新款笔记本,后者将于5月上市 [3] 下一代GB300人工智能系统 - 计划2025年第三季度推出GB300 NVL72 AI服务器,配备72颗Blackwell Ultra AI GPU和36颗Grace CPU,采用机架级设计,单个GPU拥有288GB HBM3E内存 [6] - 与GB200 NVL72相比,GB300性能提升50%,额定功率1.4kW,专为先进AI推理和测试扩展设计,支持复杂AI工作负载 [6] - 苹果已下单采购价值约10亿美元的GB300 AI芯片,每台GB300 NVL72服务器价格在370万至400万美元之间 [9] Grace Blackwell Ultra Superchip - 推出Grace Blackwell Ultra Superchip平台,被称为"思考机器",支持物理AI应用如机器人感知和行动 [11] - 该平台性能参数:40 PFLOPS TE FP4(1.5倍GB200)、576GB at 16TB/s HBM3e(1.5倍GB200)、800Gb/s CX8(2倍GB200) [13] RTX PRO企业AI运算平台 - 推出专为Agent智能体设计的RTX Pro企业AI运算平台,具备30 PFLOPS FP4 AI性能和3 PFLOPS RTX显示性能,配备800GB显存 [18] - 华擎和微星将首发该平台,联想、华硕、思科、戴尔等厂商也将加入合作 [18] - NVLink Spine支持每秒传输约900TB数据,处理能力超过整个互联网 [14] Newton物理引擎与机器人技术 - 计划7月开源Newton物理引擎,整合进ISAAC模拟器,用于机器人虚拟训练 [20] - Isaac GR00T平台通过模拟仿真训练机器人工作,GR00T Dreams升级后可生成3D动作轨迹,帮助机器人学习人类动作 [20] - 将AI模型应用于自动驾驶汽车,与梅赛德斯合作推出端到端自动驾驶车队,今年即可实现 [22] 其他重要信息 - 宣布在中国台湾开设新办事处"Nvidia Constellation" [24] - 推出NVLink Fusion定制服务,联发科、Marvell等将利用NVLink生态系统打造定制AI芯片 [16]
英伟达,巨头转型
半导体芯闻· 2025-05-19 18:04
核心观点 - 英伟达从GPU芯片厂商转型为AI基础设施巨头,通过CUDA生态和硬件创新引领加速计算与AI革命 [3][4][29] - 公司提出"AI工厂"概念,将数据中心视为生产token的价值创造中心,类比工业革命的电力和信息时代的互联网 [5] - 台湾供应链在英伟达全球版图中占据核心地位,从晶圆制造到系统组装形成完整产业链 [24][26][27] 技术演进路径 - **GPU到AI平台**:2006年推出CUDA改变并行运算,2016年推出DGX系统开启AI革命,2019年收购Mellanox强化数据中心网络能力 [3][4] - **计算范式突破**:从感知AI(图像/语音)到生成式AI(内容创作),再向代理式AI(任务执行)和物理AI(理解现实规律)演进 [14][16] - **硬件性能跃迁**:GB300单节点算力达40 PFLOPS,相当于2018年18,000块Volta GPU组成的Sierra超算,6年性能提升4,000倍 [17][18] 核心竞争优势 - **CUDA生态**:覆盖计算光刻(cuLitho)、量子化学(cuQuantum)、气候模拟(Earth-2)等20+行业,形成"库越多→应用越丰富→用户越多"的飞轮 [9][10] - **异构计算架构**:通过NVLink实现7.2TB/s单机带宽,130TB/s集群带宽,超越全球互联网流量 [20] - **制程与封装**:台积电CoWoS-L封装技术集成32颗GPU裸片+128组HBM,单芯片含2,000亿晶体管 [26] 产品路线图 - **GeForce 5060 RTX**:展示DLSS神经渲染技术,90%像素靠AI生成,实现光线追踪性能飞跃 [6] - **Grace Blackwell NVL72**:横向扩展数百台服务器,纵向突破半导体物理极限,Q3将推出GB300升级版,推理性能提升1.5倍 [17] - **三位一体平台**:集成CPU/GPU/QPU,CUDA Q实现量子误差处理,5G/6G网络全加速重构 [12] 台湾产业链协同 - **制造环节**:台积电负责12英寸晶圆前道工艺,Amkor完成CoWoS异质封装,京元电子进行125℃高温测试 [26] - **系统集成**:鸿海精密组装10,000+组件,整合液冷散热器(酷码/奇鋐)、ConnectX-7网卡等 [27] - **超级计算机**:120万组件/2英里铜缆/1,300万亿晶体管/1.8吨重量,体现台湾半导体全链条能力 [27]
黄仁勋,刚刚宣布!将在中国台湾建AI超级计算机
第一财经· 2025-05-19 12:47
英伟达AI超级计算机计划 - 英伟达联合台积电、富士康在中国台湾建立AI超级计算机 [1] - DGX Spark个人AI计算机已全面投产 预计几周后上市 [1] - 下一代GB300人工智能系统将于第三季度推出 [2] 中国市场战略 - 中国市场在上一财年为英伟达贡献170亿美元收入 占总销售额13% [3] - 公司评估中国市场策略 重申其重要性 上海被定位为重要研发基地 [3] - 英伟达计划扩建上海园区 包括建设标志性新园区 当前办公空间已显拥挤 [3] - GPU设计修改不会在中国进行 [3] 行业前景与技术优势 - 芯片产业价值达3000亿美元 数据中心市场机遇近万亿美元 [4] - 加速计算和AI技术是核心 英伟达通过CUDAx算法库保持技术独特性 [4]
黄仁勋:数据中心将成万亿美元蓝海 英伟达靠算法库独步全球
快讯· 2025-05-19 11:21
行业前景 - 芯片产业当前价值已达3000亿美元 [1] - 数据中心市场正转变为近万亿美元规模 受人工智能工厂和基础设施推动 [1] 公司技术优势 - 公司关键技术包括加速计算和人工智能 并在内部实现独特整合 [1] - 算法库尤其是CUDAx库是核心竞争力 使公司成为全球唯一持续专注库技术的企业 [1] 战略定位 - 公司倡议建立在加速计算和人工智能等关键技术基础上 [1]
【招商电子】英伟达GTC 2025跟踪报告:2028年全球万亿美金Capex可期,关注CPO、正交背板等新技术趋势
招商电子· 2025-03-20 10:51
数据中心与AI基础设施 - 预计2028年数据中心资本开支将达1万亿美元,主要用于加速计算芯片[1][2] - 2024年向四大云服务商交付130万颗Hopper GPU,2025年计划出货360万颗Blackwell GPU[2] - AI基础设施计算量较去年预计增长100倍,Tokens数量大幅增加[2][9][10] - 数据中心正在向"人工智能工厂"转型,专注于AI驱动的处理和应用[13] Blackwell平台与未来产品 - Blackwell已全面投产,NVL72结合Dynamo推理性能提升40倍[3] - 计划25H2发布Blackwell Ultra,算力提升50%,FP8精度算力达0.36EF[3] - 预计26H2推出Vera Rubin NVL144,推理能力达每秒50千万亿次浮点运算[3] - 预计27H2推出Rubin Ultra NVL576,FP4精度算力达15EF,性能较GB300提升14倍[3] - 预计2028年推出Feynman平台,迎接千兆瓦AI工厂时代[3] CPO交换机技术 - 预计25H2推出Quantum-X CPO交换机,交换容量115.2Tb/s,能耗降低3.5倍[5] - 预计26H2推出Spectrum-X CPO交换机,包含两种型号,最高背板带宽409.6TB/S[5] - 采用MRM micro mirror技术,可将连续激光束转化为二进制信号[5] - CPO技术可帮助数据中心节省60MW电力,相当于100个Rubin机柜耗电量[5] 自动驾驶与机器人技术 - 推出Halos系统保障汽车安全,已评估700万行代码并申请1000多项专利[25][26] - 借助Omniverse和Cosmos加速自动驾驶开发,实现端到端训练[26] - 推出开源通用基础模型Isaac Groot N1,具有快慢双系统架构[6][61] - 预计到2030年全球将短缺5000万名工人,机器人产业潜力巨大[60] AI技术演进与应用 - AI分为三个层次:生成式AI、智能体AI和物理AI[7] - 推理模型带来100倍Tokens增长,计算速度需提升10倍[9][10][11] - 推出Dynamo操作系统,Blackwell性能是Hopper的40倍[35][38] - CUDA-X行业框架覆盖计算光刻、5G、基因测序等多个领域[14][15] 产品路线图与技术突破 - 每年更新路线图,每两年更新架构,持续推出新产品[53] - 采用液冷技术,单个机架功率达120千瓦,含60万个部件[29][30] - 光子学技术突破,硅光子交换机可扩展到数百万GPU规模[47][48] - 与台积电合作采用3D共封装技术,实现高性能光子集成电路[49]
英伟达,我命由天不由我
虎嗅APP· 2025-03-07 18:35
英伟达的崛起与挑战 - 财报发布后五个交易日内股价两次单日跌幅超8%,单日跌幅相当于两个小米市值蒸发 [3] - 收入规模相当于四个茅台,收入和利润保持80%超高增速 [3] - 算力领域占据绝对领先地位,竞争对手难以撼动其地位 [3] - 创始人黄仁勋以亲民形象著称,擅长通过文化融合拓展市场 [4] - 公司内部实行高压管理,项目失败会面临"公开处决"式问责 [5] - 早期通过激进竞争策略击败50余家显卡公司,包括对3dfx的"趁你病要命"诉讼 [6][7][8] - 曾因与微软价格谈判破裂失去Xbox订单,后通过任天堂Switch业务扳回一城 [9][17] 战略转型与关键决策 - 早期尝试移动设备战略(Tegra芯片)和调制解调器业务(3.67亿美元收购Icera)均告失败 [15] - 坚持投入CUDA技术开发,尽管初期使用率不足1%且导致产品价格偏高 [18] - 面对激进投资者Starboard Value压力,果断砍掉失败业务但保留CUDA [16][17] - 2017年收购被Starboard Value施压的Mellanox,补强数据中心互联能力 [24][27] - 当前三大核心优势:GPU性能、CUDA生态、InfiniBand/NVlink高速互联技术 [26][27] 创始人特质与企业文化 - 黄仁勋管理风格兼具亲和力与极端严厉,被员工形容为"把手放进插座" [5] - 坚持长期投入"零亿美元市场",体现企业家情怀与战略定力 [20] - 将企业成功归因于"绝望才是成功之母",而非灵感或预见性 [23] - 保持高强度工作节奏(每天12-14小时,全年无休)推动AI技术发展 [32] - 童年移民经历塑造坚韧性格,曾每日遭受种族歧视欺凌 [29] 行业竞争格局 - 显卡行业早期竞争惨烈,存活需经历"尸山血海"式搏杀 [8] - 与AMD长期角力,包括争夺任天堂等关键客户 [17] - 面临地缘政治风险,中国市场自主替代可能构成长期威胁 [30] - AI算力领域当前处于绝对领先地位,"拿着望远镜也找不到对手" [3] 技术突破与产业影响 - 多伦多大学团队意外发现GPU可用于AI训练,催生AlexNet突破 [13][14] - CUDA技术最初服务于气候科学、医疗影像等小众科研领域 [18] - 当前AI发展高度依赖英伟达GPU硬件基础设施 [33] - 创始人坚信AI将全面造福人类,强烈反对"AI威胁论" [32]