计算本质与经济的范式转变 - 计算的本质从“存储/检索系统”(仓库)转变为“生成系统”(工厂),直接与企业收入创造挂钩 [3] - AI代工厂生产名为“Token”的商品,该商品已被细分和定价,出现类似iPhone的免费、高级、中间层级的分层 [4] - 有人愿意为每一百万个Token支付1000美元,这在不远的将来将成为现实 [4] - 计算设备因此从成本中心转变为利润中心 [4] - 基于生产力提升,未来全球GDP中用于计算的占比将是过去的100倍 [5] 公司增长前景与市值展望 - 公司迈向10万亿美元市值是一个数字,但公司的增长极大概率会发生,被视为必然 [5][6] - 未来实现3万亿美元营收的体量并非不可能 [6] 电力瓶颈与解决方案 - AI扩张的瓶颈之一是电力,但并非唯一担忧 [8] - 提升能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”,token成本每年下降一个数量级 [8] - 电网按极端峰值设计,99%的时间里未达到最坏情况,大多数时候可能只在峰值的60%左右运行,存在闲置电力 [8] - 解决方案是改变供电合同,放弃对“六个九”(99.9999%)绝对可用性的追求 [9] - 构建能够“优雅降级”的数据中心,当电网要求降低供电时,可转移关键负载或降低计算速率,轻微牺牲服务质量以换取能源消耗减少 [9] 供应链与内存战略 - 公司对ASML光刻机、台积电CoWoS先进封装等潜在产能制约环节并不焦虑,与供应商保持紧密合作 [10] - 系统工程深刻改变制造模式,例如一个Vera Rubin机架包含130万到150万个组件,汇聚200家供应商的技术 [11] - 高互联密度(如NVLink-72)要求将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机(重达两三吨)形式发货,供应链需具备吉瓦(GW)级电力储备进行出厂前测试 [11] - 大约三年前,公司成功说服多家内存大厂CEO,使其相信HBM(高带宽内存)将成为未来数据中心主流,并推动产业链投资扩产 [11] - 推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域 [12] AI缩放定律与算力需求 - AI扩展规律包括:预训练、后训练、测试时扩展、代理式扩展 [13] - 训练数据将继续扩大,很多会是合成数据,训练不再受数据限制,数据将受限于算力 [14] - 推理就是思考,是算力密集型活动,测试时扩展(包含推理、规划、搜索等)将推动推理算力需求上升 [14] 公司护城河与前沿探索 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者对公司持续优化底层的信任之上,并拥有横向整合进入全球各类云厂商、OEM和边缘设备的广泛生态 [16][17] - 公司GPU已进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选 [17] - 构建大规模太空数据中心存在核心物理痛点:太空中只能靠辐射散热,需要巨大的散热器,现阶段最务实的做法是先利用地球上的闲置电力 [17] - 评价马斯克旗下xAI仅用4个月建成拥有10万块GPU的超算中心,认为其成功源于第一性原理思维、极简主义、系统思考能力、亲自在一线行动并带来强烈紧迫感 [17] AI对劳动力市场的影响与未来展望 - 招聘时倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,包括会计师、律师、销售人员、供应链经理、药剂师、电工和木匠等 [18] - 工作本质是一系列“任务”的人可能被AI颠覆,而工作具有更深层“目标”的人可利用AI自动化处理常规琐事,从而从执行者转变为行业创新者 [19] - 使用AI的门槛已降至零,可向AI询问使用方法,唯一的障碍在于是否决定开始,等待的成本与日俱增 [20] - 公司软件工程师的数量将会增长而非减少,如果编程的定义是“描述规范让计算机去构建”,那么具备此能力的人数可能从3000万增长到10亿,未来每个木匠、水管工都可能成为程序员 [21] - 如果将AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI在当下已经实现,技术上已具备AI自主创建服务并获得数十亿用户及盈利的可行性 [21]
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然