AI计算范式的根本性转变 - 计算的本质从“检索系统”转变为“生成系统”,计算机的角色从“仓库”变为直接创造收入的“工厂” [2] - AI代工厂正在制造名为“Token”的商品,该商品已被细分和定价,例如有人愿意为每一百万个Token支付1000美元 [2] - 基于“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越 [2] - 未来用于计算的GDP占比将是过去的100倍,全球GDP将因此加速增长 [2] 公司增长与市值前景 - 公司增长极大概率会发生,未来实现3万亿美元营收的体量并非不可能 [3] - 公司能否迈向10万亿美元市值是一个被讨论的话题,该数字“只是一个数字” [2][3] AI扩展的瓶颈与解决方案 - AI扩展的瓶颈之一是电力,解决方案包括提升能效和获取更多电力 [4] - 能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”提升能效,使得token成本每年下降一个数量级 [4] - 电网按极端峰值设计,99%的时间里存在闲置电力,大多数时候可能只在峰值的60%左右运行 [4] - 需要构建能够“优雅降级”的数据中心,当电网要求降低电力供应时,数据中心可以转移关键负载或降低计算速率 [4][5] - 需要改变云厂商与电力公司之间严苛的供电合同,放弃对“六个九”绝对可用性的盲目追求 [5] 供应链与内存战略 - 公司不担心ASML光刻机、台积电CoWoS先进封装等环节的产能制约,与供应商保持紧密沟通 [5] - 系统工程深刻改变基础设施制造模式,一个Vera Rubin机架包含130万到150万个组件,背后汇聚了200家供应商 [5] - 为匹配极高的互联密度,将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机形式发货 [5][6] - 大约三年前成功说服多家内存大厂CEO,使其相信HBM将成为未来数据中心主流,并推动产业链投资扩产 [6] - 推动供应商将原本专属于手机的低功耗内存改造并引入超算领域 [7] AI缩放定律与算力需求 - AI扩张被拆分为四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展 [8] - 训练不再受数据限制,数据将受限于算力,未来会继续扩大训练数据,很多会是合成数据 [9] - 推理就是思考,是算力密集型的,测试时扩展包含推理、规划、搜索等,会推动推理算力需求上升 [9] 公司护城河与生态系统 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者的信任之上 [10] - 生态系统横向整合进入全球各类云厂商、OEM和边缘设备 [10][11] 前沿探索与工程执行力 - 公司GPU已经进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选,大规模太空数据中心存在散热等物理痛点 [11] - 对马斯克旗下xAI仅用4个月建成拥有10万块GPU的Colossus超算中心给予极高评价,将其成功归结为第一性原理思维、极简主义、系统思考与亲临一线的执行力 [11][12] AI对劳动力市场的影响 - 招聘将倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,善用AI的人将展现出更高的交付价值 [12] - 如果工作本质是一系列“任务”,被AI颠覆几乎是必然的;如果工作具有更深层的“目标”,则可以利用AI自动化常规琐事,从而成为“创新者” [13] - 编程的定义是“描述规范让计算机去构建”,能做到这一点的人数可能从3000万增长到10亿 [13] - 如果AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI“就是现在”,技术可行性已经具备 [13] 公司管理、协同设计与战略决策 - 公司进行“极限协同设计”,对从架构、芯片、系统、系统软件到算法和应用程序的整个软件栈进行优化 [17][21] - 管理团队庞大,直接汇报人数超过60人,且大多数是工程专家,涵盖内存、CPU、光学、GPU、架构、算法等领域 [20][23][25][27] - 公司采用集体讨论模式,所有相关专家参与每次技术对话,确保极限协同设计 [28][29][30] - 公司从加速器公司转变为加速计算公司,关键战略决策包括发明可编程像素着色器、引入单精度浮点数、以及将CUDA引入GeForce GPU [32][33][34] - 将CUDA引入GeForce的决策曾极大增加成本并吞噬毛利润,市值一度跌至约15亿美元,但此举为CUDA建立了庞大的装机量基础 [35][36][37][40][41][46] - 领导力体现在通过持续沟通和“推理”来塑造公司内外(包括员工、董事会、客户、供应链伙伴)的信念系统,为重大决策铺平道路 [48][49][50][51][52] 行业洞察与供应链协同 - 公司通过GTC大会等行业活动,与上下游数百位CEO沟通,告知业务状况、增长驱动力和未来方向,以指导他们的投资决策 [86][87] - 公司的工作包括告知、塑造和启发供应链伙伴,例如成功说服DRAM行业CEO投资HBM和改造手机低功耗内存用于超算,使相关公司迎来创纪录的一年 [88][89] - 供应链需要为前置的超级计算机制造环节提供吉瓦级的庞大电力储备,以进行构建和测试 [98] - 公司不担心供应链瓶颈,因为已明确告知供应商需求,并相信他们会做到 [102][103][105] 工程哲学与系统设计 - 公司的工程哲学是“光速”,代表从第一性原理出发,将一切推向物理极限(如速度、功耗、成本),然后进行权衡 [120][121] - 反对“持续改进”方法,倾向于从零开始重新设计以逼近理论最优值,例如将可能需要74天的流程重新设计为可能只需6天 [122][123] - 设计原则是系统应“像必要时那样复杂,但又要尽可能简单”,挑战所有不必要的复杂性 [129] - 公司制造的是“世界上制造过的最复杂的计算机”,例如Vera Rubin计算舱包含7种芯片类型、5种专用机架类型、40个机架、近2万个英伟达裸片、超过1100个Rubin GPU [124][127][131] - 公司可能每周生产大约200个这样的计算舱 [128]
黄仁勋深度访谈:“Token经济”爆发 AI计算占GDP比重将翻百倍 英伟达(NVDA.US)10万亿是必然