Workflow
AI缩放定律
icon
搜索文档
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
硬AI· 2026-03-25 23:18
计算本质与角色的根本性转变 - 计算本质从“存储系统”跃迁为具备上下文感知能力的“生成系统”[6] - 计算机在经济中的角色从“仓库”转变为“工厂”,从成本中心变为利润中心[6][8] - AI代工厂生产名为“Token”的商品,该商品已被细分和定价,例如有人愿意为每百万Token支付1000美元[7] 宏观经济与公司市值展望 - 生产力大幅提升将加速全球GDP增长,未来用于计算的GDP占比将是过去的100倍[9] - 公司迈向10万亿美元市值是极大概率事件,未来实现3万亿美元营收的体量并非不可能[10] 电力瓶颈与数据中心解决方案 - 电力是AI扩张的担忧之一,解决方案包括提升能效和获取更多电力[13] - 关键能效指标是“每瓦每秒token数”,通过“极致协同设计”每年可将token成本下降一个数量级[13] - 电网99%的时间未达到峰值负荷,存在大量闲置冗余电力[13] - 提议构建“优雅降级”的数据中心,在电网要求时降低计算速率或转移关键负载,以利用闲置电力[14] 供应链与内存战略 - 公司深刻改变基础设施制造模式,单个Vera Rubin机架包含约130万到150万个组件,汇聚200家供应商[16] - 将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机(重两三吨)发货[16] - 约三年前成功说服内存大厂CEO投资扩产HBM,使其成为未来数据中心主流内存[16] - 推动供应商将手机低功耗内存(LPDDR)改造并引入超算领域[17] AI缩放定律与算力需求 - AI扩张遵循四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展[19] - 训练不再受数据限制,数据将受限于算力,未来将大量使用合成数据[20] - 推理(即思考)是算力密集型的,包含推理、规划、搜索等,将推动推理算力需求上升[20] - 代理式扩展意味着AI可以快速衍生子智能体,组建庞大团队[72] 公司护城河与工程哲学 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动[22] - 公司管理采用“极限协同设计”哲学,管理团队庞大(直接汇报者约60人),跨学科专家共同攻克问题[36][37][43] - 工程哲学以“光速”为框架,从第一性原理出发,将一切逼近物理极限进行设计[119][120] - 追求“像必要时那样复杂,但又要尽可能简单”的设计原则[129] 对AI行业与劳动力的影响 - 善用AI将成为各行业(会计师、律师、销售、供应链经理、药剂师、电工、木匠等)的基本要求,能交付更高价值[25] - 全球“程序员”群体可能从3000万激增至10亿人,编程的定义将扩展为“描述规范让计算机去构建”[26] - 若将AGI定义为能自主开发应用并盈利的系统,那么AGI“已经实现”[26] 行业洞察与前沿探索 - 公司GPU已进入太空,但目前主要用于卫星图像的边缘端筛选,大规模太空数据中心面临辐射散热等物理痛点[22] - 高度评价马斯克的第一性原理思维与极简主义,其亲临现场和强烈紧迫感能推动项目高速完成(如xAI的Colossus超算)[23][114] - 中国是全球创新最快的国家之一,约50%的AI研究人员是华人,其内部激烈竞争和开源文化加速了创新[134]
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
华尔街见闻· 2026-03-24 19:09
计算本质与经济的范式转变 - 计算的本质从“存储/检索系统”(仓库)转变为“生成系统”(工厂),直接与企业收入创造挂钩 [3] - AI代工厂生产名为“Token”的商品,该商品已被细分和定价,出现类似iPhone的免费、高级、中间层级的分层 [4] - 有人愿意为每一百万个Token支付1000美元,这在不远的将来将成为现实 [4] - 计算设备因此从成本中心转变为利润中心 [4] - 基于生产力提升,未来全球GDP中用于计算的占比将是过去的100倍 [5] 公司增长前景与市值展望 - 公司迈向10万亿美元市值是一个数字,但公司的增长极大概率会发生,被视为必然 [5][6] - 未来实现3万亿美元营收的体量并非不可能 [6] 电力瓶颈与解决方案 - AI扩张的瓶颈之一是电力,但并非唯一担忧 [8] - 提升能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”,token成本每年下降一个数量级 [8] - 电网按极端峰值设计,99%的时间里未达到最坏情况,大多数时候可能只在峰值的60%左右运行,存在闲置电力 [8] - 解决方案是改变供电合同,放弃对“六个九”(99.9999%)绝对可用性的追求 [9] - 构建能够“优雅降级”的数据中心,当电网要求降低供电时,可转移关键负载或降低计算速率,轻微牺牲服务质量以换取能源消耗减少 [9] 供应链与内存战略 - 公司对ASML光刻机、台积电CoWoS先进封装等潜在产能制约环节并不焦虑,与供应商保持紧密合作 [10] - 系统工程深刻改变制造模式,例如一个Vera Rubin机架包含130万到150万个组件,汇聚200家供应商的技术 [11] - 高互联密度(如NVLink-72)要求将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机(重达两三吨)形式发货,供应链需具备吉瓦(GW)级电力储备进行出厂前测试 [11] - 大约三年前,公司成功说服多家内存大厂CEO,使其相信HBM(高带宽内存)将成为未来数据中心主流,并推动产业链投资扩产 [11] - 推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域 [12] AI缩放定律与算力需求 - AI扩展规律包括:预训练、后训练、测试时扩展、代理式扩展 [13] - 训练数据将继续扩大,很多会是合成数据,训练不再受数据限制,数据将受限于算力 [14] - 推理就是思考,是算力密集型活动,测试时扩展(包含推理、规划、搜索等)将推动推理算力需求上升 [14] 公司护城河与前沿探索 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者对公司持续优化底层的信任之上,并拥有横向整合进入全球各类云厂商、OEM和边缘设备的广泛生态 [16][17] - 公司GPU已进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选 [17] - 构建大规模太空数据中心存在核心物理痛点:太空中只能靠辐射散热,需要巨大的散热器,现阶段最务实的做法是先利用地球上的闲置电力 [17] - 评价马斯克旗下xAI仅用4个月建成拥有10万块GPU的超算中心,认为其成功源于第一性原理思维、极简主义、系统思考能力、亲自在一线行动并带来强烈紧迫感 [17] AI对劳动力市场的影响与未来展望 - 招聘时倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,包括会计师、律师、销售人员、供应链经理、药剂师、电工和木匠等 [18] - 工作本质是一系列“任务”的人可能被AI颠覆,而工作具有更深层“目标”的人可利用AI自动化处理常规琐事,从而从执行者转变为行业创新者 [19] - 使用AI的门槛已降至零,可向AI询问使用方法,唯一的障碍在于是否决定开始,等待的成本与日俱增 [20] - 公司软件工程师的数量将会增长而非减少,如果编程的定义是“描述规范让计算机去构建”,那么具备此能力的人数可能从3000万增长到10亿,未来每个木匠、水管工都可能成为程序员 [21] - 如果将AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI在当下已经实现,技术上已具备AI自主创建服务并获得数十亿用户及盈利的可行性 [21]
黄仁勋深度访谈:“Token经济”爆发 AI计算占GDP比重将翻百倍 英伟达(NVDA.US)10万亿是必然
智通财经· 2026-03-24 17:25
AI计算范式的根本性转变 - 计算的本质从“检索系统”转变为“生成系统”,计算机的角色从“仓库”变为直接创造收入的“工厂” [2] - AI代工厂正在制造名为“Token”的商品,该商品已被细分和定价,例如有人愿意为每一百万个Token支付1000美元 [2] - 基于“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越 [2] - 未来用于计算的GDP占比将是过去的100倍,全球GDP将因此加速增长 [2] 公司增长与市值前景 - 公司增长极大概率会发生,未来实现3万亿美元营收的体量并非不可能 [3] - 公司能否迈向10万亿美元市值是一个被讨论的话题,该数字“只是一个数字” [2][3] AI扩展的瓶颈与解决方案 - AI扩展的瓶颈之一是电力,解决方案包括提升能效和获取更多电力 [4] - 能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”提升能效,使得token成本每年下降一个数量级 [4] - 电网按极端峰值设计,99%的时间里存在闲置电力,大多数时候可能只在峰值的60%左右运行 [4] - 需要构建能够“优雅降级”的数据中心,当电网要求降低电力供应时,数据中心可以转移关键负载或降低计算速率 [4][5] - 需要改变云厂商与电力公司之间严苛的供电合同,放弃对“六个九”绝对可用性的盲目追求 [5] 供应链与内存战略 - 公司不担心ASML光刻机、台积电CoWoS先进封装等环节的产能制约,与供应商保持紧密沟通 [5] - 系统工程深刻改变基础设施制造模式,一个Vera Rubin机架包含130万到150万个组件,背后汇聚了200家供应商 [5] - 为匹配极高的互联密度,将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机形式发货 [5][6] - 大约三年前成功说服多家内存大厂CEO,使其相信HBM将成为未来数据中心主流,并推动产业链投资扩产 [6] - 推动供应商将原本专属于手机的低功耗内存改造并引入超算领域 [7] AI缩放定律与算力需求 - AI扩张被拆分为四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展 [8] - 训练不再受数据限制,数据将受限于算力,未来会继续扩大训练数据,很多会是合成数据 [9] - 推理就是思考,是算力密集型的,测试时扩展包含推理、规划、搜索等,会推动推理算力需求上升 [9] 公司护城河与生态系统 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者的信任之上 [10] - 生态系统横向整合进入全球各类云厂商、OEM和边缘设备 [10][11] 前沿探索与工程执行力 - 公司GPU已经进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选,大规模太空数据中心存在散热等物理痛点 [11] - 对马斯克旗下xAI仅用4个月建成拥有10万块GPU的Colossus超算中心给予极高评价,将其成功归结为第一性原理思维、极简主义、系统思考与亲临一线的执行力 [11][12] AI对劳动力市场的影响 - 招聘将倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,善用AI的人将展现出更高的交付价值 [12] - 如果工作本质是一系列“任务”,被AI颠覆几乎是必然的;如果工作具有更深层的“目标”,则可以利用AI自动化常规琐事,从而成为“创新者” [13] - 编程的定义是“描述规范让计算机去构建”,能做到这一点的人数可能从3000万增长到10亿 [13] - 如果AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI“就是现在”,技术可行性已经具备 [13] 公司管理、协同设计与战略决策 - 公司进行“极限协同设计”,对从架构、芯片、系统、系统软件到算法和应用程序的整个软件栈进行优化 [17][21] - 管理团队庞大,直接汇报人数超过60人,且大多数是工程专家,涵盖内存、CPU、光学、GPU、架构、算法等领域 [20][23][25][27] - 公司采用集体讨论模式,所有相关专家参与每次技术对话,确保极限协同设计 [28][29][30] - 公司从加速器公司转变为加速计算公司,关键战略决策包括发明可编程像素着色器、引入单精度浮点数、以及将CUDA引入GeForce GPU [32][33][34] - 将CUDA引入GeForce的决策曾极大增加成本并吞噬毛利润,市值一度跌至约15亿美元,但此举为CUDA建立了庞大的装机量基础 [35][36][37][40][41][46] - 领导力体现在通过持续沟通和“推理”来塑造公司内外(包括员工、董事会、客户、供应链伙伴)的信念系统,为重大决策铺平道路 [48][49][50][51][52] 行业洞察与供应链协同 - 公司通过GTC大会等行业活动,与上下游数百位CEO沟通,告知业务状况、增长驱动力和未来方向,以指导他们的投资决策 [86][87] - 公司的工作包括告知、塑造和启发供应链伙伴,例如成功说服DRAM行业CEO投资HBM和改造手机低功耗内存用于超算,使相关公司迎来创纪录的一年 [88][89] - 供应链需要为前置的超级计算机制造环节提供吉瓦级的庞大电力储备,以进行构建和测试 [98] - 公司不担心供应链瓶颈,因为已明确告知供应商需求,并相信他们会做到 [102][103][105] 工程哲学与系统设计 - 公司的工程哲学是“光速”,代表从第一性原理出发,将一切推向物理极限(如速度、功耗、成本),然后进行权衡 [120][121] - 反对“持续改进”方法,倾向于从零开始重新设计以逼近理论最优值,例如将可能需要74天的流程重新设计为可能只需6天 [122][123] - 设计原则是系统应“像必要时那样复杂,但又要尽可能简单”,挑战所有不必要的复杂性 [129] - 公司制造的是“世界上制造过的最复杂的计算机”,例如Vera Rubin计算舱包含7种芯片类型、5种专用机架类型、40个机架、近2万个英伟达裸片、超过1100个Rubin GPU [124][127][131] - 公司可能每周生产大约200个这样的计算舱 [128]
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
华尔街见闻· 2026-03-24 11:22
AI计算范式的根本性转变 - 计算的本质从“检索系统”转变为“生成系统”,计算机的角色从“仓库”变为直接创造收入的“工厂” [3] - AI代工厂正在制造名为“Token”的商品,这种商品已被细分和定价,例如有人愿意为每一百万个Token支付1000美元 [3] - 基于“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越 [3] 英伟达的增长前景与市场展望 - 公司CEO认为英伟达的增长极大概率会发生,是必然的,未来实现3万亿美元营收的体量并非不可能 [4] - 如果生产力大幅提升,全球GDP将加速增长,未来用于计算的GDP占比将是过去的100倍 [4] - 公司能否迈向10万亿美元市值是一个被讨论的数字,但增长是核心焦点 [4] AI扩展的瓶颈与电力解决方案 - 电力是AI扩张的一个担忧,但不是唯一担忧,解决方案包括提升能效和获取更多电力 [6] - 能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”提升能效,使得token成本每年下降一个数量级 [6] - 电网99%的时间没有达到峰值负荷,大多数时候可能只在峰值的60%左右运行,存在闲置电力 [6] - 建议构建能够“优雅降级”的数据中心,当电网要求降低电力供应时,数据中心可以转移关键负载或降低计算速率 [6] 供应链管理与内存战略 - 面对ASML光刻机、台积电CoWoS先进封装等环节的产能担忧,公司并不焦虑,与供应商保持紧密沟通 [7] - 系统工程深刻改变了基础设施制造模式,例如一个Vera Rubin机架包含130万到150万个组件,背后汇聚了200家供应商 [7] - 公司将数据中心的“超算组装”前置到了供应链的“超算制造”环节,机架以整机(重两三吨)形式发货 [7] - 大约三年前,公司成功说服了多家内存大厂的CEO,让他们相信HBM(高带宽内存)将成为未来数据中心的主流,并推动产业链投资扩产 [7] - 公司还推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域 [8] AI缩放定律与算力需求演进 - AI扩展被拆分为四条规律:预训练、后训练、测试时扩展、代理式扩展 [9] - 训练不再受数据限制,数据将受限于算力,很多训练数据会是合成数据 [9] - 推理就是思考,是算力密集型的,测试时扩展包含推理、规划、搜索等,会推动推理算力需求上升 [10] 公司的核心护城河与生态 - 公司最深的护城河是CUDA庞大的装机量与信任生态,这是由43000名员工共同推动建立的 [11] - 护城河建立在数百万开发者对公司持续优化底层的信任之上,并辅以横向整合进入全球各类云厂商、OEM和边缘设备的广泛生态 [11] 对工程领导力与行业创新的评价 - 高度评价马斯克旗下xAI仅用4个月建成拥有10万块GPU的Colossus超算中心,将其成功归结为第一性原理思维与极简主义 [11] - 马斯克被评价为能够质疑一切,直到把一切缩减到不能再减的最低必要限度,并且亲自出现在行动第一线 [11] - 公司的管理哲学强调“极限协同设计”,管理团队庞大,CEO有约60名直接下属,且几乎所有都是工程专家 [21][23] - 公司采用集体讨论而非一对一会议的模式来解决复杂的系统设计问题,确保所有相关专家都能参与并贡献 [25] - 领导力被描述为持续塑造员工和合作伙伴的信念系统,为重大决策铺平道路,使得宣布时大家已基本接受 [46][47][48] AI对就业与编程的影响 - 在招聘中,会优先雇佣“AI专家”,这一准则涵盖会计师、律师、销售人员、供应链经理、药剂师、电工和木匠等所有职业 [12] - 如果一个人的工作本质是一系列“任务”,则可能被AI颠覆;若工作有更深层的“目标”,则可以利用AI自动化常规琐事,成为“创新者” [12] - 公司软件工程师的数量将会增长而不是减少,如果编程的定义是“描述规范让计算机去构建”,那么能做到这一点的人数可能从3000万变成10亿 [13] - 对于AGI(通用人工智能),如果将其定义为一个能够自主开发应用并实现盈利的系统,那么AGI已经实现 [13] 公司发展历程与战略决策 - 公司从一家加速器公司起步,通过发明可编程像素着色器、引入单精度浮点数(FP32)、开发Cg和CUDA,逐步转型为计算公司 [29][30] - 将CUDA引入GeForce是一个关乎生死存亡的战略决策,当时极大地增加了GPU成本,完全吞噬了公司所有的毛利润,市值一度跌至约15亿美元 [31][37] - 该决策的核心理由是计算平台的核心是开发者,而开发者被装机量吸引,GeForce每年卖出数百万GPU,是培养装机量的起点 [33][35][36] - 公司坚持在GeForce上搭载CUDA,并认为英伟达是GeForce建立起来的殿堂,因为GeForce把CUDA带给了所有研究人员和科学家 [38][39] 极限协同设计与系统架构 - 极限协同设计是对从架构、芯片、系统、系统软件到算法和应用程序的整个软件栈进行优化 [22] - 协同设计之所以必要,是因为问题规模已无法装入单台计算机,需要分布式处理,而所有环节(计算、网络、CPU、GPU、交换机)都可能成为瓶颈 [18][20] - 公司架构设计反映其存在的环境,目标是成为产出成果的机器,直接决定了组织架构的设置 [22] - 系统架构快速演进以跟上算法发展,例如为混合专家模型(MoE)推出NVLink 72, Grace Blackwell机架专注于处理大语言模型,而新一代Vera Rubin机架则为了运行智能体 [63][64] 对全球创新生态的观察 - 全球大约50%的AI研究人员是华人,且大多仍在中国,中国的科技产业在移动云时代以软件贡献崛起,内部存在极其激烈的竞争 [116][117] - 中国的社会文化(家庭第一、朋友第二、公司第三)和开源交流习惯,加上激烈的竞争,使其成为当今世界上创新最快的国家之一 [117][118] - 公司开源AI模型(如Nemotron 3)的愿景包括:理解AI模型演变以进行协同设计、让AI渗透到每一个行业和国家、认识到AI不仅仅是语言而涵盖多种模态 [121][122]