信息量极大！黄仁勋最新论断：AGI已实现，OpenClaw是AI界iPhone，未来将有10亿程序员

公司发展历程与战略决策 - 公司从图形加速卡起步，通过推出CUDA打开通用计算大门，并发展为提出“AI工厂”概念的全球首个市值突破4万亿美元的科技公司，几乎重塑了整个计算产业的底层形态 [1] - 公司早期战略决策是将CUDA搭载到每一块GeForce显卡上，尽管当时成本直接上升了50%，而公司毛利率只有35%，市值一度从60-80亿美元跌至约15亿美元，但该决策被视为公司“生死存亡”的战略转折点，并最终成为当今AI计算基础设施的核心 [29][31][32][38][44] - 公司从一家功能专一的加速器公司起步，通过研发可编程像素着色器、加入IEEE标准的FP32浮点运算单元、开发Cg语言，最终走到CUDA，立志成为一家拥有自己兼容计算架构的计算公司 [27][28][29][30] - 公司认为一个计算架构的生命力取决于其装机量，因此决定将CUDA装进每年售出的数百万片GeForce GPU中，以此积累庞大的装机基础，并走进大学推广以吸引开发者 [34][36][37] - 公司靠GeForce打下江山，正是通过GeForce，CUDA才得以走进千家万户，并被科研人员和科学家所接触，为后来的深度学习革命奠定了基础 [39][40][41][42] 管理哲学与组织架构 - 公司采用“极致协同设计”方法，优化从架构、芯片、系统、软件、算法到应用的整个技术栈，包括CPU、GPU、网络、电力与散热等所有复杂组件，以解决大规模分布式计算中性能提升远超简单堆机器的问题 [9][10][12][14][16][17] - 公司首席执行官的直接汇报对象多达60人，且几乎全部具有工程背景，涵盖内存、CPU、GPU、架构、算法等各个方向的专家 [4][19][20][21][22] - 公司内部基本不进行一对一会谈，所有问题都公开讨论，让所有相关专家共同参与，以确保在讨论具体模块时，其他领域的专家也能即时提出跨领域的制约因素（如供电、内存友好性） [4][19][23][24] - 公司的组织架构设计与其所处的环境及要创造的产品紧密相关，目标是成为一套能够产出成果的机制、体系与系统，而非遵循传统的汉堡型或扁平型组织结构图 [18] - 领导方式是通过持续的逻辑推演和日常沟通，潜移默化地构建公司内外部对未来的共识，例如在正式宣布全力投入深度学习或进行重大收购（如Mellanox）前，已花费长时间进行铺垫，使决定显得理所当然 [47][48][49][50][51] 技术演进与行业趋势判断 - AI模型架构大约每六个月就会出现一种新的，而系统架构和硬件架构大约三年才迭代一次，因此必须提前预判未来两三年可能出现的技术方向 [5][65] - AI发展的规模法则已从预训练扩展至四个：预训练、后训练、推理以及智能体扩展，智能的扩张最终只取决于算力 [56][62][63] - 训练的瓶颈已从数据转变为算力，因为未来训练所用数据大部分将是合成数据，人类原生数据占比会越来越小 [57] - 推理（思考）阶段的算力需求极其密集，远比单纯的预训练（记忆与泛化）复杂，涉及逻辑推演、规划、搜索和决策 [58][59] - 下一个重要的规模法则是智能体扩展法则，智能体可以自主研究、使用工具并衍生出大量子智能体，相当于让AI实现自我复制 [60][61][62] - 有人愿意为每百万token支付1000美元的时代即将到来，这只是时间问题，智能本身是可规模化的产品，高阶智能token具有真实价值 [5][170] - OpenClaw对于智能体系统的意义，就像当年ChatGPT对于生成式AI的意义一样，是Token时代的iPhone，是历史上增长最快的应用之一 [5][80][174][177][179] 工程哲学与供应链管理 - 公司采用“光速法则”的工程哲学，即用物理极限（如光速）来检验和权衡所有设计方案的延迟、吞吐量、成本、容量等维度，追求在必要时尽可能复杂，在可能时尽可能简洁 [121][122][129] - 公司反对单纯的持续改进，主张以第一性原理从零开始重新设计，探求理论上的最快极限，而非在现有流程上进行小幅优化 [123][124][125] - 公司目前制造的是世界上最复杂的计算机，例如Vera Rubin Pod包含7种芯片类型、5种定制机柜、40个机柜、1.2万亿亿个晶体管、近2万个英伟达裸片、超过1100颗Rubin GPU、60 Exaflops算力及每秒10 PB的扩展带宽 [126] - 一个NVL72机柜就包含130万个组件、1300颗芯片，公司将超级计算机的集成工作从数据中心现场移至供应链制造环节，并以整机架形式发货 [94][96][127] - 公司需要供应链每周生产大约200个这样的Pod，并确保供应链有足够的电力（例如每周1吉瓦）用于制造和测试 [96][128] - 公司花费大量时间与上下游供应链伙伴（如台积电、ASML、内存厂商）的CEO沟通，传递行业趋势和未来需求，以引导他们进行数十亿美元级别的资本投资，共同构建未来供应链 [88][89][90][91][92][93][97] - 公司与台积电合作三十年来，业务规模高达数百上千亿美元，却没有一纸合同，建立在深厚的信任基础上 [140][142][143][144] 市场定位与竞争优势 - 公司最核心的“护城河”或竞争优势是其计算平台（尤其是CUDA）的庞大装机量，以及在此复杂系统规模下的快速执行迭代能力 [150][151][152] - 公司的第二项优势是广泛而统一的生态系统，其架构通过垂直整合和横向融合，接入了所有主要云平台、计算设备企业，并覆盖汽车、机器人、卫星、太空及各行各业 [153][154] - 公司是一家计算平台公司，进行垂直设计以优化产品，但将平台全方位开放，供其他公司整合进其产品、服务与云平台中 [53][54] - 公司对计算基本单元的认知已从单一的GPU芯片，演变为整机、集群，再到如今的吉瓦级“AI工厂”或“Token工厂” [155][156][157][158] - 公司增长的两个根本性技术原因是：计算模式从检索型文件系统转向生成型实时token处理；计算机从存储仓库转变为能创造营收的生产工厂 [168][169] - 公司未来的增长不受物理条件限制，全球GDP中用于计算的占比可能达到过去的一百倍，公司规模有望继续大幅扩张 [170][171][172] 对特定市场与技术的看法 - 中国是一个“开发者大国”，其科技产业成功源于约全球50%的AI研究人员是华人、优秀的STEM教育、内部省份间的激烈竞争、深厚的“同学”友谊纽带以及开源驱动的快速创新文化 [132][133][134] - 开源是许多行业加入AI革命的根本前提，公司通过开源AI模型（如Nemotron 3）来激活全球研究者和国家，并理解AI模型演进以更好地设计未来计算系统 [135][137][138] - 太空是处理卫星影像等海量数据的理想场所，AI必须在边缘端进行数据处理以过滤无用信息，公司GPU已成为首批进入太空的GPU，正在攻克辐射、散热、冗余设计等工程难题 [159][161][162][164][165] - 未来数据中心不应再追求“100%永久在线”，电网在99%的时间里实际负载仅为其设计峰值的60%左右，存在大量闲置电力，应通过“可优雅降级”的数据中心设计和更灵活的电力合同来利用这部分电力 [5][99][100][101][102][104] - 应对算力扩张的能源瓶颈的方法是不断优化“每秒每瓦特生成的Token数”，同时需要获取更多电力，并利用地球上闲置的电力资源 [86][87][103][166] 对同行与行业的观察 - 埃隆·马斯克是一位出色的系统级思考者，能跨越学科、质疑一切、亲临一线、并以其紧迫感带动整个供应链，从而打破思维定式并快速优化系统 [110][111][112][113][114][115][116][117] - 台积电的成功不仅在于顶尖的晶体管和封装技术，更在于其能统筹全球数百家企业动态需求的高效运营体系、兼顾技术前沿与客户服务的文化，以及所建立的无价信任 [139][140][141][142] - 以前全球只有3000万人能编程，现在这个门槛消失了，全世界10亿人都可以是“程序员”，不应为此焦虑，而应倍受鼓舞 [5] - 指望十万个智能体打造出另一个英伟达，可能性是零 [5] - 公司认为已经实现了AGI（通用人工智能） [5]