公司发展历程与战略决策 - 公司从图形加速卡起步,通过推出CUDA打开通用计算大门,并发展为提出“AI工厂”概念的全球首个市值突破4万亿美元的科技公司,几乎重塑了整个计算产业的底层形态 [1] - 公司早期战略决策是将CUDA搭载到每一块GeForce显卡上,尽管当时成本直接上升了50%,而公司毛利率只有35%,市值一度从60-80亿美元跌至约15亿美元,但该决策被视为公司“生死存亡”的战略转折点,并最终成为当今AI计算基础设施的核心 [29][31][32][38][44] - 公司从一家功能专一的加速器公司起步,通过研发可编程像素着色器、加入IEEE标准的FP32浮点运算单元、开发Cg语言,最终走到CUDA,立志成为一家拥有自己兼容计算架构的计算公司 [27][28][29][30] - 公司认为一个计算架构的生命力取决于其装机量,因此决定将CUDA装进每年售出的数百万片GeForce GPU中,以此积累庞大的装机基础,并走进大学推广以吸引开发者 [34][36][37] - 公司靠GeForce打下江山,正是通过GeForce,CUDA才得以走进千家万户,并被科研人员和科学家所接触,为后来的深度学习革命奠定了基础 [39][40][41][42] 管理哲学与组织架构 - 公司采用“极致协同设计”方法,优化从架构、芯片、系统、软件、算法到应用的整个技术栈,包括CPU、GPU、网络、电力与散热等所有复杂组件,以解决大规模分布式计算中性能提升远超简单堆机器的问题 [9][10][12][14][16][17] - 公司首席执行官的直接汇报对象多达60人,且几乎全部具有工程背景,涵盖内存、CPU、GPU、架构、算法等各个方向的专家 [4][19][20][21][22] - 公司内部基本不进行一对一会谈,所有问题都公开讨论,让所有相关专家共同参与,以确保在讨论具体模块时,其他领域的专家也能即时提出跨领域的制约因素(如供电、内存友好性) [4][19][23][24] - 公司的组织架构设计与其所处的环境及要创造的产品紧密相关,目标是成为一套能够产出成果的机制、体系与系统,而非遵循传统的汉堡型或扁平型组织结构图 [18] - 领导方式是通过持续的逻辑推演和日常沟通,潜移默化地构建公司内外部对未来的共识,例如在正式宣布全力投入深度学习或进行重大收购(如Mellanox)前,已花费长时间进行铺垫,使决定显得理所当然 [47][48][49][50][51] 技术演进与行业趋势判断 - AI模型架构大约每六个月就会出现一种新的,而系统架构和硬件架构大约三年才迭代一次,因此必须提前预判未来两三年可能出现的技术方向 [5][65] - AI发展的规模法则已从预训练扩展至四个:预训练、后训练、推理以及智能体扩展,智能的扩张最终只取决于算力 [56][62][63] - 训练的瓶颈已从数据转变为算力,因为未来训练所用数据大部分将是合成数据,人类原生数据占比会越来越小 [57] - 推理(思考)阶段的算力需求极其密集,远比单纯的预训练(记忆与泛化)复杂,涉及逻辑推演、规划、搜索和决策 [58][59] - 下一个重要的规模法则是智能体扩展法则,智能体可以自主研究、使用工具并衍生出大量子智能体,相当于让AI实现自我复制 [60][61][62] - 有人愿意为每百万token支付1000美元的时代即将到来,这只是时间问题,智能本身是可规模化的产品,高阶智能token具有真实价值 [5][170] - OpenClaw对于智能体系统的意义,就像当年ChatGPT对于生成式AI的意义一样,是Token时代的iPhone,是历史上增长最快的应用之一 [5][80][174][177][179] 工程哲学与供应链管理 - 公司采用“光速法则”的工程哲学,即用物理极限(如光速)来检验和权衡所有设计方案的延迟、吞吐量、成本、容量等维度,追求在必要时尽可能复杂,在可能时尽可能简洁 [121][122][129] - 公司反对单纯的持续改进,主张以第一性原理从零开始重新设计,探求理论上的最快极限,而非在现有流程上进行小幅优化 [123][124][125] - 公司目前制造的是世界上最复杂的计算机,例如Vera Rubin Pod包含7种芯片类型、5种定制机柜、40个机柜、1.2万亿亿个晶体管、近2万个英伟达裸片、超过1100颗Rubin GPU、60 Exaflops算力及每秒10 PB的扩展带宽 [126] - 一个NVL72机柜就包含130万个组件、1300颗芯片,公司将超级计算机的集成工作从数据中心现场移至供应链制造环节,并以整机架形式发货 [94][96][127] - 公司需要供应链每周生产大约200个这样的Pod,并确保供应链有足够的电力(例如每周1吉瓦)用于制造和测试 [96][128] - 公司花费大量时间与上下游供应链伙伴(如台积电、ASML、内存厂商)的CEO沟通,传递行业趋势和未来需求,以引导他们进行数十亿美元级别的资本投资,共同构建未来供应链 [88][89][90][91][92][93][97] - 公司与台积电合作三十年来,业务规模高达数百上千亿美元,却没有一纸合同,建立在深厚的信任基础上 [140][142][143][144] 市场定位与竞争优势 - 公司最核心的“护城河”或竞争优势是其计算平台(尤其是CUDA)的庞大装机量,以及在此复杂系统规模下的快速执行迭代能力 [150][151][152] - 公司的第二项优势是广泛而统一的生态系统,其架构通过垂直整合和横向融合,接入了所有主要云平台、计算设备企业,并覆盖汽车、机器人、卫星、太空及各行各业 [153][154] - 公司是一家计算平台公司,进行垂直设计以优化产品,但将平台全方位开放,供其他公司整合进其产品、服务与云平台中 [53][54] - 公司对计算基本单元的认知已从单一的GPU芯片,演变为整机、集群,再到如今的吉瓦级“AI工厂”或“Token工厂” [155][156][157][158] - 公司增长的两个根本性技术原因是:计算模式从检索型文件系统转向生成型实时token处理;计算机从存储仓库转变为能创造营收的生产工厂 [168][169] - 公司未来的增长不受物理条件限制,全球GDP中用于计算的占比可能达到过去的一百倍,公司规模有望继续大幅扩张 [170][171][172] 对特定市场与技术的看法 - 中国是一个“开发者大国”,其科技产业成功源于约全球50%的AI研究人员是华人、优秀的STEM教育、内部省份间的激烈竞争、深厚的“同学”友谊纽带以及开源驱动的快速创新文化 [132][133][134] - 开源是许多行业加入AI革命的根本前提,公司通过开源AI模型(如Nemotron 3)来激活全球研究者和国家,并理解AI模型演进以更好地设计未来计算系统 [135][137][138] - 太空是处理卫星影像等海量数据的理想场所,AI必须在边缘端进行数据处理以过滤无用信息,公司GPU已成为首批进入太空的GPU,正在攻克辐射、散热、冗余设计等工程难题 [159][161][162][164][165] - 未来数据中心不应再追求“100%永久在线”,电网在99%的时间里实际负载仅为其设计峰值的60%左右,存在大量闲置电力,应通过“可优雅降级”的数据中心设计和更灵活的电力合同来利用这部分电力 [5][99][100][101][102][104] - 应对算力扩张的能源瓶颈的方法是不断优化“每秒每瓦特生成的Token数”,同时需要获取更多电力,并利用地球上闲置的电力资源 [86][87][103][166] 对同行与行业的观察 - 埃隆·马斯克是一位出色的系统级思考者,能跨越学科、质疑一切、亲临一线、并以其紧迫感带动整个供应链,从而打破思维定式并快速优化系统 [110][111][112][113][114][115][116][117] - 台积电的成功不仅在于顶尖的晶体管和封装技术,更在于其能统筹全球数百家企业动态需求的高效运营体系、兼顾技术前沿与客户服务的文化,以及所建立的无价信任 [139][140][141][142] - 以前全球只有3000万人能编程,现在这个门槛消失了,全世界10亿人都可以是“程序员”,不应为此焦虑,而应倍受鼓舞 [5] - 指望十万个智能体打造出另一个英伟达,可能性是零 [5] - 公司认为已经实现了AGI(通用人工智能) [5]
信息量极大!黄仁勋最新论断:AGI已实现,OpenClaw是AI界iPhone,未来将有10亿程序员