公司战略定位与愿景 - 公司强调其本质是一家加速计算公司,而非单纯的GPU公司 [2] - 公司的目标是从算力平台演进为“全栈世界引擎”,通过垂直整合和协同设计,将整个软件世界加速后交给AI使用 [12][16][20][24] - 公司的核心方法是先垂直整合地做出一整套解决方案,再进行水平开放,让生态伙伴按需使用其部分或全部技术栈 [114][116] AI竞赛与行业瓶颈演变 - AI竞赛的焦点已从比拼算力转向比拼产出,核心衡量标准是能否快速、低成本地生成高质量结果 [4] - AI发展的瓶颈已从单一的计算环节,扩展到数据搬运、内存、网络和推理等全链路,任何一环的延迟都会制约最终产出 [4][5][24] - 衡量AI产出的核心单位是token,其价值取决于生成它的模型的“聪明”程度,即用更少token给出更准确、有用结果的能力 [7][8] 技术架构与产品布局演进 - 下一代AI推理将走向GPU与LPU(如收购的Groq)的混合架构,旨在解决极低延迟下的token生成问题,而非替代GPU [9][10][70] - Transformer架构在长记忆、处理物理规律和连续任务上存在不足,下一代模型需要混合架构(如Transformer + SSM)和具备几何感知等能力的新模型 [24][32][33][35] - 公司通过“解耦推理”策略,将推理任务(包括decode中的高计算量部分)在异构基础设施中进行更细粒度的拆分和优化,以扩展性能边界 [77][78][81] - CPU的角色至关重要,其单线程性能和I/O带宽是关键,以避免拖慢GPU。公司自研Grace CPU和Vera CPU旨在提供极高的单线程性能与带宽 [53][54][63][64] - 网络内计算(如Mellanox技术)是公司技术栈的关键部分,使得大规模NVLink成为可能 [86] 市场机会与商业模式 - AI已跨越经济价值门槛,基于推理、反思和工具使用的AI应用(如编程Agent)开始真正创造收入,改变了此前搜索等服务难以收费的局面 [39][40][41][74] - 在AI创造经济价值的场景下(如编程效率提升10倍),客户愿意为更高token速率和更低延迟的服务支付溢价 [75][90] - 建设千兆瓦级的AI工厂总投资约500亿至600亿美元,其中基础设施(土地、电力、厂房)约占150亿至170亿美元,其余为计算、网络、存储等 [25] - 公司的商业模式是提供技术栈和平台,而非最终产品或服务,通过将前沿技术开放给整个生态来扩大客户基础 [111][112][115] 行业竞争与生态格局 - 真正的竞争不在于单一的模型或芯片,而在于对整个技术栈(从电力、芯片、基础设施、模型到应用的五层蛋糕)的主导权 [10][24][98] - 中国在AI领域是不可忽视的力量,拥有大量有创造力的研究人员和出色的开源模型(如DeepSeek、Kimi、Qwen),全球技术栈需要能够吸收这些创新 [97] - 公司认为,将技术栈从上到下强制捆绑的策略会限制整体上限,应该让每一层自由竞争 [99] - 供应链面临全面压力,电力、芯片产能、土地等多环节均接近瓶颈,但公司通过长期规划和供应链布局,有信心支撑未来需求 [92][95][96] AI应用与Agent发展 - AI正从处理离散的语言token,转向需要同时理解记忆、结构和连续动作的现实世界任务 [24][36] - AI使用工具(Tool Use)是重要趋势,这些工具原本为人类设计(如Excel、SQL、Photoshop),需要被整体加速以匹配AI Agent的速度 [14][15][55] - 非结构化的工具使用(如通过多模态操作没有API的网页)是下一步方向,这依赖于强大的PC和数据处理系统 [57][58] - 编程是AI创造经济价值的典型领域,AI编程助手让工程师从写代码转向思考架构和解决问题,大幅提升效率 [45][46]
英伟达改卖Token?黄仁勋GTC后发声:token就是AI新通货,值钱的不是算力,是“每度电的智商”