Groq LP30芯片
搜索文档
SaaS 已死!黄仁勋最新演讲宣判:所有软件公司都将变成 Agent 即服务
凤凰网财经· 2026-03-19 14:33
公司战略转型 - 公司正从一家“芯片公司”向“AI基础设施和工厂公司”蜕变,其核心商业逻辑是“Token工厂经济学” [2] 业绩与需求展望 - 公司对到2027年的AI计算需求给出了至少1万亿美元的强劲预期,远高于去年提及的覆盖至2026年的5000亿美元高确信度需求 [3] - 公司认为实际计算需求将高于1万亿美元,并可能面临供不应求的局面 [3] - 公司60%的业务来自排名前五的超大型云服务商,40%的业务广泛分布于主权云、企业、工业、机器人和边缘计算等领域 [4] Token工厂经济学 - 未来的数据中心是生产Token的“工厂”,在固定的电力限制下,每瓦Token吞吐量最高的系统生产成本最低 [5][6] - AI服务被分为多个商业层级,包括免费层、中级层(约每百万token 3美元)、高级层(约每百万token 6美元)、高速层(约每百万token 45美元)和超高速层(约每百万token 150美元) [6][8] - 公司的架构能让客户在免费层实现高吞吐量,同时在最高价值的推理层级上将性能提升35倍 [6] 硬件与系统创新 - Vera Rubin是公司有史以来最复杂的AI计算系统,是一个100%液冷、无传统线缆的完整系统,机架安装时间从两天缩短至两小时 [7] - 通过端到端软硬件协同设计,Vera Rubin在两年内将Token生成速率从2200万提升至7亿,实现了350倍的增长,远超同期摩尔定律约1.5倍的提升 [7] - 为解决极速推理的带宽瓶颈,公司整合了Groq,采用非对称分离推理方案:将需要海量计算和显存的“预填充”阶段交给Vera Rubin,将对延迟极度敏感的“解码”阶段交给Groq [7] - Groq LP30芯片已由三星代工量产,预计第三季度出货;首个Vera Rubin机架已在微软Azure云上运行 [7] - 公司展示了全球首款量产的共封装光学交换机Spectrum X,并强调需要同时发展铜缆、光芯片和CPO产能 [8] - 公司正在研发下一代计算架构Feynman,以及部署在太空的数据中心计算机“Vera Rubin Space-1” [9] 软件、生态与行业变革 - 开源项目OpenClaw被形容为Agent计算机的“操作系统”,其普及速度超越了Linux过去30年的成就 [8] - 公司断言,每一个SaaS公司都将变成AaaS公司,并推出了企业级的NeMo Claw参考设计以保障智能体安全落地 [8] - 在未来的职场中,为工程师提供年度Token预算以提升效率将成为硅谷招聘的新筹码,Token额度可能达到基础年薪的一半左右 [9]