文章核心观点 - 英伟达CEO黄仁勋在GTC大会上提出,AI发展已进入“实用AI”时代,AI正从技术展示转变为直接创造经济价值的生产工具 [2][3] - AI的发展范式正从“应用程序时代”转向“智能体(Agent)时代”,计算基础设施、商业模式和软件形态将随之发生根本性变革 [12][20] - 英伟达的战略定位已从GPU芯片供应商,全面升级为提供全栈技术、助力客户构建“AI工厂”生态的AI基础设施公司 [28][35] 行业趋势与宏观判断 - 实用AI时代的经济影响:AI已成为真正的生产工具,直接影响经济活动。全球约3000万至4000万名专业软件工程师创造约3万亿美元的薪酬价值,其开发的软件支撑着全球接近100万亿美元规模的经济活动 [3][5] - AI提升生产力与就业:AI辅助编程工具显著提升软件开发效率。GitHub代码提交量从2023年的3亿次,增长至2024年的4亿次,2025年达到5亿次,2026年前几个月的数据已接近此前水平的数倍增长 [5][7]。AI不会减少就业,反而会因单位劳动力创造价值的能力提升而刺激企业招聘更多开发者 [5][6][8] - Token成为新盈利单位:行业关注点从模型能力转向Token(产出)能力。Token已成为能够直接创造收入的盈利单位,驱动全球数据中心建设热潮和算力需求增长 [8][9] - 计算范式变革:从传统的“应用程序 → 代码 → 操作系统”架构,转向“智能体(Agent) → 大语言模型 → 工具系统”的新架构。未来用户只需向AI解释意图,由AI自动编写代码、调用工具并完成任务 [12][15] 英伟达的战略与产品布局 - 公司定位:全栈AI基础设施公司:英伟达强调其本质是一家软件公司,并已转型为提供硬件、软件、库及连接全球开发者生态的全栈AI基础设施公司 [22][34][35] - 核心产品:Vera Rubin平台:该平台是一套面向智能体时代设计的端到端革命性系统,而不仅仅是单一芯片。它整合了GPU、Vera CPU、NVLink 72互连、革命性存储系统、CX-9硬件、DOCA软件栈及安全处理器,现已进入全面量产阶段 [26][37][44] - 供应链与产能:Vera Rubin平台对应的供应链规模已达上一代Grace Blackwell平台的两倍。组装一套Grace Blackwell机架的时间从约两小时缩短至五分钟,产能和交付速度大幅提升 [39][41] - Vera CPU:专为智能体时代设计,针对智能体推理、工具调用、数据库访问等任务优化。在企业SQL数据库处理场景中,性能达到现有平台的约3倍;在实时流处理场景下,性能提升最高可达6倍 [50][52][54] - 开源模型Nemotron 3 Ultra:推出5500亿参数的开源大模型,采用全球首个SSM与MoE相结合的混合架构。相比现有主流开源模型,其推理速度提升5倍,总体运行成本降低30% [56][58] - 与微软合作重新定义PC:双方合作三年,旨在重新设计PC底层架构以适应智能体时代。未来PC将内置能理解用户、对话并自主完成任务的AI智能体,大语言模型将成为PC的核心基础组件 [63][65][69] 智能体(Agent)生态与机遇 - 智能体架构:完整的AI智能体由模型、框架、工具、技能及运行时五大核心部分构成,以解耦、分布式、异构的方式运行 [23] - 催生新软件需求:智能体时代将催生数量远超今天的软件系统,因为每个企业流程、业务环节甚至个人任务都可能拥有专属智能体。软件不会消失,而是需要以“AI可调用”的形式重新存在,这是软件行业最好的时代之一 [16][17][18] - CUDA生态的新机会:英伟达的CUDA库能力可直接被智能体调用,成为Agent执行任务时的工具集。CUDA X库已升级并配套专属AI技能手册,供智能体自主学习以提升解决行业难题的能力 [19][24] - AI工厂生态:英伟达提出“AI工厂生态新范式”,其发展重心从传统计算生态升级为服务AI基建的工厂化生态体系。目标是帮助客户搭建超复杂、超大规模的AI工厂基础设施,而不仅是输出GPU或算力系统 [27][28] - AI工厂的规模与复杂度:单座1吉瓦(GW)级别的AI工厂建设成本持续攀升,从最初的200亿至400亿美元,上涨至500亿至600亿美元,未来很快将突破800亿甚至1000亿美元 [29] - 赋能合作伙伴与案例:通过DSX等平台赋能中小企业快速搭建AI云服务能力。案例显示,接入英伟达生态的企业如CoreWeave估值已攀升至500亿至700亿美元区间,并保持高速增长 [30][31][32]
刚刚,黄仁勋宣布 Rubin 全面投产,4万名工程师参与构建!史上最强CPU同步亮相