推理效率革新与Agent共振,打开万亿市场空间

行业投资评级 * 报告对互联网传媒行业给予“买入”评级 [2] 报告核心观点 * 英伟达2026年GTC大会标志着AI产业叙事正从“训练性能突破”转向“推理效率优化”,推理成为AI算力增长的核心驱动力 [5] * 英伟达通过构建“AI工厂”体系,以软硬件垂直整合重构算力基础设施,显著提升推理效率并降低成本 [5] * AI Agent与物理AI(机器人、自动驾驶)成为新的应用增长方向,将催生新的商业模式与技术范式 [5] 根据相关目录分别进行总结 一、GTC的叙事变化:AI推理成为主战场 * 推理市场空间巨大:英伟达CEO黄仁勋预计,2027年AI推理芯片潜在市场规模可达1万亿美元 [5][13] * 推理需求结构性增长:驱动因素包括:1) 高质量训练数据稀缺,模型训练更多依赖合成数据与后训练推理;2) AI Agent应用相比传统聊天机器人,token消耗量提升1-2个数量级 [5][13] * 推理占比持续提升:德勤预计,全球推理负载占AI算力比例将从2023年的约1/3提升至2026年的约2/3,长期有望超过80% [5][13] * 推理成本大幅下降:主流模型推理成本较2023年下降超过一个数量级,2026年海外主流模型API调用价格已降至每百万token约0.05–10美元区间 [5][13][15][17] * 英伟达推出新一代推理平台: * Vera Rubin平台:集成7款芯片,推理性能较上一代提升约35倍,token生成速率实现350倍增长 [5][20] * Groq LPU架构:专为低延迟推理设计,采用片上SRAM替代HBM,基于此推出的LPX机架可带来最高约10倍的潜在商业化收益空间提升 [5][23] 二、AI应用:Agent与物理AI * AI Agent成为企业刚需:商业模式将从SaaS转变为Agentic AI as a Service [5][30] * 英伟达完善OpenClaw生态:推出NemoClaw,通过OpenShell提供安全沙箱环境,解决Agent执行权限与安全控制的矛盾 [5][30][37] * 开源模型表现领先:英伟达发布的Nemotron-3 Super在OpenClaw基准测试中位列全球第四、开源模型第一 [5][31] * 物理AI技术栈形成:英伟达发布Cosmos世界模型、Isaac仿真框架和GR00T机器人基础模型,形成“世界模型+仿真训练+机器人模型”的完整技术栈,加速机器人与自动驾驶落地 [5][41] * 自动驾驶生态扩张:英伟达Robotaxi平台新增比亚迪、现代等合作伙伴,预计每年将有约1800万辆新车具备相关能力;并与Uber合作推进自动驾驶车队部署 [46] 三、投资建议 * 投资逻辑转变:AI产业叙事从训练驱动转向推理驱动,应重视全栈式AI布局、软硬协同带来的推理性价比和稳定性优势 [5][47] * 应用方向明确Agent物理AI是两大核心AI应用方向,Agent的普及对算力、模型与安全基础设施提出新需求 [5][47] * 关注垂直整合厂商:围绕自研模型+云+生态的垂直整合,短期关注谷歌,中长期关注微软、阿里巴巴、腾讯控股 [5][48] * 细分赛道机会: * 多模态应用关注快手、美图 [5][48] * IP+AI视频关注阅文集团、中文在线、上海电影、欢瑞世纪、华策影视、掌阅科技等 [5][48] * AI营销关注汇量科技、易点天下、蓝色光标等 [5][48] * AI陪伴社交关注恺英网络,AI游戏关注心动公司 [5][48] * AI内容确权关注阜博集团 [5][48] * AI医疗关注京东健康、阿里健康 [48]